关于数学公式的识别

分享 Wffty • 查看49

起因是尝试了Obsidian自己官方的Clipper(剪藏)功能,发现对于网页的数学公式的支持存在问题,比如知乎上的一个数学公式会重复出现2次,前后紧贴。

讨论的链接如下:https://forum-zh.obsidian.md/t/topic/41998/2?u=inorganic_wfftty 。在这里做一个分享是因为发现五彩的剪藏 也有一样的问题。

情况大致如帖子里所说: 例如,这里是知乎一个数学段的代码

<span class="ztext-math" data-eeimg="1" data-tex="\cos^2\alpha+\sin^2\alpha=1">
    <span></span>
    <span>
        <span class="MathJax_Preview" style="color: inherit;"></span>
        <span class="MathJax_SVG" id="MathJax-Element-2-Frame" ... data-mathml="<math> ...</math>" role="presentation">
            <svg ...>
                一堆标签
            </svg>
            <span class="MJX_Assistive_MathML" role="presentation">
                <math>
                    一堆标签
                </math>
            </span>
        </span>
        <script type="math/tex;mode=inline" id="MathJax-Element-2">\cos^2\alpha+\sin^2\alpha=1</script>
        <span class="tex2jax_ignore math-holder">\cos^2\alpha+\sin^2\alpha=1</span>
    </span>
</span>

可看到, 就简单一个 \cos^2\alpha+\sin^2\alpha=1, 它会以不同形式给表达六七次

实测, 如果 Clipper 转换出 $AAAAA$BBBBB 这个形式, 那么 AAAAA 来自 <span class="MJX_Assistive_MathML" >...</span>, 而 BBBBB 来自 <span class="tex2jax_ignore math-holder">...</span>


即这些因素导致了数学公式的重复剪藏,如果要改善这个问题,考虑到不同网站的数学引擎或者html结构的不同,可能没有统一的标准了,而只能逐个优化。

共收到3条回复
关于数学公式的识别 肥肥猫xyz
肥肥猫xyz ⚡⚡ #1 回复
非常感谢
我们跟进一下
🤝🤝
关于数学公式的识别 Wffty
Wffty #2 回复
@肥肥猫xyz 你好,我个人认为这个问题还是等有人反应问题的时候再适配对应的网页也不迟;不同网站之间的差异比较大,一次性适配是不现实的,而且工作量也大
关于数学公式的识别 肥肥猫xyz
肥肥猫xyz ⚡⚡ #3 回复
@Wffty 好的,谢谢你
登录后即可参与回复