截图识别数学公式为latex代码

本文最后更新于:2024年9月16日 下午

实现的几种途径

本文主要介绍开源的两个项目的安装使用

LaTex-OCR:pix2tex

该项目的目标是创建一个基于学习的系统,它可以接收一张数学公式的图片,并返回相应的LaTeX代码。

  1. 系统已经安装Python3.7+

  2. 国内网络环境建议更换pip源

    1
    pip install -i https://pypi.tuna.tsinghua.edu.cn/simple pip --trusted-host
  3. 然后一行代码

    1
    pip install pix2tex[gui]
  4. 在终端输入命令 latexocr就会调用应用程序,对公式截图即可自动转换并且自动复制latex代码,其中界面当中的参数 Temperature调整是公式识别的精度

安装过程中如果出现各种错误,善用各种搜索引擎和各种AI,感觉可以和chatgpt媲美的Perplexity.ai

自己安装过程中总是提示找不到PyQt的各种包,也许有用的一个命令

1
pip install PyQt6-WebEngine==6.5.0

还有调用api的用法,请参看项目主页

pix2text

从名字来看,这是pix2tex项目的加强版,pix2tex只能识别数学公式,而pix2text希望能识别文字和公式混合的场景,从使用的效果来看,还有很大的进步空间

1
pip install pix2text -i https://pypi.doubanio.com/simple

如果电脑中从未安装过 PyTorchOpenCV python包,初次安装可能会遇到不少问题,善用各种搜索引擎和AI

各种使用方式看项目主页即可,我使用的是本机脚本运行


截图识别数学公式为latex代码
https://andyppang.github.io/2023/05/29/截图识别数学公式为latex代码/
作者
PL
发布于
2023年5月29日
许可协议