MinerU - PDF 解析神器-金点圈资源站

告别PDF解析烦恼，MinerU太香了！

如果你经常和PDF打交道，尤其是那些带数学公式、复杂排版的文档，那你肯定懂那种复制出来乱码的痛。今天必须安利这个我用了小半年的工具——MinerU，真的能救命。

它最牛的地方在于识别精度。普通PDF提取文字就算了，它连数学公式、表格、图片都能给你处理得明明白白。我试过把一篇全公式的论文丢进去，出来的LaTeX代码基本能直接用，这在其他工具里想都不敢想。

而且它特别灵活：本地部署、网页版、客户端三种方式任你选。不想装软件就用在线版，要离线处理大批量文件就装客户端，注重隐私的还可以自己本地部署，开发者把选择权完全交给用户。

说几个我实际用的场景：整理学术文献时快速提取参考文献，从扫描版PDF里扒数据做分析，把书里的图表单独导出。以前得手动折腾半天的活，现在基本一键搞定。

关键是完全免费，没有任何限制。开源项目做到这个程度，确实良心。处理速度也快，几百页的文档几分钟就完事。

真心推荐给经常处理PDF的学生、研究人员、办公党。特别是理工科同学，那些公式识别能力你们用了就回不去。

用了觉得好，记得回来点个赞~