paddleocr PP-StructureV3 pdf转md 懒人整合包 cpu可用 交互界面调整

张开发
2026/4/8 0:44:54 15 分钟阅读

分享文章

paddleocr PP-StructureV3 pdf转md 懒人整合包 cpu可用 交互界面调整
前言本文依旧是懒人包的优化更新之前最大的问题就是使用fastapi这种偏向编程交互的操作方式适合api调用不太适合gui界面可视化操作现在统一把fastapi改为gradio可视化交互关于懒人包目前最多的系列是ocr其中pdf转md也最为常用优化首先第一个优化是fastapi转gradio可以看到下图左侧上传图片和PDF等文件可以预览可以拖拽和点击选择是否批量待定右侧查看输出的md结构可以复制和下载底部用于下拉和勾选对应的选项以及点击交互可以查看实时进度等以及一些文案提示问题之前把一些不必要的功能没有验证的功能都放上去容易让人迷惑现在只保留PDF和PNG等转MD的功能其他转JSONHTMLEXCEL等功能都不做以后如果需要和支持再添加对应的功能同样的对于低显存或者CPU也可以处理的AI我会把它拆分为cpu版本和gpu版本cpu版本用来简单体验功能和临时使用gpu版本用来加速和大量使用目前cpu版本先上后续再补充gpu版本懒人包说明example用于放图片等示例的文件可以快速方便的查看AI效果models存放ai的本地模型离线懒人包不会发起请求只会读取本地的文件模型output用于存放ai处理后的文件比如处理后生成的md文件python312为离线python环境含有对应的依赖包app.py为应用程序和界面代码逻辑和界面交互都在这个文件start.bat是win上的启动文件方便双击一键启动Tips点击此处 网盘下载目前PDF转MD系列的paddleocr PP-StructureV3效果不错所以先更新它后面的paddleocr vL1.5等再逐步更新图中的启动方向分类按钮和启动去扭曲按钮只是占位目前还没有下载对应的模型等待后续有空再把功能补充完善

更多文章