MinerU v2.0:0.9BVLM模型捅破解析效果天花板!

MinerU发布v2.0版本,通过仅0.9B参数的VLM模型实现文档解析效果突破,支持PDF/JPG/PNG格式并优化部署流程,实测性能超越传统72B级模型。

PDF解析的“火眼金睛”:重磅!MonkeyOCR发布,颠覆传统OCR

MonkeyOCR是一款轻量级高性能多模态大模型,在PDF文档解析任务中显著提升了文本、表格和公式的识别准确率与处理速度,超越了包括Gemini 2.5 Pro在内的多个顶级大模型。

MinerU v1.3.12:支持ppocrv5模型

MinerU v1.3.12版本更新:全面升级PP-OCRv5模型,优化手写文档识别能力,并支持更丰富的字符集(包括表情符号),同时保持对PP-OCRv4模型的兼容性。

MinerU MCP Server源码发布!打通大模型与MinerU,让 PDF 文档处理更 easy

本文详细介绍了MinerU MCP Server的架构、安装配置方法及使用场景,该服务作为连接大语言模型与文档处理工具的中间层,支持通过标准化协议实现PDF等文档的Markdown转换,并提供了本地与远程API两种部署方式及常见问题解决方案。

📖 MinerU Dify 插件超详细配置攻略,附工作流搭建案例

本文详细介绍了如何在Dify中配置和使用MinerU插件,以搭建高效的文档解析和问答工作流。

优化 RAG 知识库:告别 PDF 公式噩梦,拥抱 MinerU 的优雅

本文详细介绍了MinerU这一高效的开源工具及其在处理扫描文档和PDF中的应用,展示了如何将其输出转化为Markdown和EPUB格式以提升文档解析和阅读体验。

OCR 工具小横评:微信、Umi-OCR、MinerU、ABBYY FineReader 谁更胜一筹?

本文概述了MinerU作为一款高效的开源工具,如何处理扫描文档和PDF,并将其转化为Markdown和EPUB格式,以提升文档解析及阅读体验。

MinerU × CAMEL-AI:一键PDF提取,助力多智能体跨文档协作与深度分析

本文详细介绍了MinerU 成功集成于 CAMEL-AI 多智能体协作框架中,成为其支撑智能体的关键文档处理工具及数据加载器,开发者可以通过 MinerU API 将 PDF 文档秒级转化为结构化数据流,助力多智能体应用注入高质量的多模态数据。