🌹 MinerU 资源汇总及博客说明

MienrU各类资源汇总及开设这个博客的初衷

MinerU MCP Server源码发布!打通大模型与MinerU,让 PDF 文档处理更 easy

本文详细介绍了MinerU MCP Server的架构、安装配置方法及使用场景,该服务作为连接大语言模型与文档处理工具的中间层,支持通过标准化协议实现PDF等文档的Markdown转换,并提供了本地与远程API两种部署方式及常见问题解决方案。

Doc2X:文档解析与翻译转换的AI全方位解决方案

Doc2X文档解析工具支持PDF/图片转多种格式,提供API接口和双语对照功能,适用于学术和企业场景。

Windows11本地安装MinerU对扫描版pdf做预解析后提升Dify知识库识别率

通过MinerU对扫描版PDF进行智能解析预处理,成功解决Dify知识库对教材内容识别率低的问题,让AI准确召回四年级数学公式和语文诗词考点。

MinerU 本地部署保姆级“喂饭”教程

本文提供了MinerU本地部署的详细教程,包括环境配置、模型下载、CUDA加速配置、API服务配置等步骤,并附有卸载和删除环境的方法,旨在帮助用户成功部署MinerU并进行PDF文档解析。

📖 MinerU Dify 插件超详细配置攻略,附工作流搭建案例

本文详细介绍了如何在Dify中配置和使用MinerU插件,以搭建高效的文档解析和问答工作流。

【第三方评测】使用 OmniDocBench 对 Gemini-2.0-flash-exp 进行评测

该文档介绍了如何使用 OmniDocBench 框架评估 Gemini-2.0-flash-exp 模型在文档解析任务中的表现,并提供了模型推理、评测流程及最终与其他模型对比的评测结果。

MinerU 技术报告(原文)

这是MinerU的技术报告,介绍了MienrU这个用于高精度文档内容提取的开源解决方案。 MinerU 利用先进的 PDF-Extract-Kit 模型有效地从各种文档中提取内容,并采用精细调整的预处理和后处理规则来确保最终结果的准确性。