本地部署 | 分类 | MinerU小站

MinerU小站

部署｜教程｜非官网

使用教程

使用难题

笔记随想

工作的窗户纸

分类
本地部署 (11)
Saaas服务 (5)
疑难杂症 (4)
需要看repo (4)
思维高地 (7)
产品调研 (3)

|

MinerU发布v2.0版本，通过仅0.9B参数的VLM模型实现文档解析效果突破，支持PDF/JPG/PNG格式并优化部署流程，实测性能超越传统72B级模型。

|

MonkeyOCR是一款轻量级高性能多模态大模型，在PDF文档解析任务中显著提升了文本、表格和公式的识别准确率与处理速度，超越了包括Gemini 2.5 Pro在内的多个顶级大模型。

|

MinerU v1.3.12版本更新：全面升级PP-OCRv5模型，优化手写文档识别能力，并支持更丰富的字符集（包括表情符号），同时保持对PP-OCRv4模型的兼容性。

|

本文详细介绍了MinerU MCP Server的架构、安装配置方法及使用场景，该服务作为连接大语言模型与文档处理工具的中间层，支持通过标准化协议实现PDF等文档的Markdown转换，并提供了本地与远程API两种部署方式及常见问题解决方案。

|

本文详细介绍了如何在Dify中配置和使用MinerU插件，以搭建高效的文档解析和问答工作流。

|

项目无需安装部署，解压即用

|

本文详细介绍了MinerU这一高效的开源工具及其在处理扫描文档和PDF中的应用，展示了如何将其输出转化为Markdown和EPUB格式以提升文档解析和阅读体验。

|

本文概述了MinerU作为一款高效的开源工具，如何处理扫描文档和PDF，并将其转化为Markdown和EPUB格式，以提升文档解析及阅读体验。

|

本文需要输入密码才可访问

|

本文详细介绍了MinerU 成功集成于 CAMEL-AI 多智能体协作框架中，成为其支撑智能体的关键文档处理工具及数据加载器，开发者可以通过 MinerU API 将 PDF 文档秒级转化为结构化数据流，助力多智能体应用注入高质量的多模态数据。