公告
🎉感谢续我命的奶茶钱!🎉
notion image
🌹 MinerU 资源汇总及博客说明

MienrU各类资源汇总及开设这个博客的初衷

📖 MinerU Dify 插件超详细配置攻略,附工作流搭建案例

本文详细介绍了如何在Dify中配置和使用MinerU插件,以搭建高效的文档解析和问答工作流。

优化 RAG 知识库:告别 PDF 公式噩梦,拥抱 MinerU 的优雅

本文详细介绍了MinerU这一高效的开源工具及其在处理扫描文档和PDF中的应用,展示了如何将其输出转化为Markdown和EPUB格式以提升文档解析和阅读体验。

OCR 工具小横评:微信、Umi-OCR、MinerU、ABBYY FineReader 谁更胜一筹?

本文概述了MinerU作为一款高效的开源工具,如何处理扫描文档和PDF,并将其转化为Markdown和EPUB格式,以提升文档解析及阅读体验。

【第三方评测】使用 OmniDocBench 对 Gemini-2.0-flash-exp 进行评测

该文档介绍了如何使用 OmniDocBench 框架评估 Gemini-2.0-flash-exp 模型在文档解析任务中的表现,并提供了模型推理、评测流程及最终与其他模型对比的评测结果。

MinerU 技术报告(原文)

这是MinerU的技术报告,介绍了MienrU这个用于高精度文档内容提取的开源解决方案。 MinerU 利用先进的 PDF-Extract-Kit 模型有效地从各种文档中提取内容,并采用精细调整的预处理和后处理规则来确保最终结果的准确性。

MinerU 评测集 OmniDocBench 技术报告(原文)

这是OmniDocBench评测集的技术报告,介绍了这包含跨九种文档来源的高质量全面标注的新型基准,它通过支持灵活的多层次评估,旨在为PDF文档解析提供公平、多样化且细粒度的评测,以解决现有基准在文档类型覆盖和评估程序方面的局限性。

MinerU × CAMEL-AI:一键PDF提取,助力多智能体跨文档协作与深度分析

本文详细介绍了MinerU 成功集成于 CAMEL-AI 多智能体协作框架中,成为其支撑智能体的关键文档处理工具及数据加载器,开发者可以通过 MinerU API 将 PDF 文档秒级转化为结构化数据流,助力多智能体应用注入高质量的多模态数据。

介绍一款基于 MinerU 的PDF翻译工具

本文介绍了一款基于MinerU的PDF翻译工具Fast PDF Translate,它可以将PDF文件翻译成中文markdown并生成中文PDF。

【MinerU × LazyLLM】PDF 无损拆包,让 RAG 更懂你的文章!附 PDF 解析组件选型与 RAG 案例分享

本文介绍了MinerU和LazyLLM的结合,实现PDF无损拆包和RAG应用,提供了PDF解析组件选型和RAG案例分享,展示了MinerU在PDF解析中的优势和LazyLLM在RAG应用中的灵活性。