该文档介绍了如何使用 OmniDocBench 框架评估 Gemini-2.0-flash-exp 模型在文档解析任务中的表现,并提供了模型推理、评测流程及最终与其他模型对比的评测结果。
这是MinerU的技术报告,介绍了MienrU这个用于高精度文档内容提取的开源解决方案。 MinerU 利用先进的 PDF-Extract-Kit 模型有效地从各种文档中提取内容,并采用精细调整的预处理和后处理规则来确保最终结果的准确性。