
高效的多格式文档解析和转换工具
Docling是一个多功能的文档解析工具,支持解析PDF、DOCX、PPTX等常见格式,并可输出为Markdown和JSON格式。其PDF高级功能涵盖页面布局分析、阅读顺序和表格结构识别。工具提供统一的DoclingDocument表示格式,支持与LlamaIndex和LangChain的集成,适合信息检索和问答应用。此外,它支持扫描PDF的OCR,并提供便捷的命令行工具。即将支持方程、代码和元数据的提取。安装简单,兼容多平台和多架构。详情请参阅在线文档。

将PDF文档中的版式与表格结构自动识别的开源模型

多格式文档转Markdown工具 支持本地和S3文件

基于LLM的智能PDF解析与内容分析工具包

多语言文档智能翻译平台

基于LLM的智能文档转换和处理框架

多语言在线文档翻译服务平台

多功能文档交互与知识共享平台

多格式文档智能分析与交互平台

PDF文本提取与优化工具 支持多种OCR引擎

智能文档管理系统简化家庭和小型组织文件整理