

360layoutanalysis
简介 :
360LayoutAnalysis是由360 AI研究院开发的一系列文档分析模型和数据集,专注于文档版式分析,即从扫描的文档图像中识别和提取文本、图像、表格和其他元素。这项技术对于自动化文档处理、电子数据交换、历史文档数字化等领域至关重要。模型采用深度学习和模式识别技术,通过训练数据集提高对文档结构的理解能力,尤其注重段落的标注,以支持文本的语义理解和信息提取。
需求人群 :
目标受众为需要进行文档自动化处理、电子数据交换和历史文档数字化的企业和研究机构。该产品特别适合于需要高精度文档版式分析和信息提取的领域,如法律、金融、医疗和教育等。
使用场景
法律文档的自动化整理和信息提取。
金融研报的结构化分析和关键数据提取。
历史文档的数字化和信息保存。
产品特色
支持中文论文、英文论文、中文研报三个垂直领域及通用场景模型。
轻量化推理快速,基于yolov8训练,单模型大小仅为6.23MB。
中文论文场景包含段落信息,有助于文本的语义理解和信息提取。
中文研报场景和通用场景基于数万级别高质量数据训练。
开源模型支持商用,可通过官方邮箱申请商业用途许可。
提供详细的使用说明和代码示例,便于用户快速上手。
使用教程
1. 下载并安装所需的Python环境和依赖库。
2. 从提供的权重下载地址获取模型权重文件。
3. 准备待预测的文档图像。
4. 使用提供的代码示例初始化YOLO模型并加载权重。
5. 设置图片路径和模型路径,调用模型进行预测。
6. 根据需要调整置信度阈值和其他参数,获取预测结果。
7. 分析预测结果,提取文档中的文本、图像、表格等信息。
精选AI产品推荐

腾讯文档智能助手
腾讯文档智能助手正式开启公测,可与Word、Excel、PPT等多品类文档进行智能互动,支持内容秒级生成,实现数据处理、版式美化等创作辅助功能。主要优势有:可基于标题或描述生成多类型文档内容,支持函数公式应用、数据处理、表格自动化等能力,实现 PPT 一键美化,可快速提取 PDF 文档摘要等,让文档内容实现跨品类畅通流转。
AI文档工具
525.8K

Lexy
Lexy是一款基于AI技术的图像文字提取工具。它可以自动识别图像中的文字,并将其提取出来,方便用户进行后续处理和分析。Lexy具有高准确性和快速的识别速度,适用于各种图像文字提取场景。无论是需要从图片中提取文字的个人用户,还是需要进行大规模图像文字处理的企业用户,Lexy都可以满足您的需求。
AI图像检测识别
271.6K