
使用场景
用于识别和转录历史文献中的手写文本。
在医疗领域,用于识别医生的手写处方。
在教育领域,用于自动评分学生的手写作业。
产品特色
基于DINO-DETR的改进模型,用于文本识别和字符检测。
在合成数据上预训练,提高模型的泛化能力。
使用CTC损失在真实数据集上进行微调,优化模型性能。
支持多种语言和字符集,包括拉丁文、法文、德文和中文。
提供预训练模型和微调模型的权重文件。
包含N-gram模型,用于评估和提高识别准确性。
提供详细的安装和使用指南,方便用户快速上手。
使用教程
1. 克隆代码库到本地环境。
2. 创建虚拟环境并安装所需的Python依赖。
3. 根据指南安装与系统和CUDA版本兼容的Pytorch。
4. 将数据集放置在指定的文件夹中,并进行必要的预处理。
5. 下载预训练模型权重,并放置在适当的目录下。
6. 使用提供的脚本进行模型的微调。
7. 使用评估脚本在不同数据集上评估模型性能。
8. 根据需要,训练自己的N-gram模型以进一步提高识别准确性。
精选AI产品推荐

Deepmind Gemini
Gemini是谷歌DeepMind推出的新一代人工智能系统。它能够进行多模态推理,支持文本、图像、视频、音频和代码之间的无缝交互。Gemini在语言理解、推理、数学、编程等多个领域都超越了之前的状态,成为迄今为止最强大的AI系统之一。它有三个不同规模的版本,可满足从边缘计算到云计算的各种需求。Gemini可以广泛应用于创意设计、写作辅助、问题解答、代码生成等领域。
AI模型
11.4M
中文精选

Liblibai
LiblibAI是一个中国领先的AI创作平台,提供强大的AI创作能力,帮助创作者实现创意。平台提供海量免费AI创作模型,用户可以搜索使用模型进行图像、文字、音频等创作。平台还支持用户训练自己的AI模型。平台定位于广大创作者用户,致力于创造条件普惠,服务创意产业,让每个人都享有创作的乐趣。
AI模型
8.0M