llama-ocr
L
Llama Ocr
简介 :
开源 npm 库,免费使用 Llama 3.2 Vision 进行 OCR,支持本地和远程图像,计划支持 PDF,受 Zerox 启发,有免费和付费接口
需求人群 :
开发者和需图像文字识别的个人或企业,低成本免费,适合处理不同类型文档图像
总访问量: 7.9M
占比最多地区: IN(18.26%)
本站浏览量 : 73.7K
使用场景
开发者集成实现图像文本自动识别提取
企业自动化处理纸质文档
个人提取图片重要信息
产品特色
支持本地 图像 OCR
支持远程图像 OCR
计划支持单页 PDF 的 OCR
计划支持多页 PDF 的 OCR
将图像解析为 markdown 格式文本
提供免费和付费模型选项
未来可能支持 JSON 输出
使用教程
1. 安装:npm i llama-ocr
2. 导入模块
3. 设置 API 密钥
4. 使用 OCR 功能
5. 处理结果
6. 选择不同模型
7. 监控和优化
AIbase
智启未来,您的人工智能解决方案智库
© 2025AIbase