llama-ocr
L
Llama Ocr
簡介 :
開源 npm 庫,免費使用 Llama 3.2 Vision 進行 OCR,支持本地和遠程圖像,計劃支持 PDF,受 Zerox 啟發,有免費和付費接口
需求人群 :
開發者和需圖像文字識別的個人或企業,低成本免費,適合處理不同類型文檔圖像
總訪問量: 7.9M
佔比最多地區: IN(18.26%)
本站瀏覽量 : 70.7K
使用場景
開發者集成實現圖像文本自動識別提取
企業自動化處理紙質文檔
個人提取圖片重要信息
產品特色
支持本地 圖像 OCR
支持遠程圖像 OCR
計劃支持單頁 PDF 的 OCR
計劃支持多頁 PDF 的 OCR
將圖像解析為 markdown 格式文本
提供免費和付費模型選項
未來可能支持 JSON 輸出
使用教程
1. 安裝:npm i llama-ocr
2. 導入模塊
3. 設置 API 密鑰
4. 使用 OCR 功能
5. 處理結果
6. 選擇不同模型
7. 監控和優化
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase