
Tabled
Tabled是一個用於檢測和提取表格的Python庫,它使用surya來識別PDF中的表格,識別行列,並能夠將單元格格式化為Markdown、CSV或HTML。這個工具對於數據科學家和研究人員來說非常有用,他們經常需要從PDF文檔中提取表格數據以進行進一步的分析。Tabled的主要優點包括高準確性的表格檢測和提取能力,支持多種輸出格式,以及易於使用的命令行界面。此外,它還提供了一個交互式的APP,允許用戶直觀地嘗試在圖像或PDF文件上使用Tabled。
AI數據挖掘
64.3K

Datamonkey
DataMonkey是一個創新的數據可視化平臺,它允許用戶通過聊天的方式調用公共數據集,實現Map式的數據分析和展示。該平臺以其直觀的導航和優雅的設計,為用戶提供了一個高效、創新的數據處理和展示方式。DataMonkey不僅支持無限量的數據可視化,還允許用戶上傳文件,整合開放數據,極大地提高了數據處理的靈活性和便捷性。
AI數據挖掘
49.4K

Knowledge Table
Knowledge Table 是一個開源工具包,旨在簡化從非結構化文檔中提取和探索結構化數據的過程。它通過自然語言查詢界面,使用戶能夠創建結構化的知識表示,如表格和圖表。該工具包具有可定製的提取規則、精細調整的格式化選項,並通過UI顯示的數據溯源,適應多種用例。它的目標是為業務用戶提供熟悉的電子表格界面,同時為開發者提供靈活且高度可配置的後端,確保與現有RAG工作流程的無縫集成。
AI數據挖掘
72.0K

Parseflow
Parseflow是一個數據自動化平臺,專注於通過先進的OCR和AI技術實現文檔數據的自動提取和結構化。它能夠顯著降低操作成本,提高工作效率,適用於從發票、合同到電子郵件和簡歷等多種文檔類型。該平臺易於集成,支持60多種語言,並提供安全的數據存儲。Parseflow的主要優點包括快速的數據提取、廣泛的文檔類型支持、多語言識別能力以及與6000多個應用的集成能力。它的目標是幫助企業釋放數據的潛力,提高運營效率。
AI數據挖掘
54.6K
優質新品

Sheetbot AI
SheetBot AI是一個利用人工智能技術,為用戶提供數據分析、可視化和數據轉換的一體化平臺。它通過簡化數據操作流程,允許用戶用自然語言提問,快速獲取AI驅動的洞察,並即時生成可視化結果。該產品通過自動化重複性的數據工作,節省用戶時間,提高工作效率。它支持上傳多種數據文件格式,包括但不限於電子表格,並提供高RAM環境以處理大型數據集。此外,SheetBot AI還強調數據安全性,確保用戶數據在傳輸和處理過程中的加密和隔離。
AI數據挖掘
57.7K

Kuration AI
Kuration AI是一個利用人工智能技術幫助用戶進行B2B研究的工具,它通過智能篩選和數據豐富化,幫助用戶快速從大量信息中提煉出有價值的商業線索。產品背景是幫助企業從混亂的數據中快速找到目標公司,提高工作效率,減少人力成本。Kuration AI提供不同層次的定價計劃,滿足不同規模企業的需求。
AI數據挖掘
46.1K
優質新品

Calcgen AI
CalcGen AI是一個基於人工智能的平臺,它允許用戶通過簡單的提示生成定製的交互式數據可視化。該技術的主要優點包括易用性、靈活性和高效的數據處理能力。它支持多種輸入選項,如變量、限制、類別、排序選項、過濾器等,並允許用戶分享或嵌入他們定製的可視化圖表到自己的網站。CalcGen AI的背景信息顯示,它目前處於測試階段,並且可能在某些iOS設備上遇到內存問題,建議用戶在Mac、PC或Android設備上使用。
AI數據挖掘
48.3K

Handinger
Handinger是一個提供數據提取服務的網站,它允許用戶通過HTTP端點輕鬆提取網頁內容,包括Markdown、截圖、元數據和HTML等格式。這種服務對於訓練大型語言模型、存儲內容或獲取網頁特定內容非常有用。Handinger的價格非常低廉,每URL的成本僅為0.0005美元,且每月前2000個URL免費,沒有前期成本,也無需複雜的API積分。該服務支持所有類型的網站,並且為用戶提供了慷慨的速率限制,每分鐘可進行1000次請求。
AI數據挖掘
44.2K

Chunkr
Chunkr是一個開源的數據攝取API服務,專注於文檔佈局分析、OCR和分塊處理,將文檔轉換成適合RAG和LLM的數據格式。支持PDF、DOC、PPT和XLS文件。該服務能夠將文本、表格、圖像和手寫內容進行結構化處理,為人工智能和機器學習應用提供數據支持。它由Lumina AI Inc.維護,並且提供免費試用和定價方案。
AI數據挖掘
58.0K
國外精選

Graphy
Graphy是一個數據可視化工具,它通過簡化數據呈現的方式,使得任何人都可以成為熟練的數據講述者。它強調數據的行動性、清晰性和美觀性,幫助用戶快速做出決策,減少會議和溝通的複雜性。Graphy以其快速、易用和美觀的結果,被80,000+數據驅動團隊所信賴。
AI數據挖掘
57.4K

Haiva Analytics Agent
Haiva Analytics Agent 是一款提供即時數據洞察的分析工具,通過連接多個數據庫和第三方應用程序,為企業提供即時訪問關鍵信息的能力,幫助團隊做出更快、更明智的決策。支持多種圖表類型,簡化數據可視化,幫助企業輕鬆識別趨勢和機會。自動化常規分析任務,通過無需編碼的自助服務平臺獲取更深入的洞察,確保企業保持敏捷、數據驅動和領先於競爭對手。
AI數據挖掘
53.5K

Amplitude Made Easy
Amplitude Made Easy 是一款數字分析工具,旨在通過簡化用戶體驗,使數據分析變得輕鬆而直觀。它提供了專家創建的模板、一鍵式代碼集成、無需工程介入即可追蹤任何事件等功能,幫助用戶快速獲取關於客戶行為的深入洞察。Amplitude 通過集成分析、實驗、會話回放和客戶數據平臺(CDP)於一體,無需額外插件,即可實現數據驅動的決策。此外,Amplitude 提供高達每月5萬次用戶跟蹤的免費服務,適合個人、探索者和早期初創公司使用。
AI數據挖掘
49.4K
中文精選

Finechatbi
FineChatBI是帆軟推出的一款AI驅動的對話式業務分析工具,它利用Text2DSL技術將用戶的自然語言問題轉化為可理解、可干預的指令,從而提供可控、結果可信、分析閉環、交互友好的業務分析體驗。該產品基於企業級BI能力底座,結合AI技術,大幅降低業務分析門檻,提升企業決策效率。
AI數據挖掘
159.5K

Docai
docai 是一個利用人工智能技術從非結構化文檔中提取結構化數據的模型。它集成了Answer.AI的Byaldi、OpenAI的gpt-4o以及Langchain的結構化輸出技術,能夠顯著提高文檔處理的效率和準確性。該模型主要面向需要處理大量文檔數據並從中提取有用信息的用戶,如法律、金融、醫療等行業的專業人士。
AI數據挖掘
48.9K

Data Juicer
Data-Juicer 是一個一站式的多模態數據處理系統,旨在為大型語言模型(LLMs)提供更高質量、更豐富、更易消化的數據。它提供了一個系統化和可複用的數據處理庫,支持數據與模型的協同開發,通過沙盒實驗室實現快速迭代,並提供基於數據和模型的反饋循環、可視化和多維度自動評估等功能,幫助用戶更好地理解和改進他們的數據和模型。Data-Juicer 正在積極更新和維護,定期增強和添加更多功能、數據配方和數據集。
AI數據挖掘
59.1K

LAMDA TALENT
LAMDA-TALENT是一個綜合的表格數據分析工具箱和基準測試平臺,它集成了20多種深度學習方法、10多種傳統方法以及300多個多樣化的表格數據集。該工具箱旨在提高模型在表格數據上的性能,提供強大的預處理能力,優化數據學習,並支持用戶友好和適應性強的操作,適用於新手和專家數據科學家。
AI數據挖掘
49.1K

Apigen
APIGen是一個自動化的數據生成管道,旨在為函數調用應用生成可驗證的高質量數據集。該模型通過三個層次的驗證過程確保數據的可靠性和正確性,包括格式檢查、實際函數執行和語義驗證。APIGen能夠規模化、結構化地生成多樣化的數據集,並通過實際執行API來驗證生成的函數調用的正確性,這對於提升函數調用代理模型的性能至關重要。
AI數據挖掘
58.0K
優質新品

Omniparse
OmniParse是一個數據解析平臺,能夠將各種非結構化數據轉換為結構化、可操作的數據,特別適用於通用人工智能(GenAI)應用。它支持文檔、表格、圖片、視頻、音頻文件和網頁等數據類型,通過提供清潔、結構化的數據,為人工智能應用如RAG、微調等做好準備。
AI數據挖掘
103.2K

Databonsai
databonsai是一個Python庫,利用大型語言模型(LLMs)執行數據清洗任務。它提供了一系列工具,包括數據分類、轉換和提取,以及對LLM輸出的驗證,支持批量處理以節省令牌,並且具備重試邏輯以處理速率限制和瞬時錯誤。
AI數據挖掘
72.0K

Fineweb
FineWeb數據集包含超過15萬億個經過清洗和去重的英文網頁數據,來源於CommonCrawl。該數據集專為大型語言模型預訓練設計,旨在推動開源模型的發展。數據集經過精心處理和篩選,以確保高質量,適用於各種自然語言處理任務。
AI數據挖掘
65.1K

Mygo
MyGO是一個用於多模態知識圖譜補全的工具,它通過將離散模態信息作為細粒度的標記來處理,以提高補全的準確性。MyGO利用transformers庫對文本標記進行嵌入,進而在多模態數據集上進行訓練和評估。它支持自定義數據集,並且提供了訓練腳本以復現實驗結果。
AI數據挖掘
75.3K

百度智能雲有解(GBI)
百度智能雲有解(GBI)是一款生成式商業智能產品。它將文心大模型融入BI場景,支持通過自然語言對話式交互執行數據查詢與分析,實現"任意表,隨便問",為企業客戶建立"對話即洞察"的數據分析新範式。主要功能包括任意表格即傳即問、自然語言數據查詢、專業知識注入和複雜計算邏輯等。產品優勢在於打破傳統預置模版限制,支持跨領域遷移應用場景。定價暫未公開,根據不同接入方案會有差異。
AI數據挖掘
70.7K

MNBVC
MNBVC(Massive Never-ending BT Vast Chinese corpus)是一個旨在為AI提供豐富中文語料的項目。它不僅包括主流文化內容,還涵蓋了小眾文化和網絡用語。數據集包括新聞、作文、小說、書籍、雜誌、論文、臺詞、帖子、wiki、古詩、歌詞、商品介紹、笑話、糗事、聊天記錄等多種形式的純文本中文數據。
AI數據挖掘
64.6K

Distil | Shopify App Store
Distil的先進AI將數據噪聲轉化為金塊,使您可以將業務數據和客戶分析轉化為可行的見解。深入研究您的客戶行為、營銷漏斗和群體銷售數據。解鎖頂級客戶細分和最有效的營銷渠道。獲取每日報告卡,顯示周對周銷售與預測、新客戶與重複客戶、客戶群體分析、產品銷售和營銷渠道表現。您不需要更多的數據,只需要Distil它。
AI數據挖掘
48.3K

Predicteasy
PredictEasy是一個集成的無代碼AI數據分析平臺,提供一系列分析工具,幫助用戶分析和理解他們的數據。PredictEasy具有強大的AutoML功能,可以自動構建和選擇最佳的機器學習模型,即使用戶沒有機器學習專業知識,也能獲得準確的預測和預測結果。此外,PredictEasy還包括審計和描述工具,幫助用戶瞭解數據的特徵並識別潛在問題或偏見。總體而言,PredictEasy是一個全面的數據分析平臺,為用戶提供各種功能和能力,幫助他們充分利用數據,無論你是數據科學家、業務分析師還是需要定期處理數據的人,PredictEasy都能幫助你獲得所需的洞察力。
AI數據挖掘
56.0K

From Chaos
From Chaos是一個Chrome插件,可以將網頁內容轉化為有組織的數據。通過ChatGPT的能力,您可以輸入您的OpenAI API密鑰,在所需頁面上點擊插件,描述您想要的數據類型,並選擇數據類型(如JSON、YAML、CSV等)來下載數據。
AI數據挖掘
43.6K

Browse AI: Fast Web Scraping & Monitoring
Browse AI是一款無需編碼的工具,可以在2分鐘內訓練一個機器人來抓取任何網站的數據。您可以使用簡單的點-and-click界面設置網頁抓取自動化任務,將數據下載為電子表格或與Google表格同步,定時運行任務並監控數據變化。您還可以使用Zapier集成或REST API和Webhooks將數據流入任何其他軟件,甚至可以將任何網站轉化為API。Browse AI可幫助您節省大量時間和精力,提高工作效率。
AI數據挖掘
80.3K
國外精選

Formx.ai
FormX.ai是一個從物理文檔中提取數字化結構化數據的AI服務。它使用OCR、正則表達式和AI技術,可以方便的從各類文檔中提取結構化數據,比如發票、收據、購貨單、銀行對賬單、合同協議、HR表格、裝運單、會員卡申請等。它提供了預配置的通用數據提取模型,並且可以通過API和Web門戶使用。它還可以優化手機拍攝的文檔照片,提高數據提取準確率。FormX.ai可以大大簡化數據錄入流程,提高工作效率。
AI數據挖掘
40.0K

Rath By Kanarie
Kanaries RATH是一款AI增強的數據探索工具,可以幫助您自動發現模式和洞察,並從多維數據中生成圖表和儀表板。它使用AI增強引擎來自動化數據分析工作流程。
AI數據挖掘
48.9K

Flowpoint
Flowpoint AI是一款基於人工智能的分析工具,通過數據驅動的決策,優化轉化率,提升ROI。它能夠提供有價值的見解,幫助您充分發揮網站的潛力。
AI數據挖掘
39.2K
- 1
- 2
精選AI產品推薦
中文精選

騰訊混元圖像 2.0
騰訊混元圖像 2.0 是騰訊最新發布的 AI 圖像生成模型,顯著提升了生成速度和畫質。通過超高壓縮倍率的編解碼器和全新擴散架構,使得圖像生成速度可達到毫秒級,避免了傳統生成的等待時間。同時,模型通過強化學習算法與人類美學知識的結合,提升了圖像的真實感和細節表現,適合設計師、創作者等專業用戶使用。
圖片生成
80.6K
國外精選

Lovart
Lovart 是一款革命性的 AI 設計代理,能夠將創意提示轉化為藝術作品,支持從故事板到品牌視覺的多種設計需求。其重要性在於打破傳統設計流程,節省時間並提升創意靈感。Lovart 當前處於測試階段,用戶可加入等候名單,隨時體驗設計的樂趣。
AI設計工具
63.8K

Fastvlm
FastVLM 是一種高效的視覺編碼模型,專為視覺語言模型設計。它通過創新的 FastViTHD 混合視覺編碼器,減少了高分辨率圖像的編碼時間和輸出的 token 數量,使得模型在速度和精度上表現出色。FastVLM 的主要定位是為開發者提供強大的視覺語言處理能力,適用於各種應用場景,尤其在需要快速響應的移動設備上表現優異。
AI模型
51.1K

Keysync
KeySync 是一個針對高分辨率視頻的無洩漏唇同步框架。它解決了傳統唇同步技術中的時間一致性問題,同時通過巧妙的遮罩策略處理表情洩漏和麵部遮擋。KeySync 的優越性體現在其在唇重建和跨同步方面的先進成果,適用於自動配音等實際應用場景。
視頻編輯
48.3K

Manus
Manus 是由 Monica.im 研發的全球首款真正自主的 AI 代理產品,能夠直接交付完整的任務成果,而不僅僅是提供建議或答案。它採用 Multiple Agent 架構,運行在獨立虛擬機中,能夠通過編寫和執行代碼、瀏覽網頁、操作應用等方式直接完成任務。Manus 在 GAIA 基準測試中取得了 SOTA 表現,展現了強大的任務執行能力。其目標是成為用戶在數字世界的‘代理人’,幫助用戶高效完成各種複雜任務。
個人助理
1.5M

Trae國內版
Trae是一款專為中文開發場景設計的AI原生IDE,將AI技術深度集成於開發環境中。它通過智能代碼補全、上下文理解等功能,顯著提升開發效率和代碼質量。Trae的出現填補了國內AI集成開發工具的空白,滿足了中文開發者對高效開發工具的需求。其定位為高端開發工具,旨在為專業開發者提供強大的技術支持,目前尚未明確公開價格,但預計會採用付費模式以匹配其高端定位。
開發與工具
137.7K
國外精選

Pika
Pika是一個視頻製作平臺,用戶可以上傳自己的創意想法,Pika會自動生成相關的視頻。主要功能有:支持多種創意想法轉視頻,視頻效果專業,操作簡單易用。平臺採用免費試用模式,定位面向創意者和視頻愛好者。
視頻生成
18.7M
中文精選

Liblibai
LiblibAI是一箇中國領先的AI創作平臺,提供強大的AI創作能力,幫助創作者實現創意。平臺提供海量免費AI創作模型,用戶可以搜索使用模型進行圖像、文字、音頻等創作。平臺還支持用戶訓練自己的AI模型。平臺定位於廣大創作者用戶,致力於創造條件普惠,服務創意產業,讓每個人都享有創作的樂趣。
AI模型
8.0M