NVIDIA-Ingest
N
NVIDIA Ingest
紹介 :
NVIDIA-Ingestは、拡張性が高く、高性能なドキュメントの内容とメタデータ抽出マイクロサービスです。PDF、Word、PowerPointドキュメントの解析に対応し、NVIDIA NIMマイクロサービスを使用してテキスト、表、グラフ、画像を検出し、コンテキスト化し、抽出します。下流の生成系アプリケーションで使用できます。主な利点として、高性能、高い拡張性、複数のドキュメントタイプと抽出方法への対応などが挙げられます。現在、アーリーアクセス段階にあり、コードベースは頻繁に更新されています。
ターゲットユーザー :
大量の複雑な非構造化PDFやその他のエンタープライズドキュメントを処理し、検索システムで使用できるメタデータとテキストに変換する必要がある組織や個人(企業データアナリスト、研究者など)が対象ユーザーです。様々なドキュメントから効率的かつ正確に有用な情報を抽出できるため、データ処理と分析におけるニーズを満たします。
総訪問数: 502.6M
最も高い割合の地域: US(19.34%)
ウェブサイト閲覧数 : 50.0K
使用シナリオ
企業が大量のビジネスドキュメントから重要な情報を抽出し、ナレッジグラフを構築する
研究機関が学術文献からデータを抽出し、研究活動を支援する
データアナリストが抽出したテキストデータを後続のデータ分析とマイニングに使用する
製品特徴
ドキュメントのペイロードとインジェストタスクを含むJSONジョブ記述を受け入れる
ジョブの結果を検索できます。結果は、抽出されたオブジェクトのメタデータと処理に関する注釈を含むJSON辞書です。
PDF、Docx、pptx、画像など、複数のドキュメントタイプに対応
PDFではpdfium、Unstructured.io、Adobe Content Extraction Servicesなど、ドキュメントタイプごとに複数の抽出方法に対応
テキスト分割、変換、フィルタリング、埋め込み生成などの前処理と後処理操作に対応
使用チュートリアル
1. NIMマイクロサービスを起動する
2. Python環境にNVIDIA Ingestクライアントの依存関係をインストールする
3. インジェストジョブを送信する
4. 結果を確認して使用する
5. 必要に応じて:ライブラリを直接デプロイする
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase