

YOLO World
紹介 :
YOLO-Worldは、You Only Look Once (YOLO)シリーズの検出器をベースに、視覚言語モデルと大規模データセットによる事前学習によって、オープンボキャブラリー検出能力を強化した、高度なリアルタイムオープンボキャブラリー物体検出器です。再パラメータ化可能な視覚言語パスアグリゲーションネットワーク(RepVL-PAN)と領域テキストコントラスト損失を採用することで、視覚情報と言語情報の相互作用を促進しています。YOLO-Worldは、ゼロショット方式で様々な物体を効率的に検出し、高い効率性を備えています。チャレンジングなLVISデータセットにおいて、YOLO-WorldはV100上で35.4 APと52.0 FPSを実現し、精度と速度の両面で多くの最先端手法を凌駕しています。さらに、ファインチューニングされたYOLO-Worldは、物体検出やオープンボキャブラリーインスタンスセグメンテーションを含む、多くの下流タスクで優れた性能を発揮します。
ターゲットユーザー :
物体検出とオープンボキャブラリーインスタンスセグメンテーションに適用可能
使用シナリオ
1. YOLO-Worldを用いてリアルタイムオープンボキャブラリー物体検出を実現する。
2. LVISデータセットでYOLO-Worldによるゼロショット推論を行う。
3. YOLO-Worldを用いて物体検出とオープンボキャブラリーインスタンスセグメンテーションを行う。
製品特徴
リアルタイムオープンボキャブラリー物体検出
ゼロショット方式による様々な物体の効率的な検出
高効率、高速処理
おすすめAI製品

Deepmind Gemini
Geminiは、Google DeepMindが開発した次世代人工知能システムです。テキスト、画像、ビデオ、音声、コード間のシームレスな相互作用をサポートし、マルチモーダル推論を実行できます。言語理解、推論、数学、プログラミングなど、複数の分野において従来のシステムを凌駕し、現在までに開発された最も強力なAIシステムの一つとなっています。エッジコンピューティングからクラウドコンピューティングまで、様々なニーズに対応できる3つの異なる規模のバージョンがあります。Geminiは、クリエイティブデザイン、ライティングアシスタント、質問応答、コード生成など、幅広い分野で活用できます。
AIモデル
11.4M
中国語精選

Liblibai
LiblibAIは、中国をリードするAI創作プラットフォームです。強力なAI創作能力を提供し、クリエイターの創造性を支援します。プラットフォームは膨大な数の無料AI創作モデルを提供しており、ユーザーは検索してモデルを使用し、画像、テキスト、音声などの創作を行うことができます。また、ユーザーによる独自のAIモデルのトレーニングもサポートしています。幅広いクリエイターユーザーを対象としたプラットフォームとして、創作の機会を平等に提供し、クリエイティブ産業に貢献することで、誰もが創作の喜びを享受できるようにすることを目指しています。
AIモデル
6.9M