

Patronus GLIDER
紹介 :
Patronus GLIDERは、微調整済みのphi-3.5-mini-instructモデルに基づく汎用評価モデルです。ユーザー定義の基準と採点規則に基づいて、テキスト、会話、RAG設定を評価します。合成データとドメイン適応データを使用してトレーニングされており、金融や医療など183個の指標と685個の分野を網羅しています。最大シーケンス長は8192トークンですが、テストでは最大12000トークンの長いテキストにも対応可能です。
ターゲットユーザー :
テキスト、会話、機械学習モデルの出力評価が必要な研究者や開発者を対象としています。柔軟で多言語対応の評価ツールを提供し、ユーザー定義の採点規則に基づいてテキストと会話の品質を評価することで、モデルの精度と信頼性を向上させるのに役立ちます。
使用シナリオ
金融分野の対話システムの出力をGLIDERモデルで評価する。
医療分野のテキストの品質評価にGLIDERモデルを利用する。
教育分野の質疑応答システムにGLIDERモデルを適用し、回答の正確性と関連性を評価する。
製品特徴
英語を主として、韓国語、カザフ語、ヒンディー語など複数の言語に対応しています。
ユーザー定義の採点規則に基づいてテキストを評価します。
テスト済みで最大12000トークンの長文処理に対応しています。
会話データとRAGシステムの出力の評価に使用できます。
詳細な採点と推論出力形式を提供します。
任意の数の入力と出力をサポートし、データ構造は柔軟です。
モデル推論のコード例を提供し、ユーザーは容易に利用開始できます。
使用チュートリアル
1. Hugging Faceウェブサイトにアクセスし、Patronus GLIDERモデルのページに移動します。
2. 評価対象のデータタイプに応じて適切なデータ構造テンプレートを選択します。
3. モデル評価の基準となる合格基準(pass criteria)と評価基準(rubric)を定義します。
4. 選択したテンプレートにデータを入力し、モデルの入力形式要件に従っていることを確認します。
5. Hugging Faceが提供するpipelineコード例を使用してモデル推論を実行します。
6. 詳細な推論、キーワードリスト、最終的なスコアを含むモデル出力の結果を分析します。
7. モデル出力に基づいて合格基準または評価基準を調整し、評価効果を最適化します。
8. モデルを実際のテキスト、会話、またはRAGシステムの評価タスクに適用し、継続的な改善と最適化を行います。
おすすめAI製品

Deepmind Gemini
Geminiは、Google DeepMindが開発した次世代人工知能システムです。テキスト、画像、ビデオ、音声、コード間のシームレスな相互作用をサポートし、マルチモーダル推論を実行できます。言語理解、推論、数学、プログラミングなど、複数の分野において従来のシステムを凌駕し、現在までに開発された最も強力なAIシステムの一つとなっています。エッジコンピューティングからクラウドコンピューティングまで、様々なニーズに対応できる3つの異なる規模のバージョンがあります。Geminiは、クリエイティブデザイン、ライティングアシスタント、質問応答、コード生成など、幅広い分野で活用できます。
AIモデル
11.4M
中国語精選

Liblibai
LiblibAIは、中国をリードするAI創作プラットフォームです。強力なAI創作能力を提供し、クリエイターの創造性を支援します。プラットフォームは膨大な数の無料AI創作モデルを提供しており、ユーザーは検索してモデルを使用し、画像、テキスト、音声などの創作を行うことができます。また、ユーザーによる独自のAIモデルのトレーニングもサポートしています。幅広いクリエイターユーザーを対象としたプラットフォームとして、創作の機会を平等に提供し、クリエイティブ産業に貢献することで、誰もが創作の喜びを享受できるようにすることを目指しています。
AIモデル
6.9M