世界の優れたAI製品を発見し、未来を拓く

厳選された20,382以上のAIツールを毎日お届け

最新

人気

閲覧数

フィルター

カテゴリ

タイプ

推奨

言語

選択された条件:

リセット

2797件の商品が一致しました

最新

人気

閲覧数

OmniAvatar

OmniAvatarは先進的な音声駆動の動画生成モデルであり、高品質なバーチャルキャラクターのアニメーションを生成できます。その重要性は音声と視覚のコンテンツを組み合わせることにより、効率的な身体のアニメーションを実現することにあります。これはさまざまなアプリケーションシナリオに適しています。この技術はディープラーニングアルゴリズムを使用し、高精度なアニメーション生成を実現し、多様な入力形式をサポートしており、映画、ゲーム、ソーシャルメディア分野に定位しています。このモデルはオープンソースであり、技術の共有と応用を促進しています。

動画アニメーション

OmniGen2

OmniGen2は、ビジュアル言語モデルと拡散モデルを組み合わせた効率的なマルチモーダル生成モデルで、視覚理解、画像生成、および編集などの機能を備えています。オープンソースの特性により、研究者や開発者に対して強力な基礎を提供し、カスタマイズ可能なAIの探索を支援します。

Kimi-Dev

Kimi-Dev は強力なオープンソースコード LLM で、ソフトウェアエンジニアリングの問題を解決することを目指しています。大規模な強化学習を経て最適化され、現実の開発環境での正確さと堅牢性を保証します。Kimi-Dev-72B は SWE-bench バenchmark で 60.4% のパフォーマンスを達成し、他のオープンソースモデルを上回り、現在最も先進的なコード LLM の一つです。このモデルは Hugging Face と GitHub でダウンロードおよびデプロイが可能で、開発者や研究者向けに設計されています。

プログラミング

PandaWiki

PandaWiki は AI大モデルに基づくオープンソース知識ベース構築システムであり、ユーザーが効率的に製品ドキュメントや技術ドキュメントを構築することを支援します。その主な強みは、AI技術を用いて知的創作、質問応答、検索能力を提供する点にあります。これにより、ドキュメントの管理とユーザーエクスペリエンスを大幅に向上させます。AIを活用して作業効率を高めたいチームや企業に最適です。

Claude Code + Gemini MCP

Claude Code + Gemini MCP

Claude Code + Gemini MCPは、Claude CodeとGoogleのGemini AIを接続するプラグインです。これにより、ユーザーはClaude Codeを通じて強力なAI協力を可能にします。ユーザーはGeminiに対して質問したり、コードレビューを行ったり、ブレインストーミングを行うことが可能です。このプラグインではPythonとClaude Code CLIのインストールが要求され、簡単なインストールと使用手順が提供されています。これは開発者やプログラマー向けのツールであり、コードの質の向上やアイディアの革新を促進します。

AlphaOne

AlphaOne（α1）は、テスト時の大型推論モデル（LRMs）の思考プロセスを調整する汎用フレームワークです。α 時刻を導入し、遅い推論から早い推論への柔軟な調整を実現しました。これは既存の単調なスケーリング手法を統合?拡張し、推論能力と計算効率を最適化しています。この製品は複雑な推論タスクに取り組む研究者や開発者に適しています。

Chatterbox AI

Resemble AI が提供する最初のオープンソースのプロダクショングレードテキスト-to-音声(TTS)モデルである Chatterbox は、卓越したパフォーマンスと安定性を誇っています。閉じられた高級システムと比較しても優れた効果があります。このモデルのユニークな点は感情の強調コントロールが可能であり、ビデオ、ゲーム、AIアシスタントなど、さまざまなシナリオに対応できる点です。また、価格競争力があり、超低遅延で生産用途にも最適です。

テキスト-to-音声

Memvid

Memvid は革命的なAIメモリ管理ソリューションであり、テキストデータをビデオにエンコードすることで、何百万ものテキストブロックに対する高速なセmanticサーチを可能にします。従来のベクトルデータベースよりも効率的で、データ量が小さく、データベースがない場合でも情報を迅速にアクセスできます。本製品の価格は無料で、知識管理や情報検索の効率を高めることを目的としています。

DeepSeek R1-0528

Deepseek R1 0528

DeepSeek R1-0528は、有名なオープンソース大規模モデルプラットフォームであるDeepSeekが发布的にリリースした最新バージョンです。自然言語処理とプログラミングの高い性能があります。プログラミングタスクでの優れたパフォーマンスにより、複雑な問題にも正確に応答できることが注目を集めています。このモデルには多くのシナリオで適用可能な機能があり、開発者やAI研究者にとって重要なツールとなっています。今後、さらなる詳細なモデル情報や使用ガイドラインが公開されると予想されており、機能や適用範囲が強化される予定です。

Magentic-UI

Magentic-UI はマルチエージェントシステムに基づく研究のプロトタイプです。ユーザーは透過的でコントロール可能なインターフェースを通じてネットワークブラウジングやタスクの自動化を行えます。その主な利点は、人と機械間のインタラクションの効率を向上させながら、ユーザーに自動化プロセスに対するコントロールを提供することです。この製品は複雑なオンラインタスクを遂行するために設計されており、さまざまな操作やカスタマイズ設定に対応できます。

ヒューマンコンピュータインタラクション

Blip 3o

Blip 3o は Hugging Face プラットフォームを基盤とするアプリケーションで、先進的な生成モデルを利用してテキストから画像を生成したり、既存の画像に関する分析結果や答えを提供したりします。この製品はユーザーにとって強力な画像生成と理解の能力を提供し、デザイナー、アーティスト、および開発者の間で非常に人気があります。この技術の主な利点は、その高速な画像生成速度と質の高い生成結果です。また、複数の入力形式をサポートしているため、ユーザーエクスペリエンスが向上しています。この製品は無料であり、広く一般のユーザーに公開されています。

Bright Data MCP

Bright Data MCP

Bright Data MCP は、強力なモデルコンテキストプロトコルサーバーであり、AIエージェントやアプリケーションがリアルタイムでウェブデータにアクセスし抽出できるようにします。その主な利点は、地理的な制限やサイト検出を回避できること、ネットワークデータへの障害のないアクセスを提供することです。これらの機能により、AI のデータ収集と情報検索能力が大幅に向上されます。この製品は、リアルタイムで信頼性の高いウェブデータを必要とするビジネスユーザー向けに設計されており、価格は需要に基づいて課金され、新規ユーザーには無料試用額が提供されます。

データ分析

高品質新製品

Index-AniSora

Index-AniSoraはBilibiliから公開された最先端のアニメーションビデオ生成モデルであり、AniSora技術に基づいています。複数の二次元スタイルのビデオショット（例：海外アニメ、中国アニメ、漫画アレンジアニメ、VTuber、アニメPV、バカ動画など）をワンクリックで生成できます。このモデルは強化学習技術フレームワークを採用し、アニメーションコンテンツの生産性と品質を大幅に向上させます。その技術原理はIJCAI2025で受理されました。Index-AniSoraの公開はアニメーションビデオ生成分野での新しい技術的突破をもたらし、開発者やクリエイターに強力なツールを提供し、二次元コンテンツ創出のさらなる発展を推進します。

ビデオ制作

WorldPM-72B

WorldPM-72B は、大規模な学習によって得られた統合嗜好モデリングモデルであり、優れた汎用性と高い表現能力を持っています。このモデルは 1500 万件以上の嗜好データに基づいており、客観的な知識に関する嗜好認識において大きな可能性を示しています。より質の高いテキストコンテンツの生成に使用でき、特に執筆分野において重要な応用価値を持っています。

自然言語処理

高品質新製品

ミ positional Agent

ミ Positional Agent

ミ positional Agent は、ブラウザと連携でき、深い研究、自動計画などの機能を持つ簡潔でありながら強力な代理フレームワークです。複雑なタスクや研究を行うユーザーに適しています。開発者はこのフレームワークを使ってさまざまなモデルやツールを簡単に統合できます。このフレームワークは作業効率を高め、ユーザーに便利な体験をもたらし、さまざまな科学研究や商業用途に最適です。この製品はオープンソースであり、ユーザーは自由に使用や改造が可能です。

DICE-Talk

DICE-Talk は高度な感情対話姿面生成技術であり、多様な感情表現を生成できます。この技術は拡散モデルを使用してアイデンティティと感情を分離し、リアリスティックで多彩な出力を提供します。その重要性は、仮想キャラクター、アニメーション、ゲーム、ソーシャルメディアなどの分野に高いインタラクティブ性と表現力をもたらし、研究および開発に適しています。

仮想アバター

arxiv_summarizer

Arxiv Summarizer

この製品は、Gemini API を使って arXiv の研究論文を取得?要約する Python スクリプトです。研究者、学生、愛好家の皆様に最新情報を簡単に抽出?確認してもらうことを目的としています。冗長な文献を読む時間を大幅に短縮します。このツールは個人だけでなくチームにも適しており、文献検索の効率を改善するための自動化にも役立ちます。製品は無料で、簡単にインストールと設定が可能です。

OpenMemory MCP

OpenMemoryはオープンソースの個人向けメモリレイヤーで、大規模言語モデル（LLM）に私密でポータブルなメモリ管理を提供します。ユーザーはデータに対する完全な制御権を持ち、AIアプリケーションを作成する際も安全性を保つことができます。このプロジェクトはDocker、Python、Node.jsをサポートしており、開発者が個別化されたAI体験を行うのに適しています。また、個人情報を漏らすことなくAIを利用したいユーザーにお勧めします。

オープンソース

AgentCPM-GUI

AgentCPM-GUI はオープンソースのモバイル端末向け大規模言語モデル（LLM）エージェントで、中英語のアプリケーションを操作するために設計されています。ユーザーがスクリーンショットを提供することで、自動的にタスクを実行することができます。その主な特長は、効果的な GUI 要素理解、高度な推論能力、および中国語アプリケーションへの正確なサポートです。この技術の目的は、モバイル端末上のエージェントのユーザーエクスペリエンスを向上させ、特に複雑なタスク処理において力を発揮します。この商品はモバイル端末での生産性を向上させるための位置づけで、あらゆる種類のユーザーに適合します。

インテリジェントエージェント

MNN-LLM Android App

MNN LLM Android App

MNN-LLM は、モバイルデバイスおよびローカルPCでの大規模言語モデルの展開を最適化し、高速化するための効率的な推論フレームワークです。モデルの量子化、ハイブリッドメモリー、ハードウェア固有の最適化によって、高メモリ消費と計算コストの問題に対処します。CPUベンチマークテストでは、他のフレームワークに比べて卓越した性能を示し、プライバシープロテクションと効率的な推論を必要とするユーザーに理想的です。

DreamO

DreamO は高い忠実度と柔軟性を持つ先進的な画像カスタマイズモデルです。このフレームワークは VAE 特徴エンコーディングを組み合わせており、さまざまな入力に対応し、特にキャラクターのアイデンティティ保持に優れています。コンシューマー級GPUに対応しており、8ビット量子化やCPUオフロード機能もサポートされており、異なるハードウェア環境にも対応できます。モデルの継続的なアップデートにより、過剰飽和やプラスチック顔の問題解決に進展があり、ユーザーに質の高い画像生成体験を提供することを目指しています。

ディープラーニング

FastVLM

FastVLM は、視覚言語モデル向けに設計された効果的な視覚符号化モデルです。イノベーティブな FastViTHD ミックスドビジュアル符号化エンジンを使用することで、高解像度画像の符号化時間と出力されるトークンの数を削減し、モデルのスループットと精度を向上させました。FastVLM の主な位置付けは、開発者が強力な視覚言語処理機能を得られるように支援し、特に迅速なレスポンスが必要なモバイルデバイス上で優れたパフォーマンスを発揮します。

SurfSense

SurfSense はオープンソースのAI研究アシスタントであり、検索エンジン、Slack、Notionなど複数の外部リソースを統合したツールです。これにより、ユーザーは効率的にリサーチおよび情報管理を行えます。この製品は複数のファイル形式に対応しており、自然言語での対話ができ、コンテンツの迅速な生成も可能です。SurfSense は研究の効率向上を目指し、知識管理に高いニーズを持つユーザー向けに設計されています。

Seed-Coder

Seed-Coder は、ByteDance の Seed チームが開発したオープンソースコード大型言語モデルシリーズで、基礎、指示、および推論モデルを含みます。最小限の人力投入でコードトレーニングデータを自動的に管理することにより、プログラミング能力を大幅に向上させます。このモデルは類似のオープンソースモデルの中で優れたパフォーマンスを発揮し、さまざまなコーディングタスクに適しており、オープンソース LLM エコシステムの進展を目指しています。研究分野や工業利用に適用できます。

「大型言語モデル」

中国語精選

HunyuanCustom

HunyuanCustom は、ユーザー定義の条件に基づいて特定のテーマのビデオを生成するためのマルチモーダルカスタムビデオ生成フレームワークです。この技術は、画像ID強化モジュールや時間 CASCADE の導入を通じて、テキスト、画像、音声、ビデオなどの多様な入力に対応しており、バーチャルキャラクターアドバタイジングやビデオ編集など、さまざまなシーンでの用途に適しています。

マルチモーダル

PrimitiveAnything

Primitiveanything

PrimitiveAnything は、自己回帰変換器を使用した 3D モデル生成技術であり、細部まで丁寧な 3D オリジナルアセンブリを自動的に作成します。この技術の主な利点は、複雑な 3D 形状をディープラーニングで高速に生成できる点です。これによりデザイナーの生産性が大幅に向上します。本製品はさまざまなデザイン用途に適しており、価格は無料で、3D モデリング分野向けに位置づけられています。

ZeroSearch

ZeroSearch は、実際の検索エンジンとの相互作用なしに、大規模な言語モデル（LLMs）の検索能力を促進する新しいタイプの強化学習フレームワークです。教師あり微調整を通じて、ZeroSearch は LLM を関連する無関係なドキュメントを生成できる検索モジュールに変換します。また、モデルの推論能力を段階的に促進するコースウェアメカニズムを導入しています。この技術の主な利点は、実際の検索エンジンに基づくモデルよりもパフォーマンスが高いことに加え、API 成本が発生しないことです。さまざまな規模の LLM に対応しており、異なる強化学習アルゴリズムをサポートしています。これは、効率的な検索能力を持つ必要のある研究や開発チームに最適です。

DeerFlow

DeerFlow は、言語モデルとウェブ検索、クロール、Python 実行などの専用ツールを結合したディープラーニングフレームワークです。このプロジェクトはオープンソースコミュニティから生まれ、貢献の還元を重視しており、多彩な柔軟な機能を備えています。様々な研究ニーズに対応可能です。

オープンソース

SmartPDF

SmartPDF は Llama 3.3 をベースとしたオンラインツールであり、PDF ファイルを迅速にまとめたりセクション分けしたりすることができます。この製品は大量のドキュメントを扱うユーザー、たとえば学生、研究者、企業の専門家に適しています。このツールを使用することでユーザーは時間を節約し、生産性を向上させることができます。SmartPDF は使いやすいインターフェースを提供し、PDF および画像ファイルのアップロードと処理をサポートし、ドキュメント管理の利便性を向上させることを目指しています。

ドキュメント処理

NoteLLM

NoteLLM はユーザ生成コンテンツに特化した検索可能な大規模言語モデルであり、推薦システムのパフォーマンスを向上させることを目指しています。テーマ生成と埋め込み生成の組み合わせにより、ノートの内容に対する理解と処理力を向上させています。このモデルはエンドツーエンドのチューニング戦略を採用しており、マルチモーダル入力に対応し、多様なコンテンツ領域での応用可能性を広げています。その重要なポイントは、ノート推薦の精度と体験を効果的に向上させることで、特に小紅書などのUGCプラットフォームに最適です。

マルチモーダル処理

Agent-as-a-Judge

Agent As A Judge

Agent-as-a-Judge は、代理システム間の相互評価により作業効率と品質を向上させる新しい自動評価システムです。この製品は評価時間とコストを大幅に削減し、継続的なフィードバック信号を提供することで、代理システムが自ら改善することを促します。このシステムは主に AI 開発タスクに広く利用されており、特にコートジェネレーション分野で活躍しています。このシステムはオープンソースであり、開発者がカスタマイズや追加開発を行えるように設計されています。

高品質新製品

魔法AIペインティング

魔法AIペインティング

魔法 AI ペインティングは、最新の人工知能技術を利用した、多岐にわたる生成モードをサポートする画像生成ツールです。ユーザーはテキストによる説明で画像を生成したり、既存の画像を編集して現代的なユーザーエクスペリエンスを楽しむことができます。この製品は個人ユーザーとデザイナーに焦点を当てており、ユーザーが生成パラメーターをカスタマイズできるように設計されています。このアプリはローカルデータの保存をサポートすることで、ユーザーのプライバシーを確保しています。

ペインティング

コンピュータエージェント

コンピュータエージェント

コンピュータエージェントは、さまざまなコンピュータタスクを自動化するためのツールです。インターネットの検索から画像生成まで、多くの機能に対応し、業務効率を大幅に向上させます。頻繁に反復されるタスクをこなすユーザーにとって非常に役立つ商品です。このアプリケーションは無料であり、シンプルで直感的な操作画面を備えており、幅広いユーザー層に適しています。

コンピュータアシスタント

KeySync

KeySyncは高解像度ビデオ向けの無損失リップシンクフレームワークです。従来のリップシンク技術で問題視されている時間一貫性の問題を解決し、表情漏れや顔面被覆を巧妙に処理します。KeySyncの優れた点は、唇再構築とクロスシンクに関する先進的な成果であり、自動吹き替えなどの実アプリケーションに適応しています。

ビデオ編集

Firecrawl MCP Server

Firecrawl MCP Server

Firecrawl MCP Serverは、強力なウェブクロール機能を統合したプラグインで、CursorやClaudeなどのさまざまなLLMクライアントに対応しています。動的なコンテンツを含むウェブコンテンツを効率的にクロール、検索、抽出できるほか、自動再試行やトラフィック制限機能も搭載しており、開発者や研究者に最適です。製品には高い柔軟性とスケーラビリティがあり、一括クロールや深層研究にも対応できます。

開発ツール

Excel MCP サーバー

Excel MCP サーバー

Excel MCPサーバーは、Microsoft ExcelをインストールすることなくExcelファイルを操作できるサーバーです。ユーザーはワークブックの作成、読み込み、変更が可能です。このツールの主な利点は、その使いやすさと柔軟性であり、複数のExcel機能に対応し、AIエージェントを使ってファイル操作を可能にしています。この製品はデータアナリストや財務スタッフなど、頻繁にExcelファイルを扱うユーザー向けです。このツールはオープンソースで、Pythonで開発されており、ローカルまたはリモートサーバー上で簡単に実行できます。

「[\"データ分析\", \"開発&ツール\"]\"

DeepSeek-Prover-V2-671B

Deepseek Prover V2 671B

DeepSeek-Prover-V2-671Bは、強力な推論能力を提供する高度な人工知能モデルです。最新技術に基づいており、さまざまなシナリオに適用できます。このモデルはオープンソースであり、人工知能技術の民主化と普及、技術的障壁の低減を目指しています。これにより、多くの開発者や研究者がAI技術を使用してイノベーションを行うことが可能になります。このモデルを使用することで、ユーザーは工作效率を向上させ、さまざまなプロジェクトの進捗を加速できます。

CameraBench

CameraBenchは、ビデオ内のカメラの動きを分析するモデルであり、ビデオの解釈を通じてカメラの動きパターンを理解することを目指しています。その主な強みは、生成型の視覚言語モデルを使用してカメラの動きパターンを分類し、ビデオ-テキスト検索を行うことです。従来の方法である構造化運動(SfM)や同時位置姿勢推定(SLAM)と比較し、このモデルはシーンのセマンティックをよりよく捉えています。モデルはオープンソースであり、研究者や開発者向けに適しており、後日、さらなる改良版がリリースされます。

研究ツール

F Lite

F Liteは、FreepikとFalによって作成された大規模な拡散モデルで、100億パラメーターを持ちます。著作権クリアかつ安全な作業環境（SFW）に特化して訓練されました。モデルはFreepikの内部データセットに基づいており、約8000万枚の合法的な画像データを含んでいます。これは、このスケールのモデルが法的?安全なコンテンツに焦点を当てた最初の取り組みです。技術報告書にはモデルの詳細が記載されており、CreativeML Open RAIL-Mライセンスのもとで配布されています。モデルの設計はオープンでアクセスしやすいAIの促進を目指しています。

Step1X-Edit

Step1X-Editは実用的な汎用画像編集フレームワークであり、MLLMの画像理解能力を利用して編集指示を解析し、編集トークンを生成し、DiTネットワークによって画像にデコードします。その重要性は、実ユーザーの編集ニーズを効果的に満たし、画像編集の利便性と柔軟性を向上させる点にあります。

["チャイニーズフード],["AIデジタルアーツ]

AIbase

未来を切り開く、あなたのAIソリューション知識ベース

English 简体中文繁體中文にほんご

© 2025AIbase