ニューラルネットワーク

# ニューラルネットワーク

Procyon AI コンピュータビジョンベンチマーク

Procyon AI コンピュータビジョンベンチマーク

Procyon AI Computer Vision Benchmarkは、UL Solutionsが開発した専門的なベンチマークテストツールです。Windows PCまたはApple Mac上で、さまざまなAI推論エンジンの性能を評価することを目的としています。本ツールは、一般的なマシンビジョンタスクに基づいた一連のテストを実行し、複数の高度なニューラルネットワークモデルを利用することで、エンジニアリングチームに独立した標準化された評価手段を提供します。これにより、AI推論エンジンの実装品質と専用ハードウェアの性能を把握することができます。NVIDIA? TensorRT?、Intel? OpenVINO?など、主要なAI推論エンジンを複数サポートしており、浮動小数点と整数最適化モデルの性能を比較できます。主な利点として、インストールと実行が容易で、複雑な設定が不要、詳細な結果ファイルをエクスポートできる点が挙げられます。ハードウェアメーカー、ソフトウェア開発者、研究者などの専門ユーザーを対象とした製品であり、AI分野における研究開発と最適化作業を支援します。

開発とツール

大規模地理空間モデル

大規模地理空間モデル

ナイアンティックのLarge Geospatial Model（LGM）は、大規模機械学習によってシーンを理解し、世界中の数百万もの他のシーンと接続することを目指した、先駆的な概念です。LGMは、コンピューターが物理空間を感知し、理解するだけでなく、新たな方法でそれらとインタラクトすることを可能にし、ARグラスや、ロボット工学、コンテンツ制作、自律システムを含むより広範な分野における重要な構成要素となります。スマートフォンから現実世界に接続されたウェアラブルテクノロジーへと移行するにつれて、空間知能は未来の世界のオペレーティングシステムとなるでしょう。

HOVER

HOVERは、人間型ロボット向けの多機能神経全身コントローラーです。全身運動を模倣することで汎用的な運動スキルを提供し、多様な全身制御モードを学習します。HOVERは、多モード戦略蒸留フレームワークを用いて異なる制御モードを単一の戦略に統合し、異なる制御モード間のシームレスな切り替えを実現しながら、各モードの独自の利点を維持します。このコントローラーは、様々なモードにおける人間型ロボットの制御効率と柔軟性を向上させ、将来のロボットアプリケーションのための堅牢で拡張性の高いソリューションを提供します。

開発とツール

多種鯨類検出

多種鯨類検出

multispecies-whale-detectionは、Googleが開発したオープンソースプロジェクトです。ニューラルネットワークを用いて、様々な種や地域における鯨類の音声を検出?分類することを目的としています。このツールは、研究者や環境保護団体が海洋生物の多様性をより深く理解し、保護する上で役立ちます。

AILIBRI

AILIBRIは、テキスト、画像、ビデオ、音声など複数の分野を網羅する、2000種類以上のAIニューラルネットワークツールを掲載したディレクトリウェブサイトです。専門家から初心者まで、あらゆるユーザーがニーズに合ったツールを見つけられるよう、利便性を極めて高めています。詳細な分類と検索機能により、必要なツールを迅速に見つけることができます。

AI情報プラットフォーム

World Labs

World Labsは、空間知能に特化した企業であり、大規模世界モデル（Large World Models）を構築することにより、3D世界を感知、生成、そして操作することに取り組んでいます。スタンフォード大学の李飛飛教授、ミシガン大学のJustin Johnson教授など、AI分野の著名な科学者、教授、学者、業界リーダーによって設立されました。彼らはニューラル放射場（NeRF）技術などの革新的な技術と手法を通じて、3Dシーンの再構築と新しい視点からの合成の発展を推進しています。Marc Benioff氏、Jim Breyer氏などの著名な投資家から支援を受けており、その技術はAI分野において重要な応用価値と商業的可能性を秘めています。

3Dモデリング

zero_to_GPT

zero_to_GPTは、ゼロベースから深層学習を学び、最終的に独自のGPTモデルのトレーニングを可能にすることを目的としたチュートリアルです。人工知能技術が研究室から出て様々な業界で広く応用されるにつれ、AI技術を理解し活用できる人材への社会的な需要はますます高まっています。本チュートリアルは理論と実践を結びつけ、天気予報や翻訳などの実際の問題解決を通して、勾配降下法や逆伝播法などの深層学習の基礎理論を深く解説します。内容は、基本的なニューラルネットワークのアーキテクチャとトレーニング方法から始め、トランスフォーマー、GPUプログラミング、分散型トレーニングなどの高度なトピックへと段階的に進みます。

ALIEN

ALIENは、CUDAベースの専用物理＆レンダリングエンジンを搭載した人工生命シミュレーションプログラムです。人工生態系におけるデジタル生物の行動をシミュレートし、進化シミュレーションのプラットフォームとして機能することを目的としています。このソフトウェアプロジェクトはオープンソースであり、BSD-3-Clauseライセンスに従います。

高品質新製品

MIT MAIA

MAIA（Multimodal Automated Interpretability Agent）は、マサチューセッツ工科大学コンピュータ科学人工知能研究所（CSAIL）が開発した、AIモデルの解釈性を向上させるための自動化システムです。視覚言語モデルを基盤とし、一連の実験ツールを組み合わせることで、様々なニューラルネットワークの解釈タスクを自動的に実行します。MAIAは仮説の生成、実験計画の立案、反復的な分析による理解の深化を行い、AIモデルの内部動作メカニズムに関するより深い洞察を提供します。

高品質新製品

Comic Translate

Comic Translate

Comic Translateは、BD、Manga、Manhwa、Fumettiなど、様々なフォーマットの漫画を自動翻訳することを目的としたデスクトップアプリケーションです。英語、韓国語、日本語、フランス語、簡体字中国語、繁体字中国語、ロシア語、ドイツ語、オランダ語、スペイン語、イタリア語など、複数の言語をサポートしています。GPT-4の強力な翻訳機能を活用しており、韓国語や日本語から英語への翻訳など、他の翻訳ツールでは正確な翻訳が難しい言語ペアの翻訳に特に適しています。画像、PDF、Epub、cbr、cbzなど、様々なファイル形式に対応しており、ユーザーは手軽に様々な言語の漫画を楽しむことができます。

CoreNet

CoreNetは深層ニューラルネットワークツールキットであり、研究者やエンジニアが、基礎モデル（CLIPやLLMなど）、物体分類、物体検出、セマンティックセグメンテーションなど、様々なタスク向けに、標準的なものから新規のものまで、小規模から大規模なモデルを訓練することを可能にします。

Transformer Debugger (TDB)

Transformer Debugger (TDB)

Transformer Debuggerは、自動化された説明可能性とスパース自己符号化器技術を組み合わせることで、コード作成前の迅速な探索を可能にし、順伝播中に介入して特定の挙動への影響を観察できます。挙動に寄与する特定のコンポーネント（ニューロン、アテンションヘッド、自己符号化器の潜在表現）を特定し、これらのコンポーネントが強く活性化する理由を説明する自動生成の説明を示し、コンポーネント間の接続をトレースして回路を発見する支援を行います。

ニューラルネットワーク拡散モデル

ニューラルネットワーク拡散モデル

ニューラルネットワーク拡散モデル（Neural Network Diffusion）は、シンガポール国立大学高性能計算?人工知能研究所によって開発された、拡散過程を利用して高品質な画像を生成するモデルです。画像生成や修復などのタスクに適用できます。

InfraVisN AI

Visnetは、包括的でヘッドレスな、マルチコンパチブルなニューラルネットワークインターフェースフレームワークであり、主に自然言語処理と深層ビジョンシステムに使用されます。モジュール式のフロントエンド、サーバーレスアーキテクチャ、マルチコンパチビリティを備え、REST APIとWebsocketインターフェースを提供します。翻訳、ナンバープレート認識、顔の特徴マッチングなど、複数の主要なAIモデルが含まれています。Visnetは、監視、ドローン検出、画像?ビデオ分析などの分野で幅広く利用できます。

開発とツール

InstructIR

InstructIRは、画像と人間の指示を入力として受け取り、単一ニューラルモデルで統合的な画像修復を実行します。画像ノイズ除去、雨粒除去、ぼかし除去、霧除去、低照度画像強調など、複数の修復タスクにおいて最先端の結果を達成しています。?? デモチュートリアルから始めることができます。詳細についてはGitHubをご覧ください。免責事項：これは製品ではないため、いくつかの制限があることにご注意ください。このデモでは、何らかの劣化（ぼやけ、ノイズ、雨、低照度、霧）のある画像と、実行すべき操作を要求するプロンプトを入力する必要があります。GPUメモリの制限があるため、高解像度画像（2K、4K）を入力すると、アプリケーションがクラッシュする可能性があります。このモデルは主に合成データでトレーニングされているため、現実世界の複雑な画像では効果が低い場合があります。しかし、現実世界の霧や低照度画像では驚くほど効果を発揮します。一般的な画像強調のプロンプト（例：「この画像を調整する」、「色を強調する」）を試して、色がどのように改善されるかを確認することもできます。

汎用予測学習器

汎用予測学習器

汎用予測学習器は、メタ学習を活用した強力な手法であり、限られたデータから新たなタスクを迅速に学習できます。多様なタスクへの幅広い接触を通して、汎用的な表現を獲得し、汎用的な問題解決を実現します。本製品は、最も強力な汎用予測器であるソロモノフ帰納（SI）をメタ学習によって償却する可能性を探求しています。普遍的チューリングマシン（UTM）を用いてトレーニングデータを生成し、ネットワークに幅広いパターンを接触させます。UTMデータ生成プロセスとメタトレーニングプロトコルの理論的分析を提供します。LSTMやTransformerなどのニューラルアーキテクチャに対し、複雑度と普遍性の異なるアルゴリズムデータジェネレーターを用いた包括的な実験を実施しました。その結果、UTMデータはメタ学習において貴重なリソースであり、汎用的な予測戦略を学習できるニューラルネットワークのトレーニングに使用できることが示されました。

BakedAvatar

BakedAvatarは、標準的な多角形ラスタ化パイプラインに展開可能な、リアルタイムニューラルアバター合成のための全く新しい表現です。この手法は、学習済みのヘッドアイソサーフェスから変形可能な多層メッシュを抽出し、静的テクスチャにベイクできる表情、姿勢、視点関連の外観を計算することで、リアルタイム4Dアバター合成を実現します。3段階のニューラルアバター合成パイプラインを提案します。これには、連続変形、マニフォルド、放射場を学習すること、階層メッシュとテクスチャを抽出すること、微分ラスタ化によるテクスチャ詳細の微調整が含まれます。実験結果は、当社の表現が他の最先端手法と同等の合成結果を生み出し、必要な推論時間を大幅に削減することを示しています。さらに、ビュー合成、顔の再現、表情編集、姿勢編集など、単眼ビデオから生成された様々なアバター合成結果を示します。これらは全てインタラクティブなフレームレートで行われます。

AI顔画像生成

Neuralhub

Neuralhub は、深層学習をより簡単に実現するプラットフォームです。AI愛好家、研究者、エンジニアに実験とイノベーションの環境を提供します。私たちの目標はツールを提供するだけでなく、知識を共有し、協働できるコミュニティを構築することです。あらゆるツール、研究成果、モデルを協働空間へと集約することで、今日の深層学習を簡素化し、AI研究、学習、開発へのアクセスを容易にします。

開発プラットフォーム

Wild2Avatar

Wild2Avatarは、遮蔽された野外単眼ビデオ内の人物外観をレンダリングするための神経レンダリング手法です。障害物によってカメラの視野が遮られ、部分的な遮蔽が生じる場合でも、現実のシーンにおいて人物をレンダリングできます。本手法は、シーンを遮蔽物、人物、背景の3つの部分に分割し、特定の目的関数を使用して人物と遮蔽物や背景を分離することで、人物モデルの完全性を確保します。

Gaussian SLAM

Gaussian SLAMは、RGBDデータストリームからレンダリング可能な3Dシーンを再構築できます。これは、写真レベルのリアルさで現実世界のシーンを再構築できる最初のニューラルRGBD SLAM手法です。3Dガウスをシーン表現の基本単位として利用することで、従来手法の限界を克服しました。従来の3Dガウスは単眼設定では使いにくいことが分かりました。正確な幾何学的情報を符号化できず、単眼順序付けによる教師あり学習による最適化も困難です。幾何学的情報を符号化するように従来の3Dガウスを拡張し、それを成長させ最適化する新しいシーン表現手法を設計することで、速度や効率性を犠牲にすることなく、現実世界のデータセットを再構築?レンダリングできるSLAMシステムを提案しました。Gaussian SLAMは、現実世界のシーンを写真レベルのリアルさで再構築?レンダリングできます。一般的な合成データセットと現実世界のデータセットで手法を評価し、最先端の他のSLAM手法と比較しました。最後に、得られた最終的な3Dシーン表現は、効率的なガウシアン?スプラッシュ?レンダリングによりリアルタイムレンダリングが可能であることを示しました。

3Dモデリング

MindOne

MindOneは、多様な最先端AIモデルを統合した、ワンストップAI生成ツールアプリです。テキスト生成、画像生成、チャットボットなど、様々な機能を搭載しています。ユーザーはMindOneを使って、様々な効果の画像を迅速に生成し、スタイルやシーンを自由にカスタマイズできます。さらに、高度なNLPモデルを複数搭載しており、インテリジェントなQ&A、テキスト要約、音声認識などの機能もサポートしています。MindOneはシンプルで使いやすいインターフェースと、手頃な価格設定により、一般ユーザーでも最先端のAI技術を容易に利用し、自分自身のAI体験を始めることができます。

AI設計ツール

LLM可視化

LLM可視化プロジェクトは、GPTスタイルのニューラルネットワーク（OpenAIのGPT-2、GPT-3、そして可能性としてGPT-4で使用されているネットワークトポロジー）の3Dモデルを表示します。最初の表示では、アルファベットA、B、Cからなる小さなリストをソートする小型ネットワークの動作中の重みが表示されます。これはAndrej KarpathyによるminGPT実装のデモモデルです。レンダラーは任意のサイズのネットワークの可視化にも対応しており、より小さなgpt2サイズでも動作しますが、重みはダウンロードされません（数百MBあります）。CPUシミュレーションプロジェクトは、完全なエディタを備えた2D原理図のデジタル回路を実行します。簡単なRISC-V CPUの構築方法、ゲートレベルまでの構成要素（命令デコード、ALU、加算など）、パイプラインの各種レベルやキャッシュなどのより高度なCPUの概念などを示すチュートリアルを追加する予定です。

GPT-BOSS

GPT-BOSSを使うと、複数のニューラルネットワークに同時にアクセスし、それらを活用して時間節約や売上向上を実現する方法を学ぶことができます。使い方がわからない場合でも、適切な方法を指導します。

ドゥードゥルダッシュ

ドゥードゥルダッシュ

ドゥードゥルダッシュは、ニューラルネットワークを使ってプレイヤーの落書きの速さを予測する楽しいオンラインゲームです。指定された落書きをできるだけ早く描き、あなたの描画速度に基づいて予測結果が表示されます。このゲームは??Transformers.js を使用して開発されました。

ゲーム開発

Microsoft Cognitive Toolkit

Microsoft Cognitive Toolkit

Microsoft Cognitive Toolkit（CNTK）は、商用レベルで使用可能なオープンソースの分散型深層学習ツールです。有向グラフを用いてニューラルネットワークの計算手順を記述し、一般的なモデルタイプをサポートしており、自動微分と並列計算を実現しています。CNTKは64ビットLinuxおよびWindowsオペレーティングシステムをサポートし、Python、C、またはC++プログラムのライブラリとして使用できるほか、独自のモデル記述言語BrainScriptを用いて、スタンドアロンの機械学習ツールとしても使用できます。

Synaptic.js

Synapticは、オープンソースのJavaScriptニューラルネットワークライブラリです。基本的なニューロン、ネットワーク、トレーナー、ネットワーク構築ツールを提供します。パーセプトロン、LSTM（長短期記憶ネットワーク）、液体状態マシン、ホップフィールドネットワークなど、様々なタイプの人工ニューラルネットワークの構築とトレーニングに使用できます。また、ニューラルネットワークの学習と利用を支援するためのサンプルとデモも提供しています。

開発とツール

Waifu XL

Waifu XLは、最先端のニューラルネットワークを用いて、ブラウザ上でアニメスタイルの画像を高画質にアップスケールするツールです。画像とアニメーションGIFに対応しており、Waifu2xよりも優れた効果を発揮します。高速な画像処理、刷新されたインターフェース、Waifu2xを上回る効果などが特徴です。価格や詳細については公式ウェブサイトをご覧ください。

ResFields

ResFieldsは、複雑な時空間信号を効率的に表現するために特別に設計されたネットワークです。時変重みを多層パーセプトロン（MLP）に導入し、学習可能な残差パラメータを用いることで、モデルの表現能力を強化します。この手法は既存技術とシームレスに統合でき、2Dビデオ近似、動的形状モデリング、動的NeRF再構成など、様々な困難なタスクにおいて結果を大幅に向上させることができます。

INSTAPAINTING

INSTAPAINTINGは、ニューラルネットワークを用いた写真から絵画への変換ツールです。数秒であなたの写真をアート作品に変え、数クリックでアーティストによる100％手描きの作品を自宅にお届けします。このツールは、弊社の即時アートプレビューツールに統合されており、ウェブサイトでご利用いただけます。油絵、ペット肖像画、人物画、ウェディング、風景画など、幅広いシーンにご利用いただけます。本社はサンフランシスコにあります。

Ai Painter

Ai Painterは、ニューラルネットワークを用いた絵画生成ツールです。お持ちの写真を芸術作品に変換したり、抽象画を作成したりすることができます。高度なAI技術を活用し、写真から絵画への変換を迅速かつ正確に行います。Ai Painterはダウンロード不要で、操作も簡単なので、あらゆるスキルレベルのユーザーにご利用いただけます。さらに、Ai Painterは無料で、一切費用をかけずにご利用いただけます。

おすすめAI製品

Jules AI

Jules は、自動で煩雑なコーディングタスクを処理し、あなたに核心的なコーディングに時間をかけることを可能にする異步コーディングエージェントです。その主な強みは GitHub との統合で、Pull Request(PR) を自動化し、テストを実行し、クラウド仮想マシン上でコードを検証することで、開発効率を大幅に向上させています。Jules はさまざまな開発者に適しており、特に忙しいチームには効果的にプロジェクトとコードの品質を管理する支援を行います。

開発プログラミング

NoCode

NoCode はプログラミング経験を必要としないプラットフォームで、ユーザーが自然言語でアイデアを表現し、迅速にアプリケーションを生成することが可能です。これにより、開発の障壁を下げ、より多くの人が自身のアイデアを実現できるようになります。このプラットフォームはリアルタイムプレビュー機能とワンクリックデプロイ機能を提供しており、技術的な知識がないユーザーにも非常に使いやすい設計となっています。

開発プラットフォーム

ListenHub

ListenHub は軽量級の AI ポッドキャストジェネレーターであり、中国語と英語に対応しています。最先端の AI 技術を使用し、ユーザーが興味を持つポッドキャストコンテンツを迅速に生成できます。その主な利点には、自然な会話と超高品質な音声効果が含まれており、いつでもどこでも高品質な聴覚体験を楽しむことができます。ListenHub はコンテンツ生成速度を改善するだけでなく、モバイルデバイスにも対応しており、さまざまな場面で使いやすいです。情報取得の高効率なツールとして位置づけられており、幅広いリスナーのニーズに応えています。

中国語精選

腾讯混元画像 2.0

腾讯混元画像 2.0

腾讯混元画像 2.0 は腾讯が最新に発表したAI画像生成モデルで、生成スピードと画質が大幅に向上しました。超高圧縮倍率のエンコード?デコーダーと新しい拡散アーキテクチャを採用しており、画像生成速度はミリ秒級まで到達し、従来の時間のかかる生成を回避することが可能です。また、強化学習アルゴリズムと人間の美的知識の統合により、画像のリアリズムと詳細表現力を向上させ、デザイナー、クリエーターなどの専門ユーザーに適しています。

OpenMemory MCP

OpenMemoryはオープンソースの個人向けメモリレイヤーで、大規模言語モデル（LLM）に私密でポータブルなメモリ管理を提供します。ユーザーはデータに対する完全な制御権を持ち、AIアプリケーションを作成する際も安全性を保つことができます。このプロジェクトはDocker、Python、Node.jsをサポートしており、開発者が個別化されたAI体験を行うのに適しています。また、個人情報を漏らすことなくAIを利用したいユーザーにお勧めします。

オープンソース

FastVLM

FastVLM は、視覚言語モデル向けに設計された効果的な視覚符号化モデルです。イノベーティブな FastViTHD ミックスドビジュアル符号化エンジンを使用することで、高解像度画像の符号化時間と出力されるトークンの数を削減し、モデルのスループットと精度を向上させました。FastVLM の主な位置付けは、開発者が強力な視覚言語処理機能を得られるように支援し、特に迅速なレスポンスが必要なモバイルデバイス上で優れたパフォーマンスを発揮します。

ピカは、ユーザーが自身の創造的なアイデアをアップロードすると、AIがそれに基づいた動画を自動生成する動画制作プラットフォームです。主な機能は、多様なアイデアからの動画生成、プロフェッショナルな動画効果、シンプルで使いやすい操作性です。無料トライアル方式を採用しており、クリエイターや動画愛好家をターゲットとしています。

中国語精選

LiblibAI

LiblibAIは、中国をリードするAI創作プラットフォームです。強力なAI創作能力を提供し、クリエイターの創造性を支援します。プラットフォームは膨大な数の無料AI創作モデルを提供しており、ユーザーは検索してモデルを使用し、画像、テキスト、音声などの創作を行うことができます。また、ユーザーによる独自のAIモデルのトレーニングもサポートしています。幅広いクリエイターユーザーを対象としたプラットフォームとして、創作の機会を平等に提供し、クリエイティブ産業に貢献することで、誰もが創作の喜びを享受できるようにすることを目指しています。

AIbase

未来を切り開く、あなたのAIソリューション知識ベース

English 简体中文繁體中文にほんご

© 2025AIbase