# 音声書き起こし

FunASR
Funasr
FunASRは、音声端点検出、音声認識、句読点付与などのモデルを統合した音声オフラインファイル転写サービスソフトウェアパッケージです。長時間の音声や動画を句読点付きのテキストに変換でき、複数リクエストの同時転写にも対応しています。ITNとユーザー定義の単語辞書に対応し、サーバーにはffmpegが統合されており、様々な音声?動画フォーマットの入力をサポートします。また、HTML、Python、C++、Java、C#など、様々なプログラミング言語のクライアントを提供しており、高効率かつ正確な音声転写サービスを必要とする企業や開発者に最適です。
AI音声翻訳
55.5K
高品質新製品
Echo
Echo
Echoは、AI技術を搭載した音声とテキストメモアプリです。AI技術によって、ユーザーの思考の整理と洗練を支援します。EchoはGPT-4の大規模言語モデルを使用して、転写、想起、洞察の生成を行い、ユーザーの音声入力を正確に転写し、過去の思考に基づいて有意義な回答を提供することで、よりインタラクティブで魅力的な日記体験を実現します。この製品はプライバシーとセキュリティを重視しており、メモは暗号化され、ユーザーデータは閲覧せず、データを使用してAIをトレーニングすることもありません。業界最善のプラクティスに従ってデータ保護を実施しています。現在、Echoは無料テスト段階にあり、将来的には高度な機能の導入を計画しています。
AI筆記助手
51.9K
Easy Voice Toolkit
Easy Voice Toolkit
Easy Voice Toolkitは、オープンソースの音声プロジェクトを基盤としたAI音声ツールキットであり、音声モデルのトレーニングを含む様々な自動化された音声処理ツールを提供します。シームレスな統合により、包括的なワークフローを形成し、ユーザーは必要に応じてこれらのツールを選択的に使用したり、順序に従って使用したりすることで、生の音声ファイルを理想的な音声モデルへと段階的に変換できます。
AI音声編集
75.1K
aTrain
Atrain
aTrainは、グラーツ大学ビジネスアナリティクス&データサイエンスセンターの研究者によって開発され、グラーツ知識センターの研究者によってテストされたオフライン音声書き起こしツールです。最新の機械学習モデルを利用し、データをアップロードすることなく音声録音の自動書き起こしを行います。aTrainは『行動実験経済学ジャーナル』に掲載された論文で紹介されており、研究目的で使用する場合には、この論文への引用をお願いいたします。Windows 10および11に対応しており、MicrosoftストアまたはBANDASセンターのウェブサイトからダウンロードしてインストールできます。Linuxシステムについては、Wikiにインストールガイドが掲載されています。aTrainの主な利点は、データアップロード不要によるプライバシー保護、高品質な書き起こし精度、ローカルコンピューターでの高速処理速度です。
AI音声翻訳
51.1K
Stenote
Stenote
Stenoteは、AI駆動の音声書き起こし&要約ツールです。リアルタイムでの正確な書き起こしにより、各発言者の声を正確に捉え、会話を分かりやすい要約に変換します。迅速な意思決定と効率的なコミュニケーションを支援します。自動で章立て、重要箇所の要約、会議議事録などを生成する機能を備えています。
ライティングアシスタント
63.5K
Origlio
Origlio
Origlioは音声テキスト変換サービスであり、その他多くの機能も提供しています。音声メッセージをテキストに変換し、音声メッセージの管理と整理を支援します。音声メッセージをOriglioに転送すると、数秒で転写結果を得ることができます。音声転写に加え、Origlioは豊富な応答機能を提供し、日々の業務効率化を支援します。
言語翻訳テキスト
62.1K
AIオーディオキット
AIオーディオキット
AIオーディオキットは、macOS上でOpenAI公式のWhisper APIを用いて音声の書き起こしを行うツールです。高度なAI技術により正確な書き起こしを実現し、面倒なアップロードの手順は不要です。長文要約機能にも対応しています。AIオーディオキットは9ドルで提供され、ユーザーの時間と労力を節約します。
言語音声翻訳本
55.8K
AudioBriefly
Audiobriefly
AudioBrieflyは、音声メモ管理のためのソリューションです。AIによる書き起こし機能と要約機能により、音声コンテンツの要点に迅速にアクセスできます。音声メモの価値を最大限に引き出す、最も迅速かつ簡単な方法です。
言語翻訳
51.3K
麦耳会記(麦耳かいき)
麦耳会記(麦耳かいき)
麦耳会記は、リアルタイム音声書き起こし、リアルタイム翻訳、AIアシストライティング機能を備えたAI搭載のオフィスアシスタントです。オフィス会議、オンライン授業、顧客インタビュー録音など、様々なシーンでご利用いただけます。録音と同時に書き起こしを行い、録音終了後、音声とテキストがPCとモバイルデバイスにリアルタイムで同期されます。クラウドストレージを採用しているため、オフィス、電車内、旅行先など、場所を選ばずいつでもどこでもドキュメントや音声を確認できます。また、リアルタイム字幕同時通訳機能も搭載し、聴覚に障碍のある方にも会議への参加を容易にします。
会議助手
77.6K
Robo Translator
Robo Translator
Robo Translatorは、人工知能を活用した機械翻訳サービスです。コンテンツのローカライズを支援し、グローバルな視聴者層へのリーチ拡大に貢献します。最新のOpenAIモデルを使用し、高精度な翻訳を提供します。音声、動画、テキスト文書など、あらゆる形式のコンテンツを、1つまたは複数の言語に容易に翻訳できます。さらに、YouTube動画の字幕の自動翻訳、多言語音声トラックの作成、迅速かつ正確な音声書き起こしおよび字幕作成にも対応しています。一般的なローカライズ形式にも対応しており、ソフトウェアのローカライズも可能です。従量課金制を採用しており、実際のご利用分のみお支払いいただきます。
翻訳
51.1K
Koe
Koe
KoeはAIによる音声書き起こしツールです。様々な音声?動画ファイル形式に対応し、OpenAI Whisperモデルを用いたローカルでの書き起こしを実現しています。APIサービスを提供し、動画再生中の字幕生成、AI翻訳、音声入力といった機能も備えています。早期購入者限定価格で12ドル、2台のデバイスで永久ライセンスが利用可能です。
開発とツール
109.3K
Chatable
Chatable
Chatableは、AI技術を活用した音声書き起こし、パーソナルコーチング、自動ライティング機能を提供するAIアシスタントです。ユーザーの作業効率を向上させ、生産性と創造性を高めます。AI音声書き起こし、パーソナライズされたインテリジェントコーチング、高品質なコンテンツを自動生成するAIライティングツールを提供します。
個人補助
54.6K
PodSnacks
Podsnacks
PodSnacksは、音声データをテキストに変換し、要約を作成するAI搭載のスマートな書き起こし?要約ツールです。高度なAI技術を用いて、音声内容を正確にテキスト化し、ユーザーのニーズに合わせて要約を生成します。効率的な書き起こし?要約サービスを提供し、ユーザーの時間と労力を節約します。個人ユーザーからビジネスユーザーまで、柔軟な価格設定となっています。
言語翻訳
46.6K
Wiz Write
Wiz Write
Wiz Writeは、音声書き起こし機能を利用して、あなたのアイデアを迅速かつ正確にテキストに変換するAIアシスタントです。対話型のインターフェースにより、コンテンツ作成が簡単かつ効率的に行えます。Wiz Writeをワークフローに統合することで、より迅速なコンテンツ作成、整理された作業、シームレスな共同作業が可能になります。AI音声技術を活用して、生産性を向上させましょう。
ライティングアシスタント
47.7K
Hurd.ai ベータ版
Hurd.ai ベータ版
Hurd AIは、講義、会議、会話のあらゆる言葉を捉えるAIアシスタントです。Hurd AIを使用すれば、メモを取ったり重要な情報を逃したりすることなく、聞き役に集中できます。会議や会話の自動書き起こし、整理、要約に対応しており、音声ファイルを検索可能なテキストに変換することで、簡単にハイライト、フィルタリング、グループ化できます。Hurd AIは無料で、使用時間に制限はありません。いつでもご利用いただけます。
会議補助
43.3K
网易見外
网易見外
网易見外は、ワンストップの双方向字幕サービスを提供する製品です。最先端の機械エンジンと効率的な成果提供により、中央メディアレベルのサービス品質を保証します。ユーザーは、高速かつ正確な中国語と英語の音声書き起こし(正確率95%)、リアルタイムの双方向字幕同時投影、会議内容のリアルタイム共有機能を備えた同時通訳、そして原文の書式を維持したワンクリック翻訳機能などを備えたドキュメント翻訳などを迅速に利用できます。映像?動画分野に特化し、映画字幕のローカリゼーションを支援します。利用シーンには、映画?テレビ番組、講演、展示会?会議、政府の裁判、エンターテインメントライブ、メディアインタビューなどがあります。製品タグには、スマート字幕、音声書き起こし、同時通訳、ドキュメント翻訳、字幕ファイル翻訳、画像認識翻訳などがあります。製品の使用例には、海外ドラマの翻訳、講義の音声書き起こし、大型展示会?フォーラム、エンターテインメントライブ、メディア業界などがあります。
翻訳
214.5K
Brain Pod AI
Brain Pod AI
Brain Pod AIは、多言語コンテンツを迅速かつ高品質に生成できる画期的なAIコンテンツ作成ツールです。AI Writer、Violetを使用することで、驚くべき速度でストーリーや権威性のあるコンテンツなどを執筆できます。さらに、AI画像生成機能とAI音声機能も提供しており、無限の画像と音声の書き起こしを生成できます。Brain Pod AIのシンプルさと無限の可能性は、ビジネスワークフローのアップグレードと向上に貢献します。
ライティングアシスタント
47.2K
SpeechFlow
Speechflow
SpeechFlowは、高精度な音声テキスト変換機能を提供する強力なAPIです。14言語に対応し、音声やオーディオをテキストに変換でき、あらゆるシーンや業種でご利用いただけます。SpeechFlowの強みは、高い精度、簡単な導入、高い拡張性、クラウドおよびオンプレミスでの展開に対応している点です。
言語翻訳テキスト
141.0K
Vocapia
Vocapia
Vocapia Research開発の音声認識ソフトウェアは、高度な音声処理技術を提供し、多言語認識に対応しています。放送監視、講演会やセミナーの文字起こし、動画字幕作成、電話会議の文字起こし、音声分析など幅広い分野で活用可能です。大語彙連続音声認識、音声セグメンテーションとパーティショニング、話者識別、言語識別などの機能を備えています。大量の音声?動画ファイルの一括またはリアルタイムでの文字起こしに最適で、特に電話会話の音声やコールセンターデータの文字起こしニーズに特化しています。多言語対応の文字起こしサービスを提供しており、お客様のご要望に応じたモデルやシステムのカスタマイズも可能です。
言語識別
46.6K
Mictoo
Mictoo
Mictooは、強力で無料の音声書き起こしツールです。ファイルの録音またはアップロードをワンクリックするだけで、数秒で自動書き起こしテキストを取得できます。Mictooは、音声リソースの収集、保存、整理機能も提供しています。書き起こし内容を簡単に編集?整理し、より構造化され、読みやすいものにすることができます。さらに、会議の音声をテキストに書き起こし、OpenAI GPT-3を使用して会議の要約と行動計画を生成することで、会議でメモを取ることに気を取られることなく、創造的なアイデアに集中できます。
音声翻訳
51.3K
Sly Fish AI
Sly Fish AI
AI搭載のインテリジェントライティングアシスタントは、ユーザーに効率的なライティング支援を提供します。キーワードと基本的な内容を入力するだけで、SEO要件を満たす独自のコンテンツ(ブログ、広告、メール、ウェブサイトなど)を生成します。さらに、視覚的に魅力的な画像の作成、音声ファイルの書き起こし、コードの生成も簡単に行えます。貴重な時間を節約し、生産性を向上させるお手伝いをします。
ライティングアシスタント
44.2K
SpeakNotes
Speaknotes
SpeakNotesは、高度なAI技術を用いて音声メモの書き起こしおよび要約を行うAI搭載のモバイルアプリです。時間を節約し、整理整頓を維持し、重要なディテールを見逃すことがなくなります。多言語対応で、フォルダを作成してメモを整理でき、正確な音声テキスト変換サービスを提供し、要約を画像としてエクスポートすることも可能です。
筆記具
135.5K
DenoLyrics
Denolyrics
DenoLyricsは、人工知能モデルに基づいたウェブアプリケーションです。143言語に対応し、音声の速度に関わらず、高精度な音声テキスト変換とリアルタイムの音声書き起こしサービスを提供します。最先端技術を用いて、高品質な転写体験をお届けします。さらに、字幕生成、要約、多言語翻訳などの機能も備えています。ぜひ無料でお試しください!
言語音声翻訳本
55.2K
AI音声書き起こし
AI音声書き起こし
このAI音声書き起こしツールは、AIアルゴリズムを用いて、迅速かつ正確な音声のテキスト化を実現します。時間のかかる、そしてエラーが発生しやすい手動での書き起こしから解放され、作業効率を大幅に向上させましょう。約60言語に対応しており、インタビュー、会議、ポッドキャスト、講演会などをテキストに変換できます。72時間以内であれば全額返金保証付きなので、安心してご利用いただけます。
言語音声翻訳本
45.8K
Audiogest.app
Audiogest.app
Audiogestは、シンプルで使いやすく、正確で信頼性が高く、手頃な価格の音声書き起こし&要約生成ツールです。様々なオーディオファイルをテキストと便利な要約に変換でき、99以上の言語に対応しています。最新のAI技術を採用し、競合他社よりも高い精度を誇ります。ユーザーはオーディオファイルをアップロードするだけで、数分以内に書き起こしと要約を入手できます。
音声翻訳
66.0K
Whisper メモ
Whisper メモ
Whisper メモは、OpenAIの最新技術Whisperを用いて開発されたアプリです。音声の録音を行い、数分後に書き起こしをメールで送信します。非常に正確な書き起こし結果により、音声メモをテキストに変換できます。思いついたアイデア、リマインダー、日記など、様々な用途で音声メモの書き起こしにご活用いただけます。
言語翻訳テキスト
52.4K
Voiser
Voiser
Voiserは、550種類以上の異なる音声オプションを備えたテキスト読み上げツールです。テキストをリアルな機械音声に変換し、人間の声に最も近い機械音声を提供します。さらに、音声ファイルをテキストに変換する、高速で正確な音声書き起こしサービスも提供します。Voiserは、テキスト読み上げと音声変換の最適なソリューションです。
テキスト読み上げ音声
66.2K
おすすめAI製品
海外精選
Jules AI
Jules AI
Jules は、自動で煩雑なコーディングタスクを処理し、あなたに核心的なコーディングに時間をかけることを可能にする異步コーディングエージェントです。その主な強みは GitHub との統合で、Pull Request(PR) を自動化し、テストを実行し、クラウド仮想マシン上でコードを検証することで、開発効率を大幅に向上させています。Jules はさまざまな開発者に適しており、特に忙しいチームには効果的にプロジェクトとコードの品質を管理する支援を行います。
開発プログラミング
39.7K
NoCode
Nocode
NoCode はプログラミング経験を必要としないプラットフォームで、ユーザーが自然言語でアイデアを表現し、迅速にアプリケーションを生成することが可能です。これにより、開発の障壁を下げ、より多くの人が自身のアイデアを実現できるようになります。このプラットフォームはリアルタイムプレビュー機能とワンクリックデプロイ機能を提供しており、技術的な知識がないユーザーにも非常に使いやすい設計となっています。
開発プラットフォーム
38.9K
ListenHub
Listenhub
ListenHub は軽量級の AI ポッドキャストジェネレーターであり、中国語と英語に対応しています。最先端の AI 技術を使用し、ユーザーが興味を持つポッドキャストコンテンツを迅速に生成できます。その主な利点には、自然な会話と超高品質な音声効果が含まれており、いつでもどこでも高品質な聴覚体験を楽しむことができます。ListenHub はコンテンツ生成速度を改善するだけでなく、モバイルデバイスにも対応しており、さまざまな場面で使いやすいです。情報取得の高効率なツールとして位置づけられており、幅広いリスナーのニーズに応えています。
AI
38.1K
中国語精選
腾讯混元画像 2.0
腾讯混元画像 2.0
腾讯混元画像 2.0 は腾讯が最新に発表したAI画像生成モデルで、生成スピードと画質が大幅に向上しました。超高圧縮倍率のエンコード?デコーダーと新しい拡散アーキテクチャを採用しており、画像生成速度はミリ秒級まで到達し、従来の時間のかかる生成を回避することが可能です。また、強化学習アルゴリズムと人間の美的知識の統合により、画像のリアリズムと詳細表現力を向上させ、デザイナー、クリエーターなどの専門ユーザーに適しています。
画像生成
38.4K
OpenMemory MCP
Openmemory MCP
OpenMemoryはオープンソースの個人向けメモリレイヤーで、大規模言語モデル(LLM)に私密でポータブルなメモリ管理を提供します。ユーザーはデータに対する完全な制御権を持ち、AIアプリケーションを作成する際も安全性を保つことができます。このプロジェクトはDocker、Python、Node.jsをサポートしており、開発者が個別化されたAI体験を行うのに適しています。また、個人情報を漏らすことなくAIを利用したいユーザーにお勧めします。
オープンソース
39.2K
FastVLM
Fastvlm
FastVLM は、視覚言語モデル向けに設計された効果的な視覚符号化モデルです。イノベーティブな FastViTHD ミックスドビジュアル符号化エンジンを使用することで、高解像度画像の符号化時間と出力されるトークンの数を削減し、モデルのスループットと精度を向上させました。FastVLM の主な位置付けは、開発者が強力な視覚言語処理機能を得られるように支援し、特に迅速なレスポンスが必要なモバイルデバイス上で優れたパフォーマンスを発揮します。
画像処理
38.4K
海外精選
ピカ
ピカ
ピカは、ユーザーが自身の創造的なアイデアをアップロードすると、AIがそれに基づいた動画を自動生成する動画制作プラットフォームです。主な機能は、多様なアイデアからの動画生成、プロフェッショナルな動画効果、シンプルで使いやすい操作性です。無料トライアル方式を採用しており、クリエイターや動画愛好家をターゲットとしています。
映像制作
17.6M
中国語精選
LiblibAI
Liblibai
LiblibAIは、中国をリードするAI創作プラットフォームです。強力なAI創作能力を提供し、クリエイターの創造性を支援します。プラットフォームは膨大な数の無料AI創作モデルを提供しており、ユーザーは検索してモデルを使用し、画像、テキスト、音声などの創作を行うことができます。また、ユーザーによる独自のAIモデルのトレーニングもサポートしています。幅広いクリエイターユーザーを対象としたプラットフォームとして、創作の機会を平等に提供し、クリエイティブ産業に貢献することで、誰もが創作の喜びを享受できるようにすることを目指しています。
AIモデル
6.9M
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase