

Whisper Input
紹介 :
Whisper InputはPythonで開発されたデスクトップツールで、音声テキスト変換を高速に行うことができます。ボタン操作で音声録音を制御し、Groq Whisper Large V3 TurboまたはFunAudioLLM/SenseVoiceSmallモデルを使用して翻訳を行います。このツールの主な利点は、翻訳速度が速く、精度が高く、多言語翻訳に対応していることです。効率的な入力が必要なユーザー、特に音声記録とテキスト変換を頻繁に行う場面に適しています。現在、このツールは完全に無料で、ユーザーは料金を支払うことなく使用できます。
ターゲットユーザー :
効率的な音声入力を必要とするユーザー、例えば、オフィスワーカー、学生、コンテンツクリエイターなどにとって適しており、特にアイデアの迅速な記録、会議議事録の作成、執筆などの場面で役立ちます。
使用シナリオ
会議で要点の迅速な記録を、手動入力なしで行う。
学生が授業中に音声でノートを取り、後にテキストに変換して復習する。
コンテンツクリエイターが音声入力で記事や脚本を作成する。
製品特徴
OptionまたはAltボタンを押すと録音が開始し、ボタンを離すと録音が終了します。
多言語音声翻訳に対応し、複数の言語をテキストに変換できます。
中国語を英語に翻訳し、バイリンガル入力を実現します。
GroqまたはSiliconFlowが提供する高性能音声転写モデルを使用し、翻訳速度が速いです。
句読点を自動的に付与するため、追加の修正なしで完全な文章を出力できます。
使用チュートリアル
1. Python環境(バージョン3.10以上)がローカルにインストールされていることを確認します。
2. GroqまたはSiliconFlowアカウントに登録し、無料のAPIキーを取得します。
3. プロジェクトをローカルにクローンします:`git clone git@github.com:ErlichLiu/Whisper-Input.git`
4. 仮想環境を作成してアクティブにします:`python -m venv venv`、その後`source venv/bin/activate`(macOS/Linux)または`.\venv\Scripts\activate`(Windows)を実行します。
5. 依存関係をインストールします:`pip install pip-tools`、その後`pip-compile requirements.in`と`pip install -r requirements.txt`を実行します。
6. `.env`ファイルにAPIキーと関連設定を入力します。
7. プログラムを実行します:`python main.py`、ボタン操作で音声テキスト変換を実行できます。
おすすめAI製品

Speechflow
SpeechFlowは、高精度な音声テキスト変換機能を提供する強力なAPIです。14言語に対応し、音声やオーディオをテキストに変換でき、あらゆるシーンや業種でご利用いただけます。SpeechFlowの強みは、高い精度、簡単な導入、高い拡張性、クラウドおよびオンプレミスでの展開に対応している点です。
言語翻訳テキスト
140.8K
海外精選

Deepgram
Deepgramは、正確性、速度、低コストを兼ね備えた、強力な音声テキスト変換APIです。企業レベルのニーズに対応する、特定分野の言語モデルも提供しています。開発者はDeepgramを使って安心してアプリケーションを構築し、開発速度を向上させることができます。
言語翻訳テキスト
115.6K