Whisper-Input
W
Whisper Input
紹介 :
Whisper InputはPythonで開発されたデスクトップツールで、音声テキスト変換を高速に行うことができます。ボタン操作で音声録音を制御し、Groq Whisper Large V3 TurboまたはFunAudioLLM/SenseVoiceSmallモデルを使用して翻訳を行います。このツールの主な利点は、翻訳速度が速く、精度が高く、多言語翻訳に対応していることです。効率的な入力が必要なユーザー、特に音声記録とテキスト変換を頻繁に行う場面に適しています。現在、このツールは完全に無料で、ユーザーは料金を支払うことなく使用できます。
ターゲットユーザー :
効率的な音声入力を必要とするユーザー、例えば、オフィスワーカー、学生、コンテンツクリエイターなどにとって適しており、特にアイデアの迅速な記録、会議議事録の作成、執筆などの場面で役立ちます。
総訪問数: 502.6M
最も高い割合の地域: US(19.34%)
ウェブサイト閲覧数 : 66.8K
使用シナリオ
会議で要点の迅速な記録を、手動入力なしで行う。
学生が授業中に音声でノートを取り、後にテキストに変換して復習する。
コンテンツクリエイターが音声入力で記事や脚本を作成する。
製品特徴
OptionまたはAltボタンを押すと録音が開始し、ボタンを離すと録音が終了します。
多言語音声翻訳に対応し、複数の言語をテキストに変換できます。
中国語を英語に翻訳し、バイリンガル入力を実現します。
GroqまたはSiliconFlowが提供する高性能音声転写モデルを使用し、翻訳速度が速いです。
句読点を自動的に付与するため、追加の修正なしで完全な文章を出力できます。
使用チュートリアル
1. Python環境(バージョン3.10以上)がローカルにインストールされていることを確認します。
2. GroqまたはSiliconFlowアカウントに登録し、無料のAPIキーを取得します。
3. プロジェクトをローカルにクローンします:`git clone git@github.com:ErlichLiu/Whisper-Input.git`
4. 仮想環境を作成してアクティブにします:`python -m venv venv`、その後`source venv/bin/activate`(macOS/Linux)または`.\venv\Scripts\activate`(Windows)を実行します。
5. 依存関係をインストールします:`pip install pip-tools`、その後`pip-compile requirements.in`と`pip install -r requirements.txt`を実行します。
6. `.env`ファイルにAPIキーと関連設定を入力します。
7. プログラムを実行します:`python main.py`、ボタン操作で音声テキスト変換を実行できます。
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase