シンプルで手軽に使える文字起こしツール!「Handy」。
Handy
マイクに入力した音声を AI が文字起こしし、キャレット位置に貼り付けてくれるソフト。
ショートカットキーを押してマイクに向かって喋るだけで、音声の内容をプレーンテキストとして書き出せるようにしてくれます。
ショートカットキーを押している間だけ文字起こしを行えるようにする “ プッシュトゥトーク ” などの機能も付いています。
Handyは、AI を利用したシンプルな文字起こしツールです。
指定した録音デバイスから入力された音声をテキストに書き出してくれる文字起こしツールで、名前の通り非常にシンプルで手軽に使えるところが最大の特徴。
基本的に、
- ショートカットキーを押す(文字起こし開始)
- マイクに向かって喋る※1
- もう一度ショートカットキーを押す(文字起こし終了)
1 「Voicemeeter Banana」などのアプリで PC の音声を仮想録音デバイスに送れば、PC 上で鳴っている音声を文字起こしすることもできる。
(もっとも、スピーカーの音声をマイクで拾えば「Voicemeeter Banana」などのソフトは不要だが...)
“ プッシュトゥトーク ” 機能もついており、
- ショートカットキーを押しっぱなしにする(文字起こし開始)
- マイクに向かって喋る※1
- 押しっぱなしにしていたショートカットキーを放す(文字起こし終了)
文字入力を音声で行いたい時にはもちろん、会話の内容をテキスト化したい時、PC の音声を文字起こししたい時…などにも使えると思います。
ちなみに、文字起こしの際には OpenAI の「Whisper」もしくはアリババの「SenseVoice」といった音声認識モデルを使用することができ※2、モデルのダウンロード以外は完全にオフラインで使用できるようになっています。
2 NVIDIA の「Parakeet V3」、Moonshine AI の「Moonshine Voice」なども使えるが、日本語音声の認識に対応していないので注意。
また、「Whisper」モデルを使用するには、Intel / AMD / NVIDIA 製の GPU が必要。
(macOS を使用している場合、Mシリーズ Mac / Intel Mac が必要)
クロスプラットフォームに対応しているところもポイントの一つで、Windows 版のほかに MacOS 版、Linux 版 が用意されています。 Amazon タイムセール開催中!
基本的な使い方は以下の通り。
使用バージョン : Handy 0.7.9
インストール時の注意
- インストールの途中で「Installer is no longer responding」というダイアログが表示された場合、「再試行」をクリックしてください。
また、「Warning 1946.Property 'System.AppUserModel.ID' for shortcut 'Handy.lnk' could not be set.」というダイアログが表示されるケースもありますが、これも「OK」をクリックしてください。
モデルのダウンロードとオプション設定
- 初回起動時に、モデルの選択画面が表示されます。
「Parakeet V3」がオススメとして表示されていますが、「Parakeet V3」は日本語音声の認識に対応していないため、日本語の文字起こしをする際は「SenseVoice」や「Whisper」モデルの方が良いでしょう。
「Whisper」には複数のモデルがありますが、それぞれの特徴は次のようになっています。- Whisper Small - 文字起こしの速度は速いが、音声の認識精度は低い
- Whisper Medium - 速度・精度共に中程度
- Whisper Large - 音声の認識精度は高いが、処理速度は遅い
- Whisper Turbo - 「Whisper Large」に近い精度で、処理速度が速い
- モデルを選択すると、自動的にモデルのダウンロードが開始されます。
- モデルのダウンロードが完了すると、設定画面が表示されます。
ここでは、下記のようなオプションの設定を行うことができます。
- 文字起こしショートカット - 文字起こしを開始 / 終了 する際のショートカットキー
- プッシュトゥトーク - プッシュトゥトーク機能の ON / OFF 切り替え
- 言語 - 入力音声の言語(モデルによっては指定不可)
- マイク - 音声の入力元デバイス
- 録音中にミュート
- 音声フィードバック - 文字起こし開始時 / 終了時 に、ポン!という音を鳴らす
- 出力デバイス - フィードバック音声の再生デバイス
- 音量 - フィードバック音声の音量
- その他、左メニュー内の「詳細設定」画面で、下記のようなオプションの設定を行うこともできます。
アプリ- 非表示で起動 - タスクトレイに最小化した状態で起動する
- 起動時に実行 - Windows 起動時に自動で実行する
- トレイアイコンを表示
- オーバーレイ位置 - 文字起こし実行中に表示されるオーバーレイ※3 の表示位置
- なし - オーバーレイを表示しない
- 下 - デスクトップの下部
- 上 - デスクトップの上部
- モデルのアンロード - 一定時間後にモデルを解放する※4
4 モデルを使用していない時にモデルをアンロードすることで、システムリソースを回復させることができる。 - 実験的機能
出力- 貼り付け方法
- クリップボード (Ctrl+V)
- 直接
- なし
- クリップボード (Ctrl+Shift+V)
- クリップボード (Shift+Insert)
- クリップボードの処理
- クリップボードを変更しない
- クリップボードにコピー
- 自動送信
- オフ
- Enter
- Ctrl+Enter
- Super+Enter
文字起こし- カスタム単語
- 末尾にスペースを追加
履歴- 履歴上限
- 録音の自動削除
- しない
- 最新 〇 件を保持
- 3 日後
- 2 週間後
- 3 か月後
文字起こしを行う
- 文字起こしの準備が整ったら、設定画面で指定しておいたショートカットキーを押します。
(デフォルトは “ Ctrl + スペース キー ” )
「プッシュトゥトーク」機能を ON にしている場合は、文字起こしを止めるまでショートカットキーを押しっぱなしにします。 - 画面下部にオーバーレイが表示され、音声の聞き取りと文字起こしが開始されます。
このオーバーレイは音量メーターになっていて、入力音声の音量に応じてメーターが反応します。
ちなみに、音声の聞き取り中はタスクトレイアイコンも変化するようになっています。
- 文字起こしを止める時は、同じショートカットキーをもう一度押します。
「プッシュトゥトーク」機能を ON にしている場合は、押しっぱなしにしていたショートカットキーを放します。 - これで文字起こし完了です。
キャレットが文字入力可能な位置にある場合は、入力された音声がキャレット位置に貼り付けられます。
(「詳細設定」画面で、貼り付け機能を有効化している場合)
また、左メニュー内の「履歴」画面で、文字起こしの結果を確認することもできます。 ここでは、文字起こしの元となった音声を再生できるほか、
- 文字起こし結果のテキストを、クリップボードにコピー
- 文字起こしの結果を、お気に入りとして保存※5
- 文字起こし内容を削除
5 何もしなければ、履歴は最大で 5 件までしか保存されない模様。
(古いものから順に自動で削除されていく)
文字起こし結果のテキストについては、必要な部分のみを選択してコピーすることも可能となっています。 - この「Handy」は、メイン画面を閉じてもタスクトレイに最小化されるようになっています。
メイン画面を再度表示させたい時は、タスクトレイアイコンをクリックして「設定」を選択します。
(終了する時は、トレイアイコンをクリックして「終了」を選択する)
| Handy TOPへ |
おすすめフリーソフト
スポンサードリンク



