VOICEVOX

VOICEVOX の概要や使い方を紹介しています。

VOICEVOX を紹介しているページです。

指定した文章を、AI に喋らせることができる!「VOICEVOX」。

VOICEVOX
3.72 / 593 票)
制作者 Hiroshiba Kazuyuki
対応 -
バージョン 0.9.4
更新日時 2022-01-01
ファイルサイズ 955 KB

VOICEVOX

指定した文章を、AI に喋らせることができる音声合成ツール。
専用のフォームに入力されたテキストを、AI 話者「四国めたん」「ずんだもん」「春日部つむぎ」「波音リツ」「雨晴はう」が、それぞれの個性豊かに&実際に話しているかのごとく喋ってくれます。
各文字ごとにアクセントやイントネーションを調整する機能、語句の切れ目を調整する機能、文章ごとに話速 / 音高 / 抑揚 / 音量 を調整する機能、合成結果を WAVE ファイルとして書き出す機能 等も付いています。

「VOICEVOX」は、文章を AI に喋らせることができる音声合成ソフトです。

指定された文章内で使われている文字列の
  • 読み
  • アクセント
  • イントネーション
  • 句の切れ目
などを自動で解析し、その結果を元に(2022/01/01 時点では)AI 話者「四国めたん」「ずんだもん」「春日部つむぎ」「波音リツ」「雨晴はう」のいずれかが “ 実際に話している ” かのように喋ってくれるところが大きな特徴。
入力された文字列をただ単に発音するのではなく、それぞれの個性や性格を反映しつつ表現豊かに喋ってくれます。
(音声データは、その場で再生することができるほか、WAVE ファイルとして保存することも可能)
操作は基本的に喋らせたい文章を入力するだけなので、従来の音声合成ソフトと同じような感覚で使うことができると思います。
ちなみに、各文字ごとにアクセント / イントネーション / 長さ を調整する機能や、各文章ごとに話者(音声ライブラリ)/ 話速 / 音高 / 抑揚 / 音量 を調整する機能 も付いています。

使い方は以下の通り。

使用バージョン : VOICEVOX 0.9.4
  1. インストーラー実行時に「Windows によって PC が保護されました」という画面が表示されることがあります。
    Windows によって PC が保護されました
    この画面が表示されたら、左側にある「詳細情報」というテキストをクリック → 右下の「実行」ボタンをクリックして下さい。
    右下の「実行」ボタンをクリックする
  2. 「VOICEVOX.exe」を実行します。
  3. 初回起動時のみ、各 AI 話者のデフォルトスタイル(喋り方)選択画面が表示されます。
    「四国めたん」のデフォルトのスタイル(喋り方)を選んでください
    「四国めたん」「ずんだもん」に関しては、喋り方を
    • ノーマル
    • あまあま
    • ツンツン
    • セクシー
    の中から選べるようになっているので、既定のスタイルとしたい喋り方にチェック → 右上の「次へ」ボタンをクリックします。
    「ずんだもん」のデフォルトのスタイル(喋り方)を選んでください
    「春日部つむぎ」「雨晴はう」「波音リツ」に関しては、「ノーマル」のみ選択可能となっています。
    (バージョン 0.9.4 時点)
    「春日部つむぎ」のデフォルトのスタイル(喋り方)を選んでください
    「雨晴はう」のデフォルトのスタイル(喋り方)を選んでください
    「波音リツ」のデフォルトのスタイル(喋り方)を選んでください
  4. メイン画面が表示されます。
    VOICEVOX
    デフォルトでは、音声ライブラリとして「四国めたん」が選択された状態になっています。
    ずんだもん」「春日部つむぎ」「波音リツ」「雨晴はう」を使用したい時は、四国めたん アイコンをクリック → 変更先のライブラリを選択しておきます。
    音声ライブラリを変更することも可能
    また、「四国めたん」「ずんだもん」に関しては、喋り方のスタイルを選択することも可能となっています。
    「四国めたん」「ずんだもん」に関しては、喋り方のスタイルを選択することも可能
  5. キャラクターアイコンの右側にあるテキスト入力フォームに、喋らせたい文章を入力 → Enter キーを押します。
    テキスト入力フォームに、喋らせたいテキストを入力する
  6. 入力したテキストの読みとアクセントが、画面下部に表示されます。
    (初回のみ、時間がかかることがあります)
    入力したテキストの読みとアクセントが、画面下部に表示される
    あとは、画面左下にある 再生 ボタンをクリックすれば OK です。
    画面下部にある再生ボタンを押す
    合成結果(音量注意)
    入力されたテキストを、各 AI 話者が喋ってくれます。
  7. 尚、画面右側の欄で、入力した文章の
    • 話速
    • 音高
    • 抑揚
    • 音量
    • 開始無音 - 文章を読み上げる前の無音時間
    • 終了無音 - 文章を読み上げた後の無音時間
    を調整することもできます。
    「話速」「音高」「抑揚」「音量」を調整することも可能
    また、画面下部の「アクセント」「イントネーション」「長さ」タブで、各文字のアクセント / イントネーション / 長さ を変更することも可能となっています。
    (「長さ」は、子音 / 母音 ごとに調整することができる)
    アクセントを変更することも可能
    イントネーションの調整
    イントネーションを変更することも可能
    長さの調整
    長さを変更することも可能
    語句が意図しない部分で途切れてしまっている時は、該当の部分(空白)をクリックすることにより、語句の結合を実行することもできます。
    (「アクセント」「イントネーション」「長さ」タブのいずれでも実行することができます)
    単語間の空白をクリックする
    空白が削除された
    逆に、語句が意図した部分で途切れていない時は、該当の部分をクリックすることで分割を実行することもできます。
    分割したい部分をクリックする
    単語が分割された
    入力したテキストが意図しない読み方で読まれている時は、下部の欄で該当の語句をクリック → 変更先の読み方を入力して Enter キーを押します。
    読みを変更したい語句をクリックする
    変更先の読み方を入力する
  8. 別の文章を喋らせたい時は、画面右下にある + ボタンをクリックします。
    別の文章を喋らせたい時は、画面右下にある「+」ボタンをクリックする
  9. テキスト入力フォームが追加されるので、喋らせたい文章を入力 → Enter キーを押します。
    テキスト入力フォームが追加されるので、喋らせたい言葉を入力する
    テキスト入力フォームが追加されるので、喋らせたい文章を入力する
    各文章ごとに、音声ライブラリや 話速 / 音高 / 抑揚 / 音量 / 開始無音 / 終了無音 を変更することもできます。
    各文章ごとに、音声ライブラリを変更することもできる
    各文章ごとに、話速 / 音高 / 抑揚 / 音量 を調整することもできる
  10. 複数の文章をまとめて喋らせたい時は、先頭となる文章を選択 → 画面左上にある「連続再生」ボタンをクリックします。
    複数の文章をまとめて喋らせることもできる
    連続再生結果(音量注意)
    文章を削除したい時は、目的の文章にマウスカーソルを合わせて、右端に表示されるゴミ箱アイコンをクリックします。
    削除したい文章にマウスカーソルを合わせて、右端に表示されるゴミ箱アイコンをクリック
  11. 音声合成の結果を WAVE ファイルとして保存したい時は、メニューバー上の「ファイル」から
    • 音声書き出し - すべての文章を、まとめて WAVE ファイルとして書き出す
    • 一つだけ書き出し - 選択中の文章のみを、WAVE ファイルとして書き出す
    のどちらかを選択します。
    メニューバー上の「ファイル」から「音声書き出し」、または「一つだけ書き出し」を選択する
    ちなみに、同「ファイル」メニュー内の「プロジェクトを名前を付けて保存」から、現在の作業状態をそのまま保存できるようにもなっています。
    (復元は「プロジェクト読み込み」から)
  12. 音声保存ダイアログが表示されます。
    音声保存ダイアログ
    あとは、ファイルの保存先フォルダなどを選択し、保存を行えば OK です。
    WAVE ファイルが保存された
    WAVE ファイルと同時に保存される TXT ファイルは、メニューバー上の「ファイル」→「テキスト読み込み」から読み込むことも可能となっています。
    メニューバー上の「ファイル」から「テキスト読み込み」を選択する
    テキストが読み込まれた
  13. その他、メニューバー上の「設定」から「オプション」を開くことにより、
    • エンジンモード※1 - CPU / GPU
    • TXT ファイルの書き出し ON / OFF
    • 音声をステレオ化
    • 再生デバイス
    • 音声のサンプリングレート - 24 kHz ~ 96 kHz
    などを変更することも可能となっています。
    1 3 GB 以上のメモリを積んでいる NVIDIA 製 GPU を使用している場合は、GPU モードの方が処理を高速に行うことができる。
    オプション画面
    オプション画面
    音声のサンプリングレート

VOICEVOX TOPへ
別館

最近は Chrome 拡張機能や Firefox アドオンの紹介が多め...

VOICEVOX を紹介しているページです