VOICEVOX

VOICEVOX の概要や使い方を紹介しています。

VOICEVOX を紹介しているページです。

指定した文章を、AI に喋らせることができる!「VOICEVOX」。

VOICEVOX
3.53 / 5312 票)
制作者 Hiroshiba Kazuyuki
対応 10/11
バージョン 0.18.0
更新日時 2024-03-23
ファイルサイズ 1.2 MB

VOICEVOX

指定した文章を、AI に喋らせることができる音声合成ツール。
専用のフォームに入力されたテキストを、「四国めたん」「ずんだもん」「春日部つむぎ」「雨晴はう」「玄野武宏」「No.7」...等々、総勢 30 名以上 の AI 話者がそれぞれの個性豊かに喋ってくれます。
各文字ごとにアクセントやイントネーションを調整する機能、語句の切れ目を調整する機能、文章ごとに話速 / 抑揚 / 音量 等を調整する機能、合成結果を WAVE ファイルに書き出す機能 等も付いています。

「VOICEVOX」は、文章を AI に喋らせることができる音声合成ソフトです。

指定された文章内で使われている文字列の
  • 読み
  • アクセント
  • イントネーション
  • 句の切れ目
などを自動で解析し、その結果を元に(2024/02/18 時点では)AI 話者
  • 四国めたん
  • ずんだもん
  • 春日部つむぎ
  • 波音リツ
  • 雨晴はう
  • 玄野武宏
  • 白上虎太郎
  • 青山龍星
  • 冥鳴ひまり
  • 九州そら
  • もち子さん
  • 剣崎雌雄
  • WhiteCUL
  • 後鬼
  • No.7
  • ちび式じい
  • 櫻歌ミコ
  • 小夜/SAYO
  • ナースロボ_タイプT
  • †聖騎士 紅桜†
  • 雀松朱司
  • 麒ヶ島宗麟
  • 春歌ナナ
  • 猫使アル
  • 猫使ビィ
  • 中国うさぎ
  • 栗田まろん
  • あいえるたん
  • 満別花丸
  • 琴詠ニア
のいずれかが “ 実際に話している ” かのように喋ってくれるところが大きな特徴。
入力された文字列をただ単に発音するのではなく、それぞれの個性や性格を反映しつつ表現豊かに喋ってくれます。
(音声データは、その場で再生することができるほか、WAVE ファイルとして保存することも可能)
操作は基本的に喋らせたい文章を入力するだけなので、従来の音声合成ソフトと同じような感覚で使うことができると思います。
ちなみに、各文字ごとにアクセント / イントネーション / 長さ を調整する機能や、各文章ごとに話者(音声ライブラリ)/ 話速 / 音高 / 抑揚 / 音量 を調整する機能 も付いています。

使い方は以下の通り。

使用バージョン : VOICEVOX 0.16.1
  1. インストーラー実行時に「Windows によって PC が保護されました」という画面が表示されることがあります。
    Windows によって PC が保護されました
    この画面が表示されたら、左側にある「詳細情報」というテキストをクリック → 右下の「実行」ボタンをクリックして下さい。
    右下の「実行」ボタンをクリックする
  2. 「VOICEVOX.exe」を実行します。
  3. 利用規約が表示されるので、右上にある「同意して使用開始」ボタンをクリックします。
    「同意して使用開始」ボタンをクリックする
  4. 続いて、サンプルボイス一覧とキャラクターの並び替え画面が表示されます。
    サンプルボイス一覧と、キャラクターの並び替え
    サンプルボイス一覧と、キャラクターの並び替え
    サンプルボイス一覧と、キャラクターの並び替え
    サンプルボイス一覧と、キャラクターの並び替え
    ここでは、各キャラクターのサンプルボイスを聞いたり、各キャラクターの並び替えを実行したりすることができます。
    キャラクターの並び替えを行うこともできる
    キャラクターの並び替えを行うこともできる
    よく使いそうなキャラクターの並び順を上に上げておくと、メイン画面上で目的のキャラクターを素早く選択できるようになります。
    キャラクター選択メニュー
  5. 最後に、ソフトの利用状況収集を問うダイアログが表示されるので、適宜右上にある「許可」「拒否」ボタンをクリックします。
    (利用状況収集の許可 / 拒否 は、オプション画面にて変更することができます)
    ソフトの利用状況収集を問うダイアログ
  6. メイン画面が表示されます。
    VOICEVOX
    デフォルトでは、音声ライブラリとして「四国めたん」が選択された状態になっています。
    その他のキャラクターを使用したい時は、四国めたん アイコンをクリック → 変更先のライブラリを選択しておきます。
    音声ライブラリを変更することも可能
    名前の右側に矢印アイコンがついているキャラクターに関しては、喋り方のスタイルを選択することも可能となっています。
    名前の右側に矢印アイコンがついているキャラクターに関しては、喋り方のスタイルを選択することも可能
  7. キャラクターアイコンの右側にあるテキスト入力フォームに、喋らせたい文章を入力 → Enter キーを押します。
    テキスト入力フォームに、喋らせたいテキストを入力する
  8. 入力したテキストの読みとアクセントが、画面下部に表示されます。
    入力したテキストの読みとアクセントが、画面下部に表示される
    あとは、画面左下にある 再生 ボタンをクリックすれば OK です。
    画面下部にある再生ボタンを押す
    合成結果(音量注意)
    入力されたテキストを、各 AI 話者が喋ってくれます。
  9. 尚、画面右側の欄で、入力した文章の
    • 話速
    • 音高
    • 抑揚
    • 音量
    • 開始無音 - 文章を読み上げる前の無音時間
    • 終了無音 - 文章を読み上げた後の無音時間
    を調整することもできます。
    「話速」「音高」「抑揚」「音量」を調整することも可能
    また、画面下部の「アクセント」「イントネーション」「長さ」タブで、各文字のアクセント / イントネーション / 長さ を変更することも可能となっています。
    (「長さ」は、子音 / 母音 ごとに調整することができる)
    アクセントを変更することも可能
    イントネーションの調整
    イントネーションを変更することも可能
    長さの調整
    長さを変更することも可能
    語句が意図しない部分で途切れてしまっている時は、該当の部分(空白)をクリックすることにより、語句の結合を実行することもできます。
    (「アクセント」「イントネーション」「長さ」タブのいずれでも実行することができます)
    単語間の空白をクリックする
    空白が削除された
    逆に、語句が意図した部分で途切れていない時は、該当の部分をクリックすることで分割を実行することもできます。
    分割したい部分をクリックする
    単語が分割された
    入力したテキストが意図しない読み方で読まれている時は、下部の欄で該当の語句をクリック → 変更先の読み方を入力して Enter キーを押します。
    読みを変更したい語句をクリックする
    変更先の読み方を入力する
  10. 別の文章を喋らせたい時は、画面右下にある + ボタンをクリックします。
    別の文章を喋らせたい時は、画面右下にある「+」ボタンをクリックする
  11. テキスト入力フォームが追加されるので、喋らせたい文章を入力 → Enter キーを押します。
    テキスト入力フォームが追加されるので、喋らせたい言葉を入力する
    テキスト入力フォームが追加されるので、喋らせたい文章を入力する
    各文章ごとに、音声ライブラリや 話速 / 音高 / 抑揚 / 音量 / 開始無音 / 終了無音 を変更することもできます。
    各文章ごとに、音声ライブラリを変更することもできる
    各文章ごとに、話速 / 音高 / 抑揚 / 音量 を調整することもできる
  12. 複数の文章をまとめて喋らせたい時は、先頭となる文章を選択 → 画面左上にある「連続再生」ボタンをクリックします。
    複数の文章をまとめて喋らせることもできる
    連続再生結果(音量注意)
    文章を削除したい時は、目的の文章にマウスカーソルを合わせて、右端に表示されるゴミ箱アイコンをクリックします。
    削除したい文章にマウスカーソルを合わせて、右端に表示されるゴミ箱アイコンをクリック
  13. 音声合成の結果を WAVE ファイルとして保存したい時は、メニューバー上の「ファイル」から
    • 音声書き出し
      すべての文章を、WAVE ファイルとして個別に書き出す
    • 選択音声を書き出し
      選択中の文章のみを、WAVE ファイルとして書き出す
    • 音声を繋げて書き出し
      すべての文章を、一つに連結した WAVE ファイルとして書き出す
    のいずれかを選択します。
    メニューバー上の「ファイル」から「音声書き出し」、または「一つだけ書き出し」を選択する
    ちなみに、同「ファイル」メニュー内の「プロジェクトを名前を付けて保存」から、現在の作業状態をそのまま保存できるようにもなっています。
    (復元は「プロジェクト読み込み」から)
  14. 音声保存ダイアログが表示されます。
    音声保存ダイアログ
    あとは、ファイルの保存先フォルダなどを選択し、保存を行えば OK です。
    WAVE ファイルが保存された
  15. その他、メニューバー上の「設定」から「オプション」を開くことにより、
    • エンジンモード※1 - CPU / GPU
    • 音声のサンプリングレート - 24 kHz ~ 96 kHz
    • TXT ファイルの書き出し ON / OFF
    • 音声をステレオ化
    • 再生デバイス
    • 疑問文自動調整の ON / OFF(疑問文の語尾を自動で上げる機能)
    などを変更することも可能となっています。
    1 3 GB 以上のメモリを積んでいる NVIDIA 製 GPU を使用している場合は、GPU モードの方が処理を高速に行うことができる。
    オプション画面
    オプション画面
    音声のサンプリングレート

VOICEVOX TOPへ
別館

最近は Chrome 拡張機能や Firefox アドオンの紹介が多め...

VOICEVOX を紹介しているページです