VOICEVOXの使い方完全ガイド|商用利用・収益化・ずんだもん【2026年版】
VOICEVOXの使い方を初心者向けに徹底解説。無料インストールから音声生成、アクセント調整、WAV書き出しの手順に加え、商用利用とクレジット表記のルール、ずんだもんなどキャラ別の収益化、YMM4連携やAI自動生成での活用法まで、公式規約に基づき2026年版でまとめました。
VOICEVOXの使い方を知りたい初心者に向けて、無料インストールから音声生成、そして商用利用のルールまでを1つにまとめました。
VOICEVOXは「ずんだもん」などのキャラクターの声で、誰でも無料でテキスト読み上げ音声を作れる音声合成ソフトです。ゆっくり実況や解説動画、AIナレーションの定番ツールになっています。
ただし「無料だから何に使ってもいい」わけではありません。クレジット表記のルールや、キャラクターごとに異なる収益化の可否を理解しておかないと、動画の収益化でつまずくこともあります。
この記事では、操作手順と商用利用の両方を公式の一次情報にもとづいて整理しました。最後まで読めば、安全に音声を作って動画へ組み込むまでの流れがわかります。
目次
- VOICEVOXとは?無料で使える音声合成ソフト
- VOICEVOXのインストール方法【Windows/Mac】
- VOICEVOXの基本的な使い方【音声生成の5ステップ】
- 音声を自然にする調整テクニック
- VOICEVOXの商用利用とライセンス【公式規約で解説】
- ずんだもんなどキャラクター別の収益化の可否
- YMM4・ゆっくり動画でのVOICEVOX活用法
- よくある質問(FAQ)
- まとめ
VOICEVOXとは?無料で使える音声合成ソフト
VOICEVOXは、入力したテキストをキャラクターの声で読み上げる、無料のテキスト音声合成ソフトウェアです。商用・非商用を問わず無料で使える点が、動画クリエイターに広く支持されています(出典:VOICEVOX「ソフトウェア利用規約」https://voicevox.hiroshiba.jp/term/)。
VOICEVOXの特徴と「ずんだもん」人気
VOICEVOX最大の特徴は、キャラクターごとに個性のある声を選べることです。なかでも「ずんだもん」は、子供っぽい高めの声で人気を集め、VOICEVOXを象徴する存在になりました。
キャラクターは1人ではありません。窓の杜の紹介によると、VOICEVOXでは多数のキャラクターの声を無料で利用でき、四国めたんや春日部つむぎなど、用途に合わせて声を使い分けられます(出典:窓の杜「VOICEVOX」https://forest.watch.impress.co.jp/library/software/voicevox/)。
それぞれのキャラクターには「あまあま」「ツンツン」などの複数スタイル(喋り方)が用意されている場合もあります。1人のキャラクターで感情表現を変えられるため、掛け合いのある動画も作りやすくなっています。
対応OSと動作環境
VOICEVOXはWindows・macOS・Linuxに対応しています。Windowsは10/11、macOSは10.15以降が目安で、ダウンロード時にCPU版とGPU版を選べます(出典:窓の杜「VOICEVOX」https://forest.watch.impress.co.jp/library/software/voicevox/)。
GPUを搭載したパソコンなら、音声の生成がより速いGPUモードを快適に使えます。ただしMac版はGPUモードに対応していません。LinuxのGPUモードはNvidia製GPUのみが対象です(出典:VOICEVOX「使い方」https://voicevox.hiroshiba.jp/how_to_use/)。
最新の安定版はバージョン0.25.2で、2026年5月に更新されています。音声合成だけでなく、歌声合成の「ソング機能」もプロトタイプとして搭載されています(出典:VOICEVOX「使い方」https://voicevox.hiroshiba.jp/how_to_use/)。
ゆっくり音声(AquesTalk)との違い
「ゆっくり音声」と呼ばれるAquesTalkの合成音声と、VOICEVOXは別物です。両者は音質も商用利用の条件も異なります。
ざっくり言えば、AquesTalkは商用利用で有償ライセンスが必要になる場合があるのに対し、VOICEVOXはクレジット表記を条件に無料で商用利用できます。両者の違いはAquesTalk vs VOICEVOX徹底比較で詳しく解説しています。
どちらを使うか迷う場合は、まず無料のVOICEVOXから試すのが手軽です。次の章で、実際のインストール手順を見ていきましょう。
VOICEVOXのインストール方法【Windows/Mac】
VOICEVOXは公式サイトから無料でダウンロードできます。インストール時に表示される警告ダイアログでつまずく人が多いため、OSごとに手順を押さえておきましょう。
公式サイトからのダウンロード手順
まず公式サイト(voicevox.hiroshiba.jp)にアクセスし、「ダウンロード」を選びます。ダウンロード画面では、お使いのOS(Windows/Mac/Linux)と、CPU版・GPU版を選択します。
迷ったらCPU版で問題ありません。GPU版は対応GPUがある場合に生成が速くなりますが、まずは動かすことを優先すると良いでしょう。
Windowsでの起動と警告ダイアログ対処
ダウンロードしたファイルを起動すると、「WindowsによってPCが保護されました」というダイアログが表示されることがあります。これはマルウェアではなく、配布元の確認を促す標準的な警告です。
その際は「詳細情報」をクリックし、発行元が「Kazuyuki Hiroshiba」であることを確認してから「実行」を選んでください(出典:VOICEVOX「使い方」https://voicevox.hiroshiba.jp/how_to_use/)。発行元が異なる場合は、偽サイトの可能性があるため実行しないでください。
Macでの起動とApple Silicon対応
Macでは初回起動時に「VOICEVOXは開発を検証できないため開けません」という警告が出ることがあります。その場合はFinderで「Ctrl」キーを押しながらアプリのアイコンをクリックし、メニューから「開く」を選んでください。
または、アップルメニューの「システム設定」から「プライバシーとセキュリティ」を開き、ページ下部のセキュリティ欄で「このまま開く」を選ぶ方法もあります(出典:VOICEVOX「使い方」https://voicevox.hiroshiba.jp/how_to_use/)。
Apple Silicon搭載のMacでは、初回起動時にRosettaのインストールを求められる場合があります。案内に従ってインストールすれば、問題なく起動できます。
VOICEVOXの基本的な使い方【音声生成の5ステップ】
インストールが終われば、音声づくりはとても簡単です。ここでは最初の音声を書き出すまでを5ステップで説明します。
キャラクター選択とテキスト入力
VOICEVOXを起動すると、最初に音声合成エンジンが立ち上がります。起動が終わったら、画面左のキャラクターアイコンから使いたい声を選びます。
次に、キャラクターアイコンの右にある空白をクリックし、読み上げさせたい文章を入力します。「Enter」キーで文章を確定すると、画面下部に読みとアクセントが表示されます(出典:VOICEVOX「使い方」https://voicevox.hiroshiba.jp/how_to_use/)。
最初の1回は反映までに数秒かかることがあります。表示されたら準備は完了です。
再生と複数テキスト欄の追加
再生ボタンを押すと、音声が生成されて再生されます。キーボードの「Space」キーでも再生できるので、確認作業がはかどります。
右下の「+」ボタンを押すと、テキスト欄を増やせます。セリフを1行ずつ並べていけば、長い動画のナレーションも管理しやすくなります。テキスト欄は「Shift」+「Enter」でも追加できます。
複数のキャラクターを使いたい場合は、テキスト欄の左にあるアイコンから声を切り替えます。掛け合い形式の会話も、この方法で作成できます。
音声ファイル(WAV)の書き出し
セリフが完成したら、メニューの「ファイル」から「音声書き出し」を選びます。すべてのテキスト欄の音声が、WAV形式の音声ファイルとして書き出されます。
ファイル名は標準で「(行番号)(キャラ名)(テキスト冒頭).wav」の形式で保存されます(出典:VOICEVOX「使い方」https://voicevox.hiroshiba.jp/how_to_use/)。動画編集ソフトに取り込む前提なら、この命名規則のままが管理しやすいでしょう。
入力したセリフやアクセントの調整結果は、拡張子「.vvproj」のプロジェクトファイルとして保存できます。後日続きから編集したいときに便利です。
音声を自然にする調整テクニック
VOICEVOXの音声は、そのままでも十分聞き取れます。しかし、ひと手間加えるだけで、より自然で聞きやすいナレーションに仕上がります。
アクセント・イントネーションの修正
固有名詞や専門用語は、意図しないアクセントで読まれることがあります。その場合は、画面下部のアクセント欄にあるバーを左右に動かして、音の高低を調整します。
さらに細かく抑揚を整えたいときは「イントネーション」を開き、文字ごとの縦バーを上下させます。マウスホイールでも調整でき、「Ctrl」キーを押しながら操作するとより細かく動かせます(出典:VOICEVOX「使い方」https://voicevox.hiroshiba.jp/how_to_use/)。
単語が不自然な位置で区切られた場合は、アクセント欄で文字の間をクリックすると、結合や分離を修正できます。
話速・音高・抑揚などのパラメータ調整
画面右側の欄では、テキスト欄ごとに細かなパラメータを変更できます。主に使うのは次の項目です。
- 話速:読み上げ速度。数値が大きいほど速くなります
- 音高:声の高さ。数値が大きいほど高くなります
- 抑揚:抑揚の強さ。数値が小さいほど棒読みに近づきます
- 音量:音声の大きさ
- 間の長さ:文中の無音の長さ
動画のテンポに合わせて話速を少し上げると、間延びを防げます。設定をまとめて登録できる「プリセット機能」を使えば、毎回の調整も省けます。
読み方&アクセント辞書の活用
難しい単語や新しい言葉は、正しい読みにならないことがあります。そんなときは「設定」の「読み方&アクセント辞書」に単語を登録しておきましょう。
「単語」に表記を、「読み」にひらがなかカタカナで読み方を入力します。もし登録した読みが反映されない場合は、「単語優先度」を上げると改善します(出典:VOICEVOX「使い方」https://voicevox.hiroshiba.jp/how_to_use/)。
チャンネル名やよく使う固有名詞を登録しておけば、毎回読みを直す手間がなくなります。
VOICEVOXの商用利用とライセンス【公式規約で解説】
VOICEVOXは商用利用が可能ですが、無条件ではありません。確認すべき規約は「ソフトウェア本体」と「キャラクター(音声ライブラリ)」の2層に分かれます。ここを正しく理解することが、安全な収益化の出発点です。
ソフトウェア利用規約の要点
VOICEVOXのソフトウェア利用規約は、商用・非商用を問わず利用できると明記しています。条件は2つで、作成した音声を使うときは各音声ライブラリの規約に従うこと、そしてVOICEVOXを利用したとわかるクレジット表記をすることです(出典:VOICEVOX「ソフトウェア利用規約」https://voicevox.hiroshiba.jp/term/)。
一方で、ソフトの無断再配布や、逆コンパイル・リバースエンジニアリング、公序良俗に反する行為は禁止されています。通常の動画制作で守れる範囲ですが、規約として明示されている点は押さえておきましょう。
クレジット表記のルールと書き方
キャラクターの音源規約では、利用時にクレジット表記が必要と定められています。表記の例は「VOICEVOX:ずんだもん」「VOICEVOX:四国めたん」のように、ソフト名とキャラ名を併記する形です(出典:SSS合同会社「音源利用規約」https://zunko.jp/con_ongen_kiyaku.html)。
動画サイトの場合は、説明欄や動画内など「ユーザーが気になって見にいったときにわかる程度」の場所に記載すれば問題ありません。概要欄にまとめて書いておくのが一般的です。
なお「もち子さん」だけは特殊で、CV(声の担当者)の名前まで記載が必要です。「VOICEVOX:もち子(cv 明日葉よもぎ)」のように書きましょう。使うキャラクターごとに、個別の表記ルールを確認する習慣が大切です。
クレジットなしで使う場合の費用
「概要欄にクレジットを書きたくない」というケースもあるでしょう。その場合は、クレジット表記をしない商用利用として、1キャラクターあたり40万円(+消費税)での契約が用意されています(出典:SSS合同会社「音源利用規約」https://zunko.jp/con_ongen_kiyaku.html)。
裏を返せば、クレジットを正しく表記すれば、個人クリエイターは無料で商用利用できるということです。さらに音源の共通規約では、公序良俗に反する利用、政治・宗教活動での利用、情報商材での利用、虚偽情報の拡散、反社会的勢力による利用などが禁止されています。
ゆっくり動画全体の商用利用ルールは、音声・キャラ素材・原作キャラの3層で考える必要があります。詳しくはゆっくり実況の商用利用ライセンス完全ガイドも参考にしてください。
ずんだもんなどキャラクター別の収益化の可否
VOICEVOXで一番の悩みどころが「収益化していいのか」です。ここはキャラクターごとに権利者が異なるため、ひとくくりにできません。仕組みを理解すれば判断に迷わなくなります。
権利者ごとに規約が異なる仕組み
VOICEVOXのソフト規約は「各音声ライブラリの規約に従う」と定めています。つまり、最終的な可否はキャラクターごとの音源規約で決まります(出典:VOICEVOX「ソフトウェア利用規約」https://voicevox.hiroshiba.jp/term/)。
たとえば、ずんだもん・四国めたん・東北きりたんなどはSSS合同会社が音源規約を管理しています。これらはクレジット表記を条件に、商用・非商用ともに利用できます(出典:SSS合同会社「音源利用規約」https://zunko.jp/con_ongen_kiyaku.html)。
一方で、別の権利者が管理するキャラクターは、表記方法や条件が異なる場合があります。使う前に、そのキャラクターの公式規約を必ず確認しましょう。
個人のYouTube収益化はクレジット表記でOK
ずんだもんなどSSS合同会社管理のキャラクターは、音源規約上、商用利用が認められています。したがって、クレジットを正しく表記すれば、広告付きYouTube動画での収益化も基本的に可能です(出典:SSS合同会社「音源利用規約」https://zunko.jp/con_ongen_kiyaku.html)。
メンバーシップや投げ銭、案件動画などの収益形態も、規約の禁止事項に触れない限り利用できます。禁止されているのは、情報商材での利用や虚偽情報の拡散、政治・宗教活動などです。
なお音源の規約は「声」に関するものです。キャラクターの立ち絵やイラストを動画に使う場合は、扱いが別になります。ゆっくり動画全体の収益化の考え方はゆっくり動画の収益化完全ガイドで詳しく解説しています。
立ち絵・イラストは別ガイドラインを確認
声とイラストでは、適用される規約が異なります。SSS合同会社の音源規約のページでも、イラストの利用については別のガイドラインを参照するよう案内されています(出典:SSS合同会社「音源利用規約」https://zunko.jp/con_ongen_kiyaku.html)。
立ち絵素材は、配布しているクリエイターごとに条件が定められていることも多いものです。第三者が作った立ち絵を使う場合は、その作者の規約にも従う必要があります。
「声はOKでも、その立ち絵は別ルール」という二重構造を意識すると、トラブルを避けられます。
YMM4・ゆっくり動画でのVOICEVOX活用法
VOICEVOXで作った音声は、動画編集ソフトに取り込んで初めて動画になります。ゆっくり動画では「ゆっくりMovieMaker4(YMM4)」との組み合わせが定番です。
YMM4とVOICEVOXを連携する手順
YMM4はVOICEVOXと連携でき、ソフト内からずんだもんなどの声を直接出力できます。手順はシンプルです。
まずYMM4を起動し、「ファイル」→「設定」を開きます。「VOICEVOX連携」のタブを選び、インストール済みのVOICEVOX本体(VOICEVOX.exe)を指定します(出典:アリッシアの朝「【ymm4】Voicevoxを連携」https://alicia-ing.com/creative/video/ymm4-cooperation-voicevox/)。
連携後は、キャラクター設定の「ボイス」で声質に「VOICEVOX/ずんだもん」などを選べるようになります。YMM4のタイムラインにセリフを打つだけで、音声と字幕が同時に並ぶため、制作がぐっと速くなります。YMM4の基本操作はYMM4の使い方完全ガイドを参照してください。
ゆっくり動画制作のワークフロー
VOICEVOXとYMM4を使うと、ゆっくり動画はおおむね次の流れで作れます。
- 台本を用意する
- VOICEVOXまたはYMM4連携で音声を生成する
- 立ち絵・背景・字幕をタイムラインに並べる
- BGMや効果音を加えて書き出す
台本づくりでつまずく人は多いものです。構成テンプレートや例文はゆっくり解説の台本の作り方にまとめています。動画全体の作り方はゆっくり解説の作り方完全ガイドが参考になります。
AIで動画を自動生成する選択肢
VOICEVOXとYMM4の組み合わせは強力ですが、音声生成・立ち絵配置・字幕付けを毎回手作業で行うのは負担が大きい作業です。本数を増やすほど、編集時間がボトルネックになります。
そこで近年は、台本から音声・字幕・動画までをAIで自動生成するサービスも登場しています。yukkurigenは、こうした制作工程の自動化に特化したAIゆっくり動画生成ツールです。まずは手動でVOICEVOXに慣れ、量産フェーズで自動化を検討すると、無理なく続けられます。
よくある質問(FAQ)
Q1. VOICEVOXは本当に無料で使えますか?
はい。VOICEVOXのソフトウェアは無料で、商用・非商用を問わず利用できます。条件はクレジット表記と各音声ライブラリの規約遵守です(出典:VOICEVOX「ソフトウェア利用規約」https://voicevox.hiroshiba.jp/term/)。
Q2. クレジット表記はどこに書けばいいですか?
動画なら概要欄や動画内など、視聴者が探せばわかる場所で問題ありません。「VOICEVOX:ずんだもん」のように、ソフト名とキャラ名を併記します(出典:SSS合同会社「音源利用規約」https://zunko.jp/con_ongen_kiyaku.html)。
Q3. ずんだもんで収益化(広告収入)しても大丈夫ですか?
ずんだもんはSSS合同会社の音源規約で商用利用が認められています。クレジットを表記すれば、広告付き動画での収益化も基本的に可能です。ただし立ち絵を使う場合は、その素材の規約も別途確認してください。
Q4. クレジットを書きたくない場合はどうなりますか?
クレジット表記をしない商用利用は、1キャラクターあたり40万円(+消費税)の契約が必要です(出典:SSS合同会社「音源利用規約」https://zunko.jp/con_ongen_kiyaku.html)。個人なら、クレジットを表記して無料で使うのが現実的です。
Q5. Macでも使えますか?GPUは必要ですか?
WindowsとMac、Linuxに対応しています。GPUがなくてもCPU版で動作します。なおMac版はGPUモードに対応していません(出典:VOICEVOX「使い方」https://voicevox.hiroshiba.jp/how_to_use/)。
Q6. 作った音声を動画にするにはどうすればいいですか?
WAVで書き出して動画編集ソフトに取り込むか、YMM4とVOICEVOXを連携させてソフト内で音声を生成します。ゆっくり動画ならYMM4連携が手軽です。
まとめ
VOICEVOXの使い方と商用利用のポイントを整理します。
- VOICEVOXは無料の音声合成ソフトで、Windows・Mac・Linuxに対応している
- インストール後はキャラ選択→テキスト入力→再生→WAV書き出しの流れで音声を作れる
- アクセント・イントネーション・辞書を調整すると、より自然な音声に仕上がる
- 商用利用はクレジット表記が条件。表記すれば個人は無料で収益化も可能
- キャラクターごとに権利者・規約が異なるため、声と立ち絵は別々に確認する
まずは無料でインストールし、ずんだもんで1本の音声を書き出すところから始めてみましょう。慣れてきたらYMM4連携やAIによる自動生成で、制作を効率化できます。yukkurigenの料金プランやマーケットプレイスもあわせてご覧ください。
参考文献・出典
- VOICEVOX「ソフトウェア利用規約」 https://voicevox.hiroshiba.jp/term/ (最終アクセス:2026年6月9日)
- VOICEVOX「使い方」 https://voicevox.hiroshiba.jp/how_to_use/ (最終アクセス:2026年6月9日)
- SSS合同会社「VOICEVOX ずんだもん、東北ずん子ほか 音源利用規約」 https://zunko.jp/con_ongen_kiyaku.html (最終アクセス:2026年6月9日)
- 株式会社インプレス 窓の杜「VOICEVOX」 https://forest.watch.impress.co.jp/library/software/voicevox/ (最終アクセス:2026年6月9日)
- アリッシアの朝「【ymm4】Voicevoxを連携ーずんだもんをソフト内で生成」 https://alicia-ing.com/creative/video/ymm4-cooperation-voicevox/ (最終アクセス:2026年6月9日)