スポンサーリンク

商用利用OKのAI音声合成ソフト「VOICEPEAK 商用可能 6ナレーターセット」にvol.2登場。4年間で大きく進化したエンジンとともに個性豊かな7種の声を収録

この記事は約14分で読めます。
この記事にはアフィリエイトなどPRが含まれています

2022年3月、音声合成業界に大きな衝撃を与えたAI音声合成ソフト「VOICEPEAK 商用可能 6ナレーターセット」が登場してから、早くも4年以上が経ちました。この製品はSynthesizer Vを開発したDreamtonicsが、歌声ではなく、しゃべるソフトを、過去最高といってもいいクオリティーで出したという点でも衝撃的でしたが、グッドデザイン賞を受賞したり、BCN AWARDのユーティリティソフト部門でも高く評価されるなど、社会的にも大きなインパクトを与えた製品でした。

その後VOICEPEAKはさまざまな声の製品がリリースされてきましたが、このたび待望の新製品「VOICEPEAK 商用可能 6ナレーターセット vol.2」が6月30日に発売されることが発表されました。今回は、vol.1とはまったく毛色の異なる7種類の声を収録しつつ、4年間でコツコツと積み重ねられてきたエンジンのアップデートも見どころのひとつともいえそうです。発売に先駆けて、そのvol.2を試してみたので、実際に使ってみた印象も交えながら紹介していきたいと思います。


スポンサーリンク
スポンサーリンク

4年間で積み重ねてきたVOICEPEAKの歴史

まずは、その新製品である「VOICEPEAK 商用可能 6ナレーターセット vol.2」の紹介動画があるので、こちらをご覧になってみてください。

もはや人がしゃべっているのか、コンピュータの声なのか、判別不可能という領域に来ていることがここからも十分わかると思います。この新製品の詳細の前に、そもそもVOICEPEAKというのはどんなソフトか、という話をあらためて整理しておきましょう。

VOICEPEAKは、Dreamtonics株式会社が開発したAI音声合成エンジンをベースに、株式会社AHSが企画・販売している入力文字読み上げソフトです。Windows、macOS、Linuxの3プラットフォームに対応しており、テキストを入力するだけで高品質な音声を合成できます。歌声合成の世界でよく知られているSynthesizer Vと同じエンジン開発チームが手がけているのが特徴で、当初から「人間の喋り声にしか聴こえない」と評されるほどの高い品質を誇っていました。

VOICEPEAKはSynthesizer Vを手掛けるチームが開発している

そして「VOICEPEAK 商用可能 6ナレーターセット」のもうひとつの大きな特徴が「商用利用可能」という点です。従来の音声合成ソフトは、商用利用には別ライセンスが必要というビジネスモデルが主流でした。それに対して「VOICEPEAK 商用可能 6ナレーターセット」は、製品を購入するだけで個人・法人・教育機関を問わず商用・業務利用が可能という、当時としてはかなり革命的なポリシーを打ち出しました。この「買い切りで商用OK」というシンプルさが多くのユーザーに支持され、グッドデザイン賞やBCN AWARDといった社会的な評価にもつながったといえるでしょう。なお、BCN AWARDについては今回の発表でもユーティリティソフト部門での受賞が紹介されており、AHSとしては同部門9年連続の受賞となっています。

2022年にBCN AWARDを受賞

 

VOICEPEAKシリーズが最初に登場した2022年以降、AHSはラインナップを着実に拡充してきました。Synthesizer Vのように「エンジン(エディタ)」と「声のライブラリ」が別売りになっているのとは異なり、VOICEPEAKはエンジンと声がセットになっているため、1製品を購入すればすぐに使い始められるというわかりやすさが魅力のひとつです。

グッドデザイン賞も受賞している

 

ただし、仕組みとして理解しておきたいのは、すべてのVOICEPEAK製品に含まれるエンジン+エディタは共通のものだという点です。2本目以降の製品をインストールすると、新たなエディタがもう1つ増えるわけではなく、すでにインストール済みのエディタのなかにライブラリ(声のデータ)が追加される形になります。つまりvol.1とvol.2を両方持っていれば、起動するアプリはひとつのままで、そこで選択できる話者が14種類に増えるというイメージです。キャラクター系製品も含め、どれだけVOICEPEAK製品を追加しても管理するアプリは1つで済むため、複数の声を使い分ける際も操作に迷いがありません。

キャラクター系VOICEPEAKの広がり

6ナレーターセット(vol.1)の発売から約9ヶ月後の2022年12月には、キャラクターシリーズ第1弾として「VOICEPEAK 東北ずん子」「VOICEPEAK 彩澄しゅお」「VOICEPEAK 彩澄りりせ」「VOICEPEAK フリモメン」が登場しました。以降、さまざまなキャラクターのVOICEPEAK製品が続々とリリースされています。

AHSのキャラクターをはじめ数々のVOICEPEAK製品が誕生している

AHSオリジナルキャラクターとしては弦巻マキ、宮舞モカ、水奈瀬コウ、水奈瀬リト、桜乃そら、フリモメンなどがVOICEPEAKで展開されており、それぞれ異なる声優の声を元に制作されたAI音声合成ボイスとして使えます。また重音テトや邪神ちゃんといった他コンテンツとのコラボレーション製品など個性的な声のキャラクター製品も揃っています。

ただし、これらキャラクター系製品は「商用可能」な6ナレーターセットとはライセンス体系が異なります。キャラクター系製品は基本的に個人の非商用利用を前提としており、商用・業務利用には別途商用ライセンスの購入が必要です。これに対して6ナレーターセット(vol.1、そして今回のvol.2)は、製品購入だけで個人・法人・教育機関の商用・業務利用まで対応しているという点が大きな違いです。

地道に進化してきたエンジンとUI

あまり派手には語られてきませんでしたが、この4年間でVOICEPEAKのエンジンとUIは着実にアップデートを重ねてきています。AHSのセットアップページに掲載されている更新履歴を見ると、現在の最新版は1.2.21であり、バージョン1.0から数えると非常に多くの改善が積み重ねられてきたことがわかります。

最新のVOICEPEAKのUI

代表的なアップデート内容をいくつか振り返ってみましょう。

バージョン1.2.11では、字幕ファイル形式として広く使われているSRT形式とLAB形式での出力に対応しました。動画編集ソフトへの連携がいっそうスムーズになり、動画クリエイターからの要望に応えた形です。また同バージョンでは、アクセント・イントネーション情報を含めたコピー&ペーストも可能になっています。

現在のバージョンは1.2.21になっている

バージョン1.2.12ではSSML形式のインポートに対応。SSMLはW3Cが策定した音声合成用マークアップ言語で、さまざまなTTSシステムで使われており、ほかのシステムとのデータ連携がしやすくなりました。

バージョン1.2.13では全体の音量調整機能が追加されるとともに、感情プリセットの機能が強化されました。話速・ピッチなどの「設定」も含めたプリセット保存が可能になり、複数の声を使い分ける作業が格段に効率化されています。

バージョン1.2.13では全体の音量調整機能が追加されている

バージョン1.2.15では、予期しない終了に備えた自動保存・復元機能が追加されました。長時間の作業中にソフトが落ちてしまった場合でも、作業内容を失わずに済むようになっています。

バージョン1.2.16では、セリフ編集エリアで単語を範囲選択してそのまま右クリック辞書登録ができる機能が追加されました。

バージョン1.2.18では複数セリフブロックの一括選択・操作が可能になり、一括でのボイス変更や感情設定の調整といった操作が行えるようになりました。

バージョン1.2.19では、文中のポーズ時間をミリ秒単位で指定できるようになりました。ナレーションのタイミングを精密にコントロールしたいユーザーにとっては非常に有用な機能です。

ポーズ時間をミリ秒単位で設定できるようになっている

そして最新のバージョン1.2.21では、新規プロジェクト保存時の初期ファイル名設定や、拗音入力時の発音バグ修正といった改善が施されています。

こうした地道なアップデートの積み重ねは、VOICEPEAKが「発売して終わり」ではなく、ユーザーの声を聞きながら継続的に磨き続けられているソフトであることを示しています。現在はβ版としてバージョン1.2.22b2も公開されており、引き続き機能強化が進んでいます。

vol.1とは毛色の違う7種の声を収録した「商用可能 6ナレーターセット vol.2」

そして今回発売が発表されたのが「VOICEPEAK 商用可能 6ナレーターセット vol.2」です。

2022年に発売されたオリジナルの6ナレーターセット(vol.1)の続編という位置づけになります。vol.1には女性1〜3・男性1〜3・女の子の7種類の声が収録されていましたが、今回のvol.2では、それらとはまったく重複しない、異なる個性を持つ7種類の声が収録されています。

収録されている7種の声は以下のとおりです。

  • 女性4:中音域寄りのやや少しハスキーな声質
  • 女性5:しっとりした落ち着いた声質
  • おばあさん:熟年女性のやわらかく落ち着いた声質
  • 男性4:やや高めのトーンの声
  • 男性5:中音域中心のやわらかく穏やかな声色
  • おじいさん:熟年男性の深みのある声
  • 男の子:小学生くらいの少年をイメージした声

実はこれら7種の声はいずれも、以前から「VOICEPEAK 商用可能 ナレーター」という単品製品として個別に発売されているものです。vol.1の女の子に対応する「男の子」も2023年1月に単品でリリース済みで、「おじいさん」「おばあさん」も同様に単品で購入できます。今回のvol.2はそれらをまとめてセットとして購入できるようにしたパッケージという性格を持ちます。

7種類の声を選択できるようになっている

とはいえ「おじいさん」「おばあさん」という熟年系のボイスも含め、若い声中心だった音声合成ソフトの世界では比較的珍しい個性の声が揃っており、バリアフリー系コンテンツやドキュメンタリー風ナレーション、昔話の読み上げなど、さまざまなシチュエーションで活躍するラインナップです。

実際に使ってみた印象ですが、vol.1の声とは確かに毛色が違います。vol.1が比較的フラットでクリアなナレーション向きの声が中心だったのに対し、vol.2はより個性が際立つラインナップになっているように感じます。女性4のハスキーさ、女性5の落ち着きのある雰囲気、おばあさんのやわらかさ、おじいさんの深みある声は、それぞれ独自のキャラクター性を持っており、単なる「ナレーター」としてだけでなく、キャラクターボイスとしての使い道も広がります。

感情パラメータの調整も簡単に行うことができる

感情パラメータ(幸せ・楽しみ・怒り・悲しみ)による調整ももちろん使えます。たとえばおじいさんの声で怒りパラメータを上げると、また違った表情が出てくるなど、パラメータの効き方が声ごとに異なるのも面白いところです。

セット購入の価格メリット

前述のとおりvol.2の7種は単品の「VOICEPEAK 商用可能 ナレーター」としても購入できますが、セットで買うと大幅にお得になります。単品の通常価格は1本11,980円なので、6本分をバラで揃えると合計71,880円。これに対してvol.2のダウンロード版は23,800円ですから、約48,000円の差になります(なお「男の子」はvol.2に含まれますが、単品でも同価格で購入可能です)。

すでにvol.1をお持ちで6ナレユーザー優待を使える場合、単品の優待価格は1本5,980円なので6本で35,880円。一方vol.2の6ナレユーザー優待ダウンロード版は21,800円ですから、それでも14,000円ほどお得になります。

VOICEPEAKシリーズとの連携

先に述べた仕組みのとおり、既存のVOICEPEAKシリーズ製品をお持ちの場合、vol.2をインストールするだけで、今お使いのエディタ内にvol.2の7種の声がそのまま追加されます。vol.1の声とvol.2の声を同一プロジェクト内でシームレスに使い分けることができますし、キャラクター向けのVOICEPEAK製品と組み合わせることも同様です。プロジェクトファイルの保存・読み込みや感情プリセットの設定なども話者をまたいで一貫して機能するため、複数製品を揃えるほど声の選択肢が広がりながらも、操作感はずっと変わりません。

価格と購入方法

価格(税込)は以下のとおりです。

製品名 価格(税込)
VOICEPEAK 商用可能 6ナレーターセット vol.2(パッケージ版) 29,800円
VOICEPEAK 商用可能 6ナレーターセット vol.2(ダウンロード版) 23,800円
VOICEPEAK 商用可能 6ナレーターセット vol.2 AHSユーザー特別版※1 24,800円
VOICEPEAK 商用可能 6ナレーターセット vol.2 6ナレユーザー優待ダウンロード版※2 21,800円

※1 AHSストア限定のAHSユーザー向け商品。「AHS製品をお持ちで、かつユーザー/製品登録をお済みの方」を対象とした特別価格の商品。

※2「6ナレユーザー優待版」は「VOICEPEAK 商用可能 6ナレーターセット」(vol.1)をお持ちで、かつユーザー/製品登録済みの方向けの特別価格。AHSのWebサイトにログイン後のマイページからのみ購入可能。

vol.1をすでにお使いの方には、優待ダウンロード版の21,800円が最もリーズナブルな選択肢になります。また、AHS製品を何かしらお持ちのAHSユーザーであれば、24,800円のAHSユーザー特別版という選択肢もあります。

動作環境は以下のとおりです。

項目 内容
OS Windows 11以降(64bit)、macOS 10.13以降、Ubuntu 20.04以降(64bit)
CPU Intel Core i3以上(Windows/Intel Mac/Linux)、Apple M1以上(Appleシリコンのみ)
メモリ 2GB以上
ストレージ 500MB以上の空き容量(SSD推奨)
ディスプレイ 1280×720以上(1920×1080推奨)
その他 インターネット接続環境必須、オーディオデバイス

なお、パッケージ版にはDVD-ROMが付属しますが、AHSのWebサイトからセットアップファイルをダウンロードすることも可能です。

用途はナレーションから動画・教育・ゲームまで

改めて、VOICEPEAKの活用シーンを整理しておきましょう。

最もよく使われているのが動画のナレーション用途です。YouTubeやニコニコ動画などの動画コンテンツで、自分の声の代わりにVOICEPEAKで読み上げさせるケースは今や非常に一般的になっています。ゲーム実況はもちろん、旅動画、料理動画、解説系動画など、あらゆるジャンルの動画クリエイターが使っています。

企業・法人向けの用途も広がっています。プレゼンテーション動画や社内教育コンテンツ、製品紹介動画など、業務での利用が追加費用なしで可能という点は引き続き大きな強みです。教育機関での利用もそのひとつで、リスニング教材の作成や授業用のナレーションとして活用されているケースもあります。

スピーチや原稿のチェックにも便利で、書いた文章をVOICEPEAKに読み上げさせることで、文章の長さや読みやすさ、流れを耳で確認できます。タイムライン表示による読み上げ時間の把握も、スピーチ練習には役立ちます。

さらに、ゲームや音声ドラマ、オーディオブックなど、創作系の用途でも使われています。複数のVOICEPEAK製品を持てば、登場人物ごとに異なる声を割り当てた音声劇の制作なども可能です。

vol.1との組み合わせで広がる表現力

今回のvol.2がvol.1と明確に異なるのは声のキャラクター性の幅広さです。vol.1は標準的なナレーター向けの声が揃っていましたが、vol.2は熟年の声(おじいさん・おばあさん)から少年の声(男の子)まで、世代の幅が大きくなっています。

この2製品を組み合わせて使うと、子供から老人まで幅広い世代の声を1つのプロジェクトで扱えるようになります。家族が登場するシナリオを音声ドラマとして制作したり、世代を超えた語りかけが必要な教育コンテンツを作ったりといったことが、すべてVOICEPEAKだけで完結するようになります。

vol.2のラインナップは女性4・女性5・おばあさん・男性4・男性5・おじいさん・男の子の7種ということで、これをvol.1の7種と合わせると計14種の声が手元に揃うことになります。さらに、前述したさまざまなキャラクター系VOICEPEAK製品を組み合わせれば、個性豊かな声の資産がさらに充実していきます。

発売に向けて

「VOICEPEAK 商用可能 6ナレーターセット vol.2」の発売日は2026年6月30日(火)で、本日2026年6月5日(金)に正式に情報が解禁されました。パッケージ版・ダウンロード版・AHSユーザー特別版・6ナレユーザー優待ダウンロード版の4形態での展開となっています。

製品の詳細やサンプル音声については、AHSの製品ページで確認できます。

製品ページ:https://www.ah-soft.com/voice/6nare/

導入事例:https://www.ah-soft.com/voice/6nare/case/

4年間のアップデートで着実に完成度を高めてきたVOICEPEAKというプラットフォームに、新たなラインナップが加わることになります。すでにVOICEPEAKをお使いの方はもちろん、これからはじめてみようと考えている方にとっても、このvol.2の登場は良いきっかけになりそうです。

【関連情報】
VOICEPEAK 商用可能 6ナレーターセット vol.2製品情報

コメント