自然なしゃべりを実現するVOICEROIDって知ってた!?

VOCALOIDの調教パラメータ、PITPBSをうまく利用することで、一定の音程であっても、イントネーションをつけてしゃべらせることは可能です。うまい人が作ると、結構自然なしゃべりになって驚きますよね。でも、しゃべらせることが目的だとしたら、本来、歌を歌わせるVOCALOIDを使うのはあまり正解ではないかもしれません。

Text to Speach、いわゆるTTSというツールを使うことで、もっと簡単にキレイにしゃべらせることができるからです。そんなツールのひとつとして、「VOICEROID(ボイスロイド)」というのがあるのをご存知ですか?私も、名前は知っていたのですが、使ったことがなかったので、イマイチ理解していなかったのですが、先日試してみたら、あまりにも簡単で、かつキレイな日本語をしゃべってくれるのでビックリしました。DTMという趣旨からは少しズレてしまうかもしれませんが、今回はVOICEROIDについてちょっと紹介してみましょう。
簡単にしゃべらせることができるVOICEROID


VOICEROIDとはAHSが販売している「入力文字読み上げソフト」のシリーズ名称。明らかに「VOCALOIDをモジったな」と思わせるネーミングですが、現在、
VOICEROID 月読アイ
VOICEROID 月読ショウタ
VOICEROID+民安ともえ(弦巻マキ)
VOICEROID+鷹の爪 吉田くん
の4製品および、月読アイと月読ショウタをセットにした月読ショウタ妹パックが存在しています。

VOCALOIDと同様、実際の人の声をサンプリングしたデータを使ってしゃべらせるのですが、エンジンのほうは株式会社エーアイという会社が作ったものが採用されています。

VOCALOIDと比較すると使い方はいたって簡単。ソフトを起動して、テキストボックスに読ませたい文字を入力して「再生」ボタンを押すだけです。まずは、これを聴いてみてください。

VOICEROIDにベタ打ち(?)で入力してしゃべらせた音声
これ、VOICEROID+民安ともえ(弦巻マキ)を使って作ったのですが、VOCALOIDでいうところのベタ打ち。何も調整していないんですよ。しかもVOCALOIDに慣れている私として驚いたのは、「は」を「わ」と置き換えたりする必要がないどころか、漢字でそのまま入力しても読んでくれるんです。科学の進歩はすごいなぁ、と。

ちなみに、動画のほうはVOICEROID+民安ともえのパッケージにオマケとして収録されていた動画作成ソフト、CrazyTalk5 LEを使って作っています。これも単純にキャラクタを選択して、VOICEROIDでエクスポートしたWAVファイルを読み込んだだけなんですけどね。

VOICEROID同梱のオマケソフト、Crazy Talk 5 LEで動画も作成

ただ、考えてみると、最近、ニコ生などでもコメントを音声合成で読み上げるシステムを使っているのをよく見かけますよね。あれって何だろうと調べてみると、フリーウェアで「棒読みちゃん」なるものを使っているケースが多いみたいです。フリーウェアというわけでさっそく入手して試してみた結果が以下のとおりです。

フリーウェアの「棒読みちゃん」で同じフレーズを読ませてみた
どうですか?これだってすごいとは思いますが、やっぱりVOICEROIDを見た後だと、ちょっとレベルが違うものだな、というのが正直なところです。VOICEROID+民安ともえは実売8,000円弱で、このクオリティーを出せるわけですから、買う価値は十分あるな、と…。

さて、先ほどまったく調教せずに、これだけのしゃべりができることを紹介しましたが、もちろん色々としゃべりをいじることは可能です。

まずはイントネーション。これ、単に文字を入力するだけで自動的につくようになっていますが、中には違和感を感じるイントネーションがあることも確か。その場合は、イントネーション設定画面で修正することは可能です。また辞書機能を使って、イントネーションについて登録しておくこともできます。
イントネーションをある程度いじることは可
ただし、VOCALOIDのPITをいじるように自由度が高いわけではなく、基本的には上がるか、下がるかという2通りであり、それも標準語を基本としているこのVOICEROIDでは3パターンしか設定はできないようです。イントネーション以外でも間を空けたり、無声化したり、繋いだりといった編集操作もできるようでした。さらに試してみると最後に「?」をつけると声が持ち上がるなど、入力の仕方によってある程度の演出はできるようです。

一方、「音声効果」というページを開くと、いくつかのパラメータを調整することができました。具体的には音量、速度、ピッチのほかエコー(リバーブ)などがあります。基本的には標準のままでいいと思いますが、必要に応じて調整してみるのも面白そうです。完成したら音声データとしてWAVファイルに保存することができます。
しゃべる速度やピッチなどパラメータをいじることも可能

このWAVファイル、フォーマット的にはモノラルの16bit/16kHz16bit/8kHzのいずれかが選択できますが、通常は音質のいい16bit/16kHzを選んでおくのがいいでしょう。

なお、AHSのサイトではそれぞれで作成したボイスサンプルがUPされています。キャラクタによってかなり雰囲気も変わってくるので、チェックしてみると面白いと思います。

●VOICEROID月読アイのサンプル
●VOICEROID月読ショウタのサンプル
●VOICEROID+民安ともえ(弦巻マキ)のサンプル
●VOICEROID+鷹の爪 吉田くんのサンプル
(※上記サンプルはいずれも16bit/16kHzのモノラルのWAVファイルです) 

このようにして簡単にデータ生成できる音声合成ソフト、VOICEROIDですが音楽作品にMCとして入れてみるとか、ラップ調に使ってみるとか応用範囲はいろいろと広そうです。

モバイルバージョンを終了