CeVIO AI版の結月ゆかりが1月29日発売決定。なぜCeVIO AIなのか、どうやって作ったのか、VOCALOMAKETSに聞いてみた

すでに発表されていた通り、CeVIO AIのソングボイスとして結月ゆかりが登場するのですが、その開発のメドもつき、2021年1月29日に株式会社テクノスピーチから発売されることが決まりました。これまでVOCALOIDで歌わせたり、VOICEROIDでしゃべらせることができた結月ゆかりが、今回CeVIO AIで歌わせることが可能になったのですが、「どうしてCeVIO AIになったの？」と戸惑いを感じる人も少なくないと思います。

一方、VOCALOIDの開発ストーリーは、これまでもDTMステーションをはじめ、いろいろなメディアで紹介されていましたが、CeVIO AIの歌声をどのように開発するのか、という話はほとんど公開されていないのも事実、今回、結月ゆかりをプロデュースするVOCALOMAKETSのメンバーである、Bumpyうるしさん、かごめPさんのお二人に、詳しいお話を伺うことができたので、なぜCeVIO AIで出すことになったのか、そして、どのように開発したのか、その開発過程で困難だったことなどはないのか……など、いろいろと伺ってみました。

1月29日、「CeVIO AI 結月ゆかり麗」が発売されることになった

ーーまず、一番最初に気になるのは、なぜCeVIO AI？という点です。これまでVOCALOID 3用に結月ゆかり、VOCALOID 4用に結月ゆかり純・穏・凛と出してきたので、今回VOCALOIDの競合？ともいえるCeVIO AIをリリースするという話を聞いて、「え？」と思ったのですが、これはどうしてだったのですか？
うるし：もともと結月ゆかりはVOCALOID 3からスタートしていますが、表現の幅を広げていきたいというのが当初からの思いだったので、VOICEROIDやexVOICE、さらには先日はVoidolをリリースするなど、横方向の展開を進めてきました。今回その一つとしてCeVIO AIに取り組んだということなのです。当然のことながら、これまでのVOCALOIDやVOICEROIDなども製品としては引き続きAHSさんで販売をしていきますし、我々にとっても非常に大切なものとして守っていきたいと考えています。一方で、CeVIOについては、以前から気になっていましたが、昨年の秋くらいにテクノスピーチさんからお声がけいただいたのがキッカケでした。2019年12月にテクノスピーチがある名古屋にちょむPさんといっしょに行って、代表取締役である大浦圭一郎さん、徳田恵一さんに技術的説明を伺ったところ、すごく面白いと感じ、これなら結月ゆかりの表現の幅を広げるには最適だ、と感じ進めていくことにしたのです。

お話を伺ったVOCALOMAKETSのBumpyうるしさん(左)とかごめPさん(右)

ーー実際の制作はいつごろからスタートしたのですか？
かごめ：大浦さんから100曲ほどをワンコーラス分録音してほしいという要望をいただき、今年の6月下旬からレコーディングを開始しました。ここでの条件として、ヤマハミュージックデータショップにあるMIDIデータ楽曲の中から100曲選んでもらうのがいいということだったので、ここからボカロ曲やポップス、アニソン、童謡などを選んでいったのです。

◆VOCALOMAKETSメンバー紹介
・壱號(イチゴウ)：Bumpyうるし @bumpyurushi
・弐號(ニゴウ)：PYS/ぱやP @pys_payap
・肆號(ヨンゴウ)：ちょむＰ @chom
・伍號(ゴゴウ)：喜兵衛 @kihee
・陸號(ロクゴウ)：かごめP @kagome_p
・量産型(リョウサンガタ)：azuma @bk_azuma
・燻銀(ザ・シルバー)：いぶし銀次 @ginji_ibushi

ーーVOCALOIDだと、呪文のような歌詞の単純なフレーズをいろいろ歌って収録する……という話をよく聞きますが、そうではなく、MIDIデータ楽曲？しかもヤマハミュージックデータショップ？
うるし：いや、別にヤマハミュージックデータショップであることが前提というわけではないようです。収録した歌とそのメロディーのMIDIデータ、歌詞が揃っていればいいのだと思います。このヤマハミュージックデータショップであれば、MIDIデータと歌詞を簡単に入手できるので、便利ということのようですね。

ガイドメロディーをすべてVOCALOIDの結月ゆかりで打ち込んだと話すBumpyうるしさん

ーー歌うのは、もちろん結月ゆかりの中の人である声優の石黒千尋（@chihiro_ishi）さんですよね？
かごめ：はい、石黒さんに6月から都内のスタジオに週に1回のペースで通ってもらって、1回で15～20曲程度録音していきました。できるだけ、結月ゆかり的な歌い方にしてもらうため、伴奏データとともに、ガイドメロディーとしてVOCALOIDの結月ゆかりによるものを付けたのですが、この部分は、うるしさんのほうで作成してもらいました。
うるし：これが結構なハードワークでした。一挙に100本は用意できないので、毎週レコーディングに向けて15～20曲分用意する作業に追われました(笑)。伴奏部分はヤマハミュージックデータショップからダウンロードしたMIDIデータをGM音源で鳴らすだけなので、それほど手間はかけてないですが、VOCALOIDのところはベタ打ちとはいえ、譜割りはそれぞれなので、なかなか苦戦しました。

結月ゆかりの中の人である声優の石黒千尋さん

ーーレコーディングはスムーズに行ったのですか？
かごめ：レコーディングはCubaseを使って行いました。どのDAWが効率よく作業できるかを考えたのですが、Cubaseが一番でした。Cubaseを使えば、1つのプロジェクト内に100曲一気に並べ、サイクルマーカーを打つことで、一度の操作で100曲を別々のファイルとして書き出すことができます。こういった録音の際は非常に便利ですね。レコーディング中、石黒さんにはできるだけ、ゆかりを演じてもらったのですが、難しい点もありましたね。

Cubaseの1つのプロジェクト内にすべての楽曲を並べてレコーディングしたという

ーーCeVIO AIは、歌唱データをディープラーニングさせることで、歌った本人そのものの歌声のようにするのを目指すシステムですもんね……。
うるし：今回どうやってゆかりに寄せるかが苦労したところで、9年前にVOLCAOID 3版のゆかりを作ったころより、石黒さんの歌唱力が断然UPしていたのが背景にあるんだと思います。もっとも、石黒さんっぽさが悪いというわけではなく、石黒さんの一番美しく声の出ている音域でもあるため、音楽的には一番おいしい部分。これをうまく生かしつつも、ゆかりらしさをどう引き出すか……ですね。レコーディング時においては、マイクをいろいろと替えながら試した結果、真空管マイクであるRODEのNTKを使ってみたところ、一番ゆかりっぽくなったので、すべてこれで録っています。ただ8月中旬まで3/4ほど録り終わったところで、いろいろと調整方法を試すために一旦止めました。

今回、石黒さんのレコーディングに使ったRODEの真空管マイク、NTK

－－実際、調整ってどんなことをするんですか？
かごめ：レコーディングした結果、低域と裏声はとてもゆかりっぽさが出ている一方で、中～高域は石黒さんらしさがありました。そこでフォルマントを下げたり、低域で録ったものに対してピッチを上げる処理をしてみたり……。ここでは、ちょむPさんがMelodyne、Graillon2、Little AlterBoy、Waves Tuneを使用してピッチシフトしてみた結果、ソフトによってかなり違いがあることもわかりました。同様にフォルマント下げも僕とうるしさんで、ACID ProやMelodyneを使って試してみました。そのほか、ちょむPさんには歌ボ（VOICEROIDを歌わせたもの）とも比較してもらうなど、さまざまな試行錯誤を繰り返しました。

レコーディングのオーディオインターフェイスにはSound Devices Mixpre 3が用いられた

ーーどうするのがいいのか、簡単に結論は出たのですか？
うるし：実はVOCALOMAKETSのメンバー内でも意見が分かれたんです。当時の意見のやりとりを引っ張り出してみると、以下のような感じでした。

・中高域は石黒さん感が強い
・中高域で辛そうな感じが出ている
・中高域でかわいらしい感じが出ている
・逆に、中高域がゆかりっぽいのでそのままが良い
・むしろ何もしない方がゆかりっぽい
・フォルマントピッチを下げるとゆかりっぽさが出ている気がする
・フォルマントピッチを下げると辛そうな部分が裏声になって良い感じに抜けている気がする
・フォルマントピッチを下げるのは1.0以上は厳しい気がする
・フォルマントピッチ処理はAcid Proが自然に聴こえるのでは？
・低域のおいしい部分を活かすために、あえて中高域部分もピッチを下げて再度収録し、ピッチを上げて低域部分と合体させてみてはどうか？
→つなぎ目などは大丈夫か？
・ピッチシフトは＋２が限界でそれ以上は厳しい
・ピッチシフトはWavesTuneが自然な感じだがピッチコレクトがかかってしまう
→そのままでも大丈夫か手直しが必要か？
・Acid Proでのピッチシフトは自然な感じだが、ノイズが所々に乗って使えなかった
・そもそもピッチシフトはしない方がよい

「中高域で石黒さんの要素が強い」という意見もあれば、逆に「中高域がゆかりっぽい」、「何もしない方がゆかりっぽい」という意見もあり……。フォルマントピッチを下げてみたり、中高域部分もピッチを下げて再度収録し、ピッチを上げて低域部分と合体させる……。これでは、なかなか収拾がつかないので、外部の方々にもアドバイスをいただきました。
お願いしたのはねじ式さん、たかぴぃさん、とうふさんの3人。みなさんの協力もあって、少しずつ意見がまとまっていきました。

ーー世界中、こんなことをやった人はいないので、どうなるか予想もつかないし、まさに試行錯誤だと思いますが、具体的にはどのようにしていったのでしょう？

うるし：私とちょむPさんの意見として、いっそのこと中高域部分を除いてしまって、そのデータを学習させるのはどうだろうか、きっとその部分をAIが補間してくれて、全体がゆかりっぽくなるのではないか……と期待したんです。とはいえ、そんな方法でうまくいくのか、テクノスピーチさんに聞いてみたのです。その結果、大浦さんから戻ってきた言葉が以下のものでした。

これまでそのような極端な実験は試したことがありませんが、ある音高がデータに無い場合でもこれまで問題になったことはありませんので，音は出る（補間される）とは思います。ただ、どのように補間されるかは学習してみないとわからない状態です。つまり、低音（例：B3まで）と高音（例：C5以降）だけで学習した場合、その間（例：C4～B4）の声質が、低音の声質を模倣するものになるか、高音の声質を模倣するものになるか、その中間の声質になるかがわかりません。

まさにイチかバチかという感じですね。
かごめ：収録済の音源をすべて聴き直して、石黒さんっぽい部分をピックアップする作業をちょむPさん、銀次さんに頼みました。たとえば「この曲のサビ部分はNG」だとか、「こっち曲は全部がNG」……といった振り分けですね。

ーーそこからどうしていったのですか？
うるし：2か月間、どうすればゆかりになるか、本当に真剣にみんなで考えました。残り数十曲あったわけですが、童謡を残していたので、これをうまく活用していこうということになったのです。つまり、今まで録った音声のどの音域が石黒さん要素が強くなるかを分析した上で、低域と裏声にわけて、同じ曲を2回ずつ収録するという方法をとることにしたのです。そのためのオケとガイドボーカルの作成をし、準備を進めていきました。また、テクノスピーチさん側からは、拗音（キャ、ショ、ニュ…のように、小さいャ、ュ、ョなどが入る音）が足りない指摘を受けていたので、銀次さんにお願いして童謡の歌詞を変えたりもして準備を進めました。

レコーディング全般を担当されたVOCALOMAKETSのかごめPさん
かごめ：これで方向性はまとまったので10月中旬に収録再開し、一気に録っていきました。童謡を低域（G2～E3）と裏声（C4～G4）とそれぞれ収録していきました。高域で歌うのが厳しい曲は飛ばしましたね。石黒さんもかなり辛そうでしたが、休み休み、本当に頑張って協力してくれたのはありがたいことでした。最後に、膨大な収録音声のリップノイズ除去などをちょむPさんにも協力してもらいながら仕上げていきました。
うるし：最終的には低域、裏声と別々に録ったのをダブルカウントした結果、トータル97曲になりました。こうしてできたデータを11月にテクノスピーチさんに入稿。あとは神に祈る気持ちでしたよ。

でも、やれるだけのことはすべてやったので、これでダメならもう仕方がないって気持ちでした……。待っている間は、本当にドキドキでしたが、できあがったプロトタイプを使って、ねじ式さんに作ってもらった曲を聴いたときには、もう感無量でした……。

CeVIO AIのソングエディター上で、結月ゆかり麗を使った画面。基本的な使い方はCeVIO Creative Studioと同じ

ーー私も、その後発表された曲を聴いて驚きました。まさに結月ゆかりが、滑らかに歌う感じになっていて、すごい！と。一方で、ベータ版を使わせていただいたところ、石黒さんっぽい感じもあるな、とは感じました。
うるし：これまでの苦労が報われた思いです。ぜひ、多くの方にも使っていただきたいですね。私としては、石黒さんのよい部分と、ゆかりらしさを追及した部分のハイブリッドなゆかりになったな、と感じています。もちろん、使う人、聴く人によって印象はそれぞれだと思うので、この新しいCeVIO AI版のゆかりも多くの人に気に入っていただけると嬉しいです。そのねじ式さんに作っていただいた楽曲を、製品版で歌わせた公式デモソングが以下の動画です。

うるし：そして、今回新たに、ちいたな（@dokotana）さんに作っていただいたデモソングがこちらになります。

VOCALOMAKETS · 【公式】CeVIO AI 結月ゆかり麗【デモ02】

ーー今日のお話を伺うと、よくここまで仕上がったものだな……と感激してしまいますね。1月29日に発売とのことですが、価格などはどのようになるのでしょうか？
うるし：初回盤においてはCeVIO AIのエディターと、「CeVIO AI 結月ゆかり麗」ソングボイスのセットで、パッケージ版が18,800円（税別）、ダウンロード版が17,800円（税別）となり、テクノスピーチさんから発売されます。またこの初回特典として結月ゆかり麗のアクリルスタンドが付属しますので、ぜひ、この機会にご購入いただけると嬉しいです！なお、CeVIO AI 結月ゆかり麗のソングボイス単体は2月以降を予定しています。

CeVIO AI 結月ゆかり麗は1月29日発売

ーーありがとうございました。なお、今回の制作のアドバイザーでもあるねじ式さん、たかぴぃさん、とうふさんからはコメントもいただいているので、以下にご紹介します。

ねじ式さんからのコメント
Twitter：@nejishiki0221
元々「人間の声に近い」と感じていた結月ゆかりの声が圧倒的な解像度でリアルになった感じがしました。
元々歌詞を大切に創作活動をしているので僕の書いた歌詞に新たな魂が宿るのが本当に楽しみです。
一層魅力を増した彼女とこれからも長い付き合いになる予感しかしません！

たかぴぃさんからのコメント
Twitter：@niconico_takap
■請けたときの印象
既存のボーカロイドとは全く違うCeVIOというプラットフォームへの移植ということで、ボカロマケッツさんが当初から思慮しておられた「ゆかりらしさ」をどう保つか、どう進化させるかだという事は最初に話を頂いた時から自分的にもキーになるなと思っていたので凄く共感出来ました。

「ゆかりらしさ」と言っても実は考え方は多様で、改めて「ゆかりとは一体」みたいな議論を当のボカロマケッツさん自身が戦わせてるのは非常にいちゆかりファンといして興味深く、また自分自身のゆかりのイメージを見つめ直すいいキッカケにもなったお仕事でした。

■完成音声を聴いた時の印象
第一印象はホッとしたの一言でした。紛れもなくこれは「ゆかり」だなと。
正直なところイメージは良くも悪くも変わってしまうだろうと予想していたのでこれは嬉しい誤算でした。

進化させつつ「ゆかりらしさ」を守ってくれた石黒千尋さんやボカロマケッツさんはもちろん、開発に携わった全ての方々の苦労を考えると全方位どこに足を向けても寝られなくなっちゃいますが、微力ながら自分もアドバイザーとして音声の品質チェックなどをお手伝いさせて頂き、つくづく光栄な役目だったなあと噛みしめております。

とうふさんからのコメント
Twitter：@tohfu102
協力依頼を受けた当時は、いただいた石黒さんの音源を繰り返し聴きこんで、そこに宿る朧げな結月ゆかりらしさを探していた覚えがあります。
ですが、出来上がった音は明らかに結月ゆかりの音源になっていて、今度は探さないと石黒さんらしさが見つからない完成度でした。
VOCALOMAKETSさんは一体どんな魔法を使ったのかと驚きましたね……。

※2021.01.28追記
2021.01.12に放送した「DTMステーションPlus！」から、第166回「ZOOM V3でDTMに新次元のVocalを！」のプレトーク部分です。「CeVIO AI版の結月ゆかりが1月29日発売決定。なぜCeVIO AIなのか、どうやって作ったのか、VOCALOMAKETSに聞いてみた」から再生されます。ぜひご覧ください！