E.V.E.C.やPiapro Studioの素朴な疑問をクリプトンに聞いてみた

クリプトン・フューチャー・メディアが3月19日に発売した、VOCALOID 4対応の巡音ルカV4X。先日の記事「巡音ルカ V4X搭載のE.V.E.C.の魅力とPiapro Studio V4モードの破壊力」においても、レポートしましたとおり、クリプトン独自の「E.V.E.C.」というシステムを搭載したことで、表現できる歌声の幅が大きく広がっています。

でも、なぜVOCALOID 4というYAMAHAのシステムにE.V.E.C.という独自システムを搭載できたのでしょうか?またAppendのようなライブラリーのバリエーションとどういう関係にあり、VOCALOID 4で搭載されたクロスシンセシスではどう扱われるのか……と気になることもいっぱいあります。そこで、初音ミクや巡音ルカの生みの親としても知られるクリプトン・フューチャー・メディアの佐々木渉さん、Piapro Studio開発者である同社の黒田毅さんにお話しを伺ってみました(以下、敬称略)。


E.V.E.C.という新しい機能を搭載したPiapro Studio for V4X



--E.V.E.C.のアイディアはいつごろからあったのですか?また、これは実はV3でもやろうと思えば搭載可能な技術だったのでしょうか?それともV4でないとできない理由があったりするのですか?

佐々木:これはアペンドのアプローチを始めたころから、その先どうやっていったらいいかな……と考えていたものです。その意味ではアペンドの延長線上に存在するものなのですが、E.V.E.C.が必ずしもアペンドの代わりになるものというわけでもありません。やはり両方あったほうがいいし、シチュエーションによって使い分けるものであると考えています。システム的にはVOCALOID2ではできなかったもので、VOCALOID3であれば実装は可能だったかと思います。


初音ミクの産みの親としても知られる、クリプトン・フューチャー・メディアの佐々木渉さん 

--E.V.E.C.のシステム、技術はあくまでもクリプトンさんが独自にVOCALOIDを拡張したものである(ヤマハへの確認はとっていたのだとは思いますが…)、という認識でいいんでしょうか?それとも、もともとVOCALOIDが持っていた機能で使われていないもの(?)を活用して使っているのでしょうか?

佐々木:私たちはVOCALOIDはサンプラーであるという認識です。ただし汎用的なサンプラーではなく、特殊なサンプラーであり、「歌わせる」という用途に特化させたサンプラーですね。基本的な使い方としては、日本語のライブラリーなら日本語の全発音、英語のライブラリーなら英語の全発音を入れているわけですが、それ以外のものでも本当は何でも入れられるわけですよ。いわばサンプルスロットのようなものがいっぱいあるので、応用として、そのスロットを利用してしまおう、という発想です。サンプラーの応用という範囲で、いろいろなことが考えられます。ただし、従来規定していないものを入れたら、それを発音させるために、新しい記号を付けていく必要があります。それをやりすぎると、記号の体系はおかしくなってしまうし、容量も膨大になってしまいます。そこで、極端なことにならないように、ヤマハ社がサンプラーとしての自由度にある程度の制限をかけているというようなイメージですね。


ノートを右クリックすると、「E.V.E.C.の設定」というメニューがある 

--なるほど、ということはE.V.E.C.はVOCALOIDを拡張したというよりも、VOCALOIDが設けている制限をある程度外した……というわけなんですね。

佐々木:それで、概ね合っていると思います。われわれがシステム的に何か新たなものを開発して、エンジンのプログラムを書き換えたというわけではなく、VOCALOIDがもともと持っている構造をうまく利用したということなんです。


E.V.E.C.の設定画面。Voice Color、Voice Release、子音拡張の3種類の設定ができる

--今回のPiapro Studio 2.0を使ってみて、E.V.E.C.が非常にスムーズに搭載されたという印象を受けましたが、Piapro Studioを最初に出した時点で、E.V.E.C.の搭載を念頭に置いていたのでしょうか?
黒田:ありがとうございます。でも、Ver1を出した時点ではE.V.E.C.を載せるという考えはまったくありませんでした。バージョンアップを繰り返す中で、佐々木とのキャッチボールをしながら、2.0でE.V.E.C.を搭載することが決まったんですよ。お互い、やりたいことの方向性は明確に分かっていたので、スムーズに実装できたわけですね。

佐々木:ウチの会社、あまり厳格な打ち合わせをするというよりも、「ねぇねぇ、黒田さん、こうしません……」って、やりとりをしつつ決めていくことが多いんですよ(笑)。


Piapro Studio開発者であるクリプトン・フューチャー・メディアの黒田毅さん 

--VOCALOID4のクロスシンセシスとE.V.E.C.の関係性で少し混乱しているのですが……、たとえばプライマリをHARD、セカンダリをSOFTに設定してクロスシンセシスで動かしていく中で、Voice Colorをいろいろと変更すると、どういうことが起きるのでしょうか?
佐々木:プライマリ、セカンダリとも、E.V.E.C.でのVOICE COLORの設定があれば、それにしたがって変化していきます。つまり、クロスシンセシス用に標準のVOICE COLORがあるというわけではなく、たとえばPOWERを設定すれば、そのPOWERにおいて切り替わっていくわけですね。

--E.V.E.C.でのVoice Colorは、それぞれ別のサンプリングデータが使われているのでしょうか?それとも、内部的になんらかのパラメータをいじってシンセサイザ的に声色を変えているのでしょうか?たとえばHARDの歌声ライブラリ一つをとっても計9種類のVoice Colorがありますが、この歌声ライブラリの容量はVoice Color1種類の一般的なものと比較すると9倍の容量になっているのですか?
佐々木:まず、Voice Colorは、シンセのパラメータ的に声色をいじっているわけではなく、サンプリングが異なるものを使っています。ただし、単純に9倍の容量になるというわけではないんですよ。というのも、子音から母音へと繋がっていくところは同一なのでそこは変えていません。違うのは母音部分なので、容量は大きくはなるものの、9倍ほど大きくはなりません。

--母音のみということは、日本語なら「あ、い、う、え、お」だけが違うということですか?

佐々木:そこまで単純ではないですね(笑)。母音(V)から子音(C)に差し掛かるところも影響するので、その組み合わせの数は結構多くなりますね。つまり「C-V」は1種類でいいけれど「V」や「V-C」は9種類必要となるので、かなり大きな容量になるということは間違いありません。


3月19日に発売された巡音ルカ V4X 

--そうすると、やはり今回の巡音ルカV4Xの制作というのは、かなり大変な作業だったんですよね。
佐々木:たとえとして正しいかどうか分かりませんが、これまで自動車を開発していた人が船舶を開発するというくらい、大きな変化でした。共通するのは乗り物であるということくらい、まったく異なる仕事であり、作業の違いに酔ったというか、三半規管が狂ったような感じでした。ある意味、音の基準を作りながらバランスをとっていなかんくてはならないので、かなり大変でしたね。通常音楽を制作するときって、たとえばアナライザーを立ち上げて、音圧、音量を見ながらバランスをとるけど、この大型船舶の開発においては音量・音圧を見るアナライザーでは役に立たない。スペクトルを細かく見ていかないとできない作業なんですよ。だからエディターも従来使っていたSound Forgeのような波形編集ソフトをやめて、RX 4のようなスペクトルエディタを使うように社内を切り替えていったのです。開発スタッフも僕だけではないので、「明日からSoundForgeを使うな!」といったら、みんな「えぇぇ!?」ってなりますよね……。

--実際、歌声をスペクトルで見て、すぐに分かるものなんですか?

佐々木:多少慣れは必要ですが、これで見れば、いろいろなことがハッキリと見えてきます。波形編集ソフトで見える音量とか音圧って、いろいろな成分を束で見ているだけじゃないですか。でもスペクトルで見れば、声の特徴がすぐに見えてきます。正直なところ、VOCALOIDに向く歌声の人と、そうでない人がいます。以前は、レコーディングを終えてみて、この人は向いていなかった……とボツになったものが数多くありますが、スペクトルでちょっと見れば、向くか向かないかの判断はすぐにつきますよ。


無音を意味する発音記号「Sil」を明示的に入力することで音を止めることができ、Voice Releaseの効果が出る

--スペクトルでの編集って、そんなすごい威力があるんですね!ここで少し話題を変えて、E.V.E.C.のVoice Releaseについてお伺いします。これは音符が繋がっているところでは、まったく効果がなく、音が切れたところで初めて効果が確認できますよね。これはどうなっているんですか?
佐々木:VOCALOIDでは「ここで音が止まりますよ」というのを内部的な命令によって操作しています。通常は発音記号として表記されませんが無音を意味する「Sil」というものがあり、これを明示的に入力すれば音が止まります。通常の音の止まる箇所の音素は、内部的には「V-Sil」で表されるのですが、ここを拡張して、止まり方にバリエーションを持たせたのがVoice Releaeになります。

黒田:当社から言うのも妙ではありますが、Voice Color、Voice Releaseを含め、VOCALOID EditorでE.V.E.C.を入力するためのJob Pluginがユーザーさんによって作られていますので、これを使って発音記号を見てみると、E.V.E.C.で具体的にどのような発音記号処理がされているのかが見えやすいかもしれません。


きょん☆さん開発のJob Plugin、ルカV4X E.V.E.C.エディター 

--もうひとつ、E.V.E.C.にある子音拡張というのは何をやっているのでしょうか?たとえば「s a」の発音をさせる際、「x4」に設定すると「s s s s a」となっていると考えていいのでしょうか?
黒田:英語だと子音から子音へのつなぎ目がありますが、日本語では子音から子音という繋がりはありません。ただ、表現の仕方によって、より子音を強調した歌い方というのはあるので、E.V.E.C.でそれを実現しているんです。やっていることはおっしゃるとおり、単に子音を重ねているだけななので、手打ちで「s s s s a」のように入力するのとまったく同じ効果ですね。

--今後の製品について、お答えできる範囲で伺いたいのですが、VOCALOID 4用に出すことが決まっている製品は具体的にあるのでしょうか?また、その製品には、E.V.E.C.が搭載されると考えていいのですか?

佐々木:VOCALOID4版の鏡音リン・レンについては、E.V.E.C.対応させたものを出すことをアナウンスしています。年内にはリリースしますので、ぜひ楽しみに待っていてください。また関連して、初音ミクの声の特徴を、新しいE.V.E.C.で活かす方法論を実験しています。これはルカのように多面的な表現力の向上ではなく「よりミクらしいミク」というのをコンセプトにし、音の芯の弱い部分を綺麗に修正しつつ、徹底的に声のツヤ感やキラキラ感を伸ばすような挑戦をしています。この実験はリンレンにもフィードバックさせるため、音として扱いやすいミクオリジナル(2007年リリースのオリジナルデータベース)を元に進行しているので、リン・レンよりも先にこの実験データベースだけの展開も有るかもしれません。


現在のPiapro Studioの最新バージョンは Version 2.0.0.6。将来的にはスタンドアロン版の登場も……

--そのほかにE.V.E.C.、Piapro Studio関連での動きはありそうでしょうか?
黒田:E.V.E.C.の搭載というプロジェクトが持ち上がったことで、遅れてしまっていましたが、Piapro Studioの編集機能の充実を行っていきます。また、スタンドアロン版の開発を計画しているところです。やはりプラグインの形だと特に初心者ユーザーの方にとって、なかなかハードルが上がってしまうのは事実です。そのため、なるべく使いやすいものを出そうと、取り組んでいるところです。ただ、どこまでのことをするのかの線引きがなかなか難しいところです。もちろん、われわれとしてDAWを作るつもりはないのですが、それなりに使えるものにするためには、オーディオドライバを実装しなくてはならないなど、やらなくてはならない課題もいっぱいあるんです。すぐにリリースできるというわけではありませんが、中長期スパンで作っていこうと考えています。

--ありがとうございました。今後のE.V.E.C.対応製品、Piapro Studioのスタンドアロン版など、楽しみにしています。

【価格チェック】
◎Amazon ⇒ 巡音ルカ V4X
◎サウンドハウス ⇒ 巡音ルカ V4X
◎ダウンロード版(SONICWIRE) ⇒ 巡音ルカ V4X
◎オンラインストア(クリプトン直販) ⇒ 巡音ルカ V4X

【関連サイト】
巡音ルカ V4X製品情報
バーチャルシンガーラインナップ