これまでFREE版を使った人の反応を見ていると、「ベタ打ち入力しただけなのに、すごく歌声がきれいで自然!」というものと「ボカロ同様に入力したが、うまく歌えず使いにくい」という反応の2つがあったように思います。今回、製品版を触ってみて、なぜ両極端な意見が出ていたのか、ハッキリした気がします。
その最大の理由はCeVIOは、VOCALOIDやUTAUなどと、根本的に異なる歌声合成の技術が使われているからです。そうVOCALOIDなどがサンプリングによるシステムであるのに対し、CeVIOはHMM(隠れマルコフモデル)音声合成という手法であるため、歌わせるためのテクニック=調教方法も、まるっきり異なるのです。その結果、VOCALOID特有のテクニックを用いると、ベタ打ちと比較しても悪化してしまうケースが多いのです。
以前、HMM音声合成エンジンを開発した、名古屋工業大学大学院・教授の徳田恵一先生に話を伺った際「VOCALOIDはMIDI楽器であるのに対し、CeVIO Creative Studioは歌声合成ソフト。そのため、扱い方がまったく違うんですよ」とおっしゃっていました。その話を聴いたとき「VOCALOIDも歌声合成ソフトなのに…」とイマイチ理解することができなかったのですが、製品版を触ってみて、その意味が見えてきました。
まずは簡単な例から紹介していきましょう。たとえば「きっぱりと(ド・レ・ミ・ファ)」と歌わせたい場合、VOCALOIDなら、「き(ド)」を短いノートにし、「ぱ(レ)」、「り(ミ)」、「と(ファ)」の3つは歌わせたい音長に合わせて、ノート長を調整しますよね。そのため、分解能も事前に1/64に設定して、できるだけ細かく調整していくのが基本。これは、まさにMIDIの考え方ですよね。
CeVIO Creative Studioでは譜面通りに音符を入力していく。この際、歌詞には自動的にドレミファソの音階が入る
それに対し、CeVIOでは譜面どおりに入力していく必要があり、ノート長を調整してはいけないのです。また「っ」も文字として入力することができ、「っ」があるかどうかで、歌い方も大きく変わってくるのです。
「とはいえ、それぞれの音符の発音の長さは自分で調整したい」という人も多いはず。CeVIO Creative Studioでももちろん、そうした調整は可能で、VOCALOIDより遥かに細かく調整可能なのです。ただし、それはノートで調整するのではなく、各音素のタイミングを調整していくのが特徴。具体的に見ていきましょう。
では、CeVIO Creative Studioに搭載されたタイミング調整画面をご覧ください。あまり見慣れない画面だと思いますが、ここで子音、母音の発音位置が細かく表示されており、その位置=タイミングを自在に調整することが可能になっているのです。
VOCALOIDの場合、母音の発音位置がノートのスタート位置に合うように作られているのに対し、CeVIOのHMMエンジンでは中の人のクセがそのまま再現されており、必ずしもジャストタイミングではありません。人によって、また文字や音程によって、前ノリだったり、後ノリだったりと、微妙な違いがあるのです。でも、タイミング調整機能を使うことで、必要に応じて、ドンピシャにしたり、前ノリにしたりといったことが可能になります。
1音素が5つに分割されているが、その分割された1つずつのタイミングをズラすことも可能
また、先ほどのベタ打ち入力での歌詞を「きっぱりと」から「きぱりと」に替えると、各音素のタイミングも変わるし、「っ」が子音として捉えられていたということも確認できると思います。
ところで、すでにお気づきの方も多いと思いますが、1つの音符に、複数の文字を入力できるというのもCeVIO Creative Studioの特徴です。1音符に3文字入力すれば、自動でいい具合にタイミングを3分割してくれるのですが、必要に応じて各文字の長さを音素のタイミング調整によって変えることもできるわけです。
次に、ピッチ調整についても見てみましょう。これも画面を見ると分かる通り、VOCALOIDのPITパラメータとは大きく異なります。VOCALOIDでは、MIDIのピッチベンドとして調整する形になっていましたが、CeVIO Creative Studioのものは、各音の音程がそのまま緑色でグラフ表示されているのです。SONARのV-VOCALやMelodyne Editorのようなものと言えばわかりやすいでしょうか?
実際に歌わせるピッチを自在に描いていくことも可能なのですが、最初少し戸惑ったのは、自分が描いた線はオレンジで表示され、オリジナルの緑の線はそのまま残っていること。オレンジの線があると、こちらが有効になり、緑は発音上無視されます。しかし、入力したオレンジが気に入らなければ、消しゴムで消すことで、オリジナルの緑が有効になるのです。たとえば、ドレミファと入力していても、このピッチ調整画面で、ソの位置に直線でピッチを描くと、ずっとソで単調に歌う形になるのです。
ちなみにVOCALOIDでは、「しゃくり上げ」を表現するのに、PITを使うほかに、音符を切って、音符後半の母音部分を1オクターブ上げる、といった手段をとったり、「こぶし」を表現するのに、音符を細かく区切って、途中の母音で半音下げる、なんて手法がありますが、CeVIOにおいてこれは厳禁。この方法は明らかにMIDIのコントロール手法であり、譜面としては正しくないものになるので、CeVIOでこの方法を使うと間違いなく破綻するので注意してください。
次に、ボリューム調整画面を見てみましょう。こちらは青で音量変化が表示されています。これもVOCALOIDのDYNとはまったく考え方が異なるものです。DYNはMIDIの音量設定コマンドであるのに対し、CeVIO Creative Studioのボリューム設定は、時間の流れに対しての音量変化を示すもの。つまり波形編集ソフトにおける音量変化や、レベルメーターに現れる音量の動きのようなものと考えればいいと思います。
さらにビブラートについては2つのパラメータが用意されています。一つはビブラートの振幅調整、もう一つがビブラートの周期調整です。先ほどのピッチ調整を大きく拡大して、ビブラートを付けることも可能だとは思いますが、それとは独立した形でビブラート専用のパラメータが2つあり、ここで細かくエディットしていくことができるわけです。
画面を見ても分かる通り、予めビブラートがかかっているわけですが、それをもっと深くしたり、まったくなくして機械的な歌声にしたりということもできる、ということです。またビブラートの波形を見ても分かる通り、音によってかかり具合が違うのも興味深いところです。
つまり、同じC4の音を出すにしても、音符の長さや文字が違えば、ピッチもボリュームもビブラートも違うのは当たり前。1小節目にあるのか3小節目にあるのかによっても違いが出る可能性があるというわけです。なかなか奥が深そうですよね。
以上、CeVIO Creative Studioについて、ざっと見てきましたが、いかがだったでしょうか?まだ細かく探れていませんが、ここまでのことから、CeVIOでのデータ入力方法、調教方法はVOCALOIDやUTAUでのものとは、まったく異なるものであることが分かると思います。慣れるには、ある程度の時間はかかりそうですが、VOCALOIDからは完全に頭を切り替えて使う必要がありそうですね。
なお、発売日当日には、アップデータが公開されているとのことですから、購入した人はまずCeVIO公式ページをチェックの上、最新版にしてから使うことをお勧めします。