VOCALOID3の登場からちょうど3年。ヤマハからVOCALOIDの新バージョン、VOCALOID4が発表されました。従来のVOCALOID3の機能を踏襲しつつ、声を激しく震わせて唸るような歌声で歌うグロウルを実現するほか、「SWEET」と「DARK」のような歌声間をスムーズにモーフィングするクロスシンセシス機能などが搭載されたのが大きな特徴となっています。

第一弾の製品は12月下旬にヤマハから3製品発売される予定であり、2015年以降、クリプトン・フューチャー・メディアAHSインターネット……など各社から対応する歌声ライブラリが発売されるものと思われます。このVOCALOID4とはどんなものなのか、VOCALOID3と何が違い、VOCALOID3との関係がどうなるのかなどを整理しつつ紹介してみたいと思います。


12月下旬、VOCALOID4対応の3製品がヤマハから発売になる
 
まず年内に発売されるのは以下の3製品です。

VOCALOID4 Editor 歌声編集ソフトウェア 10,800円(実売想定価格)
VOCALOID4 Editor for Cubase Cubase7シリーズ用
歌声編集ソフトウェア
10,800円(実売想定価格)
VOCALOID4 Library VY1V4 VOCALOID4対応歌声ライブラリ 10,800円(実売想定価格)

ご覧いただいて分かるとおり、ラインナップの構成はVOCALOID3のときと同じです。「VOCALOID4 EditorのMac版は?」という質問もありそうですが、これもVOCALOID3のときと同様にWindows版のみ。Mac対応はWin/Mac対応のVOCALOID4 Editor for Cubaseで、ということになっています。
 

VOCALOID4 Editor for CuaaseはWindows、Macのハイブリッド対応 

また価格はいずれもオープンプライスとなっていますが、実売価格は10,800円前後。またVOCALOID3対応の上記製品を持っている人には、それぞれ5,400円のアップグレード価格でボーカロイドストアからのダウンロード販売も行われるようです。


VOCALOID4 Editorのユーザーインターフェイスは基本的にVOCALOID3のものが踏襲されている

DTMの観点から見て特筆すべきはVOCALOID4 Editor for Cubaseのパッケージ版(ダウンロード版を除く)にCubase AI7のがバンドルされた、という点です。つまりこれ1本買えばDAWもVOCALOID(歌声ライブラリは別途必要となりますが)も入手できてしまうわけですね。現時点で、Cubaseシリーズを入手する一番安い方法ではないでしょうか?「Cubase AI7を入手するためにこれを買うというのもあり」だと思います。
VOCALOID4 Editor for CubaseにはCubase AI7がバンドルされる

ちなみに11月10日以降に「VOCALOID3 Editor(SE)」「VOCALOID Editor for Cubase NEO」を購入すると、2015年6月まで「VOCALOID4 Editor」もしくは「VOCALOID4 Editor for Cubase」がなんと無償でダウンロードできるようです。V2 Library Import ToolなどVOCALOID4にバンドルされていない機能もあるので、そのほうが有利かもしれませんね。ただし購入証明書として領収書やレシートが必要らしいので、なくさないように取っておきましょう。

では、ここからが本題です。VOCALOID4はVOCALOID3と何が違うのでしょうか?一つ目はグロウル機能の搭載です。「あ゛あ゛あ゛あ゛……」というような、唸り声というか、がなり声を実現できるようにしたこと。演歌でこぶしを回すようなときにも使えるし、ゴスペルで力を込めた歌い方のような表現も可能になります。従来これをパラメータをいじって調教しようと思っても実現できなかったし、波形編集などでも難しかったのですが、それがVOCALOID4によって可能になったのです。


グロウルに対応したコントロールパラメータ、GWLが追加されている。β版のため「グロール」となっているが、今後修正される予定

具体的にはコントロールパラメータにGWL(グロウル)というものが追加され、これを動かすことで表現できるようになっています。数値の範囲は0~127で0だと通常表現で、127でグロウルが最大となります。また、このパラメータは新しく登場するVY1V4などグロウルに対応した歌声ライブラリでないと使うことができません。VOCALOID3の歌声ライブラリに適応させても、まったく変化しないので、その点は期待しないでくださいね。

そのVOCALOID3の歌声ライブラリとの関連性ですが、これはそのまま読み込めるようになっています。たとえば初音ミクV3が入っているマシンにVOCALOID4 EditorやVOCALOID4 Editor for Cubaseをインストールすれば、歌声ライブラリとしてそのまま使うことができるし、VOCALOID4 Editorが入っているマシンに新たにMegpoid V3をインストールしても使うことができます。

ただし逆は不可。つまり、VOCALOID4の歌声ライブラリであるVY1V4をVOCALOID3 Editorで利用することはできません。また、VOCALOID2の歌声ライブラリについては、VOCALOID3 Editorに付属していたV2 Library Import Toolを用いてVOCALOID3の歌声ライブラリに変換しておけばVOCALOID4 Eidtorでも使うことが可能となっています。

続いて、VOCALOID4のもう一つの目玉である、クロスシンセシス機能について解説しましょう。これまでも初音ミクV3ならORIGINAL、SWEET、DARK、SOFT、SOLIDと5つの異なる声質のデータベースを持っていました。同様にMegpoid V3ならNative、Adult、Power、Sweet、Whisperといったものがあったわけですが、ユーザーはこれらを切り替えながら使う必要があったわけです。


クロスシンセシスのコントロールパラメータを用いて2つの歌声間をモーフィングさせることができる

たとえば「AメロではNativeで歌わせておき、サビになったところでPowerに切り替える」といった使い方ですね。でも本来なら、曲が盛り上がってきたところで徐々にPowerに近づいていくというのがいいですし、PowerとNativeの中間のような声で歌わせたということもあったと思います。今回のVOCALOID4では、そんなことが可能になったんですね。


クロスシンセシスに用いるシンガーとしてプライマリ、セカンダリを設定する

具体的な操作方法としては、まずシンガーエディタを用いて、元となる歌声ライブラリをプライマリシンガー、変化させる先をセカンダリシンガーとして指定した新たなシンガーを作成します。

この新しいシンガーを選択した上で、パラメータとしてXSY(クロスシンセシス)で変化させれば、2つの歌声間をモーフィングすることが可能になるのです。

VOCALOID4の歌声ライブラリとして登場するVY1V4にはNormal、Soft、Power、Naturalの4つの歌声ライブラリが収録されており、クロスシンセシス機能で、そのモーフィングを実現するのですが、このクロスシンセシスは、VOCALOID4の歌声ライブラリだけでなくVOCALOID3の歌声ライブラリ間にも適用可能tなっています。つまり前述の初音ミクV3やMegpoid V3のほか、がくっぽいどV3、KAITO V3、IA/IA ROCKS、ギャラ子など、複数の歌声が収録された歌声ライブラリであれば、これを適用することが可能なのです。ただし、異なるライブラリ間、つまり初音ミクの歌声を結月ゆかりにモーフィングさせるといったことはできません。


ボーカロイドの父、剣持秀紀さんにお話を伺った

 
このクロスシンセシスについて、ボーカロイドプロジェクトリーダである剣持秀紀さんに伺ったところ、その仕組みを教えてくれました。「プライマリに設定した歌声の微細構造をベースにして、セカンダリのスペクトル包絡へと近づけるというアプローチをとっているのです。そのため、セカンダリが100%とになるパラメータ設定をしても、セカンダリの歌声と完全に一致するわけではないのですが、ほぼ近いものになります」。


技術的な詳しい情報は「ボーカロイド技術論~歌声合成の基礎とその仕組み」に記載されている

ちょっと専門的な難しい話になってしまいましたが、この辺の詳細を知りたい方は、剣持さんと私の共著である「ボーカロイド技術論」に詳しく書いてあるので、ご覧になってみてくださいね。


プライマリ(下)の微細構造にセカンダリ(上)のスペクトル包絡を割り当てていくことでモーフィングさせる


さて、VOCALOID4の新機能はこれに留まりません。VOCALOIDで発音する歌声のピッチの変化やビブラートのかかり具合をグラフで描画するピッチレンダリング機能が搭載されたのも大きな特徴です。これまでVOCALOIDを使ってきた方であればご存じのとおり、ベタ打ちしたとしても、発音の頭でしゃくる感じでピッチが変化していたり、音を伸ばせば自動的にビブラートがかかるなどしており、より自然な発音を実現していました。

でも、そのピッチ変化がどうなっているのかが目で見えなかったため不思議に思っていた人、修正に手こずっていた人も多かったのではないでしょうか?VOCALOID4では、これを視覚化することを実現しているのです。オレンジの線がピッチの変化でブルーがビブラートの変化を表しています。これを表示させるためには、そのたびに「パート」メニューから「ピッチレンダリング」を選ぶか「P」キーを押す必要があるのですが、これはなかなか便利ですよね。


ピアノロールの画面内にオレンジ、青の線でピッチ、ビブラートの動きが表示される

ちなみに、この表示はVOCALOIDの合成エンジンが作り出すピッチやビブラートであり、各歌声ライブラリが持つ揺らぎは考慮していません。したがって、VY1を使っても初音ミクを使っても結果は同じになりますよ。

さらに、ピッチ変化を平坦にしてしまう「ピッチスナップモード」というのが搭載されたのも大きな特徴。これまでもJobPluginを利用することで同等のことはできましたが、これによってロボットボイス的な歌声も簡単にできるようになっています。また、これに関連し、「エクスプレッションピッチをPITに変換」、「ビブラートピッチをPITに変換」という機能も搭載されました。これはVOCALOIDの合成エンジンが勝手に付けていたピッチの変化やビブラートをPITのパラメータへ書き出すというものなのですが、書き出されたPITをいじることで、こうした表現をユーザーが自由にいじれることになり、調教における表現力を大きく高めることを可能にしてくれます。


ここまで紹介してきたグロウル機能、クロスシンセシス機能、ピッチレンダリング機能およびピッチスナップモードやPIT変換機能については、すべてVOCALOID4 EditorおよびVOCALOID4 Editor for Cubaseに共通となっていますが、VOCALOID4 Editor for CubaseにはVOCALOID4 Editorにはない機能が1つ追加されています。それがリアルタイムでの発音機能です。


VOCALOID4 Editor for Cubaseではリアルタイム発音が可能になった

従来のVOCALOID3版であるVOCALOID Editor for Cubaseにおいても、マイナーアップデートにおいてリアルタイムでの発音機能は追加されており、「あー、あー」と歌うことはできるようになっていました。ただ、ここではかなり大きなレイテンシーがあったのですが、VOCALOID4 Editor for Cubaseでは「MIDIリアルタイム入力」という機能が搭載され、ほぼ遅延のないリアルタイム発音が可能になっています。


 リアルタイム発音時の音を指定できる

また、このリアルタイム発音で使える音は「」だけでなくア行=「あ、い、う、え、お」またはラ行=「ら、り、る、れ、ろ」の計10の中から選択する形となっています。自由に歌詞を歌わせるというわけにはいかないのですが、これはなかなか面白い機能ですよね。

以上が、VOCALOID4の基本的な新機能となります。ただ画面を見てもお分かりのとおり、コントロールパラメータ部のユーザーインターフェイスが少し変わっていたり、細かく見ていくといろいろ違いはあるようです。

なお、VOCALOID3の歌声ライブラリにバンドルされていたTiny VOCALOID Editorは廃止になった模様で、VY1V4を購入してもこれだけでは使うことはできません。かならずVOCALOID4 EditorかVOCALOID4 Editor for Cubaseが必要になるので、この点は注意してください。

【関連記事】