商品発表ではなく、あくまでも技術発表という内容ではありましたが、7月25日、ニコニコ生放送の番組「松武秀樹・相沢舞の『テクノスクール』4限目」の番組内でちょっと驚きの発表がされました。「ボーカロイドの父」として知られるヤマハの剣持秀紀さんによって、故・植木等さんがCVを務めるVOCALOIDが発表され、そのデモが演奏されたのです。

ご存知の通り、VOCALOIDは人の歌声をサンプリングしたデータを元に構築された歌声データベースを使って人のように歌わせることができるシステムです。番組中で、剣持さんは「イタコを呼んで作りました」なんて冗談を話していましたが、もちろんそんなわけはありません。番組内で、すごい技術を使う種明かしもされたので紹介してみましょう。


ボーカロイドの父、ヤマハの剣持秀紀さん
※画面はニコニコ生放送より


初音ミクは藤田咲さん、鏡音リン・レンは下田麻美さん、Megpoidは中島愛さん……というように各VOCALOID製品には、それぞれ歌声データベースに収録された歌声の主=「中の人」が存在します。主に声優さんが務めるケースが多いのですが、その収録には3時間から半日程度かけて呪文のような歌をうたってもらい、それをレコーディングしていきます。その後、数ヶ月から半年近い編集作業を行った結果、VOCALOIDとしての歌声データベースが完成するという手順になっています。

ヤマハでは、その実験的な意味もあって、故人である植木等さんのVOCALOID作りにチャレンジし、約3年間の歳月をかけて、完成したというのです。

「植木等さんが歌った昔の録音の素材はある。マルチ(トラック)で録音した素材が残っているので、それをご提供いただき、そこからボーカルトラックを取り出しました。一番最初は、通常のVOCALOIDの歌声データベース作成のように、そのボーカルトラックを切り刻んでの作業を行いました」と剣持さん。しかし、本来歌ってもらいたい呪文の歌とは違うため、なかなかうまくいかなかったようです。

そこで考え方をガラっと変えたのだとか。「ある歌声のライブラリを別の人に変えるという技術も開発しているので、これを使ってやってみました」(剣持さん)とのことですが、「え?どうやって??」と不思議に思ってしまうのが、われわれ素人です。


まず植木等さんと比呂公一さんの声を比較する(※画面はニコニコ生放送より)

「植木さんの息子さんで、歌手であり作曲家の比呂公一さんという方がいらっしゃいます。お二人の声質が近いので変換がうまくいくんじゃないかと考え、比呂公一さんにお願いして、声を録音をさせていただきました。その結果、植木さんの声と比呂公一さんの声の2つを比べると、数学的というか統計的にどういう特徴があるかを見えてくるのです」と剣持さん。


比較した結果から変換関数を導き出す、と剣持さん(※画面はニコニコ生放送より)

やはり私にはどんなアルゴリズムで比較しているのかなど、想像もできないわけですが、とにかく、2つを比較した関係性を元にして「変換関数」なるものを導きだすのだそうです。この変換関数ができれば、比呂公一さんの声を入力すると、植木等さんの声に変換できるというわけです。


比呂公一さんのデータベースを変換関数を用いて植木等さんのデータベースへと変換(※画面はニコニコ生放送より)

「そこで改めて比呂公一さんにお願いし、約3時間かけて呪文を歌ってもらい、VOCALOIDのデータベースを構築しました。その後、変換関数を用いてドーンと植木さんのデータベースへと変換してしまうわけです」と剣持さん、なかなかトンでもない技術のようです。

「変換関数とは音色の空間から音色の空間へのマッピングのようなもの。ヤマハで研究者として働いているフェルナンド君が、これに携わっています。技術的な内容としては、すでに昨年の『インタースピーチ』という国際学会で発表している内容を活用しています」(剣持さん)とのことですが、この技術を使えば何でもできてしまいそうな気もします。

この変換を植木等さんの声で行ったのは今回が初めてだったそうですが、実際にデモが演奏されたのを聴いてちょっとビックリ。誰が聴いても植木等さんという、あの独特の声、そして歌いまわしが再現されているのです。

実際発売されたら個人的にも買ってみたいと思ったのですが、後日ヤマハのVOCALOID担当者に聞いてみたところ、「現在のところまだ具体的に発売する予定はありません」とのこと。「製品として発売するよりも、実際それでできあがった楽曲がいろいろと公開される可能性のほうが高そうです」ということです。

※ニコニコ生放送のキャプチャ画面は、ドワンゴの許可を得て掲載しています