ボカロ曲のカラオケをボカロに歌わせ、満点採れるかやってみた

いまカラオケで歌われている曲の上位ランキングに入ってくるのがVOCALOID楽曲ですよね。特に若年層で歌われている率が高いみたいですが、「カラオケ行ったらボカロ曲だ!」という人も少なくないのではないでしょうか?そのカラオケ、歌うと点数が付く機能がありますが、ふと思いついたのが、「ボカロ曲ならボカロに歌わせたら100点を採れるのではないか?」ということ。

そこで、実際に試してみようと、先日、知人の某ボカロPさんの協力を得て、LIVE DAMで実験を行ってみました。勝手に変なことをして、叱られるとマズいので、その実験についてLIVE DAMを開発、運営する第一興商に連絡をしてみたところ、社内にあるカラオケルームをタダでお借りできてしまいました!というわけで、どんな結果になるのか、レポートしてみたいと思います。

カラオケルームで、ボカロ曲に合わせて初音ミクV3を歌わせてみた



今回試したカラオケのシステム、第一興商LIVE DAMには、採点ゲームとして「精密採点DX」という機能が搭載されています。この精密採点DXでどこまでの高得点が出せるのかにチャレンジしてみました。

どんな曲で試してもよかったのですが、協力してもらったボカロPさん(名前は出したくないとのことで、ここでは伏せておきます)が選んだのが
ロミオとシンデレラ(Game Version)
恋するVOCA@LOID
の2曲。

ご存じの方も多いと思いますが、いずれも初音ミクが歌う楽曲なわけで、ここでは初音ミクV3を使って試しています。曲の入力については、基本的に、そのボカロPさんにお任せしましたが、「できるだけ原曲に近い形にしてほしい」というお願いだけはしておきました。あ、念のために言っておくと、作ってくれたのは原曲を作ったdorikoさん、OSTER projectさんではないですよ。

こだわって、初音ミクもVOCALOID2版を使ったほうがよかったのでは……なんて風にもちょっと思ったところですが、メインの制作環境であるMacを使いたいということと、初音ミクV3 Originalで歌わせると、かなり近いイメージになるとのことだったので、その点はお任せしました。当日はMac版のVOCALOID Editor for Cubase NEOを持ち込んでの実験となったわけです。

Mac版のCubase 7+VOCALOID Editor for Cubase NEO+初音ミクV3で挑戦

予め、そのボーカル部分だけを聴かせてもらったところ、確かに原曲と本当にソックリにできています。Cubase 7側の処理で、リバーブなどのエフェクトが若干かかっていましたが、ここでは、その部分はオフにして素の歌声で出しています。

問題は、この歌声を、どのようにLIVE DAMへ入れるのか、という点。第一興商の方に聞いても、やはりマイク端子以外に入力できるところはないようなので、オーディオインターフェイスの出力をマイク端子へとつなぎ込みました。ただし、オーディオインターフェイスの出力はラインレベルで、LIVEDAM側はマイクレベルであるため、レベル的にミスマッチです。

そんなこともあろうかと、抵抗入りのケーブルを用意しておいたので、それを使って接続してみたところ、かなりいい感じで初音ミクの歌声でカラオケを歌わせることができました。

が、しかし、ここでもっと大きい問題にブチあたりました。そうカラオケ側とCubase側をどのように同期させるか、という点です。当然MTCMIDI Clockもないわけですから、システム的な同期は不可能。というわけで、試行錯誤での「よーいドン!」。聴いていても、微妙にタイミングが早かったり、遅かったりしたのですが、何度か試しているうちに、ピッタリの状況になりました。

音程、ビブラートなど、バッチリで画面にはキラキラと星マークが…
(諸般の事情により映像バックはフリーのものを使い、歌詞の一部にボカし処理を入れています) 

そのときの画面を見ると、奇跡の大成功といった感じで、画面には曲の進行に伴って星がキラキラと表示され、ビブラートの正解マークなどが登場してくれます。「これは100点に行くのでは!?」と期待したのですが、結果は93.382点。

惜しくも特典は93.382点と、100点には至らず

しゃくり5個、こぶし2個などと細かく評価されている

分析レポートを見ると「短いイントロながら出だしのタイミングが神業のように完ぺきでした。」とのこと。「おー!さすが、ちゃんと分析できているではないか!」とも思ったわけですが、その後何度試しても、90~94点くらいが最高で、それ以上にはなりません。

「恋するVOC@LOID」でも試してみた。タイミング合うまでに手間取ったけど、バッチリ!

気を取り直して、もう一曲の「恋するVOC@LOID」のほうにもチャレンジしましたが、こちらは最高で94.904点を記録。コメントも「全体的に落ち着いた歌声です。もう少し感情を込めて歌うと曲に個性がでてきますよ。」とお褒めの内容。「感情を込めて、と言われてもなぁ……なんて思ったわけですが、全国平均が74.726点であることを考えるとかなりの高得点。でも、やっぱり100点にはならないですね……。
恋するVOC@LOIDでも、100点にはたどり着かない…

ちなみに、そのボカロPさん、冗談で「恋するVOC@LOID」のオンチバージョン(いわゆるテイクゼロってやつですねw)も作ってきてくれたので、試しにこれで実験してみると、それでも82.597点をマーク。「高音が苦しくありませんか?舌の奥が持ち上がらないようにすると、のどを痛めません」なんて妙なコメントを返してくれましたが、オンチであっても、初音ミク本人が歌っているから、うまく行っているのでしょうか……。

「恋するVOC@LOID  テイクゼロ」でも試してみたら、思ったよりいい得点に!

といったところで、第一興商でLIVEDAMの開発を行っている開発本部・商品開発部・技術課チーフの橘聡さんに、採点のカラクリを伺ってみました。

第一興商の技術者、橘聡さんにお話を伺いいました

精密採点DXで93点、94点が出せるというのは、かなりスゴイですよ。ただ、この採点は原曲の歌唱をリファレンスに、オリジナルと一致しているかを見ているわけではないんです。歌として聴いて、上手に歌えているかを見ているんですよ」(橘さん)

とのこと。ということは、仮にオリジナルと100%合致していても100点というわけではなさそうですね。

こぶし、ビブラート、フォール、しゃくり、といったパラメータをチェックしているんですよ。たとえば、ビブラートが上手というのはピッチの揺らぎが一定であるかどうかを見るとともに、波形にしたときにキレイかどうかを判定しているといった具合。また声の大きさの変化を抑揚として見ており、ここから感情が込められた歌になっているかを判定しているのです」(橘さん)

それにしても、画面にはリアルタイムで音程判定がされていて、すごいと思ったので、これについて聞いてみると、

リアルタイム処理でピッチ検出を行っています。もちろん、ビブラートやこぶしなど、ある程度の時間の経過が必要なものもありますが、その音符の発音が終わったら、できるだけ瞬時に表示できるようにしています」(橘さん)」

とのことですから、最新テクノロジーが駆使されているわけですね。

というわけで、100点には至りませんでしたが、なかなか面白い実験ができたのではないかと思っています。

モバイルバージョンを終了