2020年11月に発売された「初音ミク NT」は、今年2025年3月に自社開発の新エンジンを搭載したバージョン(「初音ミク NT(Ver.2)」)へとメジャーアップデートされました(過去記事参照)。それから約半年後の10月15日には「鏡音リン・レン NT」がリリースされ、NTプロジェクトの開発スピードは大きく加速しています。
そして11月19日15時、NT製品に同梱されているボーカルエディター「Piapro Studio NT2」とVOCALOID 6のデータ相互互換が実現することが発表されました。Piapro StudioでVOCALOID 6の.vprファイルが読み込めるようになり、逆にVOCALOID 6でもPiapro Studioの.ppsfファイルが読み込めるようになりました。これにより、Piapro Studio NTシリーズとVOCALOID 6シリーズの間でのデータのやり取りが可能になり、クリエイターの制作環境はより柔軟なものとなります。今回は、クリプトン・フューチャー・メディア株式会社の小泉聖道さん、佐々木渉さん、岡本賢豪さんに、この相互互換の詳細と、鏡音リン・レン NTについて詳しくお話を伺いました。
スピード感を増して登場した「鏡音リン・レン NT」
――10月15日に「鏡音リン・レン NT」がリリースされました。まずはこのリリースまでの経緯を教えてください。
小泉:「鏡音リン・レン NT」は10月15日にリリースしましたが、さかのぼると8月31日に『初音ミク「マジカルミライ 2025」』というイベントのステージ企画の一環で発表し、その日から予約受付を開始していました。NTシリーズは2020年11月に発売した「初音ミク NT」の開発からスタートしていて、今年3月に「初音ミク NT」をメジャーアップデートしてから約半年で、「鏡音リン・レン NT」のリリースとなりました。「初音ミク NT」の新エンジン搭載版へのメジャーアップデートに5年近くかかっていたことを考えると、かなりのスピードアップです。
――そのスピードアップの背景には何があるのでしょうか?
小泉:開発体制が強化されたことが大きいですね。プロデューサーの佐々木を中心にしながら、私と岡本がディレクション周りに入ることで、全体の進行スケジュールや中期計画、現場メンバーのタスク管理、開発状況の進捗管理といったマネジメント部分をしっかり担えるようになりました。今後も同様のテンポ感でプロダクトを出していけるのではないかと考えています。
佐々木:実は、2020年11月に「初音ミク NT」をリリースしたタイミングでNTの新エンジンの基礎が出来上がっていたので、そこから少しずつスピードアップしていけたという事情もあります。「初音ミク NT」の開発でNTシリーズの土台と言えるものができたので、「鏡音リン・レン NT」では少し余裕を持って機能を追加しながらリリースにこぎ着けることができました。
なぜ旧NTでは鏡音リン・レンを出さなかったのか
――NTの旧エンジンを搭載した鏡音リン・レンは発売されていませんよね。なぜ当時は出さなかったのでしょうか?
岡本:これは単純に、NTをシリーズ化できるほどの方針がまだ定まっていなかったからです。当時はまだ各バーチャルシンガーのVOCALOID版の最新製品とNT製品を、どちらでどのように出していくかという設計の部分を熟考していたタイミングでした。
小泉:VOCALOIDにはVOCALOIDの良さが当然あります。ただ、昨今のVOCALOID自体は、ヤマハさんの開発計画の中で、平たく言うと人間味というかリアルを目指したエンジンとして進化を遂げられていて、一方の初音ミクはそのカウンターパート的な存在にあたるわけです。だからまずは初音ミクだけをNTの旧エンジンで製品化しつつ、それぞれの方向性を探っている段階でした。
――なるほど、VOCALOIDが人間らしさを追求する方向に進んでいる、と。
小泉:はい。けれど、初音ミクは人間になるものではないですから、そういう方向に進化していくVOCALOIDのエンジンに対して“初音ミクらしさ”を担保し続けるには工夫が必要になります。
佐々木:そうしたVOCALOIDエンジンに対する工夫の詳細は「初音ミク V6」のリリース時にあらためてお話できればと思いますが、通常のAIボイスバンクの制作とは違う、どこまで機械的な声の動きを保って、どこまで有機的なパターンに更新してという取捨選択、人間の声にはない成分の処理や、初音ミクらしさの為の明瞭化も手掛けています。NTシリーズがクラシカルな歌声合成だったりシンセサイザー的な側面を保持し続けるスタイルである一方で、VOCALOID6では英語歌唱も含めた展開を示す方向性になっています。
小泉:NTの方は各バーチャルシンガーのシンセサイザー、楽器としての音声という部分で、旧来からのサウンド、つまりキャラクターとしての“らしさ”をしっかり保持したまま、自分たちのエンジンでそれが保証できる状態で展開していく、ということなんです。
――つまりVOCALOID 6を出していく道筋が見えた中で、NTの方向性も明確になったということですね。
小泉:その通りです。なので、これまでは熟考の道すがらだったので出すことができなかった「鏡音リン・レン NT」についても、状況とこれからのビジョンを整理できたことでリリースに踏み切れました。もっとも、NTにおける“らしさ”の追求はこれからも続けていくので、製品を出したらそれで終わり、というわけではありませんが。
――その「出して終わりじゃない」というのは、具体的にどういうことでしょうか?
岡本:一つのエビデンスとして、10月15日にリリースした翌月の11月5日に「鏡音リン・レン NT」のボイスライブラリとピッチシフトのアップデートを入れています。これは低音域の部分、特に鏡音レンの聴きやすさみたいなところに補正をかけていくものです。歌声自体をガラッと変えるんじゃなくて、適切に改善をしていくわけなんですが、こういった調整をこれからもどんどん続けていくということです。
佐々木:加えてシンセサイザー的な側面も強めていく算段なのです。ユーザーのニーズをVOCALOID6でも満たしながら、NTはNTで攻めたアップデートが出来ればいいなと考えています。
「初音ミク NT(Ver.2)」と同じ新エンジンを搭載
――「鏡音リン・レン NT」には「初音ミク NT(Ver.2)」と同じエンジンが搭載されているということですが、この新エンジンの特徴を改めて教えていただけますか?
岡本:新しいエンジンの合成方式は、NTシリーズの旧エンジンと大きく異なります。旧エンジンはどちらかというとAIの合成に用いられるようなものを利用していたんです。なので、編集や変更をかけるのに利便性はあるんですけれども、やはり初音ミクらしさみたいなところはだいぶ失われてしまうという問題がありました。
今回新たに社内開発したエンジンに関しては、“VOCALOIDの初音ミク”というイメージがユーザーのみなさんの根底にある中で、それに寄り添う、近づける形で出せるようにという想いから、合成方式を思いっきり変えてみたんです。他社さんの合成エンジンではあまり使っていない、どちらかというとVOCALOIDに近いような合成方式を、新規開発しました。これにより、元の音に近づけるような形で“ボカロらしい声の方向性”を無理無く高品質に再現するようなものができたのが、今回の「鏡音リン・レン NT」にも使用されている、NTシリーズの新エンジンです。
――ここでいうVOCALOIDに近いものというのは、今のVOCALOID 6のVOCALOID:AIエンジンではなくて、元々のVOCALOIDにということですね。
岡本:V2からV4の間で使われていた技術に近い系譜のもの、という意味合いになります。もちろんまったく一緒というわけではなく、大きい意味でのカテゴリーが一緒、というぐらいですね。
佐々木:『初音ミク』『鏡音リン・レン』らしい声の張った感じだったり、キリッとした感じを再現できるように、エンジンの担当者が工夫を続けていて、更新が続く見込みです。
――旧エンジンの時とは違う系統のエンジンになって、だからこそ初音ミクらしさというところも出しやすくなっていたということですね。
岡本:はい、そうです。
小泉:また合成方式自体でもまだまだ改善の余地だったり、こういうふうにしていきたいという要望が社内ではありますので、そういったところも変えやすい、改善しやすかったところで、今回自社製のものに変えたということです。
佐々木:ライブラリーのVoice Colorもそうですし、AIとの繋ぎこみも概念ごと更新や変更をしていけるので、ここからの今後の発展性というのも加味していますね。
自社開発のメリットとは何か
――それなら元々のVOCALOIDのままでいいんじゃないの?という疑問も湧くと思うんですが、元々のVOCALOIDと比べて、どこが違うのでしょうか?
岡本:VOCALOIDはご存知の通りヤマハさんの製品なので、基本的に弊社が加えられる調整に限りがあります。また、内部でどのように音が変わっているのかというのがあまり見えないような状況でしたので、弊社が理想とするライブラリー側の調整を取り込みづらいという悩みもありました。
そこで、先ほどお話したようなV2からV4の間で使われていた技術に近い系譜のエンジンを自社開発し、弊社が新しいアプローチを試しやすい状態を創り出しました。これにより、たとえばNTの新エンジンに入っているAutomatic Controlのような、AIでパラメーターを生成するというようなところとのつなぎ込みなどを実現できるようになったわけです。
『鏡音リン・レン』専用に最適化
――「初音ミク NT(Ver.2)」の時の話は、以前エンジニアやデータベースとして初音ミク向けだったのに対して、今回は鏡音リン・レンということですけれども、それ以外に何か違いがあるものですか。「初音ミク NT(Ver.2)」との違いという意味で言うと。
岡本:仰る通り「初音ミク NT(Ver.2)」の新しいエンジンは初音ミク向けに最適化していたので、鏡音リンと鏡音レンの“らしさ”を実現できるように諸々調整を行いました。
――なるほど。機能という意味で言うと、同じエンジンを使っているから基本は同じという理解でいいですか?
岡本:そうですね。若干調整はしていますが、エンジンの基本的な機能は「初音ミク NT(Ver.2)」と同じです。
佐々木:初音ミクと鏡音リンのような少女らしい声を保持しつつ、鏡音レンのような少年の声もより“らしさ”を追求できるよう、ピッチシフトのアルゴリズムを最適化するなどの更新はしています。今後も様々な声質にアジャストしていって、将来的にはVOCALOID版では諦めた声質などにもチャレンジできるようになれば良いなと思います。
ボーカルモーフィング機能を新たに追加
――「鏡音リン・レン NT」のリリースに伴って、ボーカルモーフィングという機能を新たに追加したとのことですが。
岡本:はい。こちらはVOCALOIDでいうクロスシンセシスのような、同じシンガー間の異なるデータベース、つまり音質を混ぜるといいますか、中間の表現ができるようにするような機能です。
――他にはどうでしょう?機能という意味だと。
岡本:細かいところで言うと、Automatic Controlでのピッチラインの推定も初音ミクのものとはモデルが分かれていて、鏡音リン・レン用に最適化されたものになっています。
「Piapro Studio NT2」の進化
――「Piapro Studio NT2」自体の進化についても教えてください。この間の「初音ミク NT(Ver.2)」の記事の時は、結構細かいエディターの機能の話が中心でしたけれども、今回はどうでしょう。
岡本:今回で言うと、先ほど申し上げた通り、Automatic Controlの部分はピッチ以外にも当然ビブラートだとか抑揚みたいなものもありまして。そのあたりはAIでパラメーターが自動的に推定されている部分なんですけど、これについては「鏡音リン・レン NT」用に調整を行いました。初音ミクの時に調整したものをそのまま流用するんじゃなくて、ちゃんと鏡音リン・レン用に新たなレシピを用意して配合して・・・みたいなことをやっています。
小泉:そして3月、4月以降のPiapro Studio自体のアップデートの中で、主な機能追加された部分についてもお話ししておきたいと思います。まず速度面の向上です。9月のアップデートのタイミングで、メモリの使用量を25%削減、編集速度の高速化が1.5倍ぐらいになっています。
――それは「初音ミク NT」に同梱されているものについても同じように変わったという理解でいいですか?
小泉:はい、そうです。「Piapro Studio NT2」のGUI自体の高速化になっています。ピッチカーブのデータの受け渡しプロセスが変わって高速化したりもありました。それが今言った編集速度の高速化、約1.5倍です。
――それはすごいですね。
小泉:AIの速度も上がっていて、2倍以上、ものによっては10倍とかに高速化しています。Automatic Controlの高速化も10倍以上になっていますね。
――「初音ミク NT(Ver.2)」のリリース直後に低音部の改善もあったとのことですが。
岡本:はい。今後の他のバーチャルシンガーの展開に向けて、低音域の向上に取り組みました。合成アルゴリズムの中の計算式を見直した結果、いわゆる低音域のシンセサイザの合成感が良くなって、聴きやすくなりました。位相の調整と精度を上げることで低音域だけじゃなく全体的な音質向上につながっています。
佐々木:これは『KAITO』や『巡音ルカ』などのライブラリの改善にも影響があり、意識的に調整を進めている部分でもありますね。
――ほかの機能追加は?
岡本:キーボードショートカットの編集機能を追加しました。それと、大きな追加としては、11月中にパラアウト機能の実装を予定しています。
――ここでいうパラアウトは、各トラックごとにパラで出すということですか?
岡本:はい、そうです。
――それぞれWAVでパラで出す、Mixしないでということですね。これが実装予定と。
岡本:他にも細かいところで言うと、画面スクロールの挙動の追加とかもありました。シークバーを中心にして変更するパターンとか、画面端まで行ってというパターンとか、画面の切り替わり方や追従の仕方はいろいろありますよね。VOCALOIDエディターが後者だったので、それに対応したような形です。
――切り替えられるようになったということですか?
岡本:はい、そうですね。
11月19日、Piapro StudioとVOCALOID 6の相互互換が実現
――そして11月19日には大きな発表がありましたよね。
小泉:はい。11月19日15時に、ヤマハのVOCALOID 6の.vprファイル形式を、Piapro Studioで読み込めるようになりました。逆に、VOCALOID 6でもPiapro Studioの.ppsfファイルを読み込み可能になりました。
――これは大きいですね。具体的にどういうことができるようになるのでしょうか?
岡本:Piapro Studioでは、.vprファイルからトラック、歌詞、ノートが読み込めるようになります。VOCALOID 6側では、VOCALOIDトラック、AIトラックがあるわけですが、VOCALOIDトラックはV4までのパラメータであれば読み込めます。AIトラックは歌詞とノートが読み込めます。
――VOCALOID 6で.ppsfファイルを読み込む場合は?
岡本:同様にトラック、歌詞、ノートが読み込めます。ただし、VOCALOID 6やV5ではパート毎に言語、歌詞を変えられるんですけど、そこまでは.ppsfでは対応できないので、トラックを分けてシンガーを分けるようにする必要があります。それ以外もV5で増えたパラメータがあるんですけど、そこは未対応となります。
――書き出しはできるのでしょうか?
岡本:Piapro Studioが.vprを読み込めるようになりますが、書き出し機能はありません。VOCALOID 6が.ppsfを読み込めるようになるという形です。
――なるほど。NTシリーズとVOCALOIDシリーズが棲み分けできるようになっていく中で、少なくとも歌詞の打ち直しがいらなくなれば楽ですよね。
小泉:そうですね。NTとVOCALOID 6の両方をやるということになるわけですが、エンジンのモジュール、Automatic Controlのモジュールなどを社内開発してそれぞれの塊として持っているので、ソフトやプラグインへの対応も柔軟にできるようになっています。今は生成AIだけでなくDAWにもAIが入ってくる時代ですから、そういった最新のトレンドにつなぐ技術として、そのために自分たちのエンジンを持っているんです。
VOCALOID版初音ミクの開発状況
――最後に、VOCALOID版初音ミクの開発状況についても教えていただけますか?
小泉:8月31日にイベントのステージ企画の一環で音声を初公開しまして、10月31日にオケつきの歌唱デモ動画とティザーページを公開しました。今後の続報は、このティザーページでお知らせしていければなと。
佐々木:ここまでの経緯はとても長くて・・・VOCALOID6エンジンの人間の声とかみ合わせがされている根幹部分で、ミクの声が綺麗に鳴るように様々な工夫を重ねています。いずれヤマハさんと一緒にご説明できる機会を設けられたらと思います。
――今後のスケジュールについても教えてください。
小泉:今年12月にEarly Access版というβ版を、VOCALOID版の初音ミクユーザーに向けて公開します。日本語のデータベースだけを39日間使えるものとして提供する予定です。
佐々木:「初音ミク V4X」のときと同じく、反響を見てフィードバックで得られる意見も取り込みつつ、2026年上半期にリリースという形を考えています。
――その際の名称はどうなりますか?
小泉:「初音ミク V6」です。2024年8月に発表した仮称では「初音ミク V6 AI」としていたのですが、AIとは言わないことにしました。AIではあるんですけど、初音ミクらしさを実現するために試行錯誤したものなので。
佐々木:AIは、ミクの声を表情豊かにする手法であって、ミクを人間の声にすり替える手段としては使っていません。その辺をすり合わせるのに時間がかかってしまいましたが、VOCALOIDとNTと両方の良いところを上手く伸ばしていければと思います。
――ありがとうございました。








コメント