AI歌声合成でさとうささらが人のように歌う！来年1～3月発売予定となったCeVIO AIを試してみた

先日「AI歌声合成を実現するCeVIO AIが年内発売。IA、ONEに加え、結月ゆかり、flowerなどもCeVIO AIに対応」という記事でも紹介したCeVIO AI。やや開発が遅れている模様で、発売が2021年の1月～3月にサードパーティー製ボイスに合わせてとなることがCeVIOプロジェクトから発表されました。が、実は歌声合成のシステムはほぼ完成しているようで、先日CeVIO AIのα版を入手。現時点で使えたのは、さとうささらのソングボイスのみではありましたが、実際に試してみたところ、驚くほど自然な歌声で歌ってくれました。

ユーザーインターフェイスは従来からのCeVIO Creative Studioとほぼ同じで、ピアノロールに音符と歌詞を入力すればすぐに歌ってくれるというもの。しかし、実際に歌わせてみると、その人間っぽい歌い方のリアルさはまったくの別モノ。まだα版なので、この先さらに進化する可能性もありますが、CeVIO AIがどの程度のものなのかいろいろ試してみたので、レポートしてみたいと思います。

※2021.1.22追記
テクノスピーチから発表があり、今年春にさとうささらのソングボイス、トークボイスが発売されるとのこと。詳細が分かったら、また追記していきます。

2021年1月～3月に発売予定のCeVIO AIのα版を試してみた

今回試してみたのはCeVIOプロジェクトから送ってもらったCeVIO AIのα版。CeVIO AIは、従来のCeVIO Creative Studioと同様、歌わせるためのソング機能と、しゃべらせるためのトーク機能があります。が、手元に届いたのはCeVIO AIのソングエディタと、未発表のさとうささらのソングボイス。さとうささらのCeVIO AI版は現時点では発売日などは未定なため、キャラクター画像もシルエットになっているようです。また、トークボイスのほうは試すことができなかったのでテストできたのはソング機能のみではありますが、どんなものなのか見ていきましょう。

まずは、手元にあったMusic XMLファイルを読み込んで、歌わせてみたので、聴いてみてください。

いかがですか？ものすごくリアルに歌っているのが分かると思います。まったく無調整の、いわゆるベタ打ちでこれだけ歌ってくれるのですから、すごいですよね。「でも、この声、リバーブとかかかってない？」と思った方は、正解！バックのオケに馴染ませるため、ボーカルに軽くコーラスとリバーブが掛けています。が、それはCeVIO AIの機能ではなく、このYouTube動画を作るために、DAW側で操作したもの。生歌はこの後、ちゃんとお聴かせしますよ！

CeVIO AIのロゴ（スプラッシュスクリーン）

ちなみに、この「いつかかならず」という曲、DTMステーションをよくご覧いただいている方ならご存知かもしれませんが、2019年4月にDTMステーションCreativeレーベルから「世界初のAI歌声合成によるCD」としてリリースした楽曲で、これを最新のCeVIO AIで歌わせたものが先ほどの動画だったのです。そう、当時、まさにこのCeVIO AIのプロトタイプともいえるものに歌わせていたのですが、ついにこの歌声を手元で簡単に歌わせることができるようになると思うと感無量です。

当時の詳細については「AI歌声合成をボーカルに起用した世界初のCDをリリース。歌声合成技術が人間を超える日は来るのか!?」という記事のほうをご覧いただきたいのですが、CeVIO AIについて、これまでのCeVIO Creative Studio 7と比較しながら見ていきましょう。

現在発売されているCeVIO Creative Studio 7の画面

まず、そのCeVIO AIが使えるのはWindowsのみとなっており、動作環境は以下の通りです。

▼CeVIO AI動作環境

OS：Windows 10 日本語版 (64bit)
Windows 8.1 日本語版 (64bit)

CPU：Intel / AMD デュアルコアプロセッサー以上
※4コア以上推奨
※処理性能が低いと再生中に音飛びが発生する場合があります。(ファイル出力は問題ありません。)

グラフィック：1280 x 720 以上フルカラー

HDD容量：1GB 以上の空き容量（インストール用）

メモリ：4GB 以上
※8GB 以上推奨

冒頭でも触れた通り、UI的にはほぼ同じではありますが、実はバックの色が従来のダークからホワイトに変わっているので、パッと見の印象が少し変わってはいますが、各ボタンやノブの配置からその機能も含めて、違いはなさそうなので、これまでCeVIOを使ってきた方であれば、まったく迷うことなく使えると思います。

CeVIOI AIのソングエディターの画面。CeVIO Creative Studioと色のトーン以外ほぼ同じに見える

実際に「きらきら星」を冒頭の4小節だけ入力して歌わせていく様子をキャプチャしてみたので、こちらをご覧ください。

すべて4分音符のベタ打ちで、ここに歌詞を入力したものを再生させただけで、これはエフェクトも何もかけてない、生声。ピッチの揺れなども含めて、すごくリアルなのが分かると思います。

また2小節目の最後に4分休符がある部分を聴いてみると、ブレス（息継ぎ）がしっかり入っているんですよね。だからこそ、自然でリアルに感じる面もあると思うのですが、このブレスは特に入力において指示したわけではなく、間が空いたから、AIが勝手に息継ぎをしたということのようです。

改めて、先ほどの「いつかかならず」を聴いてみると、いろいろなところで、ブレスが入っているのが感じられるはずです。もちろん、自然に感じるのはブレスに限らず、歌声の滑らかさであったり、絶妙なビブラートであったり、とにかくCeVIO Creative Studioを含めた従来の歌声合成とは明らかに違う、生きた歌声です。

では、CeVIO AIは、単に入力されたベタ打ちの譜面を歌うだけかというと、そうではないんです。これまでのCeVIO Creative Studioと同じように、いろいろな調整が可能になっています。

たとえば、声質は画面右側にあるパラメータで調整できるほか、ALPというパラメーター画面でも調整できるので、途中で切り替えながら歌わせるとこんな感じになります。

結構雰囲気が変わるのが分かると思います。同様にVOLのパラメーターを鉛筆ツールで描くことで音量を調整することもできるし、PITのパラメーターを鉛筆で描けばピッチの動きを大きく書けることも可能です。

PITパラメーターでピッチの動きを調整できる

ほかにもTMGでタイミング調整をしたり、VIAでビブラートの振幅、VIFでビブラートの周期を調整できるなど、この辺の使い方はCeVIO Creative Studioと同じなので、これまでのCeVIOユーザーはもちろん、VOCALOIDを使ってきたユーザーでもすぐに理解できると思います。AI歌声合成でありつつつも、これだけの自由度をもって歌わせることができるのは、革命的といってもいいのではないでしょうか？

TMGでタイミング調整できるのもCeVIO Creative Studioと同じ

なお、CeVIO AIのメニュー構成を見る限り、これらもすべてCeVIO Creative Studioのものと同じになっているようです。

同様に、ツールメニューのオプションを見ても、ここにある項目は一緒です。

メニュー構成もCeVIO AIのα版を見る限りCeVIO Creative Studioと同じ

実際に発売されるまでに、何か変更されたり、追加される可能性はありますが、とりあえず使い勝手はまったく同じと考えて良さそうですね。

CeVIO AIのオプション設定画面

ところで、これまでCeVIO AIとCeVIO Creative Studioとの関係性や互換性がどうなっているか気になる方も多いと思うので、その点も紹介していきましょう。

まず、CeVIO AIはCeVIO Creative Studioの新バージョンというわけではなく、別製品という位置づけなので、別途購入する必要があります。価格面はまだ発表されていないので分かりませんが、

CeVIO AIソングエディタ
CeVIO AIトークエディタ
CeVIO AIソングボイス
CeVIO AIトークボイス

のそれぞれが発売される予定です。

従来のCeVIO Creative Studioと同様、CeVIO AIソングエディタとCeVIO AIトークエディタの両方のライセンスを認証すると、従来のCeVIO Creative Studioのように1本のソフトに統合される形になっています。

今後CeVIO AIに対応が予定されているキャラクター

これまでにIA、ONEのトークボイス、結月ゆかり、flower、東北きりたんのソングボイスが各社から発表されているほか、CeVIOプロジェクトによると、今回使った、さとうささらをはじめ、ほかにもいろいろリリースを予定しているとのことなので、期待したいところです。

では、CeVIO AIに従来のCeVIO用のソングボイスやトークボイスを読み込めるのか？結論から言ってしまうと、できません。エンジン開発元のテクノスピーチによると、従来のCeVIOとCeVIO AIでは、歌わせたり、しゃべらせたりするためのエンジンがまったく違うため、読み込んで使うことはできない、とのこと。そのため、従来のCeVIOを併用したいという人は、それぞれのソフトをインストールして使い分ける必要があります。

ただ、将来的には両方のソングボイス、トークボイスを読み込むことができるようにするアップデートを開発することも検討しているとのことです。

インポート、エクスポートもCeVIO Creative Studioと同様に用意されているほかCSSファイルの互換性もある

一方で、CeVIO Creative Studioのプロジェクトファイル（CCSファイル）は、CeVIO AIのプロジェクトファイルと基本的に共通のフォーマットにしてあるため、お互いに読み込みが可能になっています。当然、それぞれを再生した結果は違ってくるわけですが、うまく使い分けることで、面白いことができそうです。

以上、CeVIO AIのα版についてレポートしてみました。発売は来年1月～3月とのことなので、待ち遠しいところではありますが、また新しい情報があればお伝えしていきます。

※2020.12.03追記
2020.11.24に放送した「DTMステーションPlus！」から、第164回「UVIの新製品がDTMに無限の可能性を！」のプレトーク部分です。「AI歌声合成でさとうささらが人のように歌う！来年1～3月発売予定となったCeVIO AIを試してみた」から再生されます。ぜひご覧ください！