WindowsはもちろんMacでも使え、DAW上のVSTiとしても動作するCeVIO Pro (仮)がα版として無償配布開始

CeVIO Creative StudioやCeVIO AIなどのエンジン部分を開発してきた株式会社テクノスピーチが2月24日、新たな歌声合成ソフト、「CeVIO Pro (仮)」(チェビオプロ)を発表するとともに、正式版リリースへの準備段階としてα版の無償配布を開始しました。このCeVIO Pro (仮)は、WindowsだけでなくMacでも動作するソフトであり、スタンドアロンで動作するとともに、WindowsおよびMacのVSTiのプラグインとしても動作するものとなっています。

またCeVIO Pro (仮)にはソングエディタともに、デフォルトボイスライブラリとして女性シンガーである「知声」(読み:ちせい、英語表記:Chis-A)が付属。ここで合成された歌声の波形データは個人/法人、商用/非商用を問わず、原則、無料で利用することが可能となっています。実際どんなものなのか、試してみた一方、CeVIO AIなどと関係はどうなっているのか、性能的な違いはあるのか、ボイスライブラリやソングデータに互換性はあるのか……などなど、気になることもいっぱい。そこで、オンラインインタビューの形でテクノスピーチの代表取締役である大浦圭一郎さん、エンタメ事業部プロデューサーである塚田恵佑さんにお話を伺ってみました。

α版が無料公開となったCeVIO Pro (仮) 

このCeVIO Pro (仮)については、だいぶ以前からテクノスピーチのTwitter(@techno_speech)などで、開発中である旨を公表していたので、ついに登場か、と歓迎している方も多いと思います。私自身も心待ちにしていたのですが、まさかこのタイミングで無料で公開されるとは、想定外でした。具体的には公式サイト(https://cevio-pro.techno-speech.com/)にアカウント登録することにより、無料でソフトウェアをダウンロードでき、使うことができる、という形になっています。

DAW上のVSTiプラグインとして動作するCeVIO Pro (仮)

まずは、このCeVIO Pro (仮)のリリースに合わせ、ねじ式(@nejishiki0221)さん、ちいたな(@dokotana)さんによる公式デモソングが公開されているので、こちらをご覧ください。

これらが、知声による歌声ですが、まさにロックに合う感じで、カッコいいですね。これだけの歌声で歌わせることができるツールが無料で入手できるとは、かなり太っ腹、という印象です。

CeVIO Pro (仮)はMac用のインストーラも用意されている

そのCeVIO Pro (仮)、多くのDTMユーザーからも要望として出ていたMac対応およびプラグイン対応ということを実現させたのが最初に挙げるべきポイントです。これまでのCeVIO Creative StudioもCeVIO AIも、Windowsのみの対応で、スタンドアロンでの動作となっていたため、今回のCeVIO Pro (仮)は、待望のツールともいえるものです。

M1 Macにおいても問題なく動作した

動作環境は以下のようになっており、CPUにApple Siliconの表記はありません。ただ、M1 Mac miniで試してみたところ、Rosetta 2によって、とくに問題なく動作するようではありました。

※2022.2.24追記

Studio One 5 ProやAbleton Live 11.1などM1ネイティブ対応のDAWの場合、プラグインがIntel版だと認識しません。そのため、DAW側の「情報を見る」から「Rossetaを使用して開く」にチェックをいれて起動させることで、認識するようになります。

【動作環境】
●対応OS:Windows 11 / Windows 10(64bit日本語版または英語版)、Mac OS 10.12 以降
●CPU:Intel / AMD デュアルコアプロセッサー以上 ※4 コア以上推奨 ※処理性能が低いと再生中に音飛びが発生する場合があります(ファイル出力は問題ありません)。
●メモリ:4GB 以上 ※8GB 以上推奨
●HDD:1GB 以上の空き容量(インストール用)
●グラフィック:1280 x 720 以上 フルカラー
●DAW:48kHz の音声波形を生成するVSTiに対応したDAWソフトウェア
※ご利用にはインターネット接続環境が必要です

エンジン的にはCeVIO AIとほぼ同等のAI歌声合成システムとなっているようですが、UIは大きく変わり、よりDAWなどに近いテーストに仕上がっています。使い方の基本は、従来通りで、ピアノロールに音符情報を入力するとともに、歌詞をひらがなやカタカナや英語で入力すれば、歌わせることができる、というもの。今回のバージョンを見る限り、歌声合成をするためのソフトであり、喋るための音声合成機能は搭載していないようです。

Mac上のFL Studioのプラグインとして動作した

また、スタンドアロンで動作する一方で、Cubase、Studio One、Ability、Ableton Live、FL Studio……といったDAW上のプラグインとしても動作するようになっています。ただし、上記動作環境にも記載があるように、対応するプラグイン環境としてはVSTiのみであり、AudioUnitsやAAXには対応していません。

※2022.2.24追記
以前、「VST、AU、AAX、RTAS…何でも来い、Blue Cat PatchWorkが超便利!」の記事で紹介したBlue Cat PatchWorkを使うことで、Logic Pro Xで動作したという報告をいただきました。

Blue Cat PatchWorkを使うことでLogic Pro X上でも動作する(情報提供:Tsukasa Fujita@mutyasenseiさん)

また、VSTiとなっていますが、一般的なVSTiとは少し挙動が異なります。Piapro StudioやSynthesizer Vなどに近いUIといえば話が早いかもしれませんが、要するにDAWのMIDIシーケンス機能でシンセサイザを鳴らすというのではなく、DAWの中にCeVIO Pro (仮)のソングエディタが起動し、ここでエディットしたり、歌わせたりすることができるとともに、DAW側と完全に同期したり、DAWのミキサーを通じて音を出すことができる、というものになっています。

Windows上のStudio Oneのプラグインとしての動作も確認

またα版という扱いだからか、CeVIO Pro (仮)の歌声は48kHzに限定される形になっています。そのため、プラグイン環境で動作させる場合、プロジェクトのサンプリングレートを48kHzにしないと正しく音が出ないので、その点は注意してください。

DAW側のプロジェクト設定が48kHzでないと、上記のようなアラートが表示される

このようにプラグイン環境で使えることになったので、従来のように、WAVを出力して、それをDAWのオーディオトラックに読み込ませ、何か修正があったら、またソングエディタに戻って修正してからWAVを出力して……という面倒な手順を踏まずに、DAW内ですべて完結できるので、ワークフロー的に非常に使いやすくなっています。

各種パラメータ設定も自由に行えるという点では編集機能的にはCeVIO AIとほぼ同様

いずれにせよ、ユーザー登録するだけで誰でも無料で使うことができるので、まずは入手して使ってみてください。一方で、使っただけでは、よく分からない疑問点がいろいろとあったので、テクノスピーチにたくさん質問をぶつけてみました。以下のインタビューをご覧ください。

テクノスピーチ・インタビュー

--テクノスピーチのTwitterなどでCeVIO Pro (仮)を開発中という情報は見ていましたが、まさか無償配布をするとは思ってもいませんでした。
大浦:今はα版という扱いであり、正式リリースに向けて、みなさんに意見・感想などをいただきたいという思いもあり、無料で使えるようにしました。単に利用するだけでなく、このCeVIO Pro (仮)、および知声での生成物である波形についても基本的に無料でお使いいただけるようにしています。もちろん楽器への組み込みであったり、リバースエンジニアリングなどはNGですが。
塚田:そのユーザーのみなさんからのフィードバックを多くいただくために、フィードバックキャンペーンを実施中です。CeVIO Pro (仮)のサイトのコンタクトから意見や要望を送ることで、今回のねじ式さんによるデモ曲のマテリアルデータと、ご本人解説コメントもプレゼントしています。ぜひ、多くの方からのフィードバックがいただければと思っております。

オンラインインタビューさせていただいた

株式会社テクノスピーチ
代表取締役 大浦圭一郎さん

 

--その正式リリースはいつごろで、価格はいくらぐらいを想定しているのですか?
大浦:正式リリースは、今年の夏から秋くらいにできるよう目指しています。名前も変わる可能性が大きいので、あえて「CeVIO Pro (仮)」としているのです。ただ、正式リリース後も、エディタおよび、デフォルトボイスライブラリの知声については、無料で使えるようにしていく予定です。

--なんと!そんな太っ腹なんですね。でも、それだと、どうやって企業としての利益を出していくのですか?
塚田:正式リリースの近辺で、第2弾となるソングライブラリを発表する予定で準備を進めており、こちらはサブスクリプションでの有償での提供を予定しています。

大浦:音声合成の性能向上により、いずれ声の主である演者さんの声と区別がつかなくなったときに、音声合成が演者さんの敵になるのではなく、分身となって仕事をしてくれる相棒となるのが理想です。そのために、サブスクリプションモデルのように声が使われるほど演者さんに利益を還元できる仕組みを作っていくことは大切で、CeVIO Pro (仮)が先頭に立って、演者さんにもユーザーさんにも納得してもらえる解を探していこうと考えています。

塚田:また、ソングライブラリ発売を新規ファン層へアプローチするきっかけとしていただければ、とも考えており、そうした仕組みづくり、CeVIO Pro (仮)を味方であると感じていただけるような雰囲気づくりができればと思っています。

株式会社テクノスピーチ
エンタメ事業部プロデューサー
塚田恵佑さん

--なるほど、サブスクでのビジネス展開ですね。今後ソングライブラリを増やしていくとのことですが、知声のモデルとなっている方の情報なども教えてもらえますか?またライブラリの選択画面で3つのバージョンが選択できるのですが、これはどういう意味なのでしょうか?
塚田:知声は、テクノスピーチオリジナルのキャラクタで、キャラクタデザインはチェリ子(@chie_rico)さんにお願いしています。中性的な声が魅力のシンガーとして実装しましたが、知声のCVは過去にテクノスピーチの仕事を手伝ってくれていた元スタッフさんでして、既存の歌声合成ソフトウェアには採用されていない、完全新規CV製品、という形となりますね。

大浦:知声のバージョンが1.0.0、1.1.0、1.2.0(※取材時点の状況です)から選べるようになっていますが、これはディープラーニングをしていった結果、複数のバージョンが誕生したものです。基本的には一番新しい1.2.0をお使いいただくのがいいと思いますが、α版で多くの方にテストをしていただくという段階なので、あえて過去のバージョンも使えるようにしています。ぜひ、この辺も比較してみていただければと思います。

知声のバージョンが現在3つ用意されている

--一方で、従来のCeVIO AIやCeVIO Creative Studioのソングライブラリは利用できるのですか?
大浦:その話に入る前に、今回のソフトとCeVIOプロジェクトとの関係について説明させてください。ご存じの通り、CeVIO AIやCeVIO Creative StudioはCeVIOプロジェクトという企業の集合体で作ってきたソフトです。その中で当社、テクノスピーチはエンジン部分の提供を担当してきました。それに対し、今回のCeVIO Pro (仮)は、テクノスピーチによる自社・独自製品です。エンジンはもちろんGUIもアクティベーションサーバーもすべてテクノスピーチが手掛けています。元々B2Bでテクノスピーチが独自提供していたプロトタイプ実装があったこともあり、自社でのソフトウェア開発にチャレンジしてみたい、という思いを持っていました。MacやVSTiの対応のためにGUIが作り直しになりますし、いざとなったらエンジンの仕様を変えられるという面で開発効率的なメリットも享受できるので、CeVIO Pro (仮)はテクノスピーチで独自開発、リリースをする形となりました。もちろん、当社がCeVIOプロジェクトから勝手に独立したわけではなく、CeVIOプロジェクト内でも相談し、CeVIOプロジェクトも続けつつ、姉妹ブランドとして一緒にやっていきます。

塚田:そこで、ぜひご理解いただきたいのがサポートについてです。CeVIO AIやCeVIO Creative StudioはCeVIOプロジェクトが窓口になっているのに対し、CeVIO Pro (仮)は当社が窓口となり、CeVIOプロジェクト側に行ってしまうとうまく対応できない可能性があるのです。そうしたことがないように調整はしていきたいと思っておりますが、そうした点もご承知おきいただければと思います。

--その姉妹ブランドという中で、改めてソングライブラリの互換性について教えてください。
塚田:ライセンスの仕組みの違いなどがあるため、現時点においてCeVIO AIやCeVIO Creative StudioのソングライブラリをCeVIO Pro (仮)に読み込ませて使うことはできません。ただ、ユーザーのみなさんからのフィードバックを受けながら、要望の多いものに関してはクロスプラットフォーム化を検討していきたいと思います。先ほどお話した第2弾になるかどうかはわかりませんが、さとうささらについては、クロスプラットフォーム化する方向でCeVIOプロジェクトと調整を進めています。また、さとうささらのように、すでに製品を持っている方に対しては、シリアルを照合し、何かしら優待価格でのご案内ができるような仕組みを検討をしているところです。

--一方で、ソングエディタのインポートを見るとCeVIO AIやCeVIO Creative Studioのプロジェクトファイルとの互換性はあるようですね。
大浦:CSSファイルのインポート機能は搭載しました。α版ではCSSの楽譜情報だけインポートできて調整情報はインポートできませんが、今後対応予定です。またMusicXMLファイルのインポートも可能なので、これを介して従来のデータ資産をある程度活用させることができるはずです。今回のリリースには間に合いませんでしたが、CSSファイルのエクスポート機能も実装していく予定です。こうすることで、CeVIO AIで作った楽曲との行き来もしやすくなると思います。

CSSやMusicXMLのインポート機能を装備

--このインポート、エクスポートメニューにあるtssprjというのがありますが、これは何ですか?
大浦:CeVIO Pro (仮)に最適化したデータ形式です。例えば、選択したボイスのバージョンも保存されているので、ローカルにボイスファイルがDL済であれば新しいバージョンのボイスファイルがあってもそのままロードできます。入力された音符データや歌詞データはもちろん、VSTiで何をいじったのか…といった情報もすべて保存できるようになっています。ですので、通常の保存はこれを利用してください。

--もう一つ機能で、よく分からなかったのが画面左側にあるフリーズボタンです。これを選ぶと、波形ジェネレータという選択肢が出てきますが、これは何なのでしょうか?

大浦:フリーズボタンは、いわゆるフリーズ機能で、歌声合成計算を事前処理して固定させることにより、動作時のCPU処理を軽くするためのものです。が、この際に、波形ジェネレータとしてデフォルトとPrototype A 1.0.0およびPrototype A 1.1.0というのを選択できるようにしています。デフォルトはCeVIO AIと同じセッティングになるのですが、Prototype A は、われわれがニューラルボコーダーと呼んでいるものであり、新たなるチャレンジとして位置付けているものです。AI技術で音声ボコーダーを学習したようなものとなっています。通常のボコーダー、つまり声を発生させる従来のシステムよりも、さらにいい音が出るけれど、処理に時間がかかるので、フリーズ機能とともに実装したのです。もっとも、理論的にはいい声になるはずなのですが、現状では良くなるところもあれば悪くなるところもある状態でして…(笑)。この辺も改善しつつ、みなさんに試してもらってレビューしてもらいながら、進化させられたら……と考えています。

フリーズ設定においてPrototype A 1.0.0および1.1.0が選択できる

--最後に、改めての質問となりますが、CeVIO Pro (仮)とCeVIO AIを比較した場合、歌声合成としての性能に違いはありますか?
大浦:波形ジェネレータでデフォルトを選択していれば、たとえば、さとうささらであれば、基本的に同じであると考えていただいて結構です。ただ、ソフトやOSが異なると、多少の計算誤差は出て、ビットパーフェクトとはなりません。その辺もご理解いただいた上で、ぜひご活用ください。

--ありがとうございました。

なお、インタビューに対応いただいた大浦さん、さらにはデモ曲を作成したねじ式さんをゲストにお招きする形で、3月8日にDTMステーションPlus!の番組を配信します。ぜひ、こちらもご覧いただければと思います。

【関連記事】
CeVIO AI さとうささら、トークもソングも8月5日より、いよいよ発売開始

【関連情報】
CeVIO Pro (仮)公式サイト

DTMステーションPlus!配信情報
3月8日 20:30~22:30
【ニコニコ生放送】:https://live.nicovideo.jp/watch/lv335850639
【YouTubeLive】:https://youtu.be/VkvjbK_TYoo