AIボイスチャンジャー、Voidol 3にRVCエンジンが追加される形で無償アップデート。Voidol 3Rがリリース

これまで何度か取り上げてきたAIボイスチェンジャーのVoidolがまた新たな進化を遂げました。これまでVoidol、Voidol 2、Voidol 3と進化するなかで、SYNTHモードを追加したり、AIモードとSYNTHモードの連結を可能にしたり、UIを改良するとともに、キャラクターを次々と増やしていくなど、とさまざまな強化が図られてきましたが、今回さらに新たな声質変換方式が追加されることになりました。

今回リリースされたVoidol 3Rという新バージョンは、ちまたで話題のオープンソースのAIボイスチェンジャーエンジン、RVCが追加されているのです。これにより従来のVoidol 3の機能であるAIモード、SYNTHモードはそのまま利用できるのに加え、RVCによる、よりリアルなボイス変換も可能になりました。発売は4月26日でダウンロード価格は現行のVoidol 3と同様の29,700円で、5月8日まで10%オフの26,730円。すでにVoidol 3を持っているユーザーであれば無償でアップデートすることが可能です。Voidol3R本体アプリは従来のバージョンと同様にWindowsとMacに対応していますが、RVCモードはWindowsのみの対応で、推奨動作環境以上のグラフィックボードが必要となります。実際Voidol 3Rとはどんなものなのか、紹介してみましょう。

RVCモードを追加したVoidol 3Rがリリース

従来のVoidol 3にRVCモード用のモジュールを追加

クリムゾンテクノロジーが開発したAIボイスチェンジャーのVoidol。これまでも「VTuberに超強力兵器が誕生!リアルタイムに自分の声をキャラクタボイスに変換できるソフト、Voidolが発売開始!」、「VTuberのための悪魔のアイテム、Voidolに新キャラ12種類が追加。自分の声を佐藤聡美さんや小岩井ことりさんに変身!」、「Vtuberにも人気のAIボイスチェンジャーが新音声変換エンジンを追加し、Voidol 2へ。声は自在に作り込む時代に」「AIボイスチェンジャー、Voidolが大きく進化。よりリアルに、よりクリアな音声になったVoidol 3を試してみた」……といった記事で取り上げてきました。

Voidol 3RのRVCモード

今回リリースされたVoidol 3RのRはRVCのRであり、リアルタイム変換のRでもあるとのことですが、Voidolの中にRVC機能を搭載したものとなっています。またVoidol3RからRVCモードを起動するという形でRVCを利用できるようになっています。

用途に合わせ、従来のモードとRVCの切り替えが可能

RVCモードはリアルタイムに高品質の声質変換を行うため、一定以上のNVIDIAのGPUを搭載していることが前提となります。

無事インストールし、起動したらVoidolの画面が登場します。このGUI自体は従来のVoidol 3とほぼ同様ですし、そこでの機能や声質も変わっていません。では、どうやってRVC機能を使うのでしょうか?

まず、メイン画面にあるRVCボタンを押すか、ツールメニューからVoidol RVCを呼び出すことにより、RVCモードとして機能的には独立した別画面が起動する形になっています。そのため、オーディオ入出力設定も含め、Voidol本体とは別途設定する必要があるのですが、それだけに自由度高く、従来のVoidolエンジンであるAIモードやSYNTHモードも、このRVCモードも用途に合わせて使い分けることが可能になっています。

よりブラッシュアップし、軽量高速化したRVC

ではVoidol 3Rに搭載されているRVCは、一般的なRVCとまったく同じなのかというと、いろいろ違いもあるようです。

まずはインストールがとっても簡単であるという点。前述の通りGPU搭載が必須とはなるものの、Voidol 3Rを普通にインストールするだけで使えるのは大きなポイントです。RVCのインストールにチャレンジしてくじけた、という方も多いと思いますが、オープンソースのRVCをインストールするにあたっては、Python環境を構築したり、VB-AUDIOのBananaやVirtual Cableをインストールして設定するなど、それなりの知識がないと動作だせることが難しいのも事実。そうした苦労なく簡単にインストールできるというだけでも大きな価値があると思います。

またオープンソースのRVCのプラグラムには、普通に使う上では不要な部分がいろいろ含まれているためにインストールサイズも大きくなり10GB程度を喰うのが実情です。が、Voidol 3Rではその不要な部分をすべて除去し4GB程度にまで縮めていると同時に、それによってさらなる高速化を実現し、軽快に動作するようになっています。

Voidol用RVCボイスモデルは初期搭載2モデル、今後随時追加販売予定

ここで気になるのが、これまでのAIモード用ボイスモデルとVoidol RVCボイスモデルの互換性についてです。

AIモード用ボイスモデルとVoidol RVCボイスモデルは異なる音声変換方式であるため、ボイスモデルの互換性はなく、異なるモードで利用することはできません。とはいえ、実は初期状態において、RVCモード用として、音宮いろは、奏ミナトの2つのボイスモデルが搭載されており、非常に高音質に変換することが可能になっています。

すでにAIモード用ボイスモデルとして販売されているキャラクターも含め、Voidol RVCボイスモデルは随時追加予定とのことです。

一般のRVCとのデータ互換性とボイスモデルの権利保護

一方で、RVC用には、無料のもの有料のもの含め、さまざまなボイスモデルがありますが、これらをインストールすれば、Voidol 3RのRVCモードでも利用可能になっています。そういう意味では、初期搭載の2モデルに限らず、数多くのボイスモデルを利用できる環境が整っているわけです。もっとも、外部のRVCボイスモデルに関しては、動作保証対象外となっています。

一方で、初期搭載の音宮いろは、奏ミナトを、一般のRVCで利用できるのか、というとここはNGとなっています。

クリムゾンテクノロジーに聞いたところ「ここ数年の生成AIの技術進歩により、RVCをはじめとした高精度のAIボイス変換技術が登場してきています。しかし、無断での学習への利用やなりすましなどのネガティブな話題で取り上げられることも多く、AIに対して良くないイメージを持っている方もいらっしゃるかと思います。我々はVoidolの取り組みを通じて、そのような現状を変えていきたいと考えています」とのこと。

そのため、Voidol RVCモデルファイルにはプロテクトを掛けることで、不正な再利用を防止し、声の持ち主の利益を守っていくとのこと。こういう形で技術が発展していくとよさそうですね。

以上、Voidol 3Rについて紹介してみました。冒頭でもお伝えした通り、Voidol 3ユーザーであれば無償でアップデート可能なので、ぜひ入手して試してみてください。

【関連情報】

Voidol 3R製品情報

Commentsこの記事についたコメント

2件のコメント
  • Shadowgenic

    自分が試したハイエンドPC(Ryzen9 16コア+GeforceRTX 4090)で無料のRVCv2で学習したデータをMMVCServerSIOで利用した場合、レイテンシを64msに設定すると安定しますが48msだとプツプツ途切れます。
    64msの場合のCPU、GPUの負荷はともに60%程度でした。
    遅れは感じますが、リアルタイムに会話できるギリギリぐらいだと思います。

    Voidol3RでのRVCモードではレイテンシどの程度まで詰められるのでしょう?
    リアルタイムに会話を行うゲームでも利用可能なレベルが実現できていますか?
    設定画面に具体的な数値がないので、実用できるものかどうか全く判断できず・・・。

    2024年4月28日 4:48 AM
  • 藤本 健

    Shadowgenicさん

    クリムゾンテクノロジーに聞いてみたところ、マシンスペックによっても変わってくるけれど、現時点では100msec以上のレイテンシーはあるようです。まだまだ向上させていくとのことでした。50msecを切るというのは現時点では難しそうではあります。

    2024年4月30日 6:18 PM

コメントを残す

メールアドレスが公開されることはありません。 が付いている欄は必須項目です