歌声合成はさらに次の時代へ。Synthesizer Vがサンプルベースと人工知能のハイブリッドで大きく進化

以前、「VOCALOIDの競合となるのか?中国人天才少年が開発した歌声合成ソフト、Synthesizer Vの破壊力」や「VOCALOIDの対抗馬、Synthesizer Vが無料で使えるWebブラウザ版を公開。2020年、歌声合成はさらに進化する」といった記事で紹介した歌声合成ソフトのSynthesizer Vがメジャーバージョンアップし、7月30日に世界同時発売されます。またこれと同時に、VOICEROIDで人気の「琴葉 茜・葵」のSynthesizer V専用歌声データベース、さらにSakiという新たな日本語の女性ボーカルのデータベースも発売されます。

この新しいSynthesizer Vの最大の特徴は、従来からあるサンプルベースの歌声合成と、最近話題のニューラルネットワークを用いた人工知能による歌声合成の両方を併せ持つハイブリッドエンジンを搭載したこと。これにより、とても自然な人間らしい歌声が出せると同時にユーザーが自由に歌声を調声できるようになっています。また無料版のSynthesizer V Studio Basicと有料のSynthesizer V Studio Proの2つが新たにリリースされ、いずれもWindows、masOS、Linuxで動作するようになっています。また有料版のSynthesizer V Studio Proはパッケージ版も誕生し、AHSが発売元となりPCショップ、楽器店、大手量販店などにも並ぶともに、初回限定の優待版が半額で登場したり、他社製歌声合成ソフトからの乗り換え版なども登場するとのこと。実際どんなものが試してみたので紹介してみましょう。

大きく機能、性能を向上させて誕生したSyntheseizer Vの新バージョン、Syntheseizer V Studio Pro 

Synthesizer Vとは

Synthesizer Vをご存知ない方も多いと思いますが、これは上海出身のKanru Huaさんが社長を務める日本のベンチャー、Dreamtonicsが開発した歌声合成ソフトで、VOCALOID、CeVIO、Utau、また先日話題になったNEUTRINOとも異なる独自のエンジン、独自のエディタ、UIを持ったソフトです。まずは、このSynthesizer Vでどんな歌声が出せるのか、琴葉 茜・葵(ことのはあかね・あおい)の歌声によるデモが公開されたので、こちらを聴いてみてください。

AHSoftware · takapi Demo(Edit version)

いかがですか?琴葉 茜・葵のしゃべる声をご存知の方なら「VOICEROIDそのものの歌声じゃないか!」と感じられるのではないでしょうか?ちなみに「VOICEROID 琴葉 茜・葵」は声優の榊原ゆいさんの声を使った音声合成ソフト(しゃべらせるソフト)で、茜は関西弁、葵は標準語となっていましたが、歌声においては同じなので、「Synthesizer V 琴葉 茜・葵」においては茜・葵という区分けはないようですね。このデータベースは、新たに榊原ゆいさんの歌声を収録して作ったとのことです。

Synthesizer V専用の歌声データベース、「Synthesizer V 琴葉 茜・葵」

さらに、今回もう一つ今回、Sakiという歌声データベースも発売されています。こちらは、名前は明らかにされていませんが、「才能溢れるシンガーソングライターの歌声を元に制作された」Synthesizer V専用の日本語の歌声データベースとなっています。Sakiのデモ曲もまもなく公開される予定ですが、聴いてみた感じでは琴葉 茜・葵と同様、VOCALOIDやCeVIOなどとは異なる音源である感じでした。それと同時に、結構使える音源だ、と感じられるのではないでしょうか?冒頭でも紹介したとおり、今回、大きくバージョンアップしたSynthesizer Vはサンプルベースの歌声合成とAI歌声合成の両方の良さを併せ持つ、ハイブリッド歌声合成エンジンとなっているため、こんな歌声が出せるのです。

さて、そのSynthesizer Vのラインナップは以下のようになっています。

  Web Synthesizer V Synthesizer V Studio Basic Synthesizer V Studio Pro
価格 無料 無料 12,800円+税
利用環境 ブラウザ Windows / macOS / Linux
プロジェクト制限 1トラック
300ノート
3トラック 無制限
同時レンダリングスレッド 2コア 2コア 無制限
ASIO/Jack対応
追加機能 なし なし 自動調教
代替発音(音符プロパティ)
ブレス成分の分離出力
Lua/Javascriptスクリプティング
サポートされているデータベース Web用圧縮データ SVR2がサポートするすべてのフォーマット

ブラウザ上で使えるWeb Synthesizer Vも以前紹介した際のものから進化して第2世代エンジンのものになったとのこと。そして、新しくなったSynthesizer V2エンジンを搭載したSynthesizer V Studio BasicとSynthesizer V Studio Proの2つのエンジン&エディタが誕生したのです。とりあえず、どんな歌声が出せるのか試す程度であれば、無料のStudio BasicでOKですが、本格的な活用を考えればStudio Proが必要、という形です。また利用環境を見ていただくと分かる通り、Windows、macOS、LINUXのそれぞれで使えるのも大きな特徴だし、次のアップデートでVSTインストゥルメント(VSTi)にも対応する予定となっています。

Syntheseizer V Studio Proのパッケージ

歌わせ方の手順

今回、ユーザーインターフェイスも大きくブラッシュアップされて変わっているのですが、使いながら、歌わせるまでの流れを簡単に見ていきましょう。

Syntheseizer Vの起動画面。上が編曲ビュー、下がピアノロールビューになっている

起動すると、上が編曲(アレンジ)ビュー、下がピアノロールビューとなっており、VOCALOIDなどと基本的には同様の構成です。ここで、編曲ビューのトラックでkotonoha sistarsを選択したうえで、鉛筆ツールに持ち替えたうえで、ピアノロールビューに音符を書き込んでいきます。

ピアノロールに音符をマウスで打ち込んでいく

デフォルトでは「ラ(la)」、「ラ(la)」、「ラ(la)」で歌うので、1つの音符ごとに歌詞を入力していってもいいですが、修正メニューの中に「歌詞入力というものがあるので、ここで、平仮名やカタカナで入力していきます(もちろんローマ字でもOK)。

1音符ずつスペースで区切って歌詞を入力

この際、各音符ごとにスペースで区切っていってもいいし、1音符1文字であれば、「1文字ずつ区切る」にチェックを入れておくのもOKです。こうして歌わせてみたのがこちらです。

単純に音符と歌詞を入力しただけのいわゆるベタ打ちではありますが、滑らかな歌声で歌わせることができたのが分かると思います。一方、画面下のほうにパラメータというところあるので、これをクリックしてみると各種パラメータを使って調整できるようになっています。

そのパラメータとしては

ピッチベンド
ビブラートエンベロープ
ラウドネス
テンション
ブレス
有声/無声音
ジェンダー

の7つがあり、そのうちの2つを同時表示できるようになっています。このパラメータを動かすことで、歌い方がかなり変化するのですが、パラメータを設定するとほぼ瞬時にピアノロール上に表示されている波形が書き換わるというのもSynthesizer Vの大きな特徴。ライブレンダリングといわれる機能で、編集すると同時にレンダリングが行われるので、ストレスのない音楽制作を実現できるのです。

一方、画面右端を見てみると、7つのアイコンが並んでいますが、ここにもさまざまな設定・編集機能が用意されているのです。いくつかを紹介すると、一番上の音符アイコンをクリックすると画面には音符プロパティが表示されます。ここでは、各音符ごとにピッチ推移やビブラートに関する細かな設定、タイミングと音素の設定などができるようになっています。

またマイクアイコンをクリックすると歌声に関する調整パラメータが現れ、たとえばkotonoha、Sakiのラウドネスやテンション、ブレス、またデフォルトピッチ、デフォルトビブラートなどを設定するとともに、それを歌声のプリセットとして保存することも可能になっています。

また一番下の歯車アイコンをクリックすると、UIの言語設定やオーディオインターフェイスに関する設定、ショートカットの設定……といったことができるようになっています。

これらの設定画面は表示・非表示ができるし、必要に応じてウィンドウとして浮かしたり、左側にもっていくも可能など、柔軟になっており、見た目にも洗練された感じですね。

VOCALOIDやCeVIOのデータの読み込みも可

このように、一から歌わせるためのデータを打ち込んでいくのが基本ではありますが、もっと簡単に試す方法はないのか……と思う方もいるかもしれません。実はSynthesizer Vは、データの互換性にも優れており、MIDIデータが読み込めるのはもちろん、VOCALOIDのvspxファイル、CeVIOのccsファイル、UTAUのustファイルなども読み込んで歌わせることが可能です。この際、基本的には音符と歌詞情報であって、各パラメータは反映されませんが、とりあえず歌わせることができ、必要に応じて後から調整できるという意味では、非常に強力な機能であり、便利です。

ちなみに、CeVIOのセリフデータもそのまま取り込むことができ、ある程度普通にしゃべらせることができるというのも大きなポイントかもしれません。

このようにして作った歌声は、全体をミックスした状態で、また各トラックごとにでもWAVファイルで書き出すことが可能になっています。またその際のフォーマットとしてステレオかモノラルか、ビット深度は16bit/24bit/32bitFloatか、サンプリングレートは44.1/48/96kHzのいずれかを選択可能になっているのですが、もう一つ、「無声音部分の分離出力」という機能が用意されているのも大きなポイントです。

有声音と無声音を別々のファイルに分けたり、左右のチェンネルに分けるなど、いくつかの出力方法が設定できるのですが、そもそも「無声音部分の分離出力」とはどういうことなのか?実際に試してみたので、これをヘッドホンで聴いてみれば、すぐに理解できると思います。

まさに有声音と無声音を分離しているわけです。これを別トラックに分けてDAWに読み込ませて使うことで、歯擦音を調整するといったことが簡単にでき、有声音だけにエフェクトをかけるとか、無声音のみにEQをかけるなど、歌声の雰囲気をより積極的に調整可能になるわけです。これも歌声合成ソフトを使って曲を作る人にとっては、非常に魅力的な機能だと思います。

もう一つ取り上げたいのは、スクリプト機能が搭載されたことです。VOCALOID 3やVOCALOID 4には、Job Pluginという機能がありましたが、それと非常に近いもので、たとえば、「選択した音符すべての音長を10%ずつ短くする」とか、「指定した音符の文字の後に『っ』を加える」……といったスプリプトを組んで実行することができるのです。スクリプト言語としてはJob Plugin同様LUAが利用できるほか、Javascriptも利用できるようになっています。

以上、大きくバージョンアップしたSynthesizer Vについて、ざっと紹介してみましたが、いかがだったでしょうか?かなり魅力的な機能が満載で、まさに歌声合成の新時代到来という感じがします。

前述の通り、有料版のSynthesizer V Studio Proにはダウンロード版とパッケージ版があり、ここには「Sakiライト版」という歌声データベースが付属するので、とりあえずこれで歌わせることが可能ですが、本格的に使うには歌声データベースを別途入手し、インストールする必要があります。

その歌声データベースの第一弾として「Synthesizer V 琴葉 茜・葵」および「Syntheseizer V Saki」がリリースされ、いずれもパッケージ版、ダウンロード版が発売されます。


さらにパッケージ版のみですが「Syntheseizer V Studio Pro スターターパック」というものがリリースされたのも大きなトピックスです。これはSyntheseizer V Studio Pro と歌声データベース1つをセットにしたもの。具体的には歌声データベースをダウンロードするためのクーポンコードがセットとなっており、別々に購入するより少し安く購入できるようになっています。このスターターパックの場合、クーポンコードで琴葉 茜・葵またはSakiを入手できるほか、今後発売される予定の歌声データベースを入手することも可能となっています(ものによっては差額が発生する可能性もあるとのこと)。

そして、もうひとつ重要なポイントは、通常のパッケージ版、ダウンロード版のほかに、既存のAHS製品ユーザーに向けて、初回限定優待版、AHSユーザー特別版といったものが登場し、割安で購入できるということ。初回点綴優待版は9月末までAHSストアのみで販売されるもので、Synthesizer V Studio Pro(6,400円税別)とSynthesizer V Studio Proスターターパック(9,000円)といずれも通常版の半額となっています。また10月以降はAHSユーザー特別版としてSynthesizer V Studio Proが9,800円、Synthesizer V Studio Proスターターパックが16,000円となるほか、Synthesizer V Sakiが7,800円、Synthseizer V 琴葉 茜・葵が7,800円となるとのことです。

もちろん、これらはSynthesizer Vのシリーズ展開の第1弾としてであり、今後新たな歌声データベースが続々と登場する予定です。すでに英語ライブラリ、中国語ライブラリがでるほか、現在VOICEROIDのクラウドファンディングが行われている小春六花のライブラリも登場するのだとか……。この辺、また新しい情報が入ったらお伝えしていきます。

なお、AHSは、このSynthesizer Vのプロモーションを兼ねたプレゼントキャンペーンを実施しています。これは作品をアップしてくれることを条件に今回の製品全部プレゼントするのだとか……。限定10名で募集しているので、腕に自信のある方は応募してみるといいかもしれませんよ。

発表会の現場。左からDreamtonicsのTetsuyaさん、Kanru Huaさん、MCのLESS北山さん、AHS社長の尾形友秀さん

なお、今回のSynthesizer V新製品の発表会が、東京六本木の会場で行われ、その様子がAHS生放送および、英語圏向けにYouTubeLive、さらに中国圏向けにビリビリ動画で3元生中継で行われ、その場に立ち会わせていただきました。これが、今後どのように広まっていくのか、海外での波及がどうなるのかなど注目していきたいと思います。

※2020.07.22追記

2020.07.14に放送した「DTMステーションPlus!」から、第155回「Synthesizer Vで歌声合成の新時代を先取りしよう!」です。ぜひご覧ください!

【関連情報】
Synthesizer Vシリーズ公式ホームページ(AHS)
Synthesizer V Saki ホームページ
Synthesizer V 琴葉 茜・葵 ホームページ
Synthesizer V情報(Dreamtonics)
Web Synthesizer Vサイト

【価格チェック&購入】
◎Amazon ⇒ Synthesizer V Studio Pro(パッケージ版)
◎Amazon ⇒ Synthesizer V Studio Pro スターターパック(パッケージ版)
◎Amazon ⇒ Synthesizer V 琴葉 茜・葵(パッケージ版)
◎Amazon ⇒ Synthesizer V Saki(パッケージ版)

Commentsこの記事についたコメント

4件のコメント
  • 西園寺成弼

    Synthesizer V、価格的には五年前、私は藤本さんのここの記事で初めてその存在を知ってCeVIOのスターターキットを購入しましたが、その時の価格と近いので、とても導入しやすいですね。
    デモを聴くと「ボカロ寄り」な印象を受けましたが、これは「フォルマント」などの調整次第で、リアル感のある歌声にしていけるものなのかもしれませんね。
    私は、PLUSにて最後にかかる多田氏の「心を込めて」のあのゆかりさんの歌わせ方、すごく好きなので、あれをお手本にして頑張ってるつもりですが(微笑)、Synthesizer V、気軽にゲットできますから、最初はコーラス担当でもさせて、しばらく使ってみて、調整の仕方に慣れたらセンターに抜擢、というのもいいかな、と思います。あと、無声音はとてもいいですね☆

    2020年6月27日 5:17 PM
  • 高山洋一

    癖のないクラシックの歌手の歌声もできると良いと思っているのですが、専用の歌声データベースや、調整法など、ありますでしょうか?オペラ歌手、ポップ歌手、アニメ歌手、皆さん癖をつけ過ぎのように思います。もっと素直な、「良い声」が理想です。それをベースにして、声の個人化も、ソフトで簡単にできるようなら、最高ですね。プロ歌手としては、特徴がある声、その人個人の魅力を出せる声、というのが売りにもなっている場合が多いのだとは思いますが。

    2020年7月15日 1:25 PM
  • がふ

     この発表から少し後、VOCALOID5の2周年記念セールが始まりました。関係あるかどうかは置いといて、様々な歌声合成ソフトが出ることで、多様性と、程々にセール的な緊張感が出てくれればいいなと思います。
     できれば、VOCALOID5はエディタのみのバージョンの復活を期待したいです。

    2020年7月23日 12:56 PM
  • lavel

    このAI技術を使ってのストリングスやストリングス系楽器が楽しみ。
    本物と同等レベルのストリングスが出てきたら、再度の衝撃をくらいそう。

    2020年12月26日 12:03 AM

コメントを残す

メールアドレスが公開されることはありません。 が付いている欄は必須項目です