AI歌声合成まであと少し!?6年で大きく進化し、CeVIO Creative Studio 6に。CeVIO ソング&トーク スターター(さとうささら)が6,980円

昨年末「歌声合成技術に革命!ディープラーニングで人間さながらに歌うAI歌声合成システムを名工大とテクノスピーチが開発」という記事で大きな話題にもなったAI歌声合成。これを開発したのは、この記事のタイトルどおり、名古屋工業大学(以下、名工大)と同大学の学内ベンチャーである株式会社テクノスピーチの共同開発でした。

ご存じの方も多いと思いますが、テクノスピーチは、6年前からWindows用の歌声合成&音声合成ソフトであるCeVIO Creative Studioの開発にも関わる会社。そして、先日の歌声のベースとなったのも、CeVIOのキャラクタボイスである「さとうささら」でした。そのCeVIO Creative Studioは、この6年で機能、性能を向上させ、昨年12月にVersion 6に。そして2019年2月20日現在は6.1.31.0と、日々進化を続けています。そのCeVIO Creative Studioの「CeVIO ソング&トーク スターター(さとうささら)」という標準価格10,000円(税抜)のものが現在6,980円で入手可能となっているので、これがどんなソフトなのか、改めて紹介してみましょう。


誕生して6年、Version 6になったCeVIO Creative Studio

最新版のCeVIO ソング&トーク スターター(さとうささら)を紹介する前に、昨年末の記事で紹介した、さとうささらによるAI歌声合成の歌声をちょっとお聴きください。

改めて聴いてみても、ついにコンピュータによる歌声合成もここまで来たのか…と唸ってしまいます。もっとも、現行のCeVIO Creative Studio 6でこの歌わせ方ができるわけではないですし、将来的にCeVIOにAI歌声合成のエンジンが搭載されるかどうかも未知数ですが、いろいろと期待してしまうところです。

そのCeVIO、また、さとうささらについて、あまりご存知ない方も少なくないと思うので、簡単に紹介すると、これは歌声合成=ソング機能と音声合成=トーク機能を持つソフトです。歌声合成というと、初音ミクに代表されるVOCALOIDを思い浮かべる方も多いと思いますが、YAMAHAが開発したVOCALOIDとはまったく異なる方式、エンジンを用いたソフトです。


音符と歌詞を入力すれば歌うという点ではVOCALOIDと同様だが、まったく異なるエンジンを使っている

またVOCALOIDの場合、歌うことに特化しているにに対し、CeVIO Creative Studioの場合、1本のソフトで音声合成、つまり喋らせることも可能になっているのも大きな特徴です。喋らせるソフトとしては、株式会社エーアイが開発し、AHSが販売するVOICEROIDが幅広く使われていますが、それともまったく違う方式のソフトとなっているのです。


日本語を入力すれば、すぐに喋ってくれる

そう、このCeVIOは、名古屋工業大学の学内ベンチャーであるテクノスピーチが開発したソフトで、歌声合成および音声合成にはHMM=隠れマルコフモデルという方式が使われています。簡単に言うと、歌声や喋りを物理モデリングで実現するというものであり、サンプリングデータを直接利用していないのです。


人の声を物理モデリングで実現させるHMM音声合成エンジン

つまり声帯を震わせて発音して、喉の形や口の開き方などで発声する人の声を計算によってシミュレーションさせるのがHMMであり、CeVIO Creative Studioのエンジンとなっているので、非常にデータ量が少ないというのが大きな特徴となっているのです。


とにかく小さく軽いCeVIO Creative Studio

あまり単純比較するのはよくないとは思いますが、VOCALOID 5 Amyの歌声ライブラリのインストーラ(VOCALOID 5本体は含まず)のサイズが2.2GBであるのに対し、CeVIO Creative Studioは、本体とともに、さとうささらの歌声データや音声合成データが入って、105MBと1/20以下のサイズ。追加する声のキャラクタのインストーラは1~2MB程度ですから、1/1000程度。そうしたことからも、VOCALOIDとはまったく別のソフトであるということがお分かりいただけるのではないでしょうか?

現在のバージョンではなく、CeVIO Creative Studio 2の時代の作品ではありますが、ソング機能とトーク機能の両方をうまく使った公式でもソングがあるので、これを聴いてみると、AI歌声合成ではない、現状のCeVIOの雰囲気が分かると思います。

これが、CeVIO Creative Studioの標準装備のキャラクタである、さとうささら、による喋り声であり、歌声ですね。さとうささらのオフィシャルサイトを見てみたところ、2018年9月なので、CeVIO Creative Studio 6が出る前のCeVIO Creative Studio 5の時代に発表された、かち割り氷さんによる楽曲が以下のものです。

AI歌声合成のレベルには及ばないものの、VOCALOIDとは雰囲気の異なる、自然な歌声、喋りであることが分かりますよね。このさとうささらの歌声、喋り声は、人気声優である水瀬いのりさん声を元ににして作り上げたものとなっています。


さとうささらのprofile

この6年間で、大きく6回のメジャーバージョンアップがあり、細かいアップデートを入れていくと、何十回というバージョンアップが繰り返されていますが、そのアップデート内容はこちらにまとまっています。これを見てみると

・UIの改善
・合成エンジンの改善
・トーク辞書の充実
・ソング機能の向上
・トーク機能の向上

などが行われていて、6年前の登場当初と比較すると、より自然に滑らかに歌ったり、喋ったりできるようになっているようです。

とはいえ、基本的なUIや使い方は変わっていません。ソング機能においては、ピアノロール画面でメロディーを入力するとともに、歌詞を入力すれば、すぐに歌わせることができます。声質は右側のパラメータを上下させるだけで、かなりドラスティックに変更可能です。


発音のタイミングを細かく調整することができる

抑揚、つまりピッチの揺れや音量の揺れも自動的に入力されるのですが、必要に応じて、自分で自由に調整できるのも、CeVIO Creative Studioの面白さでもあります。


音量の揺れも細かく制御できる

一方、喋るトーク機能については、1文ずつ、漢字・かな交じりの日本語で普通に入力するだけで、喋ってくれます。そのトーク辞書がどんどん充実してきたこともあって、以前よりもかなりスマートに喋らせることが可能になっています。VOICEROIDなどの方式を参考にしたのか、簡単調整機能=アクセント調整機能が追加されて、文字のUP/DOWNだけで、イントネーションを大きく変化させられるようになったのも使いやすくなった点ですね。


VOICEROIDにも近い簡単調整機能

以前の記事「ボカロに有力対抗馬登場!? 新歌声合成ソフトCeVIOの衝撃!」、「ボカロとまったく作法が異なるCeVIO Creative Studioを使いこなせ」、「着実に進化していたボカロのライバル、CeVIO Creative Studio S」といった記事も、今もそのまま役立つと思うので、合わせてご覧いただければと思います。


喋り方の雰囲気をパラメータによって、かなり自由度高く変更できるのもCeVIOの特徴

また、標準搭載のさとうささらだけでなく、サードパーティからONE、IA(英語版)、赤咲湊、緑咲香澄……といったキャラクタボイスも出ており、追加して使うことが可能です。

オプションとしてさまざまなキャラクタのソングデータ、トークデータを追加して使うことも可能

これらについても「IAの妹、ONEはCeVIOとして誕生。この姉妹はホントに共存するのか!?」、「JOYSOUNDが歌声合成ソフトに参入!?ロック、バラード、演歌も歌うCeVIOの実力」といった記事で紹介しているので、参考にしてみてください。

また、故三波春夫さんの音声を元に作ったハルオロイド・ミナミは、無料で提供されているので、これをダウンロードしてインストールすれば、誰でも使うことが可能ですよ。

さて、そのCeVIO Creative Studio 6製品には、組み合わせによって、いくつかのバリエーションがありますが、一通りのことができる基本セットとなるのが、「CeVIO ソング&トーク スターター(さとうささら)」という、さとうささらのソングボイス、トークボイスをセットにしたダウンロード専用版。

標準価格が10,000円で、Amazonやベクターでは、この価格で販売されていますが、こちらのサイトだと、現在30%オフの6,980円となっています。

すでに旧バージョンを購入した方であれば、新たに購入しなくても、無料で新バージョンにアップグレードできますが、まだ持っていない方なら、このタイミングに入手してみてはいかがですか?

【ダウンロード&購入】
◎ソースネクスト ⇒ CeVIO ソング&トーク スターター(さとうささら)
【関連情報】
CeVIO ソング&トーク スターター(さとうささら)製品情報
CeVIOプロジェクト公式サイト
さとうささらオフィシャルWeb

 

Commentsこの記事についたコメント

3件のコメント
  • Ramza

    ボカロっぽさよりもナチュラルな歌声を求めて合成ソフトに手を出した自分は、Vocaloid3結月ゆかりからスタートし、昨年、藤本さんの記事等を参考にCeVIOを導入しましたが、結月ゆかりで感じた「自然な歌声」が更に一歩も二歩も進んでいるように感じて、感動を覚えました。
    「発声している」ではなく、「歌っている」と素直に感じられるレベルだと思います。そして、件の新しい歌声合成は、サンプルを聴く限り「歌い上げる」という次元。しかもこれがベタ打ちというのですから、もう、期待は高まるばかりです。
    ボカロもV5で価格が一気に高騰してしまい、「高値の華」。そうでなくとも、費用面を抜きにしてもCeVIOの方が自分の求める歌声合成の理想形に向けて着実に進化していると感じていますので、ぜひ、今後も研究開発および商品化に向けて進んでいっていただきたいと願うところです。

    2019年2月20日 9:23 PM
  • pluteus junoh

    この記事を拝読してさっそく導入してみました(割引クーポンありがとうございます!)。
    以前記事でレポートされていた衝撃的なAI合成音声のクオリティにはまだまだ遠く及びませんが、現行のVocaloid(巡音ルカV4Xをメインで使用中)とは遜色ないレベルで使えそうです。
    まだちゃんとは試してないですが、動作の軽さやいい意味でのパラメーターの簡略化がなされているUIで使い勝手は良さげですね。スタンドアローン・オンリー(?)なのも潔くて個人的にはポイント高い感じです。
    それにしてもフォルマントの幅が強烈で使い方が相当難しそうなのと、安定した声質で使える音域が少々狭いかな?という気はしました。
    まあ結局は調整次第なんでしょうが、そこにあんまり労力を使いたくない・・・というのが本音でもありますし。
    同じく以前の記事で紹介されていたSynthesizer-VやPlogue:Alter/Egoなんかも含めて、うまく使い分ければなにかとバリエーションが楽しめそうな気がしています(おまけのハルオロイドいいですね!使い方が問われますが、はい)。
    もともとが単に自分が歌えない人間ゆえの仮歌がわりにボカロを導入している事情があるので、いかにもな「ボカロ、ボカロ」した声質や演出はむしろ苦手でそれが”ルカ”を使っている最大の理由なんですよね。
    なので、学習させれば誰にだってなれそうなリアルAI歌声合成システムのいち早いリリースが待ち遠しい今日この頃です。
    でも、高いんだろうなあ・・・

    2019年2月28日 3:22 PM
    • 藤本 健

      pluteus junohさん

      AI歌声合成システム、どのように、いつごろ、いくらくらいで製品化されるのか、私もすごく気になっています。
      いろいろ探りを入れているところです!

      2019年3月1日 12:31 AM

コメントを残す

メールアドレスが公開されることはありません。 が付いている欄は必須項目です