2019年、3人の音楽好きが「プロの音楽制作をもっと自由にしたい」という思いから立ち上げたプロジェクト。それがAI歌声合成ソフト、さらにはAI楽器演奏ソフトとして、最近いろいろなところで目にするようになったACE STUDIOです。DTMステーションでも何度か記事にしていますし、最近はネット広告でよく見かけるので、ご存じの方も多いのではないでしょうか?
そのACE STUDIOの共同創業者でCEOのJoe Guo(郭靖)さん、同じく共同創業者でCPOのConger Shengさんに、先日のNAMM Showでお会いし、インタビューすることができました。なぜ彼らはAIボーカルを作ろうと思ったのか? そして今、なぜ”AIインストゥルメント”へと領域を広げるのか? さらに記事後半では、先日発表された老舗サンプルライブラリーメーカーであるEastWestとの提携について、その真意についても聞いてみました。ACE STUDIOの6年間の軌跡と、AI音楽のこれからをじっくり掘り下げていきましょう。
なぜACE STUDIOは生まれたのか?──3人の音楽好きが集まった理由
──まず、ACE STUDIOのチームについて教えてください。創業者の皆さんはどのような背景を持っているのでしょうか?
Joe: 私たちのストーリーは、2019年に私とConger、そしてSeanという3人の創業者が出会ったところから始まります。6年前のことですね。
私自身は、その頃バンド活動をしていました。バンドでボーカルを担当して、音楽を楽しんでいたんです。でも、プロフェッショナルな音楽制作のソフトウェアはとても難しくて、その難しさが私の夢をブロックしてしまいました。
Seanは、熱心なデベロッパーで、音楽に深い愛情を持っていました。小さい頃からピアノを学んでいたんです。でも中国には特有の教育環境があって、子どもたちは学校に行って電子工学を学んだり、医師や法律家になることが正しい道だとされています。彼の父親は、そのために彼の音楽への情熱を諦めさせてしまったんです。
そしてCongerは、プロの音楽プロデューサーとして、中国のポップミュージックやアイドルの楽曲制作に携わっていました。
Conger: (中国の)トップアーティストやアイドルのプロデュースをしていました。
Joe: でも彼は、伝統的な音楽制作の手法に疲れてしまっていたんです。
──3人が出会って、どんなビジョンを共有したんですか?
Joe: 素晴らしい組み合わせでした。私たちは音楽への愛を持っていましたが、同時に伝統的な方法で音楽を作ることの限界も感じていました。そこで3人で、新しいテクノロジーを使って、人々がどう音楽を作るかを再定義しようと考えたんです。これが私たちのスタートポイントでした。
その時期は、多くの試行錯誤をしました。コンシューマー向けのアプリやモバイルアプリを作って、音楽を楽しむ人々に使ってもらうための様々な実験を行いました。
そして、ある非常に興味深いシグナルを掴んだんです。そして、私たちは「ACE Virtual Singer」と呼ばれるモバイルアプリを作りました。とても楽しいアプリでした。でも、このアプリを使っている音楽家たちは、リアルなボーカルを求めていて、モバイルアプリから出る声には満足できなかったんです。コンピューターに入れて、実際にデモが作れるようにしてほしいと言われました。
──プロフェッショナルな音楽家たちには、モバイルアプリでは物足りなかったわけですね。
Joe: そうなんです。この要望はとても強いものでした。だから私たちは、プロフェッショナル向けのデスクトップソフトを作ることを考えました。それがACE STUDIOの始まりです。それから着実に製品をブラッシュアップさせていったのです。
3人から30人へ──グローバルに広がるチーム
──それから6年が経ちました。現在、会社の規模はどのくらいになっているんですか?
Joe: 3人でスタートした会社ですが、徐々に人を増やしていき、現在では30人ほどの会社に成長しました。このうち20人が開発者であり、やはり開発中心の会社です。ほかの10人がカスタマーサービス、オペレーション、マーケティング、プロダクトデザイナーなどを担当しています。
──会社はどこにあるんですか? 中国ですか?
Joe: 面白い質問ですね(笑)。本社はロサンゼルス、正確にはNorth Hollywoodにあります。でも実は、オフィスというより家庭スタジオなんです。私とCongerはそこに住んで、仕事もしています。Seanも時々訪ねてきてくれます。
他の多くのメンバーは、東アジア各地に分散しています。中国、台湾、そして日本にもいます。みんなリモートワークなんで、正直なところ、どこに住んでるのかよく分からないんですよ(笑)。
──お二人は元々どこの出身なんですか?
Joe: 私は北京の出身です。彼(Conger)は浙江省、上海の近くです。二人とも数年前にアメリカに移住し、このNorth Hollywoodを拠点としています。
AIボーカルの現在地──なぜ”140人”ものボイスが必要なのか
──現在、ACE STUDIOには140人ものボーカリストのボイスがありますよね。日本語のボーカリストはUTAU音源などを使っているようですが、より高品位なものを自社開発したりする予定はないのでしょうか?
Joe: 私たちのテクノロジーは、今も進化を続けています。
これまでUTAU音源などを積極的に採用してきた理由は、
2026年は、日本独自の展開をさらに加速させていきます。
Conger: でも、歌手の資質は多様なんです。このスタイルに向いている歌手もいれば、別のスタイルに向いている歌手もいます。私たちはこのプラットフォームに140人の歌手を提供していますが、それぞれの歌手がどのスタイルに合うかによって、期待される成果も変わってきます。音楽のスタイルによって、どの歌手を使うかが重要なんです。
──具体的な例を教えていただけますか?
Joe: 例えば、私たちの最高の歌手の一人であるClara Soraceは、ハリウッド映画で最も有名なシネマティック歌手の一人で、AAAゲームにも参加しています。Claraのサンプルは、エピックでシネマティックな雰囲気で常に素晴らしいんです。
でも、ClaraをRapやR&Bに使おうとすると、シネマティックな声では合わないんですよ。
──つまり、”万能ボーカル”というものは存在しないということですね。
Joe: その通りです。今のところ、私たちの課題は、どうやってユーザーに最適な歌手を見つけてもらうかということです。人間の歌手にとって、「このような曲は歌えない」「このような歌手は使わない」というのがあるように、AIの世界でも同じことが言えます。
モデルはデータから学びます。私たちは合成音声を使っていません。本物のデータを使っているんです。だからこそ、それぞれに違いがあるんです。
──なるほど。スタイルの違いや、質の問題ではなく、選択肢があるということですね。
Conger: そうです。でも、質を上げることもまだできます。そういったことも続けていきたいと思っています。今年は200〜300のボイスが出てくると思います。人々により多くの選択肢を提供したいんです。
これからは”ボーカル専用ソフト”ではない──AIインストゥルメントへ
──ACE STUDIO 2.0で正式にAIインストゥルメントを搭載し、ソフトの意味合いが大きく変わってきました。今後AIボーカルと、AIインストゥルメントのどちらに重点を置いていくのでしょうか?
Conger: 私はプラットフォームを構築することが重要だと思っています。AIボーカルとAIインストゥルメントのどちらかに偏るのではなく、両方の開発に注力しています。
実際、インストゥルメントの部分については、まだ実装されている数は少ないですが、私たちは今20〜30種類のインストゥルメントを開発しています。今までのハードドライブには数百種類のデータセットがありますが、もし私たちがすべてのインストゥルメントを作るとしたら──それは正しいことではありません。
私たちは、プラットフォームに集中し、テストに集中し、モデルの質に集中したいんです。そして、他のサードパーティプラットフォームやブランド、音楽家やコンポーザーが使える音楽を作れるように力を注ぎたいと考えています。
例えば、Budapest Orchestraのアンサンブルをアップデートする時、私たち自身で作るよりも、すべてのコンポジションや専門知識を含めて、私たちよりも良く作れる人たちに任せる方が良いんです。
──つまり、ACE STUDIOは単なる音源メーカーではなく、プラットフォームとして進化していくということですね。
Conger: その通りです。
EastWestとの提携、その本当の意味
──ここで、NAMMの直前に発表したEastWestとの提携についてお聞きしたいと思います。このコラボレーションはどういう背景で、何を狙っているんでしょうか?
Conger: このコラボレーションは、2026年で最も大きなことの一つです。実際に2つのことを行っていきます。まず、AIインストゥルメントをアーティストのサンプルライブラリーデータセットに統合すること。そして2つ目は、EastWestのサンプルライブラリーとAIインストゥルメントを一緒に使えるようにすることです。
──EastWestが今まで作ってきた膨大なライブラリを元にして、AIに学習させようとしている、ということなのですか?
Joe: これは技術的な質問ですね。
EastWestの最も貴重な部分は、サンプルライブラリーのデータだけではないんです。それらのデータは伝統的なサンプルライブラリーのデータです。最も貴重な部分は、サンプルライブラリーの音質とパフォーマンスに関する最高のノウハウを持っている、ということなんです。彼らの助けがあれば、世界で最高のAIインストゥルメントを作ることができます。
──つまり、既存のサンプルライブラリーをそのまま使うわけではないと?
Joe: 最高の音を作るために、スクラッチから始めます。レコーディングとアノテーションを一緒に行うんです。EastWestと、彼らのスタジオで、素晴らしいパフォーマンスを一緒に作っていきます。
──なるほど。トレーニング用のデータは、新たにレコーディングするということですね。
Conger: はい、AIのデータセットは、サンプルライブラリーとは全く違うものです。
──逆に言うと、EastWestにとってのACE STUDIOと組んだメリットは何でしょうか? 彼らは何を得ようとしているんでしょうか?
Joe: EastWestは、伝統的なサンプルライブラリーの分野で伝説的な地位を築いてきました。彼らは今、その領域を広げたいと考えているんです。
なぜなら、最も重要なのは、音楽業界がどのように変化しているかを理解することだからです。EastWestは特にテクノロジーの企業というわけではありません。彼らはこの分野で最高のブランドです。でも、時間が経過すると、テクノロジーで進化する必要があります。
20年前は、サンプルライブラリーの技術がありました。そしてその技術を活用してきました。現在は、AIの技術がある。AIを使用することを考えていますが、すべての目的は最高のインストゥルメントを作ることなんです。テクノロジーは、その手段の一つに過ぎません。
──EastWestにとっては、ACE STUDIOがAI技術を提供するパートナーということですね。
Joe: はい。私たちはAIをテーブルに持ち込み、彼らは最高の情報リソース、最高の音のパフォーマンスをテーブルに持ち込む。それによって、一緒にAIインストゥルメントを進化させることができると考えています。
ACE STUDIOはどこへ向かうのか?
今回のインタビューを通じて見えてきたのは、ACE STUDIOが単なるAIボーカルソフトの開発会社ではなく、音楽制作の未来を見据えたプラットフォーム企業へと進化しようとしているということです。
ボーカルの質向上と多様化。AIインストゥルメントの拡張。そしてプラットフォーム化。これらすべてが、6年前に3人の音楽好きが抱いた「テクノロジーで音楽制作を再定義したい」という夢の延長線上にあるようです。
「私たちは音楽への愛を持っていました。でも、伝統的な方法で音楽を作ることの限界も感じていました」──Joeさんの言葉は、ACE STUDIOの原点を象徴しています。
EastWestとの提携も、その文脈で捉えれば、伝統と革新が手を結ぶ象徴的な出来事だと言えそうです。20年前のサンプルライブラリー技術と、現在のAI技術。どちらも、「最高のインストゥルメントを作る」という同じ目標に向かっているわけです。
DTMの世界は今、大きな転換点を迎えている。ACE STUDIOの挑戦は、その最前線で繰り広げられている物語の一つであり、彼らの視線は、すでに次のステージを見据えています。北京から、浙江省から、そしてNorth Hollywoodから──世界中に散らばるチームが作り上げる音楽の未来。それは確実に、形になり始めているようです。
【関連記事】
歌も楽器もAIでここまで来た!ACE Studio 2.0が日本正式上陸、AI楽器合成が別次元に進化
【関連情報】
ACE Studio製品情報
【価格チェック&購入】
◎Dirigentオンラインストア ⇒ ACE Studio Artist Pro
◎Dirigentオンラインストア ⇒ ACE Studio Artist
◎Dirigentオンラインストア ⇒ ACE Studio Artist Pro (エデュケーション版)
◎Dirigentオンラインストア ⇒ ACE Studio Artist(エデュケーション版)











コメント