しゃべるボカロ、VOCALOID-flexが無償提供されている!

ガチャッポイドの付録コンテンツともいえる「ガチャッポイドトーク」で、注目を集めたヤマハの技術、VOCALOID-flex。すでにその声を聞いたという方もいると思いますが、イントネーションのしっかりついた話し声で、従来のTTS(Text-to-Speech)とはまったく違う流暢なしゃべっりをしてくれます。

そのVOCALOID-flexのクラウド版、NetVOCALOID-flexが、期間限定で技術者向けに無料解放されているのをご存知ですか? リクルートなどが主催するMashup Award 6というイベント用に解放しているのですが、先日その説明会に参加してみたので、簡単に紹介しましょう。

しゃべるVOCALOID、VOCALOID-flexが無償で利用可能!?

Mashup Awardというのはネット上のAPIと呼ばれる仕組みを利用するプログラミングのコンテストで、現在国内最大級のものです。2006年にリクルートの実証研究機関であるMTL(Media Technology Labs)を中心に6社が主体となってスタートさせ、第6回となる今回はそのリーディングパートナー企業が12社、APIは56の協力企業から計179種類が提供されるなど、大規模なものになっています。ちなみに、MTLの前進であるリクルートのMDC(Media Design Center)というところに私は2002年まで在籍していました…。

そのAPI提供企業として今回新たに参加したのがヤマハ。そしてそこで提供されたAPIこそがVOCALOID-flexだったのです。このVOCALOID-flexのAPIに関する説明会が、10月27日にリクルートのMTLで開催され、約50人の開発者たちが集まりました。まあヤマハからはVOCALOIDの生みの親である研究開発センターの剣持秀紀さん、同開発センターネットビジネスグループの宮木強さんが参加して、詳細の説明が行われたのです。

VOCALOIDの生みの親、剣持秀紀さん

VOCALOID-flexは歌詞とともにピッチや音素長の情報を与えることで、キレイに話をしたり、より滑らかに歌わせることができるものです。今回提供されたAPIは、ネット上にあるVOCALOID-flexエンジンに、VSXML(Voice Synthesis XML)という形式に則ったデータで、歌詞やピッチ、音素長の情報を渡すことで、合成音をMP3で返してくれるというもの。

VOCALOID-flexのシステム構成図

VOCALOID-flex APIの概要

プログラマでない、われわれエンドユーザーが簡単に使えるものではありませんが、全国にいるフリーのエンジニアさんたちが作ったサービスを利用することで、われわれもVOCALOID-flexで遊ぶことが可能になるのです。

APIに関して詳しく解説をしていた宮木強さん

このVOCALOID-flexのAPIを使った作品第一号として登場したのは、「TANKALOID」というもの。これは5・7・5・7・7と、短歌をひらがなで与えると、いかにも短歌のイントネーションで読み上げてくれるのです。このサービス自体はだれでも無料で使うことができるので、興味がある人は試してみてはいかがでしょうか? ちなみに、この声の主はVY1。そうヤマハ自らが開発した歌声ライブラリだから、こうしたところで自由に使えるわけですね。

一方で、そのネット上のエンジンはガチャッポイドによるNetVOCALOID-flexとまったく同じものを利用しているとのこと。そのため、大量のアクセスが集中すると処理量がオーバーフローしてしまう可能性もあるため、われわれエンドユーザーの利用は1時間あたり20回までという制限が設けられているそうです。

また、このVOCALOID-flexのAPIはあくまでもMashup Award 6用に特別に無料公開されているものなため、利用できるのは12月10日までとのことです。

なお、プログラミングができるという方なら、ぜひMashup Award 6に参加してみてはいかがですか?VOCALOID-flex APIに限ったものではありませんが、最優秀賞を勝ち取れば100万円の賞金、優秀賞でも10万円の賞金が得られるほか、数多くの賞が用意されています。ちなみに、昨年の第5回の応募作品は346ですから、なんらかの賞をGETできるチャンスは高そうですよ。もちろん応募は無料ですし、まだほとんど公開されていないVOCALOID-flexを自在に使うことができるのですから、面白そうですよ。作品の応募期間は11月8日まで、気になる方はぜひ急いでください。

ただし、VOCALOID-flexを利用するためには、ヤマハへの申請が必要で、それが受理された後にSDK(開発ツールキット)を入手してから使う形になります。このSDKには、VOCALOID-flexエディタが入っているわけではないので、どうやってしゃべらせるためのデータであるVSXMLを生成するかも、腕の見せ所。逆にいうと、ヤマハがここに参加した目的のひとつには、多くの人にVOCALOID-flexの利用法を考えてもらう、ということにあるようです。いずれにせよ、どんな作品が登場してくるのか楽しみなところです。

Commentsこの記事についたコメント

コメントを残す

メールアドレスが公開されることはありません。 が付いている欄は必須項目です