AI音声認識技術も超高性能に。AI ボイスレコーダー、AutoMemo Sが有能で超便利

A.I.VOICEやvoicepeak、CeVIO AI、VOICEVOX……などなど音声合成技術がどんどん進化し、人間が喋っているのか、機械が喋っているのか、判断が難しいレベルになってきていますが、今回のテーマは喋るほうのではなく、言葉を聴き、理解するほうの技術について。いわゆる音声認識技術ですが、こちらもAIを使う形になり、ここ数年で飛躍的に進化してきています。実際、そのAI音声認識を用いた製品もいくつか登場してきているようですが、その中でも今、非常に注目を集めているのがソースネクストが販売しているAutoMemo SというAIボイスレコーダーです。

見た目はコンパクトなICレコーダーであり、ボタンを押せば録音がスタートし、再度ボタンを押すとストップするというシンプルな構造ではありますが、単純に録音するだけでなく、録音中の会話がすべてテキストに自動で変換されるのです。そのAutoMemo Sをソースネクストから借りて試すことができました。DTM、音楽とは直接関係ないネタではありますが、音に関する技術の情報ということで、これがどんな機材なのか紹介してみたいと思います。

ソースネクストのAIボイスレコーダー、AutoMemo Sを試してみた

私は仕事柄、出かけて行って、インタビューするということが頻繁にあります。普段は直接パソコンでメモをとっていて、それで十分事足りるのですが、かなり専門的な内容の場合や、立ち話でメモが取りにくいような場合は、ICレコーダーを使って録音することもあります。

ただ、ICレコーダーを使って嫌なのは、家に戻ってから、再度同じ時間をかけて聴き返さなくてはならないこと。作業効率的に考えると、すごく無駄だな、と思うわけです。

そうした無駄をなくし、インタビューや議事録作成の効率を飛躍的に向上させるのが、自動でテキストを書き起こしてくれるツールです。昔から「テープ起こし屋」という商売はありました。つまり、カセットテープなどに録音した音をテキストに書き起こしてくれる業者の存在です。もちろん、内容にもよる面はありますが、ある程度の専門性が求められる録音の場合、相場は1時間1万円程度だったと記憶しています。その昔、私が会社員の編集者だった時代は、ときどき、そんな業者に仕事を依頼しつつ、これをコンピュータによる音声認識で処理してくれるようになったらいいのにな……なんて夢見ていました。

その後、時代とともに技術も進化し、音声認識を行う製品というのもいろいろと登場するようになっていきました。そのたびに私もいろいろと試してきましたが、まあ、正直なところ、まともに使えるというものはあまりありませんでした。

AutoMemo S、見た目はいたってシンプルな小さなICレコーダーである

一人での演説、語りであれば、多少できても、複数の人がいると破綻してしまったり、少し騒音のある環境で録音したものだと、まったく使い物にならない……という状況でした。そのため、今回のAutoMemo Sもそれほど大きな期待はしていなかったのは事実。ただ、最近はYouTubeのテロップ作成機能もかなり高精度化してきているので、もしかしたら……という淡い期待も持って試してみたのです。

結論から言ってしまいましょう。これ、スゴイです。DTMとかレコーディング……といったそれなりにマニアックというか専門的な内容であっても、ほぼ問題なく文字起こしが出来てしまうのには、驚かされました。実際、どんな状況なのか、どのように使うのかなどを見ていきましょう。

デザイン的にもシンプルで、スイッチ類は右サイドに電源ボタンがあるのと光るタッチセンスボタンがあるだけ

AutoMemo Sは写真の通り、とっても小さいデバイスで、これ本体で充電できるから、本体1つ持ち歩けばOKというもの。ここにマイクもスピーカーも内蔵されているから、録音もでき、再生して音を聴くこともできます。こうやって使う分には至って普通のICレコーダーですね。

もっともDTMステーションやAV WatchのDigital Audio Laboratoryで時々取り上げるリニアPCMレコーダーとはまったくの別物。録った結果はMP3だし、ACG(オート・ゲイン・コントロール)機能搭載だから音楽をレコーディングするのに適したものでは決してありません。でもAGCだからこそ、レベル調整も不要だし、喋りを録音するという意味においては、非常にスマートに使えるようになっており、普段の操作は電源を入れて、白く光るボタンを押すだけ。これで録音がスタートし、終わったら再度ボタンを押せば終了。

光るボタンを押すと、録音がスタートする。再度押すと終了する

ただし、実際には使い始める前に少し設定をしておく必要があります。まずはWi-Fiの設定。自宅のWi-Fiを見つけてパスワードを入れればOKです。その後、利用するアカウントの設定を行います。アカウントにはGoogleアカウントを使う方法と、Apple IDでログインする方法がありますので、どちらかを選びます。

その後、月額プラン(月額税込980円、初月無料)かお試しプラン(無料)を選びます。お試しプランは無料ですが、毎月1時間までの文字起こしとなっているので、とにかくちょっと試したいというのはこれでもいいかもしれません。そのほかにも10時間チャージ、100時間チャージというのがあり、価格は以下のようになっています。

AutoMemo Sを使うには、プランの設定が必要。無料の「お試しプラン」もあるがその場合1か月に1時間のみ

さて、これで準備完了。あとは単にボタンを押して録音するだけ。この録音時にはもちろんWi-Fiにつながっている必要はないので、好きなところに持ち歩いて利用すればOKです。実際、私も先週からインタビューの際に持ち歩いては試しています。

では、その録音した結果をどうやって文字起こしするのか。実は、Wi-Fiに繋げばいいだけなんですよ。先日も取材を終えた帰りの電車の中でiPhoneのテザリングに接続してみました。約1時間のインタビューだったのですが、テザリングに接続して、やはり7~8分はかかったでしょうか…、文字起こしが完了した案内が表示され、見てみると、かなりキレイにテキスト化されているんですね。

録音終了後、Wi-Fi環境下にあれば、自動的に、このような感じでテキスト化される

もちろん、100%完璧とはいいません。でも95%くらいの正解率でテキスト化できているんです。95%をどう評価するかは人それぞれですし、確かに、そのままインタビューとして公開できるものではありません。でも、文字起こしされたテキストを読めば、インタビューに立ち会った本人であれば、ほぼ問題なくすべて分かるはず。誤認識された部分を手動でチョコチョコと修正していけば、簡単に完璧な状態へと持っていくことが可能です。

こうしたインタビューや会議、最近はリアルの場よりもオンラインのケースが増えていますよね。私もオンラインインタビューということが増えているので、これについても試してみました。私はiPadを使い、この内蔵マイク、内蔵スピーカーでZoomやGoogle Meets、Microsoft Teams、Skype……といったものを使うケースが多いので、普通にデスクの上にAutoMemo Sを置いて録音してみたのです。

充電に使えるUSB Type-C端子のほかヘッドホン端子(左)、マイク/ライン入力端子(右)がある

スピーカーからの音は厳しいのでは……と心配したのは杞憂に終わりました。まったく問題なくキレイに文字起こしができちゃいます。環境によってはスピーカーからの音ではなく、ラインで拾いたいという人もいるでしょう。そうした人のために、ライン入力もあるし、ヘッドホン出力も用意されているので、必要に応じていろいろなセッティングができそうです。

再生するとテキストと同期し、再生中の文字が青くマーカー表示される

またAutoMemo S上においては文字と音声がしっかり同期しているので、録音内容を聴き返しながら文字をチェックしていくということもできるし、検索機能があるので、文字を指定して見つけ出すと、そこの音を聴くこともできるのです。

もちろん、必要に応じて0.5倍速~2.0倍速での再生もできるし、長時間録音になってしまった場合などは途中で分割する……といった機能も用意されています。

再生速度は0.5~2.0倍速まで調整可能

でも、そのテキスト化された文書をAutoMemo S上で読むだけだとしたら不便だし、当然パソコン上にデータを持っていきたいところ。もちろん、そうしたことも可能なのですが、ここがメチャメチャよくできているんですよね。

マニュアルも読まずに使っていたので、最初はUSB-C端子をPCに接続して取り出すのかな……と思ったのですが、これだと何も見れません。では、どうするのか?ここには共有という機能があり、これを使うことでPCやスマホとやり取りが可能になるのです。

まずは「クラウド保存」機能というものがあり、こいつが便利です。具体的にはDropbox、Google Drive、OneDriveの3種類がサポートされているので、自分の使っているクラウドサービスのアカウントを設定すればOK。これを設定すると、新たに録音し、テキスト化されると、自動的にクラウド上に音声とテキストが共有されるのです。

Dropbox、Google Drive、OneDriveとのクラウド連携が可能

しかもそれらとは別にAutoMemo Sのサービスとしてクラウド上に録音データが記録される仕組みになっているようです。ソースネクストによると、保存件数、期間に制限はないとのことなので、「残り容量で録音しきれるのか」といった心配不要で使うことができるようになっています。

OneDriveを連携させたところautomemoというフォルダ内に年、月フォルダができ、そこにテキストとMP3ファイルが

そうしたクラウドでの共有とは別にメールで共有という機能も設けられています。これを設定すると録音終了し、テキスト化されると自動でメールが飛んでいきます。ただし、この際録音データは添付されるのではなく、前述のクラウドに保存されたデータのURLが届くだけなので、メールの容量を喰う…といった心配も不要です。

メール設定すると、テキストとMP3のダウンロードURLが送られてくる

さらに驚いたのは、このAutoMemo Sとまったく同じ機能をiPhoneやAndroidでも実現し、これらと同期できるようになっている、という点です。「オートメモ」というアプリをインストールして、アカウント設定を行うと、スマホ上でもまったく同じことができるようになるのです。AutoMemo Sで録音したデータを、スマホ上で再生することもできるし、文字起こしした結果をスマホ上で読むこともできる。すべてまったく同じなので、AutoMemo Sと比較して大きいことは確かですが、操作性という面では慣れたスマホのほうが便利であるのも事実です。

iPhoneにオートメモというアプリを入れてログインしたら、AutoMemo Sと完全に同期し、機能もまったく同じ

で、このアプリには録音する機能も同じようにあるので、たとえば出先にAutoMemo Sを忘れていってしまった場合でも、スマホのオートメモのアプリを起動して録音ボタンを押せば、これで使うことができ、録音が終了すれば自動的にテキスト化されるわけです。もちろん、クラウド上にも同じ情報が保存され、設定されていればメールも飛んでいくわけです。これって、スゴくないですか?

今回はソーステクストから機材を借りましたが、この世界を知ってしまったら、もう元には戻れそうにありません。ライターや編集といった仕事をしている人はもちろんですが、会社員でもフリーランスでも会議やミーティングを記録したいというニーズは数多くあると思います。そんなときに、AutoMemo Sが絶大な威力を発揮してくれるはずです。

DTMステーション特別割引情報
AutoMemo S クーポンコード: DTM-2022-11
割引後価格:19,800円→17,800円
有効期限 : 2023年1月15日(日)まで
利用方法 : 以下のページから商品をカートに入れた後に、クーポンコードを入力してください。
販売ページ:AutoMemo S

なお、ソースネクストから2,000円のクーポンコードを発行してもらったので、上記のコードを入れることで、通常価格である19,800円から2,000円引きの17,800円での購入が可能それとは別に1,780ポイントのソースネクストのポイント還元もあります。

クーポンコードを入力することで17,800円で購入でき、1,780ポイントがもらえる。さらに……

さらに、2022年12月1日~2023年1月31日の期間に購入すると、PayPayポイントが最大10,000円戻ってくるというキャンペーンも実施中のようです。詳細はソースネクストのページをご覧いただきたいのですが、キャンペーン1においてはAutoMemo Sを購入して応募すれば先着で5,000円分のPayPayポイントがもらえ、キャンペーン2としては月額プラインに入れば200人に500ポイント、年額プランなら80名に5,000ポイントがもらえるとのことなので、いまがチャンスだと思います。ぜひ、この機会に、AutoMemo Sを入手してみてはいかがでしょうか?

2022年12月1日~2023年1月31日までの購入でPayPayポイント、最大10,000円分がもらえるキャンペーン実施中

【関連情報】
AutoMemo S製品情報
40,000アカウント突破記念キャンペーン

【価格チェック&購入】
◎ソースネクスト ⇒ AutoMemo S