ソースネクストから6月26日、AI音声文字起こしソフト「RecText AI」が発売されました。通常価格9,980円のところ、7月9日まで発売記念キャンペーンとして6,980円で販売されています。RecText AIは、Open AIのWhisperエンジンを採用したAI音声文字起こしソフトで、最大の特徴は買い切り型でありながらオフライン処理が可能という点です。音声データをクラウドにアップロードすることなく、ローカル環境で処理するため、機密性を重視する個人や企業にとって安心して利用できるツールとなっています。
ソースネクストでは、これまでにもサブスクリプション型の音声文字起こしサービス「AutoMemo」を展開してきましたが、RecText AIはこれらとは異なるアプローチで文字起こし市場に参入する製品です。AutoMemoがクラウド処理によるサブスクリプションモデルを採用しているのに対し、RecText AIは一度購入すれば追加費用やランニングコストが一切かからない買い切り型を採用。実際、AutoMemoの年額料金と比較してもRecText AIの方が安価に設定されており、長期利用を考えるユーザーにとってはコストメリットが大きいのもポイントです。DTM、音楽制作とは直接関係ないネタではありますが、音声合成・音声認識をさまざまな角度から見てきたDTMステーションとしては気になる情報なので、RecText AIについてその内容をチェックしていきましょう。
オフライン処理による安心感とプライバシー保護
ソースネクストのAutoMemoについては、これまでも「AI音声認識技術も超高性能に。AI ボイスレコーダー、AutoMemo Sが有能で超便利」、「OpenAIのエンジン採用で話者認識もできる超高性能なAIボイスレコーダー、AutoMemoはどこまで進化するのか」、「AIが文字起こしてくれるボイスレコーダー、AutoMemoがさらに進化。オンラインミーティングにも対応し、自動要約機能なども搭載」といった記事でとりあげてきました。私個人的にも、AutoMemo Rは手放せない存在であり、当然サブスクで利用していて、もはやこれなしには仕事ができないというほど、重要な存在になっています。
そうした中、ソースネクスト自らが競合するRecText AIを出したということで、個人的にもとにかく気になる存在。RecText AIの最大のポイントはサブスク費用が不要の買い切りであること。そして音声データの処理をすべてローカル環境で行う、というのも重要なポイントです。これは、AutoMemoがクラウドサーバーで音声を処理するのとは対照的で、機密情報や個人情報を含む音声データを外部に送信したくない企業や個人にとって大きなメリットとなります。オフライン処理のため、インターネット接続がない環境でも利用可能で、セキュリティポリシーの厳しい企業環境でも安心して導入できます。
カテゴリ | 項目 | RecText AI | AutoMemo |
製品名 | RecText AI | AutoMemo | |
概要 | 定価(税込み) | 9,980円 | 14,800円/年 |
処理と保存場所 | ローカル | クラウド | |
対応OS | Windows | Windows/Mac/iOS/Android | |
インストール | 必要 | 不要 | |
文字起こし時間 | 無制限 | 30時間/月 | |
文字起こし精度 | 92.1% | 98.9% | |
文字起こしスピード | 25%~100% | 33% | |
対応言語 | 日本語のみ | 72言語 | |
入力 | 動画ファイル | ○ | ○ |
音声ファイル | ○ | ○ | |
録音 | ○ | ○ | |
録画 | ○ | - | |
一覧 | 検索 | ○ | ○ |
並び替え | ○ | - | |
文字起こしの優先度変更 | ○ | - | |
ブックマーク | ○ | ○ | |
ブックマークコメント | ○ | - | |
録音/録画中 | マイクON/OFF | ○ | - |
メモ | ○ | - | |
ファイル名の設定 | ○ | - | |
文字起こし結果 | 頭出し再生 | ○ | ○ |
編集 | ○ | ○ | |
メモ | ○ | ○ | |
テキスト出力 | ○ | ○ | |
話者分離 | - | ○ | |
要約 | - | ○ | |
共有 | - | ○ |
文字起こしエンジンはOpen AIのWhisperを使用
文字起こしエンジンについては、RecText AIもAutoMemoと同様にOpenAIのWhisperエンジンを採用しています。ただし、AutoMemoがノイズ処理などの前処理を行うことで精度98.9%を実現しているのに対し、RecText AIの精度は92.1%となっています。とはいえ、実用レベルとしては十分な性能を持っており、日常的な会議や取材、録音データの文字起こしには問題なく活用できそうです。
実際に試してみたところ、キレイに録音されたデータであれば、AutoMemoともそれほど大きな差はなさそうという印象でした。ただ、AutoMemoであれば誰がしゃべった内容なのかをしっかり認識して切り分けてくれたり、その人が誰なのかを指定するといったことができるのに対し、RecText AIはそうした話者分離機能はありません。
またChat GPTでもWhisperを利用することは可能なので、RecText AIの結果はChat GPTでの結果とも比較的近いものになりそうです。ただしChat GPTの場合は、クラウドにアップロードするのでセキュリティーの面で気になるほか、無料ユーザーだと利用できる音声時間、ファイルサイズなどの制限があるので、そこもネックになりそうです。
それに対して、RecText AIならローカルで何時間でも文字起こしが可能なのは大きなメリットとなりそうです。
リアルタイム録音・録画とブックマーク機能
RecText AIでは、MP4、WMV、MP3、WAVの各ファイル形式に対応しており、既存の音声・動画ファイルをアップロードして文字起こしを行うことができます。さらに、ソフト内で直接録音や録画を行うことも可能で、録音・録画終了後に文字起こしを実行していくことができます。
注目すべきは、録音・録画中にブックマーク機能を使えること。重要な発言やポイントとなる箇所で手動でブックマークを設定しておけば、後から該当箇所を素早く見つけることができます。また、議事録作成に便利なメモ帳機能も搭載されており、文字起こし結果と合わせて会議の要点をまとめることも可能です。
これはAutoMemoにはない機能であり、とっても便利に活用できそうです。
文字起こしの処理速度とシステム要件
気になる文字起こしの処理速度は、リアルタイムの25~100%程度で、PCのCPU性能やメモリ容量に依存します。私がIntel Core i9-12900H、64GBメモリのPCで検証したところ、5分間の音声ファイルの文字起こしが約1分40秒で完了しました。つまり、実時間の約33%の時間で処理が完了したことになり、十分実用的な速度といえます。これはAutoMemoよりも速そうな感じです。
文字起こし結果からは、特定の単語やフレーズを検索して該当箇所に頭出しすることができ、長時間の録音データから必要な部分を効率的に見つけ出すことが可能です。また、再生速度の調整や10秒送り機能なども搭載されており、確認作業を効率化する機能が充実しています。
ちなみに、専門用語では「フィラー」と呼ばれる、「えー」とか「あー」という会話中の間を埋める発話は自動でカットしてくれるので、文字起こし結果はとてもスッキリしたものになるのも特徴です。認識率92.1%という、これだけのことがスタンドアロンのパソコンでできるようになるとは数年前には想像もできなかったですよね。
AutoMemoとの機能差分と棲み分け
ソースネクスト自身が競合製品を作った形となるRecText AIですが、AutoMemoとは明確な棲み分けがされています。AutoMemoは多言語対応、話者分離、要約機能、共有機能など、より高機能なサービスを提供している一方で、RecText AIは日本語のみの対応となり、話者分離や要約機能は搭載されていません。またRecText AIがWindows専用のソフトであるためMacユーザーには利用できないというのも大きなネックにはなるところです。
しかし、RecText AIには買い切り型によるコストメリット、オフライン処理による安心感、そして録音中のメモ機能など、AutoMemoにはない特徴を持っています。用途や予算、セキュリティ要件に応じて選択できるよう、両製品を併存させているのがソースネクストの戦略といえそうです。
では、私個人としては、どちらを選ぶのか。今回のRecText AIがサブスクではなく、買い切りだという話を聞いて、切り替えようか…と思ったのですが、そうもいかないな、というのが正直なところ。というのも外国人インタビューが頻繁にあるので、日本語だけの対応だと難しいというのが1点目。インタビュー記事にすることが多いので、話者分離がやはり必要なのが2点目。そしてAutoMemo Rというハードを利用しているため、電源のON/OFFやアプリの起動、録音ボタン操作などが不要で、スイッチ一つで即録音・終了ができる便利さからはもう戻れないというのも重要なところ。さらにAutoMemo Rは録音した結果が自動でWi-Fiを通じてアップロードされ、文字起こししておいてくれるというは、自分にとっての必須機能。買い切りなのは魅力だけれど、やっぱりAutoMemoはやめられそうにないですね。
とはいえ、多くの人にとってはRecText AIで十分だと思うし、機密を守るという意味ではクラウドにアップして処理するAutoMemoはNGという人も多そうです。オフライン処理による安心感、録音中のブックマーク機能、議事録作成支援など、AutoMemoとは異なる価値を提供するRecText AI。文字起こしツールの導入を検討している方は、用途と要件に応じてAutoMemoとRecText AIを比較検討してみることをお勧めします。発売記念キャンペーン期間中であれば、通常価格より3,000円安く購入できるのも見逃せないポイントです。
【関連情報】
RecText AI製品情報
AutoMemo製品情報
【関連記事】
ソースネクストのAutoMemo、音声を送信するだけで高精度な文字起こしが可能。スマホ連携で音声ファイル転送も
AutoMemoがバージョンアップしてAutoMemoSに。無制限の文字起こしが月額1,980円で利用可能に
AutoMemo ビジネスが登場、法人向け音声文字起こしサービスが月額16,500円でスタート
【価格チェック&購入】
◎ソースネクスト ⇒ RecText AI(発売記念価格6,980円)
◎ソースネクスト ⇒ AutoMemo
コメント