会議や取材を自動で文字起こし!議事録作りが捗るソースネクストの「AutoMemo」をレビュー


ソースネクストが、録音した音声を自動でテキスト化するボイスレコーダー「AutoMemo(オートメモ)」を11月10日に発売した。会議の議事録作りやメディアの取材ツールなどの需要を見込む。同社公式サイトでの直販価格は税別18,000円だ。今回、この製品を使用する機会を得たのでレビューしたい。

文字起こしの利点は発言者や発言内容を検索できること

筆者のような紙/Webメディアの記者は、インタビューを文章にする機会が多い。そのとき、下準備として取材でやり取りした会話をそのままテキスト化(文字起こし)することもある。

文字起こしする利点は、取材時に不慣れな専門用語が頻出して理解に自信が持てなかった部分を確認したり、一問一答式の記事にする際に取材時の雰囲気まで再現したりできることだ。

会議の議事録を文字起こししてテキストデータで残す一番の利点は、ストックしておくことで、後から発言者の発言内容を確認したいときに全文検索で該当部分がさっと参照できるところだろう。録音データをひとつずつ再生して探さなくても良いので、時間を大幅に節約できる。

文字起こしは、利点が多い半面欠点もある。容易に想像がつくと思うが、文字起こしに掛かる手間と時間だ。AutoMemoはこの手間と時間を低減する。

AutoMemoの文字起こしまでの流れ(画像出典:AutoMemoサイト)

スマートフォンでは専用アプリ「オートメモ」を利用し、同期したテキストデータを表示したり、テキストデータ上で指定した場所の音声を再生したりできるほか、各種設定なども施せる。オートメモは、AndroidとiOSに対応する。

クラウドへのアップロードにはWi-Fiを利用する。会社などでいつも同じ会議室を使う場合は、その部屋のWi-Fiと繋ぐ設定にしておくと良いだろう。外に持ち出す機会が多いなら、モバイルWi-Fiルーターと繋ぐ設定にするか、スマートフォンのテザリングと繋ぐ設定が現実的だ。

製品購入時は、毎月1時間まで無料でテキスト化できる「ベーシックプラン」が適用されており、用途に応じてテキスト化できる量を増やせる他のプランに有料で切り替えられる。「プレミアムプラン」は月額税込980円で毎月30時間までテキスト化可能。「10時間チャージ」は1回のチャージで10時間分の録音データをテキスト化できる。プランの変更はスマホアプリのオートメモ上で行う。

ちなみに、2021年3月31日まで「プレミアムプラン無料キャンペーン」を実施中だ。申し込みしたユーザーを対象に、プレミアムプランが申し込みから6カ月間無料となる。

本体の操作は極めてシンプル、細かい操作はスマホアプリ上で行う

AutoMemoの操作はかなりシンプルに設計されている。録音は電源を入れた後、本体正面の大きな丸い録音ボタンを押すと開始。もう一度押すと停止して待機状態になる。録音中は録音ボタン中央が光り、待機中は録音ボタンの外周が光ってゆっくり点滅する。録音形式はMP3だ。

録音中は録音ボタンの中央が光る
待機中は録音ボタンの外周部が光って、ゆっくり点滅する

AutoMemoでの録音時にWi-Fiは不要だが、Wi-Fiのない場所ではテキスト化はできない。Wi-Fiにつながったタイミングで録音データがクラウドに自動的に送られてテキスト化され、そのあとスマートフォンと同期し、文字と音声を確認可能になる。録音データとテキストデータはクラウド上に容量無制限で保存でき、保存期間も制限なしだ。

テキスト化に掛かる時間は録音時間のおよそ半分くらいで、複数の録音データを一度にテキスト化すると録音時間の短いものから同期していく。このため、慣れないうちは順番が前後したのを見て「録音できていなかったのか?」と焦るかもしれないので注意しよう。

1時間の録音だと、テキスト化して同期が完了するまでに30分くらい掛かった

オートメモでテキストを表示すると、タイトルの付与、データの個別削除、再生速度の調整、ブックマーク追加、テキスト化言語の変更(翻訳)などが利用できる。任意の場所をタップすると、該当部分を音声で再生する。誰の発言か確認したいときや文字起こしの正確さを確認したいときに重宝する。

オートメモの画面。テキストデータの個別の操作は一覧画面ではなく、テキストデータを開いた画面上で行う

翻訳は72言語に対応しており、このあたりは流石に「ポケトーク」で知られたソースネクストだと感じるが、オートメモ上でテキストデータを編集できないので、文字起こしに間違いがあると間違ったまま翻訳されてしまう点が残念だ。翻訳を日本語に戻すと、翻訳の翻訳にはならず、元の音声データから再びテキスト化する。

オートメモ上で72言語に翻訳可能(スクロールで表示)

テキストデータはメールの平文として転送でき、パソコンに取り込みたいときはメールで受け取る形となる。文字コードにISO-2022-JP(UTF-8)を採用しており、文字化けの心配は少ない。事前にメールアドレスを登録しておけば、スマートフォンへの取り込みと同時にそのアドレスにメールを発信できる。メールには音声ファイルへのリンクも貼られており、パソコンやタブレットで簡単にダウンロード可能だ。

テキストデータのメールは録音データに一括で紐付けられ、全部受け取るか、受け取らないかしか選べない。月額でテキスト化できる時間に制限があるので、全部受け取ると制限が気になるという場合は、一括では受け取らない設定にして、オートメモ上でテキストを表示してメニューから「共有」を利用するのがオススメだ。メールに限らず、SNSや外部ストレージなど、スマホにインストールしてあるアプリを利用して、別のデバイスや他のユーザーに転送できる。

このほか、一覧画面から検索も利用できる。任意のキーワードを指定して全ファイルから全文検索が可能だ。

AutoMemoのマイクは本体上部にあり、集音距離は1メートル以内を推奨している。外部マイク入力端子が備わっているので、集音距離の広い会議室で使う場合は、別途集音距離の長いマイクを用意するとより使いやすいだろう。なお、AutoMemo本体にスピーカーは搭載しておらず、本体で再生はできない。

本体上部にマイク。側面に電源ボタン
外部マイク入力端子は本体下部に配置。充電用のコネクタはUSB Type-C

本体の録音ボタンの下には一回り小さい「マークボタン」が用意されている。議題が変わったタイミングなどで押下すると、テキスト化したあとでそこに「マーク」が記録される。このマークは、いわゆるブックマーク(しおり)で、オートメモ上で追加や削除が可能だ。削除したいマークを表示して、画面上でそのマークを長押しすれば削除できる(これは分かりにくかった)。マークの情報はテキストデータに付加しないので、PC上にメール転送したデータなどには表示されない。

本体サイズはW41×D12×H×130mm、本体重量は約86g。電源はバッテリーで、電池容量は1,400mAh。付属のUSB Type-Cケーブル(給電側コネクタはType-A)で充電する。

流行りのオンライン会議での利用は難しい

実際に使用してみて、予想していた以上に滑らかにテキスト化することに驚いた。短い会話ほど素早くテキスト化し、スマートフォン上ですぐに確認できる。

会話する人間を特定して文字化できないため、話の内容によっては誰がしゃべった言葉なのか分かりづらくなるところがやや気になる。オートメモ上で再生して確認すれば良いのだが、それも多すぎると面倒になりそうだ。

AutoMemoのWebサイトの「よくあるご質問」を参照すると、「web会議でも使えますか?」のクエスチョンに対し、「スピーカー品質や通信環境などにより録音・テキスト化の精度は変わりますが、一般的な環境の場合、正確なテキスト化は難しい場合が多いです。」というアンサーが付けられている。

ZoomやTeamsなどのオンライン会議の議事録作成には向いていないということだ。

実際にZoomでオンライン会議した際に議事録を取ってみたが、確かにスピーカーから出てくる音声は状況により、人の声として認識しないところがあった。録音はできており、しゃべる人によっては比較的きれいに認識するので、しゃべる人の声の質や使っているマイク性能などによって、スピーカー経由の声は環境音のノイズとしてキャンセルされるのかもしれない。

ほとんど認識しない声の人もあり、そういう人との会話の録音では、筆者が相槌を打つ「はい」ばかりが拾われて「はいはいはいはいはい…」と続くテキストが生成されて、いささかシュールだった。時節柄、オンライン会議が増えていることを考えると、ここはなんとか調整してもっとしっかり対応して欲しかった。アップデートでの改善を期待したい。

オンライン会議の文字起こしはしゃべる人によっては言葉として拾えないようでなかなか難しい

録音されているのにテキスト化されなかった部分は、完全な文字起こしが必要なら自分で書き加えるしかないだろう。それでも、文字起こしを自分でイチからやろうとすれば、録音時間の2倍や3倍の時間が掛かることもザラである。AutoMemoで手間が大幅に軽減できることを考えると活躍する機会が多くなりそうだ。

店頭展示機の衛生面に注意

AutoMemoは筆者のようなメディアの人間はもちろん、会議で議事録を残したい企業、官公庁、学術機関など、さまざまな組織で一台あると便利なアイテムと言えるだろう。18,000円は決して安くないが、ハイレゾ音源に対応するICレコーダーなどはもっと高額な商品も少なくない。自動で文字起こしする「機能」や「利点」がきちんと認知されれば、需要のある人なら手に取る価格のはずだ。

店頭ではICレコーダー売り場や、同社の翻訳デバイス「ポケトーク」のそばで展開することになる。ノイズキャンセリングが秀逸なので、店内の雑音の中でもしっかり音声を拾う点は接客する上で良いアピールポイントになるだろう。

AutoMemoの展示例。ポケトークや電子メモ端末と並んで展示されていることが多い

気を付けたいのは衛生面だ。実機を置いて自由に触れるようにしているところも少なくないが、手に持ってマイクに向かってしゃべる使い方となるので、お客様にはマスク着用の上での試用をお願いし、消毒用アルコールなどでこまめに手入れする必要がある。セルフ売り場ではなおざりになりがちなので気を付けてほしい。