無料文字起こし4ツールの性能を比較。「Group Transcribe」「Sloos」「Googleドキュメント」「Zoom」

文字起こしツールについては「実際の操作画面や精度を見なければよく分からない」という方も多いはず。そこで今回は4つのリアルタイム型文字起こしとして使える無料ツールを実際に使用し、その感想をお伝えします。

ライター:吉岡勇哉

利用前の準備

リアルタイム型の文字起こしツールをより高い精度で利用するためには、次のことを意識しましょう。

利用環境を整える

リアルタイム型の文字起こしの場合、雑音の入らない静かな環境で利用することが大切です。利用中に他の人の会話やノイズが入ると、拾うべき音が拾えず精度が著しく低下します。会議室など静かな室内での利用を心がけましょう。

状況に応じたマイクを使う

状況に応じたマイクを使う

マイクの感度が悪いと音が拾いきれずに、文字データが途切れてしまったり、誤った言葉に変換されたりしてしまうかもしれません。
パソコンを用いてツールを使用する場合は可能な限り内蔵マイクではなく、外付けのマイクを使用しましょう。

インターネット環境を整える

ほとんどの文字起こしツールはインターネット環境が必須です。通信が不安定な状態でツールを起動しても反応しなかったり、作成した文字データが途切れてしまったりすることも。ツールの利用にあたっては、安定したインターネット環境を構築できる光回線での使用がおすすめです。

話し方に注意する

滑舌はもちろんですが、早口になったり、複数の方の発言が被ったりしないように気を付けましょう。これらを意識しないと、音声をうまく拾えずシステムのテキスト出力精度が落ちてしまいます。
発言のタイミングに関しては事前にある程度の順番を決めておいたり、発言前に挙手などの合図を送るようにしたりしておくと良いでしょう。

4つのおすすめツールを実際に使ってみた

以下の条件で「Group Transcribe」「Sloos」「Googleドキュメント」「Zoom」を実際に使用して、文字起こしツールとしての性能を比較します。

  • 形式:リアルタイム型の文字起こし
  • 場所:静かな個室
  • 音声:事前に録音した音声データ
  • マイク:端末の内蔵マイク

使う音声は以下の2つ。

1.ナレーション音声

「街の景色が緑から赤、黄色に変わるこの季節、仕事帰りや待ち合わせ前のちょっとした時間に、ほっと一息つきませんか?
コーヒーの本場、ヨーロッパで活躍するトップバリスタが監修したカフェブランドが、この秋恵比寿にオープンします。
ビーナスコーヒー。高品質な手入れコーヒーを是非ご堪能ください」

2.インタビュー音声

話者1
「ライブハウスが、ライブが結構『自粛、自粛』ってなってるけど、これからどうなってきそう?」

話者2
「なんとなくっすけど、でもちょっと戻ってきてる部分もあるのと、割とでも、あんまり、4月5月は中止なったけど、5月以降は意外とやってたんで、まあどうなっていくやろ。でも結局なんかこう自分の作品がめっちゃ良くなってったら、配信とかでもやっぱ人集まると思うし、見てくれる人が多くなると思うし。
結局はなんかこうあんまコロナ関係ないというか、コロナでライブハウスがきつくなってるのもあんま関係ないかなというか、ちゃんといいもん作れてたらまあ野外で開催したら人は集まるし、なんかこう感染対策としてこう配慮した室内じゃなくて外でやるみたいなことは自分の頭使ったらいくらでもできるかなと思うし、まあ逆にそっちより内容がすごい大事かなというか、自分の力がちゃんとあれば人は集まるかなと思うんで、そこに向けてこう自分の力を上げていきたいなとは思ってますけど。まあ周りの状況は関係ないかなと思ってます」

今回の検証のように音声データをリアルタイム型の文字起こしツールに、マイクを通して聞き取らせば、アップロード型のようにも使用できます。

・前回記事:無料文字起こしツールで議事録を効率化

1.Group Transcribe

「Group Transcribe」はiOS専用のアプリなので、使用するにはiPhoneなどのAppleデバイスでアプリのダウンロードが必要です。

iPhoneを使用して音声を聞き取らせた結果は以下の通り。

・ナレーション音声

Group Transcribe ナレーション音声

・インタビュー音声

Group Transcribe インタビュー音声

かなり精度が高く、句読点や改行も自動で行ってくれているため、比較的見やすくまとめられています。

2.Sloos

「Sloos」は2023年11月現在、無償で提供されている文字起こしツールです。Webサイトからメールアドレス登録などの簡単な新規登録を行えば誰でも使用可能。10秒程度の音声を登録するだけで、1台のマイクから最大10名の話者を識別し、発言内容をリアルタイムで文字起こしができます。

Windowsパソコンを用いたSloosではこのような結果になりました。

・ナレーション音声

Sloos ナレーション音声

・インタビュー音声

Sloos インタビュー音声

読み取れたところに関しては正確な文字起こしがされていますが、全体的にほとんど読み取ることができませんでした。

3.Googleドキュメント

パソコンでGoogleドキュメントを使用する場合、「新しいドキュメント」を開きメニューのツールから「音声入力」をクリック。その時表示されたマイクのアイコンを押せば、文字起こしとして活用できる音声入力が始まります。
一方スマホアプリの場合は、文字入力を行うキーボード上のマイクアイコンをクリックするだけで音声入力が行えます。

Windowsパソコンを用いたGoogle ドキュメントの使用結果はこちら。

・ナレーション音声
反応しませんでした。

・インタビュー音声

Googleドキュメント インタビュー音声

今回の方法ではどちらの音声もうまく読み取ることができませんでした。

4.Zoom

「Zoom」で文字起こし機能を使うためには、以下の手順でデフォルト設定を変更しなければいけません。
まずはZoomアカウントを作成してサインインします。そこから「設定」をクリックし、「ミーティング」タブの「ミーティング内(詳細)」をクリック。「自動字幕」と「完全な文字起こし」をオンにすれば設定完了です。

以下、Windowsパソコンを用いたZoomの結果です。

・ナレーション音声

Zoom ナレーション音声

・インタビュー音声

Zoom インタビュー音声

ところどころに誤字や脱字があるものの、許容できる範囲ではないでしょうか。またZoomの場合は録音された時間も記載されるため、あとから文字データを参考に音声を確認するのに便利です。

まとめ

今回の検証では以下のような結果が生まれました。

Group TranscribeSloosGoogleドキュメントZoom
精度××
句読点の有無××
改行の有無×
(時間による改行はあり)
話者の特定
(端末複数使用の場合)
×
(端末複数使用の場合)
多言語対応
翻訳機能
(端末複数使用の場合)
×××

「Group Transcribe」と「Zoom」であればどちらも問題なく使用できそうです。どちらのツールを利用するかは「使用予定時間」や「翻訳機能の有無」、「発言された時間を知りたいか」で検討すると良いでしょう。
「Sloos」と「Googleドキュメント」は録音データからの文字起こしでなければうまく機能することもあるので、興味のある方はお試しください。

どのツールも利用には安定したインターネット環境が必要です。利用前には今一度通信状態を確認し、不安が残る場合は光回線などへの切り替えも検討してみてはいかがでしょうか。


【関西でネット回線をお探しなら】 eo光は17年連続お客さま満足度 No.1!
※RBB TODAYブロードバンドアワード2023 キャリア部門 エリア別総合(近畿)第1位(2024年2月発表)
2007年~2023年17年連続受賞

詳しくはこちら

※上記掲載の情報は、取材当時のものです。掲載日以降に内容が変更される場合がございますので、あらかじめご了承ください。

  • 1996年、奈良生まれ。大学卒業後、内装建築会社に就職。2年後カナダにて留学という名の余暇を過ごし、その後ライターの道へ。現在はジャンルを問わずさまざまな執筆を行う。

関連記事