今日も元気に問答御用

アラサーサラリーマンが「考え方を考えてみる」「考えたことを書き残す」ブログ。ツイッターアカウント @shiroimai

巷で話題の音声認識アプリ「Edivoice」でブログ記事を書いてみた

気になったら試さなきゃ 音声認識アプリの第一印象

最近ブログを回っていると、音声認識アプリの便利さを褒める記事が色々とありました。
経済学者の野口悠紀雄も、音声認識アプリの便利さを解説する本を出しているとかで。

で、そんなブログ記事を読んでいる中で見かけた音声認識アプリ「Edivoice」を試してみることにしました。
この記事は音声認識で執筆しています。

慣れたらどうかわからないのですが、第一印象としては、「結構疲れる」「決して楽ではない」「キーボードがあるならそっちがいいな」という感覚です。

アプリの精度について

音声認識の精度は非常に高いです。ここまでの記述では、かぎかっこや句読点、アプリ名の「Edivoice」を手打ちしていますが、他の日本語入力は全部音声で行っています。見出しの「精度」が一発目では「制度」と出てきてしまった以外は(この文の「精度」も手打ちしました)、変換も目的通りの文字が出てきています。

意図した文字列が出ないこともまれにありますが、「確かに甘噛みしたかな」と納得いくようなケースがほとんどです。*1

それでも音声認識がイマイチじゃないかと思う理由

認識結果待ちのタイムラグ

最長でどのぐらいの音声まで認識してくれるのか知りませんが、音を聞いてから文字にしてくれるまで、多少のタイムラグがあります。
待ち時間は1秒ないくらいでしょうか。それでも、「流れるように思考し、文字に起こす」と言うには、結構気になる時間です。

これは、アプリのアップデートや、ハード性能の向上で、将来的には改善するところかもしれません。

原稿レベルのセリフをそらで言えますか?

これは、アプリに依存しない、音声認識執筆そのものの欠点です。

私がブログを書く時には、まずはアウトラインを作って、アウトラインの中身についてもある程度箇条書きした上で、そこに肉付けする形で執筆をしていきます。

先にある程度アイデアを整理して、可視化してから実際の執筆に入るんですよね。

でも、音声認識アプリ単体で執筆を行う場合、事前にアウトラインの整理はできません。
そして「なんとなく口から出た言葉」では、書き言葉にはなりません。口から出す前に、ある程度整理して、整形しておかなくてはいけません。

あんまり試行錯誤してしまっては、省エネという音声認識の目的が失われてしまいますから、一発で書けてなんぼです。

だから、音声認識で執筆をする時は、

  • 話す前に、何を話すかきっちり考えて
  • 話すときも、滑舌をはっきり、聞き取りやすいように気をつけて
  • 話した後は、正しく聞き取ってもらえたか、一瞬ドキドキして

と、割合気を張りっぱなしなんですよね。
「話した言葉がそのまま文字になる」という言葉から受ける印象ほどには、楽じゃありませんでした。

キーを叩いている方が、アイデアが広がる気がする

音声認識より、キーボードを叩いていた方が、連想やアイデアが広がるような気がするんですよね。

前の項目にも書いた通り、音声認識は割合「一発勝負」です。
世の中のどこにも出ていない言葉を、いきなり言葉にして、完成原稿に持ってくる。そりゃ大変ですって。

事前に、「メモ」や「下書き」の形で「書き散らかす」のが前提になっているキーボード執筆の方が、アイデアが広がりやすい、整理しやすいのは当然とも言えます。

気分の問題としては、「指から刺激を受けるとアイデアが広がる気がする」なんてのもありますね。

結論

現状における、私の音声認識に関する印象をまとめます。

  • 音声認識アプリ「Edivoice」は、なかなかすごい
  • 音声認識には、下記のような欠点もある
    • 一発書きが前提になっていて、実はスマートな文章を入力するのが大変
    • 下書きやアウトラインとの相性も悪いため、アイデアを広げることや精密な論理構成にも向かない
  • 今は、キーボード入力の方が、楽だし楽しいな

スマホフリック入力よりは、楽な気もします。
キーボード入力に未習熟の人にも、メリットは大きいでしょうね。
入力にとっくに習熟した人が、「音声認識の方がよっぽど早い」という感想を持っているのは、ちょっと解せないところがあります。
前述のようなデメリットはデメリットと感じていないということでしょうか。本人の慣れや技術でそれを実現しているのか、あるいはデメリットが最小化するような環境を作っているのか。

私の使っている「キーボードはポメラ」「音声認識スマホ」という環境は、デメリットの悪影響を一番モロに受けるのは、認めざるを得ないところです。

今後も、気が向いたら音声認識も試してみたいと思っています。何か新発見があったらお伝えしますね。
(今井士郎)

今回使用したアプリはこちら。
デメリットも感じたものの、アプリ自体は非常に優秀と感じました。

話すだけで書ける究極の文章法 人工知能が助けてくれる

*1:アマガミ」の変換がカタカナでしか出ないのはどうかと思う。