ブログ記事やレポートなどを作成する際は皆さんキーボードを用いて一文字ずつタイピングしていると思います。しかし一日に何記事も書いたりするとタイピングをする手や指の疲れだけでなく目, 肩,腰などの疲れや運動不足の原因にもなっています。ライターやブロガーにとってこれは避けられない宿命のように思います。しかし無料のツールとちょっとした PC デバイスを用いることでこの入力作業の効率を劇的に上げることができます。それがGoogle ドキュメントを用いた「 音声入力で記事作成 」です。
無料の音声入力ツール Google ドキュメント
Google ドキュメントは、Googleが無料提供する、ウェブブラウザ内で動くオフィスソフトです。通常は Windows のワードのようにテキスト入力し記事を作成するのですが、この入力方法として音声入力機能があります。
音声入力を行うにはツールから音声入力を選択する、もしくは「 Control + SHIFT + S」 のショートカットキーを用いることで音声入力ボタンが表示されます。このボタンを押して赤色表示にすると音声入力がオンになります。
音声入力はある一定時間音声を認識しないと自動的に切れてしまいます。他にも Google ドキュメントの自動保存機能のときや、他の雑音によって音声が正しく認識されない場合でも切れてしまいます。ある音声入力の間にキーボードによる入力や文章の削除は可能です。しかし他のブラウザをクリックしたり、 Google ドキュメント内のツールの使用や文字修正変換を行うと音声入力は一度切れてしまいます。
音声入力で記事作成 のコツ
文章のかたまりを意識して入力
Google ドキュメントを用いた音声入力のコツは、ある程度の長さの文章を途切れずに文の塊で音声入力することです。文章を連続で入力している場合はスムーズに後に認識がされるのですが、途中で区切ってしまったり、「の、が」などの助動詞から入力をスタートさせる場合には 、最初の助動詞の認識がうまくいかないことがあります。
Google ドキュメントの素晴らしいところとして、途中の文章の変換がおかしくても最後まで一文として入力するとその文の前後の関係から自動的に変換のミスを修正することが挙げられます。
また音声入力の際に複数のテキスト候補が存在する場合は入力したテキストに下点線が表示されます。この下点線のテキストを右クリックするとテキストの修正候補が表示されます。
それでも気づかないうちに変換ミスされていることもあるので、再度読み返して文章をチェックする必要があります。
句読点や改行の際には一工夫
また Google ドキュメントでの入力では、句読点”、” ”。” ”「」”や改行、消去などの作業が行わないため、完全にキーボードフリーにはできません。そのため適所適所でキーボードで入力補助を行い文章構成を正していく必要があります。音声入力だけでは改行や削除が行えないのでこれらの作業をする際はキーボードを用いています。
しかし句読点の入力の際には音声入力で丸や点と入力し一通りの音声入力が終わった後に Google ドキュメントの機能であるテキスト全置換機能を用いて一括で変換を行っております。
他にも文章が途切れてしまうと助詞の判別が難しいので、文章が途切れてしまった時は「や」「が」「の」 はキーボードで入力し、その先から音声入力を再開します。また音声入力が途切れた後の入力は比較的音声認識ミスや変換ミスが起こりやすいのでゆっくりとしっかりと発音し音声入力するように心がけています。
音声認識されない固有名詞は「コード」づけの後に【置換】
音声入力ではどうしても一般的な単語でない固有名詞や英単語の入力に難があります。例えば「Habitika」という単語を音声入力すると「歯ビッチか」「葉引きか」「響きか」など”はびちか”の響きに似たものを自動で認識して入力してしまいます。
そこでおすすめしたいのは、データベースに乗っていないような単語を無理に使うのは避けて、一般的な単語を「コード」として仮入力しておくのです。
- このコードは文章中に他の表現と被らないこと
- 音声認識されやすいこと
- 後で読み返したとき、何を置き換えたものか自分で気づけること
が条件です。
この条件をまもる「コード」を含んだ状態でひとまずの音声入力を終えた後に、Wordの【置換】を行うことで一発で、音声入力で認識されなかった単語を文中にいれることが出来ます。
Google ドキュメントの欠点
句読点や改行処理
Google ドキュメントの欠点としてあげられるのは句読点”、””。””「」”や改行、消去などの入力処理が行わないため、完全にキーボードフリーにはできないという点です。句読点や改行などの音声入力変換昨日は実は iOS には搭載されております。現在の Google ドキュメントで句読点や改行などを行う際にはキーボードでその都度入力するか、置換機能で一括変換を行う必要があります。
音声認識の隙間時間
Google ドキュメントは絶えず音声認識ができるというわけではなく、 Google ドキュメント側で自動保存の際には音声入力は一時的にと切れることがあります。
またしばらく音声認識がされないとマイクによる入力モードが自動的に途切れてしまいます。その際には画面上のマイクのボタンを再び押して入力モードをオンにする必要があります。
画面上で再変換や新しい変換選択肢を選択する際にもこのマイクの入力モードが切れてしまいます。
環境音により音声認識精度が落ちる
これは当たり前のことですが音声入力の際に自分の声以外の環境音があまりにも大きいと正確な音声入力はできません。
今までは PC のマイクを用いて音声入力をしていたのですが、作業中に音楽を聴く際には スピーカーの音 が PC のマイクに入ってしまい音声入力の精度が下がってしまうことがあります。作業中にスピーカーでなくてイヤホンで音楽を聞けば解決する話なのですが、個人的な好みのためにスピーカーで音楽を聴きながら音声入力をスムーズにできる方法がないかを探しておりました。 その解決方法は後ほど以下で紹介します。
Google ドキュメントで英文入力は敷居が高い?
Google ドキュメントを用いた入力には日本語のほかにも英語での入力も可能です。しかしその場合には、日本人のカタカナ英語でなくネイティブ並みの英語の発音力が必要となります。なぜならば音声認識の元となっているデータはそれぞれのネイティブスピーカーがしゃべる各言語であるため、英語を第二言語としている人々が喋る英語はまた別の音声データベースに収録されていると考えられます。
文章はオンライン上に一時保存される
Google ドキュメントを用いて入力するには、タレス一時保存ファイルが保存されております。 Google のサーバーを用いたサービスなので作業ログを個人の PC 上でなくサーバー上に保存されてしまう形となります。個人で使用する場合には問題ないと思いますが、会社や企業などの情報セキュリティに対して厳しい場所での使用には注意が必要かもしれません。私もあくまでプライベートの使用に限り、会社ではこのシステムは使いません。
Google ドキュメントは win-win の関係
Google ドキュメントの中で複数の方法があるような音声認識をした場合に文字の下にうっすらと点線が示されます。一通り入力を終えた後その点線部分を右クリックすると、別の変換候補が表示されます。その中から自分が意図した返還を容易につけることができます。
この変換候補の見つけ方について仕組みはわかっていないのですが、おそらく Google が大量に保有する音声入力データと画像変換データとで最も確率の高いものを提案しているのだと思います。私たちはこのように音声認識のミスを変換することで Google に正しい音声認識の仕方を学ばせている、という風にも解釈できます。
このようなサービスが無償で提供されることで私達は便利な機能を無料で使え、 Google やソフト開発側はより多くの人に用いてもらうことで大量の入力データを収集し、おそらくですか人工知能の学習に用いることでこれらの変換精度や補足精度を上げているものだと思います。
ヘッドセットマイクで一段階上の快適性を実現
今回紹介した Google ドキュメントの音声認識に必要な機能があります。それは PC のマイク機能です。現在販売されている PC のほとんどにはマイク機能が付属されていると思います。しかしより快適な音声入力によるテキスト作成を行いたい場合にはヘッドセット式マイクを購入することをお勧めします。
ヘッドセットマイクを購入することによるメリットは以下の3点です。
PC から離れて音声入力ができる
この機能があれば従来のように PC の前に長時間座ってキーボード入力をする必要もなくなります。それどころか、ソファーに寝そべりながらテキスト入力をしたり、運動や作業をしながら記事の作成を行うことができます。
音声認識の精度が上がる
これは音声認識のマイクと自分の口との距離の問題です。 PC に付属しているマイクを用いた場合には、どうしても自分の 口とPCとの距離を近くする必要があります。またスピーカーを用いて音楽を聴いたりする際には自分の声がかき消されてしまって音声認識の精度が下がってしまいます。
小声での入力が可能になる
音声認識の際には入力したい内容を自分の声で読み上げる必要があります。一人暮らしで防音のしっかりした部屋での音声入力であれば問題はないのですが、同居人がいる壁が薄くて遮音性が乏しい家に住んでいる場合には、大声で入力することは憚られます。特にブログなどでプライベートであったりな、他人に聞かれると恥ずかしいような記事の作成を行っている場合にはこのヘッドセットは大変重宝します。
購入したヘッドセットマイクの紹介
私が購入したのは ワイヤレスタイプのヘッドセットマイクです。
Logicool ロジクール H600 折りたたみ式 ワイヤレスヘッドセット 2年間無償保証 Windows Mac Chrome OS 対応 ノイズキャンセリングマイク標準装備 USB接続
これを用いることである程度離れていても音声でスムーズに 入力をすることができます。こちらの製品を PC から5メートルほど離れても正確に音声の認識がされています。とはいえある程度のキーボードによる入力の補助が必要なため完全にワイヤレスとなることはできませんが、それでもテキスト入力の自由度は大変上がりました。必要最小限のキーボード入力でてストレスなく文章を書くことができます。
最後に
ある程度の長さの文章はスムーズに音声認識してくれるため長文をタイプする際の疲労感は格段に減ります。この Google ドキュメントによる音声入力の懸念点としてやはり認識ミスや変換ミスによる、文章の乱れが気になります。私は音声認識で作成したテキストをさらに PC でテキスト読み上げさせることにより文章の緑がないかの確認を行っています。テキスト読み上げソフトを用いることで文章校正の今はだいぶ減らすことができたと思います。この方法についてはまた別の記事で紹介します。この方法でも誤変換は気づけない場合があるので、下点線箇所の確認が欠かせません。
それでもこの音声入力のテキスト作成は非常に便利なので皆さんも是非試してみてください。
コメント