とても簡単に文字起こしが可能なグーグルドキュメント
グーグルドキュメントで文字起こしをするには、新規のGoogleドキュメントを開き以下の通り行うだけで自動テープ起こしが可能です。
- ステップ 1: マイクをオンにする
- ステップ 2: 音声入力を使用する
詳しい設定などは最後にご紹介しますので、まずはGoogleの自動文字入力の凄さを見て下さい。
日本語と英語の両方でテストを行いましたが、とりあえず得意であろう英語の自動音声入力の精度をチェックしてみようと思います。
自動音声入力の精度が凄い
テスト1 アメリカ大統領の就任演説(英語)
テストデータとして使用したのはアメリカ大統領の就任演説!
先日ドナルド・トランプが行った演説がYouTubeにアップされていました。
このトランプ大統領~就任演説【全文】を試しに自動音声入力させてみます。
全部で約17分。全文の文字起こしにかかった時間はリアルタイムに同時入力してくれるので、もちろん17分です。
一部分をブログにUPします。冒頭部分になります。
グーグルドキュメント自動文字起こし | ロイターの文字起こし |
---|---|
Chief justice Roberts President Carter President Clinton President Bush President Obama fellow Americans and people of the world thank you we the citizens of America are now joined a great National effort to rebuild our country and restarts promise for all of our people together we will determine the course of America and the world for many many years to come we will face challenges we will confront hardships but we will get the job done every four years We Gather on these steps to carry out the orderly and peaceful transfer of power and we are grateful to President Obama and First Lady Michelle Obama for their gracious a throughout this transition they have been magnificent thank you today’s ceremony Whoever has very special meaning because today we are not merely transferring power from one Administration to another or from one party to another but we are transferring power from Washington D C and giving it back to you the people | Chief Justice Roberts, President Carter, President Clinton, President Bush, President Obama, fellow Americans, and people of the world: thank you. We, the citizens of America, are now joined in a great national effort to rebuild our country and to restore its promise for all of our people. Together, we will determine the course of America and the world for years to come. We will face challenges. We will confront hardships. But we will get the job done. Every four years, we gather on these steps to carry out the orderly and peaceful transfer of power, and we are grateful to President Obama and First Lady Michelle Obama for their gracious aid throughout this transition. They have been magnificent. Today’s ceremony, however, has very special meaning. Because today we are not merely transferring power from one Administration to another, or from one party to another – but we are transferring power from Washington, D.C. and giving it back to you, the American People. |
凄くないですか!!
ロイターのサイトでは文字起こしされていない部分までしっかり文字起こししてくれてます。「thank you」とかの部分です。
そもそも、非常に正確に文字起こししているように思えます。
ロイターが全文文字起こししてこちらのページで公開しているので比べて頂いても、YouTubeで聞きながら確認して頂いていても良いのですが、この認識機能凄すぎる!!!
ここまで正確に文字起こしするとは思いませんでした。そして17分という長時間でも問題なく動いていることにも感動。
テスト2 NHKニュース ボージョレ・ヌーボー 解禁前に初荷が羽田に到着
さて、次に本命の日本語を試してみます。
日本語テストですが、日本語は英語よりは難しく基本的に英語よりは認識率は下がるので滑舌の良いアナウンサーの声をテストデータとして使いました。
使用したのはYouTubeにあるNHKチャンネルのニュース動画。
2本のニュースを試しに音声入力にて自動文字起こししてみました。間違い箇所は赤下線にて訂正しています。句読点はあとから私が手作業で付けました。
ボジョレーヌーボーずんだ(正:を積んだ)今年最初の航空便は、午前6時40分頃羽田空港に到着しました。
ボジョレーヌーボーはフランスブルゴーニュ地方のボージョレー地区で、その年に収穫されたぶどうを使ったワインの新酒台(正:です)。
第一便で到着した2604(正:2600本)あまりのボトルは、税関の職員が要領(正:容量)や原産地が正しく記載されているか検査を行った後、輸入元の大手酒造会社に引き渡されました。
酒造会社によりますとボジョレーヌーボーが今日から順次国内各地の空港に到着し、0(正:例)年とほぼ同じ600万本余りが輸入される見通しだということです。
今年は来月17日に販売が解禁されます。
テスト3 NHKニュース 大西卓哉さん 国際宇宙ステーションからあす帰還へ
元旅客機のパイロットで日本人11人目の宇宙飛行士となったお兄(正:大西)さんは、今年4月から国際宇宙ステーションに滞在し、今月23日にはアメリカの宇宙輸送船シグナスをロボットアームでキャッチする重要な任務を果たしました。
大西さんはおよそ4ヶ月間の任務を終了し、日本時間の明日ロシアの宇宙船ソユーズで地球に帰還します。
お兄(大西)さんは日本時間の今日昼頃ブログに次のように書き込みました。
「じゃあ(正:さあ)明日はいよいよ機関(正:帰還)というお(正:大)仕事が待っています。皆で話をしたりしているうちに遅い時間になってしまいましたがこれからゆっくりと休もうと思います」
大西さんは日本時間の明日午前6時15分頃、アメリカとロシアのふたりの宇宙飛行士と共にという風(正:ソユーズ)に乗り込み扉が閉められます。そして大西さん裸画法栗田(正:らが乗り込んだ)ソユーズは午前9時半過ぎに国際宇宙ステーションを離れて大気圏に突入する飛行に移り、午後1時頃中央アジアカザフスタンの平原に着陸する予定です。
どうですか?日本語でも発音さえしっかりして滑舌良く話すとこれほど正確に音声認識します。
日本語は漢字がありますから、英語ほどは正確になりませんが、それでもこれだけ認識して文字化できれば凄いですよね。
メチャクチャ早いタイピング技術の持ち主ならばリアルタイムに打ち込んだほうが早いでしょうが、私程度のタイピング技術だと自動音声入力後に手直ししたほうが早くて疲れません。
英語に至っては確実に音声認識のほうが楽ですし、間違いも日本語ほどありませんので非常に楽です。
実はこの技術はYouTubeで使われています。
YouTubeには字幕機能と翻訳機能が付いていますが、その機能はほぼこれと同様かと思います。
また字幕機能とはべつに文字起こしという機能も付いており、動画の何分何秒目に何を話しているのか時系列に自動的に文字起こしをしてくれている機能もついていたりします。
Googleドキュメントで音声入力文字起こしする方法
直接Googleドキュメントを開いてもOKです
ドライブの【新規】をクリックするとGoogleドキュメントが開けます
ショートカットではCtrl+Shift+Sになります。
マイクに音声を入力する必要があるので、イヤフォンジャックとマイク入力端子をに繋ぎます。
これって、通常やりませんけど壊れないのか心配だったり。でも試したときには問題ありませんでした。一応自己責任でよろしくお願いしますm(__)m
新規ドキュメント内に出てくる以下のアイコンのマイクマークをクリックして音声を流すだけです!すごく簡単。
この際に入力言語を選ぶ必要がありますので、言語選択はお忘れずに。
自分の声で入力する際には英語であれば以下のフレーズを使用してテキストに句読点を追加することができます。
- Period(ピリオド)
- Comma(カンマ)
- Exclamation point(感嘆符)
- Question mark(疑問符)
- New line(改行)
- New paragraph(改段落)
注: 句読点に対応しているのはドイツ語、英語、スペイン語、フランス語、イタリア語、ロシア語のみです。
日本語で改行や句読点に対応していないのは時間が解決してくれるでしょうね。
こちらが何かするわけでもなく、時間とともにどんどん進化していくGoogleの自動音声入力機能。今後は更に更に使いやすく便利になっていくのだと思います。
今のうちに一度は使って凄さを体感してみて下さい。
コメント