TOPパソコン全般

ここまで進んだGoogleドキュメントの自動音声入力!もうテープ起こしは無料アプリでOK!?





新規のGoogleドキュメントを開き以下の通り行うだけで自動テープ起こしが可能です。
ステップ 1: マイクをオンにする
ステップ 2: 音声入力を使用する

詳しい設定などは最後にご紹介しますので、まずはGoogleの自動文字入力の凄さを見て下さい。
日本語と英語の両方でテストを行いましたが、とりあえず得意であろう英語の自動音声入力の精度をチェックしてみようと思います。

テストデータとして使用したのはアメリカ大統領の就任演説!
先日ドナルド・トランプが行った演説がYouTubeにアップされていました。
このトランプ大統領~就任演説【全文】を試しに自動音声入力させてみます。
全部で約17分。全文の文字起こしにかかった時間はリアルタイムに同時入力してくれるので、もちろん17分です。


上のYouTube動画をGoogleドキュメンを使って自動入力した音声入力全文です。(リンク)
全てをブログにUPするとさすがに長いので全文は上のリンクから御覧ください。
17分もあるので途中でフリーズするかと思いきや17分間ず~~っと自動音声入力がONになっていたのには驚きました。

一部分をブログにUPします。冒頭部分と最後のクライマックス部分です。

冒頭部分
Chief justice Roberts President Carter President Clinton President Bush President Obama fellow Americans and people of the world thank you we the citizens of America are now joined a great National effort to rebuild our country and restarts promise for all of our people together we will determine the course of America and the world for many many years to come we will face challenges we will confront hardships but we will get the job done every four years We Gather on these steps to carry out the orderly and peaceful transfer of power and we are grateful to President Obama and First Lady Michelle Obama for their gracious a throughout this transition they have been magnificent thank you today's ceremony Whoever has very special meaning because today we are not merely transferring power from one Administration to another or from one party to another but we are transferring power from Washington D C and giving it back to you the people

-------中略--------

最後のクライマックス部分
your voice your hopes and your dreams will Define our American Destiny and your courage and goodness and love will forever guide us along the way together we will make America strong again we will make America wealthy again we will make America proud again we will make America safe again and yes together we will make America great again thank you God bless you and God bless America thank you God bless America


ロイターが全文文字起こししてこちらのページで公開しているので比べて頂いても、YouTubeで聞きながら確認して頂いていても良いのですが、この認識機能凄すぎる!!!
ここまで正確に文字起こしするとは思いませんでした。そして17分という長時間でも問題なく動いていることにも感動。


さて、次に本命の日本語を試してみます。
日本語テストですが、日本語は英語よりは難しく基本的に英語よりは認識率は下がるので滑舌の良いアナウンサーの声をテストデータとして使いました。

使用したのはYouTubeにあるNHKチャンネルのニュース動画。
2本のニュースを試しに音声入力にて自動文字起こししてみました。間違い箇所は赤字にて訂正しています。


①【NHKニュース(YouTube公式チャンネル) ボージョレ・ヌーボー 解禁前に初荷が羽田に到着  0:52 】

------自動音声入力結果(句読点は手動)------
ボジョレーヌーボーすんだ(を積んだ)今年最初の航空便は、午前6時40分頃羽田空港に到着しました。
ボジョレーヌーボーはフランスブルゴーニュ地方のボージョレー地区で、その年に収穫されたぶどうを使ったワインの新台(です)。
第一便で到着した2604(2600本)あまりのボトルは、税関の職員が要領(容量)や原産地が正しく記載されているか検査を行った後、輸入元の大手酒造会社に引き渡されました。
酒造会社によりますとボジョレーヌーボーが今日から順次国内各地の空港に到着し、0(例)年とほぼ同じ600万本余りが輸入される見通しだということです。
今年は来月17日に販売が解禁されます
-------------------------------------------


②【NHKニュース(YouTube公式チャンネル)  大西卓哉さん 国際宇宙ステーションからあす帰還へ  1:17】

------自動音声入力結果(句読点は手動)------
元旅客機のパイロットで日本人11人目の宇宙飛行士となったお兄(大西)さんは、今年4月から国際宇宙ステーションに滞在し、今月23日にはアメリカの宇宙輸送船シグナスをロボットアームでキャッチする重要な任務を果たしました。
大西さんはおよそ4ヶ月間の任務を終了し、日本時間の明日ロシアの宇宙船ソユーズで地球に帰還します。
お兄(大西)さんは日本時間の今日昼頃ブログに次のように書き込みました。
じゃあ(さあ)明日はいよいよ機関(帰還)というお(大)仕事が待っています。皆で話をしたりしているうちに遅い時間になってしまいましたがこれからゆっくりと休もうと思います」
大西さんは日本時間の明日午前6時15分頃、アメリカとロシアのふたりの宇宙飛行士と共にという風(ソユーズ)に乗り込み扉が閉められます。そして大西さん裸画法栗田(らが乗り込んだ)ソユーズは午前9時半過ぎに国際宇宙ステーションを離れて大気圏に突入する飛行に移り、午後1時頃中央アジアカザフスタンの平原に着陸する予定です。
-------------------------------------------


どうですか?日本語でも発音さえしっかりして滑舌良く話すとこれほど正確に音声認識します。
メチャクチャ早いタイピング技術の持ち主ならばリアルタイムに打ち込んだほうが早いでしょうが、私程度のタイピング技術だと自動音声入力後に手直ししたほうが早くて疲れません。


英語に至っては確実に音声認識のほうが楽ですし、間違いも日本語ほどありませんので非常に楽です。

実はこの技術はYouTubeで使われています。
YouTubeには字幕機能と翻訳機能が付いていますが、その機能はほぼこれと同様かと思います。
また字幕機能とはべつに文字起こしという機能も付いており、動画の何分何秒目に何を話しているのか時系列に自動的に文字起こしをしてくれている機能もついていたりします。



【Googleドキュメント】
音声入力による自動文字起こし手順


GoogleクロームにてGoogleドライブを開きます
(もしくはGoogleドキュメントに直接アクセスします)

・[新規]からGoogleドキュメントを選びます
(Googleドキュメントの場合は+マークで新規ドキュメントを作成)


・新規の無題ドキュメントが開いたらツール→音声入力...を選びクリックする



・マイクに音声を入力する必要があるのでスピーカー端子の音をマイクに繋ぎます。




あとは新規ドキュメント内に出てくる以下のアイコンのマイクマークをクリックして音声を流すだけです!すごく簡単。

     入力言語は選ぶ必要があります。



また、自分の声で入力する際には英語であれば以下のフレーズを使用してテキストに句読点を追加することができます。

  • Period(ピリオド)
  • Comma(カンマ)
  • Exclamation point(感嘆符)
  • Question mark(疑問符)
  • New line(改行)
  • New paragraph(改段落)

注: 句読点に対応しているのはドイツ語、英語、スペイン語、フランス語、イタリア語、ロシア語のみです。



日本語で改行や句読点に対応していないのは時間が解決してくれるでしょうね。
こちらが何かするわけでもなく、時間とともにどんどん進化していくGoogleの自動音声入力機能。今後は更に更に使いやすく便利になっていくのだと思います。

今のうちに一度は使って凄さを体感してみて下さい。






パソコン全般 | 2017.01.26 [EDIT]

【関連するタグ】

【最新記事一覧】

02/08   図書館やビデオレンタルで借りたDVDの紛失/破損による弁償は著作権補償処理のため高額請求されますのでご注意を!
02/02   不正レビューを大量削除!Amazonのカスタマーレビューランキングが復活更新しました! 
01/26   ここまで進んだGoogleドキュメントの自動音声入力!もうテープ起こしは無料アプリでOK!?
01/21   800万円の掛布団を販売する西川グループで聞いた羽毛布団の正しい使い方。
01/18   知らなきゃ損する!? Google翻訳アプリの自動OCR翻訳機能が凄すぎる!撮影するだけでOK
01/08   ヨーグルトについてのグダグタ個人メモ
01/08   新年あけましておめでとうございます!私にとって本年は腸元気の幕開けの年です。
12/27   Windows7で画像回転すると画像劣化するがロスレス回転ではしない?データ増加は?
12/18   スタジオアリスで初撮影 1年後の写真データダウンロードサービスが嬉しい
12/09   「プリントヘッドの種類が違います」とプリンターに表示された時の対処方法と修理実例(mg/mpシリーズ) メンテナンスモードに入ることが肝か!?
12/02   チェキフィルムが堂々の1位 スマホ用レンズが114 円!など。 Amazonのランキング大賞2016が発表
11/28   ライティング大全とも言える100種類以上の照明機材比較資料が無料公開

【ポストカード写真】 Photo by 管理人(Orca)

<<不正レビューを大量削除!Amazonのカスタマーレビューランキングが復活更新しました!  | ホームへ | 800万円の掛布団を販売する西川グループで聞いた羽毛布団の正しい使い方。>>
  • 【】
【// :】
| ホームへ |