画像も音声も!超便利な文字起こしツール2選

  • お客さまからいただいた画像形式の資料をテキスト化したい
  • インタビューの録音データを文字起こししたい

などなど、Webサイト制作過程のなかで、テキスト化・文字に起こしたいシーンがしばしばあります。

多少のことなら手で入力すれば良いのですが、量が多いと結構時間がかかってしまうため、いわゆるOCR系のツール(自動文字起こしソフト)を使って、効率化したいところ。

 

ということで、今日は「超便利な文字起こしツール2選」と題しまして、僕がよく使う文字起こしツールをご紹介させていただきます。

これまでいくつか使ってきたツールのなかでも、かなり精度がよくオススメです。

MacでもWindowsでも無料で使えますので、悩んでいらっしゃる方がみえたらぜひお試しください。

 

画像の文字起こしなら「Googleドライブ+Googleドキュメント」

画像の文字起こしはもうこれ一択。

使い方も簡単で、

  1. 文字起こししたい画像をGoogleドライブに入れる
  2. そのファイルをGoogleドキュメントで開く

たったこれだけです。

知らない方のために、簡単にご説明しますね。

Googleドライブは、いわゆるストレージサービスと呼ばれるもの。クラウド上に保管・共有することのできるサービス。
同様のサービスだとDropboxやMicrosoftのOneDriveあたりが有名でしょうか。

Googleドキュメントは、ブラウザ上で使える文書ファイル編集ソフト。簡単に言うとWordのようなソフトです。

文字起こし手順

Googleドライブにアクセスし、文字起こししたい画像をアップロードします

 

上記①〜③の手順で、アップロードした画像をGoogleドキュメントで開きます。

 

すると、アップロードした画像とともに、画像内のテキストが表示されます。簡単ですね!

少しだけ注意点(Googleドキュメントの癖)

  • 改行箇所に「スペース」が入ることが多いです。
  • 「()」は半角括弧+スペースになることが多いです。

 

 

音声の文字起こしなら「YouTube+ChatGPT」

文字起こしにYouTube?と思われたかもしれませんが、ChatGPTのChromeアドオン(拡張機能)を併用した合せ技です。

簡単に言うと、YouTubeにアップした音声データをChatGPTに文字起こしさせます。

大まかな流れとしては、下記になります。

  1. Chromeアドオン「YouTube Summary with ChatGPT」をインストールしておく
  2. 文字起こししたい音声データ(or動画)をYouTubeに「非公開」でアップロード
  3. その動画のページで「Transcript & Summary」ボタンをクリック

事前準備がやや必要ですが、慣れてしまえばこちらもすごく簡単なので、下記手順をご覧いただければと思います。

なお、事前準備完了から、文字起こしまで多少時間がかかりますので注意してください。

※音声データがそれなりにクリアでないとこの文字起こしの精度が落ちます。あらかじめご了承ください。

事前準備:Chromeへアドオン(拡張機能)を追加

事前準備としてまず、GoogleChromeに、拡張機能「YouTube Summary with ChatGPT & Claude」を追加しておきます。
YouTubeの動画を文章で要約してくれる拡張機能です。

事前準備:音声ファイル形式の確認・変換

YouTube上にで音声ファイル(or動画データ)をアップロードするために、必要に応じてファイル形式を変換する必要があります。

»YouTube でサポートされているファイル形式

例えば僕の場合は、ボイスレコーダーで録音したデータ「wav」を、いったん「mp3」へ変換し、そこからさらに「mp4」へ変換しています。(「wav」から「mp4」へ直接変換したデータをYouTubeへアップすると、エラーになります)

なお、今回ご紹介するこの手法で文字起こしをするのであれば、はじめからボイスレコーダー等の「録音データ」ではなく、スマホのカメラ等で「動画データ」として記録しておくとか、あえてzoomで収録する方が良いかもしれませんね。変換の手間が省けます。

事前準備:YouTubeへアップロード

Youtube上にで音声データ(or動画データ)をアップロードしていきます。

手順のスクリーンショットを貼っておきますので、不慣れな方は参考になさってください。

重いファイルだとアップロードするだけでも時間がかかるので、何か作業をしながら準備しておくのがいいかもしれません。

動画のアップが終わりました。子ども向けかどうかが必須項目として設置されているため、選択のうえ次へ進みます。

「非公開」で問題ありません。選択のうえ「保存」

これで事前準備は完了です。

あとはChatGPTのChromeアドオン(拡張機能)が、文字起こしをしてくれるのを待つだけです。

データの長さによると思いますが、一晩くらいおいておくのが無難かもしれません。

 

文字起こし手順

文字起こし手順という程のことでもないのですが.. 確認方法です。

アップロードした動画を確認します。

インストールした拡張機能(YouTube Summary with ChatGPT & Claude)によって、各動画ページの右上に「Transcript & Summary」というボタンが表示されているので、クリックしてください。

 

すると、動画内の音声がテキストで表示されます。素晴らしすぎる!

※繰り返しになりますが、アップロードしたばかりの動画ではテキストが表示されないため、その場合は少し時間をおいてから確認してみてください。

 

音声データの文字起こし、やったことがある方はわかると思うんですが、画像以上に時間がかかるんですよね。聞きとりにくい部分を何回も聞き直したり。

例えば15分のインタビューでも1時間くらいはかかるんじゃないでしょうか。話している量や聞き取りやすさによってはもっとかかるかもしれません。

誤字脱字等がまったくないわけではないので、多少なりとも自分で修正する必要はありますが、かなり精度は高いと思います。さすがAI。事前準備がやや面倒に感じる方もいらっしゃるかもしれませんが、ゼロから自分で書き起こす労力と比べれば、雲泥の差。かなり効率化できます。

YouTubeチャンネルを運営している方なら、動画のテロップ作成にも活用できそうですよね。

2023年12月 追記:とんでもない商品を発見しました

クラウドファンディングサイト「Makuake」にて、とんでもない商品を発見してしまいました。

ChatGPTと連携し、録音したデータが自動で文字起こしされるレコーダー。これはもう革命ですね。

PLAUD NOTE ChatGPT連携AIボイスレコーダー|議事録を即時に作成

 

 

おわりに

いかがでしたか?

いわゆるOCR系のツール(文字起こしソフト)をいくつか使ってきたなかで、精度が高く安定して使いやすいツールに絞ってご紹介させていただきました。

もし文字起こしが必要になった場合は、ぜひ試してみてくださいね。

 

Webサイト制作・運用でお悩みの方はご相談ください
この記事をシェアする
x
facebook
line
pockets
pockets

お問い合わせ CONTACT

数あるWebサイト制作会社からアットノエルを見つけてくれた方へ。
Webサイト制作会社・パートナーを変える必要はもうありません。
「もっと早く出逢いたかった」そうおっしゃっていただけるのがわたしたちの誇り。
御社の強みを明確にし、企画から制作、改善、運用のお手伝いまで、総合的にサポートいたします。