Power AutomateでPDFや画像からテキストを抽出する方法（OCR活用）

「PDFファイルの中の文字をコピペできない…」「スキャンした書類から情報を自動で抜き出したい」そんな時に便利なのが OCR（光学文字認識） 機能です！

この記事では、Power Automate Desktop を使って、PDFや画像から文字情報を抽出する方法（OCRの使い方） を、ステップごとにやさしく解説します。2024年の最新アップデートに対応しています。

✅ この記事でわかること

OCR（Optical Character Recognition）とは、画像やPDFなどから 文字らしきものを見つけてテキストとして取り出す技術 のこと。

たとえば、スキャンされた請求書や写真に写っている文字なども、テキストとして扱えるようになります。

Power Automate Desktopでは、画像やPDFファイルをOCRで読み取って、文字として扱うことが可能です。

💡シナリオ：PDFの中の請求書から顧客情報を抽出して、画面に表示してみる ✅ Step 1：新しいデスクトップフローを作成する

✅ Step 2：アクション「OCR でテキストを抽出」を検索して追加

🔧 設定内容項目設定内容OCRエンジンWindows OCR（推奨）または Tesseract OCR画像ファイルのパス対象のPDFまたは画像ファイルのパスを入力

🔸ファイルのパスは、対象ファイルを右クリック → 「パスのコピー」で簡単に取得できます。

✅ Step 3：抽出したテキストをメッセージボックスで表示する

✅ Step 4：フローを実行して確認する

右上の「実行」ボタンを押すと、PDFや画像内の文字が抽出され、メッセージとして表示されます。

Q1. OCRエンジンは「Windows」と「Tesseract」のどちらがいいの？

どちらも使用できますが、Windows OCRエンジンの方が安定性が高いとの声もあります。環境やPDFの内容によって最適なものが異なるため、両方試してみるのがおすすめです。

Q2. 手書き文字も認識できますか？

基本的には手書き文字の認識は難しいです。OCRは印刷文字に強く、筆跡やクセのある文字は正確に読み取れないことがあります。

Q3. PDF全体ではなく、一部だけ読み取ることはできますか？

可能です。ただしPower Automate Desktopでは、対象エリアを指定するには追加の画像処理が必要になるため、少し上級者向けです。まずは全文抽出から始めるのがおすすめです。

Power Automate for desktopとは？ OCR よかったらシェアしてね！

カモネギ課長

BOT