初心者向けPDFからのテキストと画像の抽出ガイド

PDFファイルから画像とテキストを抽出する複数の方法を学ぶ

PDFファイルは、プラットフォーム間や同じソフトウェアを使用しない人々の間でフォーマットされたファイルを交換するのに最適ですが、テキストや画像をPDFファイルから取り出し、Webページ、 ワープロ文書 、PowerPointプレゼンテーション、 デスクトップパブリッシングソフトウェアで

個々のPDFに設定されているニーズやセキュリティオプションに応じて、PDFファイルからテキスト、画像、またはその両方を抽出するオプションがいくつかあります。 あなたにとって最適なオプションを選択してください。

Adobe Acrobatを使用してPDFファイルから画像とテキストを抽出する

無料のAcrobat ReaderだけでなくAdobe Acrobatのフルバージョンをお持ちの場合は、個々の画像やすべての画像、PDFからのテキストを抽出し、EPS、JPG、TIFFなどのさまざまな形式で書き出すことができます。 Acrobat DCでPDFから情報を抽出するには、[ ツール] > [ PDFを書き出す]を選択し、オプションを選択します。 テキストを抽出するには、PDFをWord形式またはリッチテキスト形式にエクスポートし、以下のオプションを選択します。

Acrobat Readerを使用したPDFからのコピー&ペースト

Acrobat Readerをお持ちの場合は、PDFファイルの一部をクリップボードにコピーして別のプログラムに貼り付けることができます。 テキストの場合は、PDFのテキスト部分をハイライト表示し、 Ctrl + Cを押してコピーします。

その後、 Microsoft Wordなどのワープロソフトを開き、 Ctrl + Vキーを押してテキストを貼り付けます。 画像をクリックして画像を選択し、同じキーボードコマンドを使用して画像をサポートするプログラムにコピーして貼り付けます。

グラフィックスプログラムでPDFファイルを開く

画像抽出が目的の場合、 Photoshop 、CorelDRAW、Adobe Illustratorの新しいバージョンなどのイラストレーションプログラムでPDFを開き、編集や画像を保存してデスクトップパブリッシングアプリケーションで使用できます。

サードパーティのPDF抽出ソフトウェアツールを使用する

ページレイアウトを維持しながらPDFファイルをHTMLに変換し、PDFコンテンツをベクトルグラフィックス形式に抽出して変換し、ワープロ、プレゼンテーション、およびデスクトップパブリッシングソフトウェアで使用するためにPDFコンテンツを抽出するスタンドアロンのユーティリティとプラグインがいくつかあります。 これらのツールは、一括抽出/変換、ファイル全体または部分コンテンツの抽出、複数のファイル形式のサポートなどのさまざまなオプションを提供します。これらは主に商用およびシェアウェアのWindowsベースのユーティリティです。

オンラインPDF抽出ツールを使用する

オンラインの抽出ツールを使用すると、ソフトウェアをダウンロードまたはインストールする必要がありません。 どのくらい抽出できるかはさまざまです。 たとえば、ExtractPDF.comでは、最大14MBのファイルをアップロードするか、イメージ、テキスト、またはフォントの抽出のためにPDFにURLを指定します。

スクリーンショットを撮る

PDFで画像のスクリーンショットを撮る前に、できるだけ画面上で拡大してください。 PCでは、PDFウィンドウのタイトルバーをクリックし、 Alt + PrtScnを押します。 Macでは、 Command + Shift + 4をクリックし、表示されているカーソルを使用して、ドラッグしてキャプチャする領域を選択します。