Word 文書に変換せずに PDF ファイルを開くには、保存されている場所に関係なくファイルを直接開きます (たとえば、[ドキュメント] フォルダー内の PDF ファイルをダブルクリックします)。
ただし、PDF ファイルを編集する場合は、Word で開きます。 Word では、PDF のコピーを作成してそれを Word 文書に変換し、元の PDF のレイアウトと一致させようとします。 Word で変換されたバージョンを保持したくない場合に備えて、常に元の PDF ファイルが保持されます。
PDF から Word への変換は、ビジネス文書、法的文書、科学分野の文書などのほとんどがテキストのファイルで最適に機能します。 しかし、PDF ファイルを Word で開くと、元の PDF とまったく同じ外観にはならないことがあります。
PDF 内のほとんどがグラフで構成されている場合、ページ全体が画像として表示されることがあります。 この場合、ページ内のテキストを編集することはできません。
場合によっては、Word で要素が検出されないために、元の PDF ファイルと Word のバージョンが一致しないことがあります。 たとえば、Word では、脚注が認識されず、脚注が通常の文字列として処理され、ページの末尾に配置されないことがあります。
適切に変換されない文書要素
一部の要素では、PDF から Word 形式に変換するときに問題が発生することがわかっています。 PDF にそれらの要素が含まれている場合は、Word 文書に変換せずに PDF を直接開くことをお勧めします。
-
セルの間隔がある表
-
ページの色とページ罫線
-
変更履歴
-
フレーム
-
1 ページを超える脚注
-
文末脚注
-
音声、ビデオ、PDF のアクティブな要素
-
PDF ブックマーク
-
PDF タグ
-
PDF コメント
-
光彩や影などのフォント効果 (Word ファイルでは効果はグラフィックとして表される)
変換はどのように機能するか
PDF は固定のファイル形式です。つまり、ファイルには、ページ上のテキスト、画像、およびベクター グラフィックスの場所が保存されますが、必ずしもそれらの間の関係が保存されるわけではありません。 ほとんどの PDF には、段落、表、列などの構造的なコンテンツ要素に関する情報は含まれていません。 たとえば、PDF は、表のセル内のコンテンツとは無関係な行のセットとして表を保存します。
アプリケーションが異なれば、同じコンテンツが PDF ファイル内の別の構造を使って表されます。 たとえば、非表示のテキスト、グラフィック、画像が PDF に含まれている場合があります。 これに異なる文字列表示範囲枠が使われているとします。 しかし、これらの違いは、PDF をリーダーで見るときには表示されません。
PDF ファイルを Word で開くと、Word で複雑なルールのシステムが使われ、元の PDF を表すために最適な Word オブジェクト (見出し、リスト、表など) が何であるかが検出され、それらのオブジェクトを Word 文書内で配置する最適な位置が決められます。