PDFをコピペすると文字化けするのを解消する方法 (Mac編)

2024年9月7日

テクノロジー

t f B! P L
eyecatch 仕事でデータのやり取りをする時に、PDFを渡される事があります。 1ファイルで中に、画像もテキストも入っているのですが、通常誰もが使っているのは、PDFビューワーなので、中に入っている画像はファイルとして取り出すことはできません。 もちろん、PDFエディターを使えば、アプリによっては中に登録されている画像を、ファイルとしてダウンロードできる機能をもっている場合もありますが、ほとんどが有償のソフトか、怪しいフリーソフトなので、画像を取り出したいだけでアプリを気軽に使うのは躊躇してしまいます。 画像は画面キャプチャでもしてなんとかサンプル画像として利用することはできるかもしれませんが、 PDFに書かれている文字列は、テキストで登録されていれば、普通にパソコンなどでコピペすることができるはずなのに、たまにコピペすると、文字が思いっきり崩れてしまう時があります。

文字化けの実態

調べてみるとこれは、特殊な文字フォントを使って登録されている場合、PDFをファイル化した時に、表示はされているんですが、テキストデータとしては、データが壊れてしまっているのだそうです。 なので、どんなにコピペを行なっても、バイナリデータっぽい表示がされて、テキストデータを拾う事ができません。 そうした場合に、Macを使っていると裏技的にテキストを取り出す事ができる方法を見つけたので、困った人は是非やってみてください。 こんな感じで、テキストは選択できているのに、コピペすると文字化けをしています。

文字化けするPDFからのテキスト救出法

まずはじめに言っておきますが、登録されているテキストを100%完璧に取り出すことは難しいという事を納得しておいてください。 どうするかというと、MacOSに初めからインストールされているプレビューというアプリは、最近では、AI文字起こしがされているという機能を使って、 テキストの入ったPDFを一度すべて画像化して、その画像をプレビューアプリで開くと、よほど変わった文字じゃないかぎり、自動でテキストとして認識してくれるようになります。

手順1. 文字化けするPDFファイルを準備する

手順2. 普通にアプリでPDFファイルを開く

※リアル仕事データなのでボカしています。

手順3. ファイル - 書き出す を選択

手順4. PNGデータで保存する

手順5. プレビューアプリで開いてテキストを選択

無事にテキストが救出できました。

あとがき

おおよそのコピペができると、そのあとはちゃんとテキストが正常かどうかをチェックするようにしましょう。 正直こんな事をするぐらいなら、wordやエクセルで資料をもらった方が確実ですね。 または、テキストファイルと画像でいいんですよ。 きっと時間をかけてこうしたきれいな資料を作ったんだろうなということは想像できますが、相手にレイアウト情報を伝えたいだけであれば、Figmaなどで行なった方が確実ですよね。 ちなみに、このブログを書いている時に、色々と検索していたら、ASCIIに次の様なページを見つけたので、最後にシェアしておきます。 PDFから画像を取り出す方法

人気の投稿

このブログを検索

ごあいさつ

このWebサイトは、独自思考で我が道を行くユゲタの少し尖った思考のTechブログです。 毎日興味がどんどん切り替わるので、テーマはマルチになっています。 もしかしたらアイデアに困っている人の助けになるかもしれません。

ブログ アーカイブ