PDFを品質を損なわずに圧縮する方法

· 7 分で読めます

PDF は文書を共有する最も一般的なファイル形式の 1 つですが、驚くほど大きくなることがあります。埋め込み画像、フォント、スキャンされたページを含む PDF は、メール添付ファイルの制限(通常 25 MB)を簡単に超えてしまいます。PDF を圧縮すると、内容を損なわず読みやすいまま、ファイルサイズが削減されます。ブラウザベースの圧縮ツールは、文書をサーバーにアップロードせず、すべての作業をローカルで処理します。

PDF がこんなに大きくなる理由

すべての PDF が同じというわけではありません。シンプルなテキスト文書は 50 KB かもしれませんが、スキャンされた契約書は 20 MB になりえます。主な要因:

オンラインで PDF を圧縮する方法

  1. PDF をアップロード: ファイル(最大 100 MB)をアップロードゾーンにドロップするか、クリックして参照します。
  2. 圧縮レベルを選択: 軽(10〜20% 削減、最高品質)、中(20〜35%、バランス型)、または高(30〜50%、最大圧縮)から選びます。
  3. 圧縮してダウンロード: 「PDF を圧縮」をクリックしてブラウザ内で処理し、より小さいファイルをダウンロードします。ツールはサイズ削減を表示します。

PDF 圧縮の簡単な歴史

PDF(1993 年)は最初から圧縮を念頭に設計されました。オリジナルの PDF 1.0 仕様は、一般データ用に FlateDecode(ZIP や PNG と同じ Deflate アルゴリズム)と画像用の JPEG 埋め込みを含んでいました。年月を経て、PDF には以下が追加されました:

バージョン追加された圧縮
1.01993FlateDecode(zlib/Deflate)、JPEG、CCITT Fax
1.21996LZW 圧縮(特許懸念あり)
1.420012 値画像用 JBIG2(スキャン用の高圧縮)
1.52003JPEG 2000、オブジェクトストリーム、クロスリファレンスストリーム
1.7 / Ext 32009メタデータ圧縮の改善
2.02017高速ウェブ表示のための改善されたストリーム線形化

現代の PDF 圧縮ツールは、各オブジェクトに最も効率的なエンコードで PDF を再構築します。エンコードが不十分な PDF は、品質を失わずに再エンコードするだけで 50% 縮小することがあります。古いツール(2000 年代初期)からの PDF は、すでに効率的なエンコードを使っている現代のツールからの PDF よりもはるかに圧縮されます。

無料の Ghostscript ライブラリ(1986 年から、PDF 自体より古い)は、オープンソース世界の事実上の PDF 圧縮エンジンでした。ほとんどのブラウザベースの圧縮ツールは、Ghostscript の移植版または pdf-lib(JavaScript)を使って作業を行います。

適切な圧縮レベルの選択

軽圧縮はメタデータ、未使用オブジェクトを削除し、内部構造を最適化します。これはどんな文書にも安全で、テキストと画像は手を加えられません。

中圧縮はさらに、埋め込み画像の解像度を下げます。印刷品質の画像が必要ないデジタル共有用の文書に良いです。

高圧縮は画像品質を積極的に下げます。可能な限り小さいファイルが必要で、文書が主にテキストの場合に使用します。画像の多い PDF では目に見える品質低下が出ます。

圧縮技術の詳細

技術動作品質コスト
ストリーム再エンコードオブジェクトストリームを zlib/Deflate で再圧縮なし、可逆
画像ダウンサンプリング埋め込み画像の DPI を下げる(300 から 150)画像品質損失、テキストは無事
画像再エンコードJPEG をより低品質で再エンコード(95% から 75%)画像品質損失
画像フォーマット変換写真用に PNG を JPEG に変換変換アーティファクト
フォントサブセット化フォント全体ではなく使用されたグリフのみを埋め込むなし
未使用オブジェクト削除孤立データを取り除くなし
重複削除同一ストリームの重複排除なし
メタデータ削除作成者、履歴、コメントを削除プライバシー改善、内容は変わらず
線形化高速ウェブ表示のための並べ替えなし、わずかなオーバーヘッド
サムネイル削除キャッシュされたページプレビューを取り除くビューアがサムネイルを再レンダリング必要
OCR レイヤーのフラット化別々のテキストと画像レイヤーを結合検索可能性が変わる可能性

良い圧縮ツールは、品質に影響するものより先に可逆技術(再エンコード、サブセット化、重複排除)を適用します。一部の圧縮ツールはすべてのノブを公開しますが、他はプリセットを使います。

画像解像度の目標

異なる用途には、異なる DPI 設定が意味を成します:

用途推奨 DPI理由
印刷(プロ用)300 DPI高品質印刷の業界標準
印刷(家庭用)200 DPIオフィスプリンターに十分
画面表示150 DPI標準モニターでくっきり
メール添付100〜150 DPIサイズと可読性のバランス
ウェブ埋め込み96 DPI標準画面解像度
モバイルプレビュー72 DPIより小さなファイル、電話でも読みやすい

600 DPI でスキャンされた PDF を 150 DPI に圧縮すると、通常は画面上で見える品質差なしにファイルサイズの 70〜80% を失います。

よくある落とし穴

より小さい PDF のためのヒント

圧縮しないほうがいい場合

一部の PDF はフルサイズのままにすべきです:

代替アプローチ

ブラウザ圧縮で十分に縮小しない場合:

マシンを離れるべきでない機密 PDF には、ブラウザベースの圧縮(このツール)またはローカルデスクトップツール(Adobe Acrobat、Ghostscript)のみが安全な選択肢です。

プライバシーと機密 PDF

PDF 圧縮ツールは完全にブラウザ内で動作します。アップロードする PDF、中間処理、圧縮された出力のすべてがデバイス上に残ります。サーバーへのアップロードも、ログ記録も、誰かとの共有もありません。

これが重要なのは、圧縮する PDF が非常に機密性の高いものであることが多いからです: メール送信用に準備された署名済み契約書、財務諸表、旅行書類用にスキャンされたパスポート、専門医に送られている診療記録、エンバーゴ下の内部企業報告書、従業員記録、法的訴状、確定申告書。クラウド PDF 圧縮ツールは設計上、ファイルをサーバーにアップロードし、しばしば「サービス改善」のために保持し、機密契約書や人事記録が検索エンジンにインデックスされる実際のデータ漏洩に関与してきました。ブラウザベースの圧縮ツールはエクスポージャーがゼロです: PDF は決してマシンを離れません。

ブラウザベースの圧縮は、ページが読み込まれた後はオフラインでも機能します。飛行機内、インターネットアクセスのないセキュアな施設、またはサードパーティに機密文書をアップロードできない、すべきでない場所での文書処理に便利です。

よくある質問

PDFのサイズをどれくらい削減できますか?

コンテンツに依存します。主にテキストのPDFは10〜20%しか削減できませんが、大きな埋め込み画像のあるPDFは30〜50%以上削減できます。

圧縮はPDFの品質を低下させますか?

軽い圧縮は、未使用データとメタデータを削除することで品質を保持します。強い圧縮は、画像が豊富なPDFの画像品質を低下させる可能性がありますが、テキストは鮮明で読みやすく保たれます。

圧縮されたPDFは印刷可能のままですか?

はい。圧縮されたPDFは完全に機能します, 元のように印刷、表示、共有できます。テキスト品質は圧縮の影響を受けません。

オンラインで機密PDFを圧縮するのは安全ですか?

はい、ブラウザ内ツールで。PDFはデバイス上で完全に処理され、サーバーに送信されることはありません。