ブリーフは純白

ブリーフをかぶった変態の独り言。インデザインや組版、デザインとか色とか、そういう界隈のこと。

【Webのこと】複数のWebページをPDF書き出ししたい

Webサイトの見た目のままで記事掲載したい、とりあえずこの期間の記事を全部PDFにしてほしい(その中から掲載記事抜粋する)という仕事がありました。

※記事は取捨選択してから入稿しましょう。

仕方ないので手法を検討しました。

素直にやろうとすると、ページを開く・印刷からPDF書き出しを記事数分繰り返す、となります。

f:id:bliblibli-fu:20210808093827p:plain

 

Webサイトを保存・Acrobatで結合

Webページは、右クリック→名前をつけて保存、もしくは、Ctrl+S、でWebページを構成すものすべてを保存することができます。

つまりWebサイトまるごと保存すれば中の画像も動画も簡単に手に入れることができちゃうんですよね。モラル的にそんなことしないけどね!

今回は仕事の依頼なので保存してみました。画像はダミーです。

f:id:bliblibli-fu:20210808100215p:plain

保存したWebページのフォルダの中を「html」で検索して右クリック→Acrobatで結合します。

f:id:bliblibli-fu:20210808100345p:plain

f:id:bliblibli-fu:20210808100442p:plain


Acdrobatを持っていない人でも、フリーのアプリでPDFを作ることは可能です。例えばWondershare PDFelementなどで、こちらは無償体験版でも一括処理からPDF作成もできますが、ファイルを保存すると透かしが入ります。

f:id:bliblibli-fu:20210808101236p:plain

話は脱線しましたが、Acrobatで結合したPDFですが、変換はAcrobatに依存しますのでレイアウトが崩れることがママあります。残念クオリティ。仕事で依頼のあったWebページも左寄せの文字が中央揃えになったりしたので、ちょっと使えない感じでした。「内容が分かりさえすれば多少のことは気にしない」というような需要であればこの方法は使えると思います。

f:id:bliblibli-fu:20210808101501p:plain

さてと、次の方法を考えましょうかね・・・。

Acrobatの「WebページからPDFを作成」

Acrobatには最初から「WebページからPDFを作成」という便利機能がついていたんですよね。知りませんでした。「複数レベルをキャプチャ」からどの階層まで対象とするかも選べます。便利すぎる・・・。

f:id:bliblibli-fu:20210808102306p:plain

ただ、当然と言えば当然なんですが、変換はAcrobatに依存しますのでレイアウトが崩れることがママあります。残念クオリティ。

f:id:bliblibli-fu:20210808102501p:plain

つまり、Acrobatではなく、「印刷からPDF書き出しするルートを通らないといけない」ということが分かりました。

ブラウザから一括印刷できないか?

GoogleChrome、Edge、FirefoxSafari・・・ブラウザに一括印刷機能はないか調べました。それぞれのブラウザに拡張機能としてAcrobatを入れることもできますが、今回はこれが使えないという状況です。

Safariにそれができそうなことが書いてあるのもみたんですが、残念ながらWindowsだったので、これも×です。

Firefoxに改造したアドオンを入れるとできるというのもありましたが、件のアドオンのページがなくなっていましたので、これもできません。

ここまで調べてきましたが意外なブラウザに光明が見えました。それは・・・

 

f:id:bliblibli-fu:20210808103455p:plain

 

IEには「リンクドキュメントをすべて印刷する」というオプションがデフォルトで用意されている。

 

f:id:bliblibli-fu:20210808110506p:plain

すぐ確認しました。

f:id:bliblibli-fu:20210808110557p:plain

マジだった。

なんだよ、これでできんじゃん。

これならヘッダー・フッター・ページサイズも自由に決められるじゃん。

f:id:bliblibli-fu:20210808110729p:plain

yしかも今回の依頼は「ある期間」の記事のPDF化。ページ内すべてのリンクは必要ないのです。100ページ中の50ページが必要な場合、不要な50ページを削除しないといけませんし、上部にあるサイト内のメニューリンクもいりません。

この場合Web保存した一覧用のHTMLから不要な部分を削除しておけばよいのです。

例えばリスト3からリスト9を使いたいとします。

f:id:bliblibli-fu:20210808111543p:plain

f:id:bliblibli-fu:20210808111755p:plain

メモ帳とかで開いて↑の青い部分だけにすればよいのです。

↓ このような感じです。

f:id:bliblibli-fu:20210808111915p:plain

f:id:bliblibli-fu:20210808112048p:plain

とてもシンプルになりました。

f:id:bliblibli-fu:20210808112221p:plain

この辺とか要らないや。空にしとこ。(最初「そら」って読んだ・・・)

f:id:bliblibli-fu:20210808112503p:plain

f:id:bliblibli-fu:20210808112519p:plain

ページごとに次々と保存し始めます。

f:id:bliblibli-fu:20210808112934p:plain

 

無事に書き出されたのがこちら。

なかなかいい感じにできました。

f:id:bliblibli-fu:20210808112620p:plain

 

どうでしょうか?

Web内の複数ページを印刷・PDF化するときの参考になれば幸いです。