【Webのこと】複数のWebページをPDF書き出ししたい
Webサイトの見た目のままで記事掲載したい、とりあえずこの期間の記事を全部PDFにしてほしい(その中から掲載記事抜粋する)という仕事がありました。
※記事は取捨選択してから入稿しましょう。
仕方ないので手法を検討しました。
素直にやろうとすると、ページを開く・印刷からPDF書き出しを記事数分繰り返す、となります。
Webサイトを保存・Acrobatで結合
Webページは、右クリック→名前をつけて保存、もしくは、Ctrl+S、でWebページを構成すものすべてを保存することができます。
つまりWebサイトまるごと保存すれば中の画像も動画も簡単に手に入れることができちゃうんですよね。モラル的にそんなことしないけどね!
今回は仕事の依頼なので保存してみました。画像はダミーです。
保存したWebページのフォルダの中を「html」で検索して右クリック→Acrobatで結合します。
Acdrobatを持っていない人でも、フリーのアプリでPDFを作ることは可能です。例えばWondershare PDFelementなどで、こちらは無償体験版でも一括処理からPDF作成もできますが、ファイルを保存すると透かしが入ります。
話は脱線しましたが、Acrobatで結合したPDFですが、変換はAcrobatに依存しますのでレイアウトが崩れることがママあります。残念クオリティ。仕事で依頼のあったWebページも左寄せの文字が中央揃えになったりしたので、ちょっと使えない感じでした。「内容が分かりさえすれば多少のことは気にしない」というような需要であればこの方法は使えると思います。
さてと、次の方法を考えましょうかね・・・。
Acrobatの「WebページからPDFを作成」
Acrobatには最初から「WebページからPDFを作成」という便利機能がついていたんですよね。知りませんでした。「複数レベルをキャプチャ」からどの階層まで対象とするかも選べます。便利すぎる・・・。
ただ、当然と言えば当然なんですが、変換はAcrobatに依存しますのでレイアウトが崩れることがママあります。残念クオリティ。
つまり、Acrobatではなく、「印刷からPDF書き出しするルートを通らないといけない」ということが分かりました。
ブラウザから一括印刷できないか?
GoogleChrome、Edge、Firefox、Safari・・・ブラウザに一括印刷機能はないか調べました。それぞれのブラウザに拡張機能としてAcrobatを入れることもできますが、今回はこれが使えないという状況です。
Safariにそれができそうなことが書いてあるのもみたんですが、残念ながらWindowsだったので、これも×です。
Firefoxに改造したアドオンを入れるとできるというのもありましたが、件のアドオンのページがなくなっていましたので、これもできません。
ここまで調べてきましたが意外なブラウザに光明が見えました。それは・・・
IEには「リンクドキュメントをすべて印刷する」というオプションがデフォルトで用意されている。
すぐ確認しました。
マジだった。
なんだよ、これでできんじゃん。
これならヘッダー・フッター・ページサイズも自由に決められるじゃん。
yしかも今回の依頼は「ある期間」の記事のPDF化。ページ内すべてのリンクは必要ないのです。100ページ中の50ページが必要な場合、不要な50ページを削除しないといけませんし、上部にあるサイト内のメニューリンクもいりません。
この場合Web保存した一覧用のHTMLから不要な部分を削除しておけばよいのです。
例えばリスト3からリスト9を使いたいとします。
メモ帳とかで開いて↑の青い部分だけにすればよいのです。
↓ このような感じです。
とてもシンプルになりました。
この辺とか要らないや。空にしとこ。(最初「そら」って読んだ・・・)
ページごとに次々と保存し始めます。
無事に書き出されたのがこちら。
なかなかいい感じにできました。
どうでしょうか?
Web内の複数ページを印刷・PDF化するときの参考になれば幸いです。