隠したいところを黒塗りしたPDF文書で情報漏洩してしまう事件が時々発生しています。原因はPDF文書を画像と同じであるかのように誤認してしまうためだと思われます。しかしながら、PDF文書はテキストデータであり、黒塗りの方法によっては塗った部分に存在していた文字がそのまま残ってしまうのです。
参考までに最近の事故の例として、国立大学法人大分大学が2023年2月28日に公表した「個人情報漏えいのおそれについての公表」を挙げておきます。
さて、この件については文字で説明するのは少々難しいので、簡単な動画を作成してみました。2分45秒くらいの動画なのでご覧ください。
一般にやりがちな方法はWord等で隠したい文字を残したまま真っ黒な長方形の図形を重ね合わせて見た目で隠れている状態にしたものですが、この場合は文字が残っているためPDF文書を生成したときに図形の下の文字データもそのままテキストデータとしてPDF文書に入ってしまいます。そのため、簡単に隠れている部分の文字データを見ることが可能になるほか、インターネットから誰でもアクセス可能なサーバーに配置した場合、検索エンジンにも隠した部分の文字データを拾われてしまうため、検索可能な状態になってしまいます。
正しい方法としてはWord等で作成した文書をそのままPDF文書化して保存し、Adobe Acrobatの「テキストと画像を墨消し」機能を使って改めて隠したい文字を黒塗りにする方法になります。この場合、墨消しすべき部分のデータをPDF文書から削除しますので、他者に見られることはありませんし、インターネットから誰でもアクセス可能なサーバーに配置した場合でも検索可能な状態にはなりません。
Word上で黒塗り状態にしてからPDF文書にしたいという気持ちは理解できるのですが、PDF文書の特性を正しく理解しないと情報漏洩事故を起こしてしまうので注意が必要です。
尚、Adobe Acrobat以外にもPDF文書を加工できるアプリがありますが、それらが墨消し機能を持っているかどうかは弊社では把握しておりませんので、アプリの購入の際には御自身で機能を確認の上、適切なアプリの購入をお勧め致します。