eディスカバリーにおける画像ファイルの対応(ESI Culling)

ESI(電子情報)には、メールや文書ファイルのようなテキストファイルだけでなく、大量の画像ファイルも含まれている。eディスカバリーのデータ収集、データ処理・加工の工程において、画像ファイルはどのように対処すればいいのだろうか?
テキストファイルであれば、キーワード検索による絞り込みによって、容易に対象範囲を絞り込むことは可能だが、画像ファイルはそもそもキーワード検索ができない。不要な情報をデータ収集することは、後の工程で無駄なコストを発生させるし、必要なデータを除去(ESI Culling)してしまうことは、証拠隠蔽行為(Spoilation)につながる恐れがある。
ここでは、画像ファイルの対応について、いくつかのヒントを紹介しよう。
・メタデータに対するキーワード検索による絞り込み
画像ファイルには、通常、作成日、撮影日、作成者など、ソフトまたはハードによって埋め込まれたメタデータが存在する。このメタデータに対し、キーワード検索を行って、情報を絞り込むことが可能だ。
・日付範囲、画像種類によるデータ除去(Culling)
撮影日などの日付を利用し、日付の範囲で画像を絞り込むことが可能だ。
・OCRソフトの使用によるキーワード検索
画像ファイルに対して、OCRソフトを使い、画像にファイルに含まれるテキストを読み込み、キーワード検索をかけることが可能だ。画像の品質にもよるため、完璧な認識は不可能だが、それでも95%以上の認識率を維持できる。
上記の手段を組み合わせることで、画像ファイルについても電子情報除去(ESI Culling)を行い、eディスカバリーのコスト削減を期待することができる。