スラッシュドット・ジャパン: 政府、個人情報を匿名化して売買するためのルール作りを検討 ~ ルールは有難いが、どこまでカバーできるか?

スラッシュドット・ジャパン: 政府、個人情報を匿名化して売買するためのルール作りを検討.

先日来、個人情報を含む実際のデータの扱いについて、悩むところがあっていろいろな人と議論した。具体的には、たとえばある学生の様々な履歴を一元管理してそこから何らかの傾向を引き出そうとか、たとえば様々なカルテデータを一元管理して傾向を引き出そうとか。 どちらも、一人一人のデータを時間軸で串刺しにして見渡す、というのがミソで、そのために既に蓄積されている様々なデータ(学生の場合で言えば、高校の学習記録、大学入試成績、大学内での学習記録、就職、就職後の履歴など)を、個人ごとに串刺しで眺め渡したい。その情報から、1つは全体を見てある程度グループ分けできるのではないか、典型を取り出すことができるのではないか、ということと、もう1つは1人1人のカウンセリング等の入力情報にできないか、ということ、の2つの用途が考えられる。

このようなことをやろうと思うと、それぞれのデータベース(高校の、大学入試の、大学成績の、就職の、そして就職先の履歴)を、個人を識別しつつ抜き出さなければならない。 これはまさに個人情報である。 それぞれのデータの管理者が、個人情報保護を盾にとって、個人と結びつく形の情報は不可、となると、串刺しはできなくなる。

要するに、串刺しをしようとすると、個人情報の壁を越えなければならず、1人1人の対象者からそれぞれのデータについてOKを貰うとなると、統計的な傾向を見出すに足りるだけの多数データは入手できないだろう。

そう、こういう分析では、別に、個人IDが実存の個人と結びついている必要はない。ただ、集団の中で特定でき、その特定を基にして串刺しをしたいだけであって、串刺しが終われば個人IDは必要がなくなるという類のものである。 でも、現状ではハードルはかなり高い。

この記事にあるような議論で、どのようなコンセンサスが得られるのだろうか?

ちなみに、今強力に行われているのは、ターゲットマーケティングだろう。その個別ユーザに関するデータとして使うには、買い取ったデータのIDと自分の持つ顧客システム内でのIDが結びつかなければならないだろう。 具体的には、たとえばAさんのX社での購入履歴をY社が買い取れれば、Y社がターゲットマーケティングに直結できるだろう。 この場合も、Aさんの物理的なアイデンティティと、顧客IDとは結びつく必要は必ずしもないのだが、とにかく同じ人だという情報は欲しい。 そのような場合もうまくいくような「匿名化」は可能だろうか? また、その場合に、ユーザはX社がY社へ情報を売ることをを是とするだろうか? それとも、今回カバーされるのは、まったくアノニマスな情報だけなのだろうか?