2018年になって、過去の未解決事件がいくつも解決されています。
代表的な例は1970年代にアメリカで起きたゴールデン・ステート・キラー事件。これを皮切りに、数か月の間で長らく未解決だった凶悪事件が次々に解決されてきました。
これをもたらしたのは警察の捜査技術に起きたイノベーション……ではなく、遺伝子系図サイトという、ごく一部の愛好家に向けた趣味の民間ウェブサイト。
もともと警察とは縁もゆかりもなかった遺伝子系図サイトは、今では犯罪捜査の未来を創るとまで言われています。この記事では、遺伝子系図サイトが注目されるようになった経緯、従来の犯罪捜査手法から見た意義を解説していきます。
遺伝子系図サイトとは
遺伝子系図サイトとは、自分のDNA情報をアップロードし、同じようにアップロードした別のユーザーと照合してつながりを探って家系図作りの補助とするためのサイトです。
代表的なものは、前述のゴールデン・ステート・キラー事件解決にも使われたGEDmatch。ユーザーは遺伝子検査サービスの検査結果データをアップロードし、その情報をもとにGEDmatch上の他のユーザーと血縁関係を照合できます。
これはもともと系図学を修める人に向けたサービスです。系図学とは親子関係・親戚関係を明らかにして家系図を作成する学問で、研究者やアマチュアを含め、GEDmatchには数多くの人がDNAデータを登録していました。
あくまで一部の人に向けた趣味のサイトですが、2018年初頭の時点で100万人ほどのユーザーがデータを登録していたといいます。そんな趣味のサイトが有名な未解決事件解決の決め手になったことは、驚きをもって迎えられました。
ゴールデン・ステート・キラー事件
遺伝子系図サイトが注目されるきっかけとなったゴールデン・ステート・キラー事件は、1974年から1986年にかけて起こった、同一犯による複数の凶悪事件を指します。カリフォルニア全土で足かけ10年以上に渡り、わかっているだけでも100件以上の強盗、13人の殺害に関与しています。
事件はもともと複数の犯人が起こした個別の事件だと考えられていました。しかしさまざまな目撃証言や記録を検証したところ、2000年代に初頭に単独犯による犯行だということが判明。この時点でいくつもの目撃証言、似顔絵、ひいてはDNAまで証拠として収集されていたにもかかわらず、犯人はその後もなお20年近く逃げ続けることとなります。
従来の科学捜査の弱点
州警察は犯人のDNAまで回収していたにもかかわらず、どうして今まで解決できなかったのでしょうか。
そのことは、警察が行えるDNA検査の弱点に直接関わっています。
警察で採用されていたDNA検査は、犯人のDNAを採取してそれを警察のDNAデータベースと照合し、本人あるいは近親者を割り出すというもの。
これには2つの制約がありました。1つは、近しい家族か本人としか照合できなかったこと。
アメリカでは短鎖縦列反復整列という古い手法が使われていました。
これは人間のDNA内に存在するDNA配列の反復箇所を比較するという方法です。この反復箇所は親から子へと確実に受け継がれるため、DNAを元に近しい血縁関係を正確に割り出すことができます。
その一方、割り出せるのは親兄弟などに限られてしまいます。例えば警察のデータベースにいとこやまたいとこなど比較的遠い親戚がいたとしても、この方法では血縁者関係を割り出せないのです。
もうひとつは、警察のDNAデータベースの偏りです。
警察のDNAデータベースに登録されるのは、何らかの容疑をかけられて逮捕された人間だけ。ということは、データベース内から犯人の手がかりを探るには、犯人あるいはその親兄弟が過去に警察に逮捕されていなければ不可能です。
警察という組織の性質上、犯罪の容疑者の枠を超えて広くDNA情報を収集するのは難しいもの。そのため警察のDNA鑑定が成功するには、偏りのあるデータベースの中にごく限られた人物が登録されているという条件が満たされていなければなりません。犯罪捜査に大きく貢献するDNA検査でも、この条件が満たされない限りは無力なのです。
遺伝子家系図サイトの活用
遺伝子系図サイトの活用は、DNA鑑定の弱点を見事に解決する妙手でした。
遺伝子系図サイトの強みは、データベースの偏りが少なく、かつデータ量が多いことです。逮捕歴のある人物しか登録されていない警察のデータベースとは違い、民間の遺伝子検査を受けたことのある人なら誰でも登録できます。
ゴールデン・ステート・キラー事件の捜査に使われたGEDmatchのユーザー数は現在時点でおよそ100万人ほどと見積もられています。
単純な人数で言えば警察のデータベースの方が多いのですが、民間のデータベースは個人ごとのデータ量で差をつけています。
多くの民間の遺伝子検査ではSNP(スニップ)を測定します。SNPとは個人間でDNAが異なっている場所を指し、これを数十万単位で解析することで体質や病気リスクを測定するのです。膨大なスニップのデータが収録されているこちらのデータは、個人のゲノムについてより幅広い情報を得られるという点で、警察のデータベースより有利なのです。
スニップのデータはより詳細な情報源となるので、遠い親戚同士のつながりを照合することができます。この点こそ、遺伝子系図サイトの大きな強みです。
兄弟の数は一般にせいぜい数人、いとこまで数えても多くて十数人にとどまります。しかし親戚は遠くなればなるほど爆発的に数を増し、5代前、6代前の先祖が同じという親戚を辿っていけば、その数は数百人数千人という規模になっていきます。GEDmatchのデータを使えば、曾々々祖父母が同じ親戚(よいとこ)周辺までなら高い正確度で関係を照合できます。
ある個人のよいとこ(曾々々祖父母が同じ親戚)は一般に数百人いるので、その中の誰かがGEDmatchに登録している可能性は十分に高いのです。実際にゴールデン・ステート・キラー事件では、GEDmatchに登録されたデータを使い、犯人のよいとこを10数人割り出しています。
捜査班はそのつながりを起点にして犯人周辺の家系図を作り出し、高い確率で犯人であると考えられる人物を特定。最終的にその人物のDNAを手に入れて犯人のものと照合し、その結果見事に一致したことで、長年の未解決事件は幕を閉じました。
事件の余波
GEDmatchを活用した鮮やかな逮捕劇を皮切りに、遺伝子系図サイトの犯罪捜査への利用はにわかに注目を集めました。
ここで問題になるのはプライバシーです。実際にGEDmatchの管理人は警察から捜査への協力を持ちかけられた際、すぐには首を縦に振りませんでした。最終的には協力することを決めたが、熟慮の末の決断だったと語っています。
この一件以来、GEDmatchは規約を改定。凶悪事件の捜査に限り犯罪捜査にデータベースの利用を許す旨を追加しました。
とはいえ意見は分かれています。現にGEDmatch以外の遺伝子系図サイトでは、犯罪捜査には活用できないことを規約に追加したものもあるほど。
このように、現状ではプライバシーと公益のトレードオフという点が論点になっています。しかしここにはもう一つ、データ収集と活用のためのインフラに関して、政府機関と民間の力関係が変わりつつあるという示唆が隠れているのです。
データが軸となる社会の関係性の変化
警察のDNA捜査は、警察が持つ権限や強制力に加えて、大規模なデータを収集・管理・活用するためのインフラ整備と人手の確保なしには成り立ちません。
何百万、何千万人という単位の人間のデータを収集・管理するということは大規模な人手を要することであり、それほどのリソースを動員できるのは従来であれば国家機構に限られてきました。
ところが近年、この状況は変化を見せつつあります。
いわゆるGAFAが経済の主導的な地位を占めているのは、データ収集と活用を洗練させ、それをもとにユーザーに対して質の高いサービスを提供しているからに他なりません。
このようにデジタル機器とネットワークの発展にともない、データの重要性は増していきました。これは同時に、民間企業でも大規模なデータの収集と管理が可能となっていったことを意味しています。
大規模なデータを確保できるのはもはや国家機構に限られません。日本政府は個人の住所変更の記録は正確にたどれても、買い物の傾向や音楽の好みについてはGoogleやAmazonの方がよほど詳しく知っています。
ゴールデン・ステート・キラー事件の捜査は、民間の、それも小規模の人員で運営される団体が、国家機関よりも良質なデータを保有していたことが明らかになった事例とは言えないでしょうか。
GEDmatchが警察の捜査能力を拡大させたように、その他の政府機関にも民間のリソースを活用することでその機能を改善させられる事例があるだろうことは想像に難くありません。今後政府による大規模データの活用がさらに推し進められるのなら、データのリソースを民間に求める事例が他にも出てくることでしょう。
その動きが進んでいくのならば、企業と国家、そして個別のデータを生み出す個人の関係は今とは違ったものになるかもしれません。趣味の家系図作りが犯罪捜査に役立っているように、ごく個人的なことがらの記録が意外な形で公益に結びつく日が来るのかもしれませんね。