遺伝子のSNSが犯罪捜査に活用される!遺伝子系図サイトで見知らぬ親戚を見つけ出せるように

2018年になって、過去の未解決事件がいくつも解決されています。

代表的な例は1970年代にアメリカで起きたゴールデン・ステート・キラー事件。これを皮切りに、数か月の間で長らく未解決だった凶悪事件が次々に解決されてきました。

これをもたらしたのは警察の捜査技術に起きたイノベーション……ではなく、遺伝子系図サイトという、ごく一部の愛好家に向けた趣味の民間ウェブサイト。

もともと警察とは縁もゆかりもなかった遺伝子系図サイトは、今では犯罪捜査の未来を創るとまで言われています。この記事では、遺伝子系図サイトが注目されるようになった経緯、従来の犯罪捜査手法から見た意義を解説していきます。

遺伝子系図サイトとは

遺伝子系図サイトとは、自分のDNA情報をアップロードし、同じようにアップロードした別のユーザーと照合してつながりを探って家系図作りの補助とするためのサイトです。

代表的なものは、前述のゴールデン・ステート・キラー事件解決にも使われたGEDmatch。ユーザーは遺伝子検査サービスの検査結果データをアップロードし、その情報をもとにGEDmatch上の他のユーザーと血縁関係を照合できます。

これはもともと系図学を修める人に向けたサービスです。系図学とは親子関係・親戚関係を明らかにして家系図を作成する学問で、研究者やアマチュアを含め、GEDmatchには数多くの人がDNAデータを登録していました

あくまで一部の人に向けた趣味のサイトですが、2018年初頭の時点で100万人ほどのユーザーがデータを登録していたといいます。そんな趣味のサイトが有名な未解決事件解決の決め手になったことは、驚きをもって迎えられました。

ゴールデン・ステート・キラー事件

遺伝子系図サイトが注目されるきっかけとなったゴールデン・ステート・キラー事件は、1974年から1986年にかけて起こった、同一犯による複数の凶悪事件を指します。カリフォルニア全土で足かけ10年以上に渡り、わかっているだけでも100件以上の強盗、13人の殺害に関与しています。

事件はもともと複数の犯人が起こした個別の事件だと考えられていました。しかしさまざまな目撃証言や記録を検証したところ、2000年代に初頭に単独犯による犯行だということが判明。この時点でいくつもの目撃証言、似顔絵、ひいてはDNAまで証拠として収集されていたにもかかわらず、犯人はその後もなお20年近く逃げ続けることとなります

従来の科学捜査の弱点

州警察は犯人のDNAまで回収していたにもかかわらず、どうして今まで解決できなかったのでしょうか。

そのことは、警察が行えるDNA検査の弱点に直接関わっています。

警察で採用されていたDNA検査は、犯人のDNAを採取してそれを警察のDNAデータベースと照合し、本人あるいは近親者を割り出すというもの。

これには2つの制約がありました。1つは、近しい家族か本人としか照合できなかったこと。

アメリカでは短鎖縦列反復整列という古い手法が使われていました。

これは人間のDNA内に存在するDNA配列の反復箇所を比較するという方法です。この反復箇所は親から子へと確実に受け継がれるため、DNAを元に近しい血縁関係を正確に割り出すことができます。

その一方、割り出せるのは親兄弟などに限られてしまいます。例えば警察のデータベースにいとこやまたいとこなど比較的遠い親戚がいたとしても、この方法では血縁者関係を割り出せないのです。

もうひとつは、警察のDNAデータベースの偏りです。

警察のDNAデータベースに登録されるのは、何らかの容疑をかけられて逮捕された人間だけ。ということは、データベース内から犯人の手がかりを探るには、犯人あるいはその親兄弟が過去に警察に逮捕されていなければ不可能です。

警察という組織の性質上、犯罪の容疑者の枠を超えて広くDNA情報を収集するのは難しいもの。そのため警察のDNA鑑定が成功するには、偏りのあるデータベースの中にごく限られた人物が登録されているという条件が満たされていなければなりません。犯罪捜査に大きく貢献するDNA検査でも、この条件が満たされない限りは無力なのです

遺伝子家系図サイトの活用

遺伝子系図サイトの活用は、DNA鑑定の弱点を見事に解決する妙手でした。

遺伝子系図サイトの強みは、データベースの偏りが少なく、かつデータ量が多いことです。逮捕歴のある人物しか登録されていない警察のデータベースとは違い、民間の遺伝子検査を受けたことのある人なら誰でも登録できます

ゴールデン・ステート・キラー事件の捜査に使われたGEDmatchのユーザー数は現在時点でおよそ100万人ほどと見積もられています。

単純な人数で言えば警察のデータベースの方が多いのですが、民間のデータベースは個人ごとのデータ量で差をつけています

多くの民間の遺伝子検査ではSNP(スニップ)を測定します。SNPとは個人間でDNAが異なっている場所を指し、これを数十万単位で解析することで体質や病気リスクを測定するのです。膨大なスニップのデータが収録されているこちらのデータは、個人のゲノムについてより幅広い情報を得られるという点で、警察のデータベースより有利なのです。

スニップのデータはより詳細な情報源となるので、遠い親戚同士のつながりを照合することができます。この点こそ、遺伝子系図サイトの大きな強みです。

兄弟の数は一般にせいぜい数人、いとこまで数えても多くて十数人にとどまります。しかし親戚は遠くなればなるほど爆発的に数を増し、5代前、6代前の先祖が同じという親戚を辿っていけば、その数は数百人数千人という規模になっていきますGEDmatchのデータを使えば、曾々々祖父母が同じ親戚(よいとこ)周辺までなら高い正確度で関係を照合できます

ある個人のよいとこ(曾々々祖父母が同じ親戚)は一般に数百人いるので、その中の誰かがGEDmatchに登録している可能性は十分に高いのです。実際にゴールデン・ステート・キラー事件では、GEDmatchに登録されたデータを使い、犯人のよいとこを10数人割り出しています。

捜査班はそのつながりを起点にして犯人周辺の家系図を作り出し、高い確率で犯人であると考えられる人物を特定。最終的にその人物のDNAを手に入れて犯人のものと照合し、その結果見事に一致したことで、長年の未解決事件は幕を閉じました。