2016年3月15日 17:53
富士通研、データベース上でゲノム情報の解析処理を400倍高速化する技術
富士通研究所(富士通研)は3月15日、ゲノム上の変異情報と疾患や生活習慣などによる環境情報との関連性をデータベース上で解析する際に、従来手法に比べて約400倍高速に処理できる技術を開発したと発表した。
現在、ゲノム医療の進展により、ゲノム・遺伝情報と臨床・環境情報を組み合わせて解析することで、遺伝要因と環境要因の関連性を探索する研究が行われている。このような研究では多様な角度から解析するためにゲノム情報をデータベースに格納して処理するが、膨大な規模のゲノムデータを扱うため、処理に時間がかかるという課題があった。
たとえば10万人の母集団データに対し、個人差の要因となる「バリアント」と呼ばれる変異箇所のひとつについて集計すると、既存のオープンソース・データベースソフトを用いた場合、約1秒の時間がかかることが同社の調査によってわかっている。したがって、1000万箇所のバリアントの集計を10万人規模の母集団で行うとすると、約120日かかる計算になる。
今回同社は、データベース上でゲノム情報の高速な集計処理を可能にするデータ構造「ゲノム型」とその処理方法を開発した。ゲノム型は1人のゲノム情報をデータベース上の1列(カラム)