2016年3月15日 17:53
富士通研、データベース上でゲノム情報の解析処理を400倍高速化する技術
で格納するデータ構造で、各バリアントの情報を固定ビット長にコード化して格納する。バリアントを1列に格納することにより、ひとつの問い合わせで同時に集計することが可能になり、1バリアントあたりの集計処理性能が大幅に向上する。
また、バリアントの大半は、計算機上で2ビット長のコードに置換することができるが、3ビット以上の複雑なコードに置換されるバリアントも多数ある。したがって、従来は複数のビット長が存在する可変長データを扱う必要があったが、今回同社は、このような可変長データを、固定ビット長構造を崩さずに格納して集計処理する方式を考案し、高速な集計処理を実現。さらにバリアントのコード化により、文字列でバリアントを格納する場合に比べ、ゲノム情報サイズが1/16に削減されるため、数十万人規模の大規模データについてもインメモリで高速に処理することが可能となっている。
同社は今後、さらなる集計処理の高速化および運用上必要となる機能の実装を進め、医療機関との共同研究、倫理審査を経て、同社ヘルスケアシステム事業本部のソリューションに適用する予定であるとしている。
「隣の空き地はうちのもの同然だろ」所有していないスペースを”無断使用”する隣人!?後日…→【予想外の天罰】が下り、顔面蒼白!?