Information/Sensibility
近年、DNAチップ技術の進展により、様々な実験条件下における遺伝子発現データが大量にもたらされ、GEO(Gene Expression Omnibus)などの公共データベースに急速に蓄積されつつある。癌などの難病に関する大規模遺伝子発現データを対象として疾患の 原因となっている遺伝子群を高精度で発見する情報解析技術の開発を目指す。
従来、大規模な遺伝子発現データを対象としてモジュールを見つけ出すには膨大な組み合わせのチェックが必要であったため現実的な時間内に探索することは不可能であった。本来膨大な商品購買データを対象として複数の顧客から同時に購 入される商品群(飽和集合)を見つけ出す方法として用いられる「飽和集合列挙法」と呼ばれる高速データマイニングを置き換え利用することにより超高速かつ網羅的にモジュールを発見することに成功。飽和集合の網羅列挙アルゴリズムとして世界最速のLCM(Linear time Closed itemset Miner)を用い、更に独自のデータ圧縮技術により、高速化と省メモリを実現している。
飽和集合列挙法により、現実的な時間内でモジュ ールの網羅探索を実現。
確率論的またはヒューリスティックに基づく方法は近似解としてのモジュール探索であったが、網羅探 索により高精度で生物学的に有用なモジュール抽出が可能となった。
生理データ解析、音声識別、情報推薦技術などの分野に特化した新規データマイニング技術の開発。
心理状態に関わる遺伝子モジュールデータベース
乳児の病理音声診断システム