雪の話題も届き、本格的な冬が来た感じですが、皆様のエリアではいかがでしょうか?

さて、GPGPU(多目的グラフィック・プロセッシング・ユニット)というゲーム用のグラフィックLSIやボードを搭載したパソコンがあります。

このところ、この演算LSIを使って統計解析を行うようなプログラム開発に取り組んでいます。

400バイト前後の長さの数値データが数千万件あり、1対1千万件の類似性を評価するのに、普通のCPUを使ったパソコンで1~2分程度かかるところを、アルゴリズムの改良を含めてGPUボードで10秒ぐらいまで短縮できました。これだけ見ているとすごそうに見えます。

でも、1対多でなく、多対多、ここでは、1千万件の総当たりでどれだけ似ているかを計算しようとすると、10秒×1千万件/2となり、578日程度計算時間が必要という試算結果です。このままでは、まだ使い物になりません。あと100倍ぐらい高速に処理する必要があります。

総当りは、2つのデータの組合せで、Nの2乗のオーダーですから、まだ序の口ですが、データの組合せの多い世界は、本当に大変と最近は感じます。

近似解を得るのがやっとの世界がたくさんありますね。早く量子コンピューターが使えるようにならないかな、と思います。