今年も暑い夏が続いていますが、いかがお過ごしでしょうか?台風もたくさん発生していて気になるところです。

話題が変わりますが、8月の初めに、東芝と統数研が、欠測値補完とLASSOという変数選択をまとめて処理する解析ツール「HMLasso」を公開しました。────────────────────────────────東芝:大量の欠損を含むデータからでも不具合の要因を特定する機械学習アルゴリズム(AI)を開発https://www.toshiba.co.jp/rdc/detail/1908_01.htm────────────────────────────────

統計解析では、欠測値があった場合、そのサンプルから取られたデータを捨てるか、または周りのデータの統計的な特徴を使って合理的に推定し、見かけ上、形を整えてから回帰分析を行うというのがこれまでの流れでした。

彼らが開発した解析ツールは、R言語という統計解析のサイトから誰でもダウンロードして使えます。

これからの人たちは、少々欠測があってもほとんど気にせず統計解析の答えが得られるわけですね。現場で実験し、データを測定する感覚がすごく変わりそうな気がします。