ビックデーターをどうとり扱うか?(本当は、ただの統計勉強法です。)

ここではビックデーターにどう立ち向かうかではなく。 その前の段階、統計学を一般的に学ぶにはどの本を読めば近道かを述べます。 ゼロからの統計学学習方法です。 まず、まったく知識のないものには、統計のみかた(三省堂)で統計学とは、 どういうものなかを知ります。次に「統計のはなし」日科技連を読みます。 この辺はだいたいこんなものだと言う感じをつかんでもらえばいいと思います。 やっと本格的な本「楽しく学べる統計教室」現代数学社には、本格的な数式が出ています。 しかしながら、やさしい数式で書かれています。 それで、物足りない方は、「数理統計学」「入門数理統計学」など 深く数学に入りこんだ本があります。 もっとも、数学にのめり混みたいひとには「確率・統計入門」岩波書店をお勧めします。 この本には、どのようにしてF分布だとかカイ2乗分布ができるのか、証明が書いてあり 古い本ではありますが。もっともやっかいな本であります。 私はなんとこのもっともやっかいな本から大学時代勉強してしまいました。 おかげで、とんでもない遠まわりをしてしまいました。 本を読む順番をまちがえるととんでも無い事なります。 ひととり統計学の基本を見につけると、実験計画法、多変量解析、遺伝的アルゴリズム ノンパラメタリック法、回帰分析、有意検定など大きな原野が広がっています。 ビックデーターに立ち向かうには、ベイズ法だけでなくこれらを融合し 立ち向かうと言ってしまえば、あたりまえです。 これらの手法を全部やってみて、その成果をまた、統計学的に分析する手法など どうでしょうか?人間の直感とどっちが勝つかみものです。 最近、コンピューターが棋士に勝っています。その手法は評価関数によるものですが 人工知能ですね、量子コンピューター内臓のそれを考えましょう。