2019年5月9日木曜日

人工知能時代の確率・統計の学び方

人工知能の燃料は、ビッグデータです。すなわち統計なくして人工知能は動きません。
燃料を力に変えるエンジンが、数学です。エンジンが変われば、得られる力も変わります。
そしてそれらを制御するのがプログラミング。規則正しく事を進めるための仕様書です。
すなわち「統計+数学+プログラミング=人工知能」と言っても過言ではありません。

統計で大事なのは「社会を見る目線」です。数字の処理より、むしろ感性が大事です。
また、ここでの数学の使い方は、理論をはめ込むことです。計算は機械がやります。
そして、プログラミングは言語です。それは翻訳作業・編集作業に似ています。
ですから人工知能に文系も理系もないのです。それは今どきの一般教養であっていい。

人工知能を理解するための近道は、統計を学ぶことです。結局そこが本質ですから。
数学やプログラミングから入ると、人工知能に行きつくのはだいぶ先になるでしょう。
統計を学ぶには、エクセルでやるのが一番です。理屈だけではピンとこないでしょう。
というわけで「エクセル→統計→人工知能」の順番で進めるのが効率的かつ効果的です。

確率と統計は似ています。けれども、高校の確率と統計はむしろ真逆だとも言えます。
高校の確率では「サイコロ=1/6 , じゃんけん=1/3 , コイン=1/2」から話が始まります。
つまり高校の確率では「大元が与えられて、そこから具体例を計算する」わけです。
それに対して「周辺情報から大元を探る」のが統計です。その意味で真逆なのです。

「周辺情報から大元を探る」というのは、要するに「条件付き確率」を計算すること。
もう一つ、高校の確率の中で人工知能を理解するために必要なのは「期待値」です。
要するに、情報に「重み付け」するわけです。その考え方・計算法は期待値と同じです。
条件付き確率も期待値も教科書での扱いは小さいですが、それこそが将来役立ちます。

情報の重み付けとは、一律に受け取るのではなく、強弱をつけて受け取ること。
生物の脳も人工知能も同じです。忘れることやぼんやり見ることは大事な機能です。
そこから意味が出てくるからです。そしてそれをなしているのがディープラーニング。
ビッグデータを元にして、情報の重み付け、すなわち「係数」を決めているのです。

数学が嫌い・苦手だという人こそ、統計とプログラミングと人工知能を学びましょう。
数学は「抽象的で非現実的でどこで役に立つかわからない」と言う人がいます。
確かに受験数学と一部の授業にはそういう面があるかもしれません。残念ながら。
でも、統計とプログラミングと人工知能は十分に「具体的で現実的で実用的」ですよ。

0 件のコメント:

コメントを投稿