まず、「強化学習」ですが、簡単に説明すると、機械学習の一つの手法です。機械学習というのは、一般的にいう人工知能みたいなものです。
私個人としては、人工知能という言葉はすごいものを想像されてしまうイメージがあるのでちょっときらいなんですがね・・・で、どんなもんかというと、try&errorですな。
ある行動規則に従って行動した結果、何らかの報酬が得られ、その報酬が良い報酬だったらその行動規則の通りもう一回やるみたいな感じです。報酬の大小によって、行動を強化するというものです。
ざっと簡単に説明するとこんな感じですかね?
ざっと説明し過ぎですかね・・・いろいろ突っ込みありましたらコメント入れてください。また、作ったソースは基本的にアップしようと思うのですが、フリーソフトなので、自由に使っていただいてOKです。一応断っておきます。
で、今日やった準備ですが、グラフとか入れたいので、matlabを入れたいなーと思ったのですが、高価なので、matlabライクなフリーソフトである「
FreeMat」を入れました。
schilab入れようと思っていたのですが、Macバージョンが無かったので探してみたらFreeMatなるソフトを発見しましたので導入してみました。
FreeMatのインストールはとっても簡単でした。公式サイトからダウンロードしてきたら、即実行可能形式になってたので、ダブルクリックで起動完了です。
簡単ですなー
では、次回からまっとうにプログラミングを勉強していこうかなと思います。よろしかったら見てください。
テーマ:プログラミング - ジャンル:コンピュータ