気になる技術ニュースや読んで面白かった書籍を綴るブログです。主目的はログを残すこと
Javaプログラミング勉強の連載企画第0.5回目です。

いっこうに第1回になりませんが、今日はテーマの決定とまたまた準備です。

テーマですが、何にしようかいろいろ検討した結果、私が学生のときに研究していた「強化学習」をやろうと思います。
強化学習の唯一と言っても良い教科書である「Reinforcement Learning, Richard S.Sutton and Andrew G.Barto」を順に追って行こうと思います。
ちなみに、訳書がありますが、訳がところどころ(?)の位置があるので、本当は原書を読まれるのがおすすめです。

Javaの勉強をしつつ、強化学習の復習をしようと思っているわけですな。




まず、「強化学習」ですが、簡単に説明すると、機械学習の一つの手法です。機械学習というのは、一般的にいう人工知能みたいなものです。私個人としては、人工知能という言葉はすごいものを想像されてしまうイメージがあるのでちょっときらいなんですがね・・・

で、どんなもんかというと、try&errorですな。
ある行動規則に従って行動した結果、何らかの報酬が得られ、その報酬が良い報酬だったらその行動規則の通りもう一回やるみたいな感じです。報酬の大小によって、行動を強化するというものです。

ざっと簡単に説明するとこんな感じですかね?ざっと説明し過ぎですかね・・・
いろいろ突っ込みありましたらコメント入れてください。また、作ったソースは基本的にアップしようと思うのですが、フリーソフトなので、自由に使っていただいてOKです。一応断っておきます。

で、今日やった準備ですが、グラフとか入れたいので、matlabを入れたいなーと思ったのですが、高価なので、matlabライクなフリーソフトである「FreeMat」を入れました。
schilab入れようと思っていたのですが、Macバージョンが無かったので探してみたらFreeMatなるソフトを発見しましたので導入してみました。

FreeMatのインストールはとっても簡単でした。公式サイトからダウンロードしてきたら、即実行可能形式になってたので、ダブルクリックで起動完了です。
簡単ですなー

では、次回からまっとうにプログラミングを勉強していこうかなと思います。よろしかったら見てください。

テーマ:プログラミング - ジャンル:コンピュータ


管理者にだけ表示を許可する
http://adrift0engineer.blog18.fc2.com/tb.php/32-39e927be
この記事にトラックバックする(FC2ブログユーザー)
// HOME // 
Powered By FC2ブログ. copyright © 2005 科学技術ニュースログ all rights reserved.
ブログマスター紹介

技術者@漂流中

Author:技術者@漂流中
とある企業の研究所に在籍中。技術を追っかけていこうと日々邁進中です。
あ、あと、ガンダム好き。GCBでジオン軍少佐

最近の記事
フリーエリア

いろいろブログパーツをテストしてみるエリア

最近のコメント

最近のトラックバック

月別アーカイブ
カテゴリー
ブログ内検索

RSSフィード
リンク
By FC2ブログ

今すぐブログを作ろう!

Powered By FC2ブログ

ブロとも申請フォーム