アーカイブ

記号の将棋  機械学習による評価関数

07311718_007

私は囲碁は少しやりますが、それでも1級に届くかどうかです。将棋となると殆ど解かりません。しかし、2007年4月21日HNK・BS2で放映された将棋のトッププロと将棋ソフトのトップが平手で対戦した記録「運命の一手 渡辺竜王VS人工知能・ボナンザ」は非常に面白いものでした。約1時間半の長尺のドキュメントですが、時間を感じませんでした。人間のチャンピオンが”人工知能”と称されるコンピュータに負けたのは1997年当時のChessの世界チャンピオン・ガルリ・キモビッチ・カスパロフ(Гарри Кимович Каспаров, Garry Kimovich Kasparov)がIBMの当時のChess専用スーパーコンピュータ・Deep Blueに1勝2敗3引き分けと負け越したのが最初です。何故当時莫大な費用かけIBMが専用スパーコンピュータを製作した理由ですが、表題に掲げた機械学習にも絡んで来るのですが、現在注目を浴びつつあるデータマイニングの有用性を実証するためだった訳です。そして数量化予想にも関係して来るのです。

ところで、私がChessソフトに触れたのは、恐ろしい事に、そうでも無いかも知れませんが、APPLEⅡを購入した1978年の翌年の事です。ソフト名はmicro chess 2.0です。今でも手元にガリ版刷りの解説(The magazine for 6502 computer families! Lab.letters march 1979 Vol3 No3)が有りますが、一応対戦可能ソフトになっています。アンパッサン(通過捕獲)、Castling、check、check mate、Stale mate、パーペチュアル・チェック(千日手)などが取り上げられています。あれから約28年、感慨深いものがあります。後日談として、詳しくは知りませんが、APPLEⅡのハードを使用したプログラムで当時のスパーコンピュータと互角に渡り合った猛者もいたようです。

話が横道にそれて申し訳ない。本筋に戻して、番組に一点疑問があります。番組では全幅検索がコンピュータの能力として強調されていましたが、この将棋ソフト(Bonanza)の真に衝撃的なところは機械学習の成果を実装して有効に働かせた事です。Bonanzaが出現する以前は”評価関数”に関して人力あるいは簡単な数式で求めていたのですが、Bonanzaでは人間の主観によって評価値を決めるのでは無く、プロの手筋を自動学習して決めていた訳です。私としても機械学習を完全には理解できませんが、ラグランジェの未定乗数法が使われているとされていますので、これは大規模な連立一次方程式を解く事に繋がり、ここで私の競馬予想に使用している数量化1類の解法と通暁してくる訳です。余談ですが、Bonanza自身に機械学習のプログラム(評価関数)が組み込まれている訳では無いでしょう、組み込まれているのは高速アクセス可能なユニーク数(重複の無い唯一の整数—これもややこしい概念です)を使った評価値のハッシュテーブルとなるかと思います。

※画像は内容とは無関係ですが、長めの文章の時に味付けとしてアップします。画材は野地温泉に行く途中の何とか…忘れた…と言うところです。

Leave a Reply

 

 

 

You can use these HTML tags

<a href="" title=""> <abbr title=""> <acronym title=""> <b> <blockquote cite=""> <cite> <code> <del datetime=""> <em> <i> <q cite=""> <strike> <strong>