modify file open option

ymgaq · ymgaq · commit 394488a6e1c4 · 2018-02-14T20:28:31.000+09:00
diff --git a/README.md b/README.md
@@ -20,11 +20,11 @@ PyaqはPythonのみで実装された囲碁プログラムです。
   
 TensorFlowの導入は[UbuntuにTensorFlowをインストール](https://qiita.com/yudsuzuk/items/092c38fee18e4484ece9)を参考にしてください。  
 TensorFlowでGPUを用いる場合は  
-- CUDA 8.0
-- cuDNN 6.0  
+- [CUDA Toolkit 9.0](https://developer.nvidia.com/cuda-90-download-archive)
+- [cuDNN v7.0](https://developer.nvidia.com/cudnn)
   
-をインストールしておく必要があります。  
-導入は[CUDA 8.0とcuDNN 6をUbuntu 16.04LTSにインストールする](https://qiita.com/JeJeNeNo/items/05e148a325192004e2cd)を参考にしてください。  
+をインストールしておく必要があります。また、nVidia製の[CUDA Capability](https://developer.nvidia.com/cuda-gpus)3.5以上のグラフィックボードが必要です。  
+CUDA導入は[CUDA 8.0とcuDNN 6をUbuntu 16.04LTSにインストールする](https://qiita.com/JeJeNeNo/items/05e148a325192004e2cd)などを参考にしてください（注：リンク先の場合とバージョンが異なります）。  
 
 次に、ソースコードをダウンロードします。  
 ```
@@ -68,7 +68,6 @@ $ ./pyaq.py --self --random
  1 X  .  X  O  O  O  O  O  .  1
    A  B  C  D  E  F  G  H  J 
 
-
 result: W+16.0
 ```
 
@@ -88,6 +87,7 @@ $ ./pyaq.py --learn
 ```
 
 GPUなしで学習させたい場合は```--cpu```オプションを追加してください。  
+（ただし、CPUのみの学習は十分にテストされていません。）  
 
 ```
 $ ./pyaq.py --learn --cpu
@@ -135,6 +135,8 @@ progress: 2.70[%] 13.4[sec]
 2.5%ごとにtestデータの評価を行います。 ```policy```は棋譜の次の手とニューラルネットワークが出力する手との一致率、```value```は棋譜の勝敗とネットワークが出力する評価値（-1~+1）の誤差（Mean Squared Error）を表します。 最終的に、testデータでpolicyが57%、valueが0.36程度になるようです。  
 学習が完了すると、パラメータファイル```model.ckpt```が保存されます。  
 
+ネットワークモデルの```BLOCK_CNT```や```FILTER_CNT```、または盤面の```KEEP_PREV_CNT```などを変更したり、モデルの形を変えたり、オリジナルの棋譜データを使用することで、より強力なパラメータを生成できる可能性があります。 興味がある方は、あなただけの最強のネットワーク作りに挑戦してみましょう。  
+
 ## 3. 自己対戦をさせてみる（コンソール）
 
 コンソール上で学習したモデルを使って、まず探索なしの自己対戦をさせてみます。  
@@ -245,9 +247,11 @@ move count=3: left time=0.0[sec] evaluated=104
 
 ## 4. GoGuiで対局する
 
+学習をしていない人は、学習済みのデータファイル```Pyaq/pre_train```にある```/model.ckpt```を```Pyaq/```にコピーしてください。  
+
 [GoGui](https://sourceforge.net/projects/gogui/files/gogui/1.4.9/)を使ってGUIでの対局を行います。  
 メニュー＞対局＞碁盤サイズを「9」に設定した後、
-メニュー＞プログラム＞新規プログラムから実行コマンドとワーキングディレクトリを登録します。  
+メニュー＞プログラム＞新規プログラムから「コマンド」と「ワーキングディレクトリ」を登録します。  
 
 ![resister](https://user-images.githubusercontent.com/32036527/36086431-acdf1168-100f-11e8-9127-adc138b3fa3d.png)  
 
diff --git a/board.py b/board.py
@@ -303,7 +303,7 @@ def score(self):
         return stone_cnt[1] - stone_cnt[0] - KOMI
 
     def rollout(self, show_board=False):
-        while self.move_cnt < EBVCNT * 1.5:
+        while self.move_cnt < EBVCNT * 2:
             prev_move = self.prev_move
             move = self.random_play()
             if show_board and move != PASS:
@@ -355,7 +355,7 @@ def feature(self):
 
         return feature_[rv_list, :]
 
-    def get_hash(self):
+    def hash(self):
         return (hash(str(self.color.data)) ^
                 hash(str(self.prev_color[0].data)) ^ self.turn)
 
@@ -366,4 +366,4 @@ def info(self):
             if self.legal(v) and not self.eyeshape(v, self.turn):
                 cand_list.append(ev2rv(v))
         cand_list.append(ev2rv(PASS))
-        return (self.get_hash(), self.move_cnt, cand_list)
+        return (self.hash(), self.move_cnt, cand_list)
diff --git a/learn.py b/learn.py
@@ -66,7 +66,7 @@ def average_gradients(tower_grads):
 
 def stdout_log(str):
     stdout.write(str)
-    log_file = open("log.txt", "aw")
+    log_file = open("log.txt", "a")
     log_file.write(str)
     log_file.close()
 
diff --git a/pyaq.py b/pyaq.py
@@ -46,7 +46,7 @@
         if not random:
             tree = search.Tree("model.ckpt", use_gpu)
 
-        while b.move_cnt < BVCNT * 1.5:
+        while b.move_cnt < BVCNT * 2:
             prev_move = b.prev_move
             if random:
                 move = b.random_play()
@@ -75,7 +75,7 @@
         else:
             winner = "B" if score > 0 else "W"
             result_str = "%s+%.1f" % (winner, abs(score))
-        sys.stderr.write("\nresult: %s\n" % result_str)
+        sys.stderr.write("result: %s\n" % result_str)
 
     else:
         learn.learn(3e-4, 0.5, sgf_dir="sgf/", use_gpu=use_gpu, gpu_cnt=1)
diff --git a/search.py b/search.py
@@ -147,7 +147,7 @@ def search_branch(self, b, node_id, route):
                 next_id = self.create_node(b.info(), prob_[0])
                 next_nd = self.node[next_id]
                 nd.next_id[best] = next_id
-                nd.next_hash[best] = b.get_hash()
+                nd.next_hash[best] = b.hash()
 
                 next_nd.total_value -= nd.value_win[best]
                 next_nd.total_cnt += nd.visit_cnt[best]