-
Notifications
You must be signed in to change notification settings - Fork 718
Open
Description
最近在用这个库训练,提一点建议和我在改造的地方
- evaluation部分的数据如果只有payoff 太单薄,需要有 vpip(入池率),af(bet+raise/call), pfr(preflop raise) 概率,胜率这些数据,来描述这个learner 是否像个人
- obs部分维度太少或者不够精准, public cards 和hand数据没有区分,很难画像用户行为,每个人的筹码量,raise多少次,在preflop时候的动作都关系到AI去画像对手来评估他自己的行为,需要修改和补充这些维度
- 深短筹对AI的行为判断也是很大关键。 不能通用大家都是一样的筹码,要不同筹码量训练
- 起步阶段用RadomAgent就是灾难,虽然用了基于GTO的Agent做起步训练,依然是灾难,learner的入池率高达 80+%(疯子)关键reward一直是 -10以上还是孜孜不倦的入池,完全没有学习GTO 25% 入池率。这部分是我最困恼的,我也在努力学习怎么优化它
这个库基础功能还算强大,我只是在优化训练步骤和补充一些额外维度进训练里。2年多没有更新了,希望作者有机会再更新一些新的Agent,感谢
Metadata
Metadata
Assignees
Labels
No labels