nolimitholdem可能需要优化的部分

最近在用这个库训练，提一点建议和我在改造的地方

1. evaluation部分的数据如果只有payoff 太单薄，需要有 vpip(入池率），af(bet+raise/call), pfr(preflop raise) 概率，胜率这些数据，来描述这个learner 是否像个人
2.  obs部分维度太少或者不够精准， public cards 和hand数据没有区分，很难画像用户行为，每个人的筹码量，raise多少次，在preflop时候的动作都关系到AI去画像对手来评估他自己的行为，需要修改和补充这些维度
3.  深短筹对AI的行为判断也是很大关键。 不能通用大家都是一样的筹码，要不同筹码量训练
4.  起步阶段用RadomAgent就是灾难，虽然用了基于GTO的Agent做起步训练，依然是灾难，learner的入池率高达 80+%（疯子）关键reward一直是 -10以上还是孜孜不倦的入池，完全没有学习GTO 25% 入池率。这部分是我最困恼的，我也在努力学习怎么优化它

这个库基础功能还算强大，我只是在优化训练步骤和补充一些额外维度进训练里。2年多没有更新了，希望作者有机会再更新一些新的Agent，感谢

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Uh oh!

nolimitholdem可能需要优化的部分 #332

Metadata

Assignees

Labels

Type

Projects

Milestone

Relationships

Development

nolimitholdem可能需要优化的部分 #332

Description

Metadata

Metadata

Assignees

Labels

Type

Projects

Milestone

Relationships

Development

Issue actions