Skip to content

nolimitholdem可能需要优化的部分 #332

@magicdvd

Description

@magicdvd

最近在用这个库训练,提一点建议和我在改造的地方

  1. evaluation部分的数据如果只有payoff 太单薄,需要有 vpip(入池率),af(bet+raise/call), pfr(preflop raise) 概率,胜率这些数据,来描述这个learner 是否像个人
  2. obs部分维度太少或者不够精准, public cards 和hand数据没有区分,很难画像用户行为,每个人的筹码量,raise多少次,在preflop时候的动作都关系到AI去画像对手来评估他自己的行为,需要修改和补充这些维度
  3. 深短筹对AI的行为判断也是很大关键。 不能通用大家都是一样的筹码,要不同筹码量训练
  4. 起步阶段用RadomAgent就是灾难,虽然用了基于GTO的Agent做起步训练,依然是灾难,learner的入池率高达 80+%(疯子)关键reward一直是 -10以上还是孜孜不倦的入池,完全没有学习GTO 25% 入池率。这部分是我最困恼的,我也在努力学习怎么优化它

这个库基础功能还算强大,我只是在优化训练步骤和补充一些额外维度进训练里。2年多没有更新了,希望作者有机会再更新一些新的Agent,感谢

Metadata

Metadata

Assignees

No one assigned

    Labels

    No labels
    No labels

    Type

    No type

    Projects

    No projects

    Milestone

    No milestone

    Relationships

    None yet

    Development

    No branches or pull requests

    Issue actions