This project is a Texas Hold'em AI system, designed for building poker bots, AI opponents, and training environments.
本项目是一套德州扑克AI系统源码,可用于构建AI对手、训练系统等。
⚠️ 声明:本项目仅供研究和教育目的使用。不得用于任何形式的真实货币赌博或违反相关平台服务条款的行为。
🔥 Achieves 97%+ win rate against general players (GG level)
🔥 在普通玩家对局中胜率可达 97%+(GG级别) 【AI和中高级牌手线下对战数据】
🔥 在一般玩家對局中勝率可達 94%+(GG級別) 【AI和顶级职业牌手线下对战数据】
📊 Based on large-scale simulation & self-play training
📊 基于大量模拟与自博弈训练
📊 基於大規模模擬與自我對弈訓練
🤖 Demonstrates strong decision-making and strategy optimization
🤖 展现出强大的决策能力与策略优化能力
🤖 展現出強大的決策能力與策略優化能力
- ✔ High win rate strategy(高胜率策略)
- ✔ Bluff / fold intelligence(诈唬与弃牌决策)
- ✔ Probability-based decisions(概率决策)
- ✔ Adaptive gameplay(自适应对局)
👉 Close to real poker AI behavior
👉 接近真实扑克AI策略
👉 接近真實撲克AI策略
- 🧠 Intelligent decision-making(智能决策)
- 🎯 Strategy-based gameplay(策略博弈)
- 🔄 Self-play training(自我对弈训练)
- 📊 Simulation environment(模拟环境)
- 🤖 AI poker bot(扑克AI机器人)
- Game Theory(博弈论)
- Reinforcement Learning(强化学习)
- Monte Carlo Simulation(蒙特卡洛)
- CFR (Counterfactual Regret Minimization)
👉 Widely used in advanced poker AI research
- Poker AI bot(AI机器人)
- Poker training tool(训练工具)
- AI vs AI simulation(AI对战)
- Online poker AI system(在线AI系统)
👉 Can be extended to real products
- ✔ Combines poker + AI (high-value niche)
- ✔ Suitable for research & business
- ✔ Expandable with LLM / ChatGPT
- ✔ Can simulate real players
👉 Build next-generation poker AI
Can be integrated with:
- ChatGPT / LLM
- AI agents
- Strategy learning systems
👉 Build AI poker assistant or smart opponent
- C++ / Python
- AI algorithms
- Game engine
| 特性 | 说明 |
|---|---|
| 🧠 多种AI算法 | 支持 CFR、PPO、DQN 等多种算法 |
| 🎮 完整游戏环境 | 包含完整的德州扑克规则实现 |
| 🔄 自我对弈训练 | 支持通过自我对弈持续提升策略 |
| 📊 评估工具 | 提供胜率、收益等多项评估指标 |
| 🐳 容器化支持 | 提供 Docker 配置,便于环境部署 |
| 🤖 人机对战 | 支持与训练好的AI模型对战 |
git clone https://github.com/niubideren111/Texas-Holdem-AI-System.git cd Texas-Holdem-AI-System
chmod +x scripts/reproduce_result.sh ./scripts/reproduce_result.sh 运行后,您将看到:
✅ 环境自动配置
✅ 模型训练进度(约30秒)
bash
source venv/bin/activate # Windows: venv\Scripts\activate
python examples/play_vs_ai.py --model models/demo_model.bin 📦 安装 前置要求 Python 3.8 或更高版本
pip 包管理器
(可选)C++17 编译器(用于完整性能)
bash
git clone https://github.com/niubideren111/Texas-Holdem-AI-System.git cd Texas-Holdem-AI-System
python -m venv venv source venv/bin/activate # Linux/Mac
pip install -r requirements.txt
pip install -e . 📖 使用方法 训练新模型 bash
python scripts/train.py --algo cfr --iterations 1000 --save-path models/
python scripts/train.py --algo ppo --iterations 5000 评估模型 bash
python scripts/evaluate.py --model models/your_model.bin --num-games 500 快速测试 bash
python examples/simple_game.py Docker 运行 bash
docker build -f docker/Dockerfile -t texas-holdem-ai .
docker-compose -f docker/docker-compose.yml up trainer 📁 项目结构 text Texas-Holdem-AI-System/ ├── src/ # 源代码 │ ├── core/ # 核心游戏逻辑 │ ├── algorithms/ # AI算法实现(CFR, PPO, DQN) │ ├── env/ # 游戏环境封装 │ └── utils/ # 工具函数 ├── scripts/ # 运行脚本 │ ├── train.py # 训练脚本 │ ├── evaluate.py # 评估脚本 │ └── reproduce_result.sh # 一键复现脚本 ├── examples/ # 示例代码 │ ├── simple_game.py # 简单游戏示例 │ └── play_vs_ai.py # 人机对战示例 ├── tests/ # 单元测试 ├── models/ # 训练好的模型(Git LFS) ├── config/ # 配置文件 ├── docker/ # Docker 配置 ├── docs/ # 文档 ├── requirements.txt # Python 依赖 ├── setup.py # 安装配置 ├── Makefile # 构建命令 └── CMakeLists.txt # C++ 构建配置
本项目实现了多种德州扑克AI算法:
Counterfactual Regret Minimization (CFR) 原理:通过最小化反事实遗憾值来逼近纳什均衡策略
特点:理论上保证收敛到纳什均衡
适用:有限博弈、策略求解
Proximal Policy Optimization (PPO) 原理:基于策略梯度的深度强化学习算法
特点:训练稳定、样本效率较高
适用:复杂环境、连续决策
Deep Q-Network (DQN) 原理:使用深度神经网络近似Q函数
特点:适合离散动作空间
适用:规则明确的决策问题
以下结果基于 scripts/minimal_train.py 在标准环境下测试获得,可在您的环境中复现。
模型 对手 胜率 平均收益 测试局数 CFR (100轮) 随机策略 ~55% +15 chips 500 CFR (500轮) 随机策略 ~62% +42 chips 500 随机策略 随机策略 50% 0 chips 500 复现上述结果 bash
python scripts/minimal_train.py --iterations 100
python scripts/minimal_train.py --iterations 500
python scripts/minimal_evaluate.py --model models/minimal_model.bin --num-games 500 注意:以上结果为演示性数据,完整训练需要更多迭代和数据。
修改配置 编辑 config/default.yaml 文件:
yaml game: num_players: 2 starting_stack: 1000 small_blind: 5 big_blind: 10
ai: algorithm: cfr model_path: models/latest.bin
training: iterations: 10000 save_interval: 1000 ###自定义游戏规则 python from src.env.poker_env import PokerEnv
env = PokerEnv( num_players=3, starting_stack=2000, small_blind=10, big_blind=20 )
obs = env.reset() done = False while not done: action = your_agent.act(obs) obs, reward, done, info = env.step(action)

- Telegram:TG:@fox_lovemyself
❓ 常见问题 Q: 训练速度很慢怎么办? A:
减少 --iterations 参数值
启用 GPU 支持(需安装 CUDA)
使用 config/default.yaml 中的并行设置
Q: 提示找不到模块? A: 确保运行了 pip install -e . 安装项目
Q: C++ 编译失败? A: 项目可以纯 Python 运行,C++ 部分用于性能优化,不影响核心功能
Q: 模型文件太大无法提交? A:
bash
git lfs install git lfs track ".bin" git add models/.bin Q: 可以在真实的在线平台使用吗? A: 不可以。本项目仅限研究和教育目的,在任何真实货币赌博平台使用违反服务条款,可能面临法律风险。
🤝 贡献指南 欢迎贡献代码、报告问题或提出建议!
Fork 本仓库
创建特性分支 (git checkout -b feature/amazing-feature)
提交更改 (git commit -m 'feat: add amazing feature')
推送到分支 (git push origin feature/amazing-feature)
创建 Pull Request
详细规范请参阅 CONTRIBUTING.md
📜 许可证 本项目采用 MIT 许可证 - 详见 LICENSE 文件
不得用于任何形式的真实货币赌博
不得用于违反任何在线平台服务条款的行为
用户自行承担使用本项目的法律责任
作者不对任何滥用行为负责
⭐ Star History 如果您觉得这个项目对您有帮助,请给一个 ⭐ 支持一下!
texas holdem ai poker ai poker bot poker ai system ai poker strategy poker simulation ai poker engine 德州AI源码 扑克AI系统