Teoria Poker

Transcrição

Teoria Poker
Introdução à
Te o r i a d o Po ke r
Baseado no trabalho de
Ra f a e l S h i n j i Ao k i K i ku c h i
Poker: Sorte ou
habilidade?
• Os mesmos jogadores chegam às finais dos torneios
Doyle Brunson: 10 vezes
campeão
do World Series of Poker desde
1976
2
Poker: Sorte ou
habilidade?
• Resultados consistentes
3
Poker: Sorte ou
habilidade?
• Apenas 30% das mãos vão até o final
o 70% das vezes as cartas privadas não são reveladas
• Jogadores apresentam padrões
Sim
Jogada
Agressiva
Mão Forte
Não
Jogada
Passiva
4
Regras
• Cada jogador: 2 cartas privadas
• 5 cartas comunitárias
• Melhor combinação de cinco cartas vence
5
Regras
• Quatro rodadas de aposta
o Pre-Flop
• Nenhuma carta comunitária
o Flop
• 3 cartas comunitárias
o Turn
• 4 cartas comunitárias
o River
• 5 cartas comunitárias
6
Regras
• Rodada de aposta
o Aposta corrente
o Ações
• Fold
• Call (Check)
• Raise (Bet)
7
Teoria do Poker
8
Equidade
• Jogador A
• Jogador B
Quantas
vezes
cada
jogador
vence?
• Board
9
Equidade
• Jogador A
• Jogador B
…
(42)
(2)
• Board
10
Equidade
• Jogador A
Vence 42/44 = 95.4%
vezes
• Jogador B
Vence 2/44 = 4.6%
vezes
• Board
11
Equidade
• Jogador A
Vence 908/990 = 91.7%
vezes
• Jogador B
Vence 82/990 = 8.3%
vezes
• Board
12
Equidade
• Jogador A
Vence 64.9% vezes
• Jogador B
Vence 35.1% vezes
• Pre-Flop
13
O que o Marroquim deve fazer?
Raise All-In
Pre-Flop
Ratton
1
5
Marroquim
2
D
C
A
B
14
Valor Esperado
• Ratton
Vence 64.9% vezes
• Marroquim
Vence 35.1% vezes
o Fold →
E [G ]=0
o Call →
E [G ]=0,649⋅(−3)+0,351⋅7=0,51
15
Desafios
• Não conhecemos as cartas dos oponentes
• Como estimar esses valores?
16
Redes de Bayes
17
Redes de Bayes
• Representação de modelos probabilísticos na
forma de grafos direcionados
o Vértices – Variáveis aleatórias
o Arestas – Relações de dependência (“causa”)
• Definido por:
o Estrutura (nós e relacionamentos)
o Distribuições condicionais
18
Redes de Bayes
19
Redes de Bayes
• Inferências sobre variáveis de interesse
o Qual a distribuição de , dado que sabemos ?
o Algoritmos eficientes de inferência
20
Redes de Bayes
Qual a
distribuição de
GM, dado que
S=F e N=V?
21
Snowman
22
23
Treinamento
• 100,000 mãos de 6-max Pot-Limit Omaha
• Cada mão pôde gerar até 6 entradas de
treinamento (uma por jogador)
o Entrada: observações sobre as variáveis da rede
• Adaptação das distribuições condicionais para
ajuste do conjunto de treinamento
24
Avaliação
25
Software de Simulação
• Simulador de estados de jogo
• Decisões do modelo sobre um estado
26
Avaliação de
Desempenho
• Simulador aberto junto com uma mesa de um site
online de poker
o Menor estrutura de apostas disponível
• Mudança de estado na mesa
 Mudança manual no simulador
27
Resultado da Avaliação
* 10 melhores jogadores com mais de 3,000 mãos no
histórico
28

Documentos relacionados

POKER Regras de Jogo

POKER Regras de Jogo estas cartas com as suas 2, para formar a combinação mais forte possível. Então começa a segunda rodada de apostas.

Leia mais