A la manière du BlackJack
avec Diophante.fr



Le problème

Il s'agit du problème de Diophante
G191**** :
Je joue une partie avec deux dés à la manière du Blackjack. Je lance les deux dés autant de fois que je le souhaite. A l'issue de chaque lancer, je calcule la somme des numéros obtenus puis le cumul des sommes enregistrées depuis le début de la partie. Si je m'arrête, mon score est égal à la somme cumulée à la condition que celle-ci reste inférieure ou égale à 21.
Si cette somme est strictement supérieure à 21, mon score est nul.
Quelle stratégie dois-je adopter pour maximiser l'espérance mathématique de mon score ?
Déterminez cette espérance mathématique : quel meilleur score puis-je espérer avec un bonne tactique ?



Expérimentons

Dans l'animation suivante,
- on peut jouer seul tout simplement : JOUER.
A chaque jeu, on décide de continuer ou bien de s'arrêter.
Si l'on dépasse 21, bien entendu on perd et le score du jeu est 0.

On peut également faire une SIMULATION animée ou ULTRA rapide avec espérance immédiate sur de très nombreux jeux.

Le résultat sera variable avec le SEUIL d'arrêt choisi.
Ne pas regarder trop vite la solution ;).

Solution et Démonstration
(Ma démarche complète ICI )

Cherchons les probabilités d’obtenir les sommes de 1 à 12 en jouant avec deux dés.
Il suffit de dresser le tableau des résultats possibles avec deux dés et de compter le nombre d’apparitions de chaque nombre.



Exemple : 2 a une chance sur 36 d’apparaître car on l’a une seule fois dans le tableau.
3 a 2 chances sur 36 etc.
1 -> 0 ; 2 -> 1 ; 3 -> 2 ; 4 -> 3 ; 5 -> 4 ; 6 -> 5 ; 7 -> 6 ; 8 -> 5 ; 9 -> 4 ; 10 -> 3 ; 11 -> 2 ; 12 ->1.

CHERCHONS à partir d'exemples

Imaginons que,
-on a obtenu la somme 15 :
21-15=6
Possibilités :
6 -> 5/36
5 -> 4/36
4 -> 3/36
3 -> 2/36
2 ->1/36
Probabilité totale :
(5+4+3+2+1)=15/36
inférieure à 18/36, je m’arrête car j’ai plus de chances de perdre que de gagner.

--on a obtenu la somme 6 :
21-6=15
Tous les jeux sont OK, je rejoue.
--on a obtenu la somme 14 :
21-14=7
Possibilités :
7 -> 6/36
6 -> 5/36
5 -> 4/36
4 -> 3/36
3 -> 2/36
2 -> 1/36
Probabilité totale :
(6+5+4+3+2+1)=21/36
supérieure à 18/36, je continue car j’ai plus de chances de gagner que de perdre.

FINALEMENT
- Tant que j’ai une somme inférieure ou égale à 14 je peux obtenir jusqu’à 7 points et les probabilités sont : (6+5+4+3+2+1)/36 = 21/36 dont plus de 18/36.

-A partir de 15 les probabilités ok sont de (5+4+3+2+1)/36 = 15/36 mois de 18/36 donc STOPPER.

Mais il faut tenir compte de l’espérance et on a un meilleur résultat avec un seuil de 14.

La bonne stratégie sera de s’arrêter dès que l’on approchera d'n seuil de 14 ...
Il faut analyser plus précisément.

Le calcul est un peu délicat et se fait de proche en proche.

Pour ceux qui sont intéressés, voici le début de la démarche, ma démarche complète est ICI.

En un seul lancer de dés (probabilité p1)

p1(X=1) = 0/36
p1 (X=2) = 1/36
p1 (X=3) = 2/36
p1 (X=4) =3/36
p1 (X=5) = 4/36
p1 (X=6) = 5/36
p1 (X=7) = 6/36
p1 (X=8) = 5/36
p1 (X=9) = 4/36
p1 (X=10) = 3/36
p1 (X=11) = 2/36
p1 (X=12) =1/36

Calcul des probabilités selon le nombre de jeux

En deux lancers de dés (proba p2)
p2(X=4) ? p (X=2 )*p(X=2)=1/36²
p2 (X=5 ?p(X=2 )*p(X=3)+p1(X=3)*p(X=2)=2/36²+2/36²=4/36²
p2 (X=6) ? p(X=2 )*p(X=4)+p1(X=3)*p(X=3)+p(X=4)*p(X=2)=3/36²+4/36²+3/36²=10/36²
p2 (X=7) ? 2*p (X=2 )*p(X=5)+2*p(X=3)*p(X=4)=2*4/36²+2*6/36²=20/36²
p2 (X=8) ? 2*p(X=2 )*p(X=6)+2*p(X=3 )*p(X=5)+p (X=4 d(X=4)=2*5/36²+2*8/36²+9/36²=35/36²
p2 (X=9) ? 2*p(X=2 )*p(X=7)+2*p(X=3 )*p(X=6)+2*p (X=4)*p(X=5)=2*6/36²+2*10/36²+2*12/36²=56/36²
p2 (X=10) ? p(X=5 )*p(X=5)+2*p(X=6 )*p(X=4)+2*p (X=7)*p(X=3)+2*p(X=8)*p(X=2)=
16/36²+2*15/36²+2*12/36²+2*5/36²=80/36²
p2 (X=11) ?2*p(X=6)*p(X=5)+2p(X=7)*p(X=4)+2*p(X=8)*p(X=3)+2*p(X=9)*p(X=2)=
( 2*20+2*18+2*10+2*4)/36²=104/36²
p2 (X=12) ?p(X=6)p(X=6)+2*p(X=7)p(X=5)+2*p(X=8)p(X=4)+2*p(X=9)p(X=3)+p(X=10)p(X=2)=
(25+2*24+2*15+2*8+2*3)/36²=125/36²
p2 (X=13) ?2*p(X=7)p(X=6)+2*p(X=8)p(X=5)+ 2*p(X=9)p(X=4)+ 2*p(X=10)p(X=3)+2*p(X=11)p(X=2)=
(2*30+2*20+2*12+2*6+2*2)/36²=140/36²
p2 (X=14) ?p(X=7)p(X=7)+2*p(X=8)p(X=6)+2*p(X=9)p(X=5)+2*p(X=10)p(X=4)+2*p(X=11)p(X=3)+
2*p(X=12)p(X=2)=(36+50+32+18+8+2)/36²=146/36²
p2 (X=15) ?2*p(X=8)p(X=7)+2*p(9)p(X=6)+2*p(10)p(X=5)+2*p(11)p(X=4)+2*p(12)p(X=3)=
=(2*30+2*20+2*12+2*6+2*2)/36²=140/36²
p2 (X=16) ?p(X=8)p(X=8)+2*p(X=9)p(X=7)+2*p(X=10)p(X=6)+2*p(X=11)p(X=5)+2*p(X=12)p(X=4)=
=( 25+2*24+2*15+2*8+2*3)/36²=125/36²
p2 (X=17) ?2*p(X=8)*p(X=9)+2*p(X=7)*p(X=10)+2*p(X=6)*p(X=11)+2*p(X=5)*p(X=12)=
=(40+36+20+8)/36²=104/36²
p2 (X=18) ?p(X=9)*p(X=9)+2*p(X=8)*p(X=10)+2*p(X=7)*p(X=11)+2*p(X=6)*p(X=12)=
=(16+30+24+10)/36²=80/36²
p2 (X=19) ?2*p(X=9)*p(X=10)+2*p(X=8)*p(X=11)+2*p(X=7)*p(X=12)= 24+20+12)/36²=56/36²
p2 (X=20) ?p(X=10)*p(X=10)+2*p(X=9)*p(X=11)+2*p(X=8)*p(X=12)=(9+16+10)/36²=35/36²
p2 (X=21) ?2*p(X=11)*p(X=10)+2*p(X=12)*p(X=9)=(12+8)/36²=20/36²
p2 (X=22) ?p(X=11)*p(X=11)+2*p(X=12)*p(X=10)=(4+6)/36²=10/36²
p2 (X=23) ?2*p(X=12)*p(X=11)=( 4)/36²=4/36²
p2 (X=24) ?p(X=12)*p(X=12)=1/36²
Le total fait bien 36²=1296 =36*36? OK

En poursuivant les calculs en plusieurs étapes,
nous trouvons que la stratégie optimale donnant le meilleur résultat correspond à un seuil de 14

L'animation précédente, permet de vérifier de façon très précise ce résultat.
On obtient : E ~ 15.705329831634371

Ci-dessus, une simulation sur 20 000 cas avec la condition d’arrêt sur 14 donne effectivement une moyenne de 15.7
On retient donc le seuil de 14 :
-tant que le résultat est inférieur à 14, je continue ;
-à partir d’une somme supérieure ou égale à 14 j’arrête de jouer et prends le score donné.

Avec un SEUIL de 14, l’espérance mathématique est de 15.7 environ.

A vos jeux...


Menu trucs  Accueil