Introduction à la GTO au poker (2/2)

Publié le 27 janvier 2022 par Francois M.

(Accès à la première partie de cet article)

Dans la première partie de cet article, nous avons vu que la stratégie GTO (Game Theorie Optimal, ou Optimum de la Théorie des Jeux) ne pouvait pas être battue mais au mieux égalée. Respectant en tous points le jeu équilibré optimal, elle n’est pas exploitable par l'adversaire.

La GTO appliquée au poker est apparue au début de la décennie 2010 et a trouvé une illustration visuelle à travers les matrices 13 x 13 multi-décisions, représentant les 169 mains-modèles du hold’em. Ce qui signifie qu’on s’attache à résoudre le jeu préflop au stade des deux cartes du départ. Pourquoi ? Par rejet de l’hyper-complexité. Le déroulement du jeu au long des quatre tours d’enchères successifs liés aux différents flops possibles et aux différentes attaques et défenses adverses multiplie d’une manière infernale les cas possibles et aboutit à une arborescence foisonnante. A défaut de pouvoir les résoudre facilement pour le moment, les solutions équilibrées en cours de coup peuvent être données via les solveurs habituels. Ceux-ci seront trouvés en ligne, tant sur le web que sous forme d’apps, moyennant des abonnements qui oscillent entre $10 et $100 par mois selon les solveurs et les options, parfois plus, mais présentant la plupart du temps une version gratuite à usage restreint.

La grande majorité des configurations de jeu préflop peut se réduire à 3 situations génériques :

- Personne n’a encore ouvert ; dois-je le faire ?

- Un joueur a déjà ouvert ; dois-je faire un 3-bet ?

- J’ai déjà ouvert, puis un des blindeurs a fait un 3-bet ; dois-je faire un 4-bet ?

On voit que ces trois situations sont très différentes, qu’elles exigent de posséder des mains différentes selon les cas, mais aussi qu’elles diffèrent en fonction de la position et de la profondeur. D’une manière générale, la GTO peut émettre une décision équilibrée sans connaître la profondeur adverse ni même la position adverse. En shorthanded 6-max, il n’y a que si vous êtes au SB (small blind) ou au BU (bouton) que la question de savoir si vous avez la position (IP) ou pas (OOP) se résout d’elle-même. C’est dans les quatre autres positions (BB pour big blind, LJ pour low jack, HJ pour high jack et CO pour cut-off) qu’elles se règleront en deux valeurs : IP ou OOP (en position ou hors position).

En vertu du gap concept (on doit avoir une meilleure main pour payer que pour ouvrir, cf. David Sklansky, Poker de tournoi plus), la notion de position impacte le curseur de la force de la main pour définir les décisions GTO.

David Sklansky.

La GTO peut se passer du tracker. La GTO peut se battre EV+ contre un adversaire ne jouant pas GTO caractérisé par un tracker, mais elle ne va pas en extraire le maximum de valeur. Pour extraire la meilleure valeur d’un adversaire non GTO, il faut jouer exploitant, ce qui fait appel à l’expérience du joueur qui repère les failles adverses pour en tirer le meilleur parti et maximiser son EV. Dit autrement, si vous affrontez GTO un adversaire qui ne joue pas GTO, certes vous serez EV+. Mais vous serez EV++ si vous vous écartez de la GTO en remplaçant certaines décisions GTO par des décisions qui tirent parti des failles adverses mises au jour par le tracker et par votre observation du dit joueur.

Par exemple, face à un "ABC player", vous pourrez adopter une stratégie de type "small ball" chère à Negreanu et son Poker Power, avec une range polarisée, qui privilégie les min-raises de fin de parole avec des premiums mais aussi avec des mains potentielles comme 54o, 86s ou J8o, à l’affût d’un flop piégeur. Par définition, une range polarisée n’est pas GTO mais exploitante.

Revenons au jeu GTO pur, et oublions le tracker. À chaque situation (main, position et profondeur données) correspond un jeu de décisions particulier, c’est-à-dire une range particulière. Va donc se poser la question : comment j’applique concrètement les décisions GTO en session ?

Car il y a un problème de taille : l’intégration mémorielle des ranges. Il y a des ranges d’open, des ranges versus open, des ranges versus 3-bet… qui varient selon la position, qui varient en fonction de la profondeur du stack, qui varient aussi en fonction de la position de l’adversaire quand il a ouvert ou fait un 3-bet. Bien sûr, avec plusieurs centaines d’heures de par-cœur et de pratique, vous finirez par les intégrer à peu près, quoique je doute que vous puissiez vous souvenir de TOUTES les 250+ ranges différentes. D’où l’idée de se faire aider en session, soit avec une app spécialisée dont on a déjà parlé plus haut, soit avec un pense-bête papier de votre fabrication. L’avantage du pense-bête papier est qu’il ne tombe jamais en panne (ni de batterie, ni de réseau) et qu’un seul pouce suffit : le gauche si vous êtes droitier de souris, et inversement ; votre main qui tient la souris ne la quitte jamais.

Jenvick Meinsohn a commencé par confectionner son propre pense-bête artisanal, mais c’était carrément un mémoire de 200 pages hérissé d’onglets qu’il maniait à toute vitesse par habitude. Jenvick multitable depuis plus de 15 ans et a réussi à se qualifier pour de gros tournois live en EPT 5.000€ et WSOPE 10.000€. On serait mal avisé de négliger ses trouvailles et son avis.

Pour entrer dans les détails et voir des exemples, nous allons basculer dans l’univers formidable de Jenvick à travers son Poker GTO Memento, qui n’est autre que son pense-bête artisanal ayant subi plusieurs versions successives pour une utilisation plus facile, et est devenu un véritable outil au service des joueurs de tournois online désireux de jouer optimal. Les ranges ci-dessous en sont extraites. Dans cet univers, nous sommes en tournoi MTT 6-max, au stade préflop. Le tiers du temps vous serez dans les blinds, un autre tiers en milieu de parole (LJ ou HJ) et un autre tiers en fin de parole (CO ou BU).

Admettons que le tournoi vienne de commencer, que vous ayez 100BB de profondeur, et que vous héritiez du bouton. Personne n’a ouvert, et c’est à vous de parler. Vu votre profondeur et votre position, vous allez ouvrir avec une range très large, de l’ordre de 56% d’après le solveur, qui représente classiquement votre éventail de décision de cette manière :

Attention : cette représentation n’est pas celle de Poker GTO Memento, mais celle d’un solveur classique.

Range simple dans sa composition, range classique, avec deux décisions seulement : raise (en bleu) et fold (en blanc). Mais avec quelques subtilités. Dans les mains-frontière, on trouve des fréquences, c’est-à-dire des décisions partielles, pour K5o, Q7o, T7o, 97o, 76o et 63s. C’est dans ces cas qu’il faudra faire jouer le hasard. Petit problème : si Q7o et 76o donnent environ 50% de raise et 50% de fold, ce qui est facile à gérer, ce n’est pas le cas des quatre autres : à l’œil, on peut affirmer que K5o donne environ 90/10, T7o environ 60/40, 97o environ 70/30, et 63s environ 20/80. Et encore sommes-nous ici dans une range assez pauvre en fréquences.

Bien sûr, vous pouvez toujours arrondir les cas limites, c’est-à-dire toujours relancer avec K5o et 97o, et toujours passer avec 63o. Mais déjà vous donnez un premier coup de canif dans la GTO, donc vous ne jouez plus vraiment équilibré, même si d’un point de vue statistique les cas en question sont rares.

Quand Jeinvick Meinsohn m’a montré ces ranges, j’ai senti qu’il y avait un problème d’application concrète de l’information. Tel quel, il faudrait admettre une marge d’erreur pour ces mains-frontière, et si on ne résolvait pas cet obstacle, je préférais ne pas me lancer dans un projet de pense-bête dérivé de celui que Jenvick avait créé pour lui-même. Le sien était hérissé d’onglets sortants, qu’il était facile de retrouver avec le classement logique des différentes configurations qu’il avait créées. En trois secondes en moyenne, il ouvrait le pense-bête à la bonne page, et la réponse se trouvait dans la range qui correspondait à sa profondeur. C’était carré, c’était direct, c’était efficace et cela évitait le recours à des apps ou autres instruments en ligne.

Puis, à force de brain-storming en ce mois d’août 2021, nous avons fini par trouver la solution. Il suffisait de représenter les fréquences sous forme d’un dé à jouer, donc avec 1 point pour une fréquence d’autour de 15%, jusqu’à 6 points pour une fréquence d’autour de 85%. Et la range présentée ci-dessus est devenue celle-ci, qui provient de la version définitive de Poker GTO Memento :

Range incluse dans Poker GTO Memento.

Par convention, les points blancs (fold) ont été supprimés pour les mains multi-décisions. Si on prend l’exemple de Q7o, si le dé que vous lancez donne 1, 2 ou 3, vous relancez, et s’il donne 4, 5 ou 6, vous jetez. Idem, dans le cas de K5o, si le dé donne 6, vous jetez, sinon vous relancez. Cette façon de transposer les fréquences continues en un modèle discret (au sens statistique du terme) crée bien sûr un léger biais dû à l’arrondi, mais il est si ténu qu’il est négligeable – d’autant que les petits arrondis dans un sens sont compensés par les petits arrondis dans l’autre sens, ce qui préserve l’équilibre général.

Bien sûr, jeter un dé à chaque fois que de besoin devient pénible. On peut recourir à d’autres solutions en un clic :

- Les secondes de votre horloge de PC forment un formidable générateur de nombres aléatoires : de 00 à 09 secondes, on a 1 ; de 10 à 19 secondes, on a 2 ; etc., jusqu’à 50 à 59 qui vaut 6.

- Il est facile d’afficher à l’écran un générateur d’un nombre aléatoire de 1 à 6, fourni par Google sur la requête « générateur de nombre aléatoire », ou sur des sites comme www.de-en-ligne.fr.

Générateur de nombre aléatoire Google.

Générateur de nombre aléatoire www.de-en-ligne.fr

En gardant en permanence ce petit utilitaire dans le coin de votre écran, vous générez en un clic le jet de dé voulu… et vous instillez de cette manière la dose de hasard nécessaire pour jouer fidèlement GTO, conformément aux grands pontes de la théorie des jeux, dont David Sklansky.

Bien sûr, on peut objecter que ce n’est plus vraiment du poker puisque les décisions sont imprimées d’avance sur le mémento, mais c’est la tendance actuelle qui normalise le jeu pour le rendre toujours plus performant. Et comme de plus en plus d’adversaires le font, chacun doit trouver la parade pour ne pas se laisser déborder.

Maintenant, allez-vous systématiquement avoir recours à Poker GTO Memento pour agir en session ? Très vite, vous vous apercevrez que la décision vient d’elle-même dans bien des cas. Vous savez d’avance si vous relancez quand vous avez une premium ou une main dans les 3 premiers déciles ; idem avec la plupart des mains des 3 derniers déciles, que vous vous ferez une joie de jeter la plupart du temps. Avec ces mains-là, vous n’avez pas besoin de pense-bête. C’est pour les 40 à 50% de mains intermédiaires comme A4o, Q8s ou 76s que vous aurez besoin de la confirmation de Poker GTO Memento.

Il y a aussi le cas des ranges multi-décisions, où là encore il est compliqué de connaître toutes les subtilités, surtout quand on a jusqu’à 3 décisions possibles pour une main donnée. Et ne croyez pas que ce type de range se retrouve uniquement dans des cas indirects comme versus open ou versus 3-bet. On en trouve déjà dans l’open direct, par exemple si vous êtes au hi-jack avec un short-stack de 15BB :

De telles ranges sont complexes, et elles sont nombreuses en GTO. Faire all-in avec KTs, QTs et JTs se comprend, et si ATs n’exige que le raise-call, c’est pour value, comme pour tous les A8s+. On voit le basculement radical avec K9s, Q9s et J9s, qui exigent un raise-fold, alors que ces mains sont proches respectivement de KTs, QTs et JTs. A5o exige une fréquence minoritaire de raise-fold, alors que A6o est un fold direct. On retrouve ici l’avantage a priori paradoxal d'A5 sur A6 (idem en suited, A5s permet le all-in mais A6s ne permet que le raise-fold), car A5 a besoin de 3 cartes pour faire quinte et A6 a besoin de 4 cartes – ceux qui ont lu mon Essentiel des probabilités au poker savent qu'en table pleine A5o est 100e sur 169, et que A6o est 114e, alors qu’en HU elles sont à touche-touche, respectivement 41e et 42e, avec une equity préflop de 57,7% chacune. Pour résoudre ce genre de situation complexe, un pense-bête s’impose si vous voulez jouer en pur GTO.

Poker GTO Memento s’impose aussi quand il s'agit d'aborder ce genre de range :

Comme son en-tête l'indique, celle-là gère la situation où vous êtes au BB avec une profondeur de 25BB et que le cut-off vient d’ouvrir. Une range accidentée très diversifiée, avec peu de folds et énormément de calls. On joue toutes les mains suited, on fold quelques mains offsuit d’office, comme T5o ou 95o, mais on call avec T6o ou 96o par exemple. Vous remarquerez que A5o a 3 issues aléatoires : on peut payer, faire un 3-bet ou même push (le jet de dé tranchera), mais jamais fold. Ces cas reviennent souvent en GTO, surtout en réponse à un open ou à un 3-bet adverse. Là encore, le pense-bête s’impose, et Poker GTO Memento EST ce pense-bête.

Jenvick Meinsohn en session, avec son indispensable Poker GTO Memento.

Mais l’immense avantage de cet instrument, je trouve, est ceci : plus on l’utilise et moins on a besoin de l’utiliser. C’est à force d’utiliser les décisions GTO, à force d’ouvrir le mémento aux différents onglets, que le joueur finit par intégrer progressivement les décisions. Cela prendra du temps, mais Poker GTO Memento s'avère être un formidable outil d’auto-formation à la GTO, à mon sens le seul actuellement disponible, et une fois de plus cette première mondiale est française. Jenvick = cocorico GTO ?

Ma conclusion

À un joueur qui était tenté de l’utiliser et qui payait un solveur tous les mois, j’ai répondu que Poker GTO Memento était disponible sans abonnement. Il suffit de l’acheter une seule fois, c’est un one-shot. De plus, vous pouvez le consulter dans toutes les situations où vous êtes offline pour faire vos "révisions". En outre, si vous avez des doutes quant à la présence de bots programmés pour la GTO qui arriveraient à infiltrer certaines tables online, sachez que les rooms sont équipées pour les traquer et qu’elles y arrivent très bien. Mais pour les quelques-uns qui passeraient à travers les mailles du filet, la meilleure parade est de jouer aussi bien qu’eux, et pour ce faire, Poker GTO Memento fournit la solution ultime.

Pour aller plus loin dans la GTO et ses applications, je vous suggère de visionner les vidéos qui s'y rapportent et à lire les articles afférents. Je vous laisse les choisir, ils sont nombreux, et c'est une matière assez pointue pour que, dès les premières démonstrations, vous vous rendiez compte si celui qui en parle connaît son sujet ou pas.