Оптимальный блеф

Тема в разделе "Математика покера", создана пользователем MrTwister, 8 июл 2013.

  1. MrTwister

    MrTwister Продвинутый

    0
    965
    +132 / -0
    Оптимальный-блеф.jpg

    Однако вы не можете блефовать каждый раз со слабой рукой. Если вы станете блефовать слишком часто, то оппонент поймет, что ваш диапазон не сбалансирован, а потому начнет чаще вскрывать ваши блефы.


    Таким образом, для баланса своих блефов вам следует выявлять ситуации, в которых вы можете блефовать со слабой рукой. Например, если вы блефуете в определенной ситуации, то вы должны рассмотреть баланс, чтобы ваша рука по розыгрышу выглядела сильно. Иными словами, ваш воспринимаемый диапазон должен состоять из сильных рук, чтобы напугать оппонента.
    Каждый думающий игрок ответит на нашу ставку с почти любой рукой, которая имеет ценность на вскрытии. Это объясняется тем, что любую сильную руку мы бы разыгрывали другим способом.
    1. с тузом мы бы ставили на флопе;
    2. с королем или ещё какой-нибудь слабой рукой мы бы чекали вслед на ривере;
    3. с сетом мы бы ставили на флопе, либо повышали на терне, чтобы защититься от возможных «дров»;
    4. получив на терне сет восьмерок, мы бы наверняка повышали;
    5. с сетом троек мы бы упали уже на терне.
    Таким образом, из возможных вэлью рук остаются только король-восемь, девять-восемь или в некоторых случаях туз-три. В то же время наш общий диапазон на ривере гораздо шире, так как мы могли отвечать на терне с множеством различных «дров». Исходя из этого, оппоненту становится очевидно, что у нашей руки нет ценности, поэтому он ответит с любой парой, делая данный блеф ужасным.

    Существует несколько факторов, которые в совокупности предопределяют прибыльность блефа:
    1. вероятность (в мыслях оппонента), что нас есть сильная рука;
    2. вероятность, что у оппонента есть рука, с которой он может ответить;
    3. размер ставки относительно размера банка;
    4. частота блефа.
    Нашей целью в данной статье будет установление взаимосвязей между этими четырьмя факторами.

    Простой блеф

    Представьте себя на ривере в некой абстрактной раздаче. Вы в позиции, а ваш оппонент чекнул на доске:

    6:diamond: 5:heart: 4:spade: 7:diamond: 8:spade: .​

    На доске образовался стрит, а так как вряд ли у кого-то из вас есть девятка, банк будет поделен. Из предшествующей игры вы знаете, что соперник никогда не будет чекать с девяткой, а у вас может оказаться девятка. Итак, как вы оцениваете свое эквити? Немногим более половины банка, так как у вас ещё может быть девятка, а в оставшееся время вы разделите банк?

    В действительности, при достаточно глубоких стеках наше эквити равняется целому банку. Это означает, что в среднем мы ожидаем выигрывать целый банк. В этом легко убедиться, так как в каждой раздаче мы будем ходить последними. Если у нас каждый раз будет оказываться девятка, а стеки будут достаточно крупными, то оппонент не сможет прибыльно отвечать. В результате сопернику придется сбрасываться каждый раз, отдавая нам целый банк.

    Мы можем взять длительную дистанцию, чтобы вычислить определенный объективный размер ставки. Этот размер ставки, после которой нам будет безразлично – ответит или сбросится наш соперник. Учитывая, что ожидаемая выгода фолда всегда равна 0, нам следует подобрать такой размер ставки, чтобы EV колла также было равно нулю.

    Если мы ставим меньше этой суммы, то оппонент может прибыльно отвечать. Если мы ставим больше, то для соперника колл приобретает отрицательное EV, поэтому ему придется падать каждый раз. Если бы могли проиграть раздачу, ставя больше объективной суммы, то оппонент мог бы извлекать из этого прибыль. Однако здесь даже в наихудшем раскладе мы разделим банк.

    Пусть «eq» будет вероятностью, что у нас есть девятка. Тогда EV колла нашего оппонента составит:

    bluff-form-1.jpg

    Мы вправе изменить размер банка на 1$ и разделить размер ставки на ту же сумму (как и оригинальный размер банка), то есть:

    Ставка (новая) := ставка/банк(оригинальный).

    Сейчас мы можем использовать единицу за размер банка, а соотношение нашей ставки к размеру банка за размер ставки. Это изменит формулу EV для нашего оппонента (сейчас его EV выражено как часть текущего размера банка) следующим образом:

    bluff-form-2.jpg

    Из определения, что EV фолда всегда равняется нулю:

    EVфолда = 0.

    Продолжаем наш анализ. Основная идея (когда только у вас может оказаться девятка) состоит в том, чтобы всегда ставить на ривере определенную сумму, которая на длительной дистанции нивелировала бы возможные подстройки оппонента. Мы хотим привести обе опции соперника к одинаковому знаменателю. Итак, мы решаем:

    bluff-form-3.jpg

    Это означает, что если мы установим размер нашей ставки согласно этой формуле и будем ставить каждый раз, то стратегия оппонента перестанет иметь значение. Учитывая, что оппонент будет отвечать с нулевым ожиданием (как и в случае с фолдом), мы будем забирать весь банк. На основе этой формулы мы можем построить следующий график.

    bluff-graf-1.jpg

    Если у нас случайная рука, то она будет содержать девятку (при условии, что у соперника её нет) с вероятностью 17,2%.

    0,172 = 1 – (41/45)(40/44).

    Согласовывая эту величину с нашей формулой, мы получаем оптимальный размер ставки равный 2,4.

    bluff-form-4.jpg

    Учитывая, что мы определили размер ставки как отношение нашей ставки к размеру банка, то нам следует каждый раз делать бет, в 2,4 раза превышающий банк, чтобы EV колла оппонента равнялось нулю.

    К сожалению, наш стек не всегда будет настолько велик для оптимальной ставки. Если вы ставите меньше, то предоставляете оппоненту более хорошие шансы на колл, в результате чего он может прибыльно отвечать. Например, если в банке 500$, а у нас в стеке остается 750$, то мы можем сделать ставку, лишь в полтора раза превышающую размер банка.

    1,5 = 750$/500$.

    В результате EV нашего соперника становится 0,1566 от размера банка.

    0,1566 = (1 – 17/99)(0,5+1,5) – 1,5

    Помните, что эта ожидаемая выгоды также выражается как отношение $/банк, поэтому мы вычисляем реальное EV нашего оппонента путем умножения этой пропорции на текущий размер банка (500$), чтобы получить 78,30$.

    78,30$ = (0,1566)(500$).

    Как вы понимаете, чем крупнее банк, тем меньшую сумму мы можем поставить. Это означает, что EV колла нашего оппонента возрастает. С другой стороны, если бы сделали огромную ставку, например, в шесть раз превышающую банк, то EV колла оппонента равнялось бы -0,616 от размера банка.

    -0,616 = (1 – 17/99)(0,5 + 6) – 6.

    Таким образом, если в банке будет 500$, то соперник будет коллировать в минус 308,08$.

    308,08$ = (-0,616)(500$).

    К счастью для нашего оппонента, он вправе нажать кнопку фолд с нулевым ожиданием.

    Если бы мы всегда ставили больше «объективной» суммы, то хорошие соперники всегда бы сбрасывались, позволяя нам забирать банк. Однако плохие игроки могут отвечать каждый раз, не веря вам. Если мы при этом будем ставить больше, чем указано в формуле, то колл соперника приобретет отрицательное EV, принося нам деньги.

    С другой стороны, если мы поставим меньше, чем гласит формула, то соперник сможет отвечать с положительным EV. Тогда он будет делать ошибку, сбрасывая свою руку. Таким образом, чем больше мы ставим, тем больше прибыли извлекаем из возможной ошибки соперника. В остальных случаях (например, когда у оппонента может оказаться лучшая рука) ставка выше «объективной» суммы будет ошибкой.

    В заключении я бы хотел подчеркнуть обратную связь между вероятностью, что у нас окажется сильная рука, и размером вашей ставки. Перед нами ситуация, в которой оппонент может в лучшем случае только разделить банк, а в остальных случаях будет проигрывать вашей лучшей руке – чем выше вероятность наличия у вас лучшей руки, тем меньше вы должны ставить, и чем ниже эта вероятность, тем больше вы должны ставить.
    Более реалистичный пример

    В предыдущей раздаче повышение размера ставки не стоило нам денег, так как в худшем случае мы могли лишь поделить банк. Однако в большинстве случаев у нас не будет такой роскоши. У вас будет возможный блеф или сильная рука, а у оппонента рука, способная побить ваш блеф. Более того, вы не всегда будете вольны выбирать свой размер ставки, так как иногда размер эффективного стека окажется равен (или меньше) банку.

    Мы на ривере против одного соперника. Он чекнул, а нам предстоит принять решение. В банке 800$, а эффективный стек 600$. На доску вышли следующие карты:

    J:diamond: T:spade: 4:spade:K:spade:3:spade:.​

    Без каких-либо дополнительных знаний мы можем установить вероятность, что в случайную руку будет входить хотя бы одна пиковая карта – 35%.

    0,35 = 1 – (38/47)(37/46).

    Однако, исходя из предыдущего розыгрыша, мы можем предположить, что у оппонента почти всегда окажется слабая пика. Точно так же наш соперник может вычислить, что у нас будет высокая пика примерно в 20% случаев, а какая-то слабая рука в 80% случаев. Это означает, что мы окажемся впереди 20% раз. Итак, по какой стратегии нам играть?

    Очевидно, что мы никогда не будем чекать вслед с сильным флешем. Кроме того, мы не можем варьировать размер своей ставки, так как эффективный стек меньше банка. Это означает, что единственным стратегическим вопросом остается частота, с которой мы должны идти в олл-ин на ривере. Если мы будем это делать каждый раз, то для соперника правильной игрой станет колл всех наших ставок. Это даст нам ожидаемую выгоду в 20% (вероятность, что у нас окажется сильная пика) от банка в 2000$, и за минусов 600$ мы получим -200$.

    -200$ = (0,20)(2000$) – 600$.

    Если бы мы ставили только с сильным флешем, то соперник всегда бы сбрасывался, отдавая нам банк в 800$ в 20% случаев, поэтому наше EV составит 160$.

    160$ = (0,2)(800$).

    Если мы хотим найти оптимальную частоту блефа, то должны для начала найти формулу, по которой рассчитывается EV колла оппонента. Когда мы ставим, то он может выбирать только между коллом и фолдом. Ожидаемая выгода фолда равна нулю. Ожидаемая выгода колла равна вероятности, что у него окажется лучшая рука, умноженная на размер банка в момент его колла, за минусом размера колла.

    bluff-form-5.jpg

    Когда мы не блефуем, то вероятность его выигрыша равна 0, но в 80% случаев мы будем блефовать, так флеш окажется у нас только 20% раз. Допустим, что «s» - это частота нашего блефа, т.е. вероятность нашей ставки без руки с выигрывающим флешем. Прошу заметить, что общая вероятность нашей ставки составляет:

    Pbet = (s)(0,8) + (1)(0,2).

    Вероятность выигрыша нашего соперника:

    bluff-form-6.jpg

    Графическое изображение данной формулы представляет отношение между частотой нашего блефа и вероятностью, что оппонент выиграет после нашей ставки.

    bluff-graf-2.jpg

    Конечно, мы не хотим, чтобы оппонент эксплуатировал нашу стратегию, поэтому будем использовать оптимальную частоту блефа. Это частота, которая уравнивает его EVколла с EVфолда, т.е. 0. У нас получается, что величина «s» должна равняться 10,7%.

    bluff-form-7.jpg

    Это означает, что когда мы не попадаем во флеш (в 80% случаев), то должны ставить с остальными руками 10,7% раз, а чекать вслед (и проигрывать) 89,3% раз. Если мы блефуем чаще, то теоретически теряем деньги, когда соперник отвечает. Если мы блефуем реже, то упускаем прибыльные возможности для блефа, позволяя оппоненту сбрасываться в убеждении хорошего фолда (т.е. он знает, что его рука бита).

    Общее EV нашего соперника после чека равно размеру банка, умноженного на вероятность того, что мы чекнем вслед и потеряем 571,43$. Это объясняется тем, что когда мы ставим, то его ожидаемая выгода будет равняться нулю.

    571,43$ = (0,8)(1 – 0,107)(800$).

    Даже несмотря на то, что у оппонента 80% эквити на вскрытии, наша стратегия блефа позволяет несколько нивелировать это превосходство, оставляя ему только 71% эквити.

    0,71 = 571,43$/800$.

    Если соперник начнет эксплуатировать наши ошибки в частоте блефа, то его EV будет выглядеть следующим образом:

    bluff-form-8.jpg

    Мы можем графически изобразить данную формулу:

    bluff-graf-3.jpg

    Мы понимаем, что EV нашего оппонента становится минимальным, когда «s» равно 10,7%. Также на данном примере мы замечаем примерную симметрию около этой точки. Ставить на 5% раз чаще будет той же ошибкой, как и ставить на 5% реже.

    Игра по стратегии, приближенной к равновесной

    Это математика. Она советует нам, как играть по оптимальной стратегии теории игр против оппонентов, которые знают вашу стратегию. Так мы действуем из опасения, что они начнут нас эксплуатировать. Однако мы вправе блефовать чаще или реже, чем это предписывает оптимальная стратегия. Мы должны так поступать, если хотим использовать ошибки соперников. Если они отвечают слишком часто, то мы блефуем реже. Если они падают слишком часто, то мы блефуем больше. Здесь все очевидно.

    На практике мы не сможем блефовать именно 10,7% в ситуациях, когда у нас не окажется флеша. Конечно, можно попытаться это делать, но на длительной дистанции мы будем блефовать чуть реже или чуть чаще. Обычно это столь важно, но нам стоит анализировать, могут ли оппоненты нас эксплуатировать, если мы отклоняемся от оптимальной частоты. Если мы понимаем, что блефовать часто хуже, чем блефовать реже, то следует подстроиться, чтобы в среднем ошибка стоила нам меньше денег (относительно оптимальной частоты).

    Вспомним нашу первую ситуацию для блефа на доске:

    6:diamond: 5:heart: 4:spade: 7:diamond: 8:spade: .​

    Мы нашли «объективный» размер ставки, который в два раза превышает размер банка. Если мы ставим эту сумму, то EV колла и фолда нашего оппонента становится равным нулю. Мы также пришли к выводу, что если ставим больше, то соперник будет просто выкидывать каждую свою руку. Это не изменит нашей ожидаемой выгоды.

    Однако, если мы ставим больше, а оппонент ошибочно отвечает некоторое количество раз, то зарабатываем больше денег, чем ставкой в 2,4 раза превышающую размер банка. Несмотря на то, что при оптимальной игре оппонента ставка в 2,4 размера банка и ставка большего размера одинаковы, в последнем варианте у соперника больше возможностей для ошибки.

    Вернемся ко второй раздаче на доске:

    J:diamond: T:spade: 4:spade:K:spade:3:spade:.​

    Здесь мы не могли изменить оптимальную частоту блефа, которая составляла 10,7% в тех случаях, где у нас не оказывалось флеша. В противном случае наша стратегия становилась эксплуатируемой. Когда вы взглянули на график EV нашего оппонента, то заметили симметрию вокруг точки равновесия. Это означает, что мы будем проигрывать приблизительно одинаковую сумму, если начнем ставить чаще или реже (при условии, что соперник действует оптимально). Здесь у нас нет стороны равновесия, на которой мы в полной безопасности. Однако, допустим, что мы небрежно относимся к оптимальной стратегии, блефуя от 0 до 40%. В наихудшем варианте, где мы вообще не будем ставить с блефом, EV оппонента будет 640$, в худшем сценарии, где мы будет ставить 40% раз, EV соперника составит 1000$. Таким образом, если мы не можем точно наметить оптимальную частоту блефа, то нам лучше блефовать реже, так здесь наши убытки окажутся меньше.

    В сложных раздачах, где ваш оппонент сможет выбирать между несколькими опциями, более частый блеф (чем по стратегии равновесия) обычно хуже, чем более редкий блеф, так как ставка предоставляет оппоненту дополнительные возможности. Он может решить ответить или повысить, чтобы построить банк крупнее.

    Каталог статей.png
     
    • Нравится Нравится x 2
    Последнее редактирование модератором: 13 ноя 2018
  2. Гэмблер777

    Гэмблер777 Местный

    0
    391
    +52 / -0
    Очень интересная статья, спасибо!
     
  3. Padavan

    Padavan Продвинутый

    0
    635
    +55 / -0
    Вот только на практике эти концепции довольно сложно применять.
     
  4. Mihai

    Mihai

    0
    7
    +0 / -0
    Полезная мысль!