【ポーカー】”レンジとオッズで考える”なんて大間違い【AIに近づく第一歩】

ngwoman

こんにちは。TOMOです。

先日、
【ポーカー】”レンジとオッズで考える”ということ【脱初心者の心がけ】
というタイトルの記事を投稿しました。

リアルでもブログでも僕が常々言っていることで、最近ではしまぽさんが”コンビナトリクス”という用語を用いた動画をあげている考え方と、ほとんど同じこととなります。


さて、そんな”レンジとオッズで考えてアクションを決める”ということを改めて例を用いて振り返ると、

・相手はSBから10BBのオールインをしてきた
・相手の持ちうるハンド(=レンジ)は、ポケット全部とA持ち全部、54s以上のスーテッドコネクタ、数字を足して20を超えるハンド全部
・自分のハンドはKJo
・コールは正解か?

等の答えが出せます。


相手のレンジをポーカーっぽく書き直すと、
・22+
・Ax+
・K7+
・Q8+
・J9+
・T9s,98s,87s,76s,65s,54s

となります。

アプリでレンジ表の形にすると、以下のようになります。


そしてこのレンジに対するKJoのエクイティを計算すると、49.5%となるようです。

 勝利する確率×勝利時の期待値+敗北する確率×敗北時の期待値
の計算式に当てはめると、
 49.5% × 11 + 50.5% × (-9) = 0.9
と期待値プラスになり、コールすることで1回あたり0.9の利益がもたらされることが分かります。

Axやポケットは絶対にレンジに入っていて、それらには不利な勝負になる……スーコネ含めてKT以下のハンドには有利だけど、勝率は50%を切っていそう……
というレンジの考えだけではダウンに偏りがちですが、オッズまで考えるとコールになる……(からオッズの考えは大事)という例でした。


そもそもレンジの考えが無ければ、「JK好きだからコール」「オールインは強いアクションだからそれにはダウン」という論理もへったくれもない当てずっぽうのプレイになってしまい、それでは中長期的にレンジの考えを持って数学的に正しいプレイをする人に負けてしまうのは明らかです。
(ポーカーというのは相対的に数学的に誤ったプレイをした方が負けるようにできているので)


レンジとオッズ、両方の考えを持って正しいプレイが判断できるということですね。



さて、ではレンジとオッズで考えて正しいプレイをしていたら中長期的に見て負けることは無いのでしょうか?

一つ例を上げてみます

3max
5/10/アンティ1.25

プリフロ
SB c
BB 8♡4♧ ✓

フロップ
9♤8♧4♤
SB ✓
BB b23.75
SB r48
BB r107.88
SB c

ターン
Q♡
SB,BB ✓

リバー
6♡
SB ✓
BB b59.88
SB rAI ES341.37
BB d ←ここ


Snowie先生はBBの84oを100%オールイン(コール)と提唱しています。

一方で、SBのオールインレンジを見てみると、

99%ストレート(84の負け)・1%ハイカード(84の勝ち)と極端にバリューヘビーになっています。

相手のレンジ(99%ストレート)とオッズ(必要勝率約30%)とを鑑みるとダウン推奨のはずですが、ここはコールが正解。。

さすがに違和感がありすぎるので、リバーオールインとなるハンドレンジを確認したところ、Snowieの想定では84oが残っていませんでした。


前のストリートを遡っていったところ、プリフロのSBリンプに対してBB84oをポットレイズに回すのが正解で、チェックハンドに残っているはずが無いということのようです。


ただし、プリフロで0.5ポットレイズを検討する場合はチェックが正解なので残っていても本来不思議ではないハンドではあります。
(こういったハンドが相手のレンジから消えてしまうのはSnowieの良くない仕様だと僕は思っていますが、仕方ない部分でもあります)


ということで84oで検討すると「途中でエラープレイが発生していることが原因のエラー表示」を仮定の結論にして終えることもできてしまいます。

ですが、ここで改めてBB側のリバーオールインレンジを確認するとQ6oというハンドが残っていることが分かるので、このハンドで再検討することにします。


BBのQ6o2ペアも、当然SBの99%ストレートが独占するレンジにコールが正当化されるはずが無いのは84oの時の考え(1%の実勝率と30%の必要勝率)と一緒です。

でも、やはりコールが正解になります。

これは一体どういうことなのでしょうか?


前提として、Snowieが算出する正しいプレイは、1ハンド1ハンドで期待値が最大にプレイになるプレイではありません。

数多あるハンドと、ボードやベット額等のシチュエーションの組み合わせにおいて、相手に搾取されない(弱みにつけこまれない=エクスプロイトされない)プレイの集合体がSnowieの正解とするプレイとなります。


詳しい話に興味があれば、以下のページを参照ください;
【ポーカー】Snowieの強みと弱みの話


Snowieの強みを紹介するページ
POKERSnowie THE AI Weaknesses
には、
・例えばプリフロでAAで大きくオープンし、QJで小さくオープンすることは弱みになってしまう(ので強いハンドも弱いハンドも同じ額でオープンする)
という文が実際に記載されています。(原文は英語です)


ポストフロップも同じで、1ハンド1ハンドではなくトータルで見た時に期待値がマイナスにならないプレイをすることで、(変な日本語ですが)弱いハンドでもしっかり損失を出すことで、強いハンドでもしっかり利益を出せています。


今回の例では、この2ペアで降りてしまうようだと、理論上SB側は広くブラフすることでハンド全体でより利益が出せてしまいます。


SB側視点でもBB側視点でもお互いに搾取されない(エクスプロイトされない)プレイの集合上、今回はBB側の2ペアは相手に利益をもたらしている……という分かったようで分からない話です。

もう少し分かりやすい例を出すと、
・リバーでペアボードでも無くストフラも無いボードで、Kハイフラッシュを引きました
・相手がチェックしたのでバリューのつもりでポット200に対して100のベットをしました
・この時相手のレンジはAハイフラッシュ10%、ナッツブロックのAx30%、Q以下のフラッシュ30%、トップヒット~2ペア30%を想定しています

・相手から見た自分のレンジはKハイ以下のフラッシュでのバリュー30%,2ペアでのシンバリュー30%,エアーブラフ40%です
・相手が500のオールインをしてきました
・必要勝率33.3%ですが、コールしますか?

という問題を考えます。

自分がナッツになるAを抑えていない以上、相手が持っている可能性はあります。

そしてどれだけBB側にブラフが混じっているかは誰にも分かりません。

でも、Kハイフラッシュで降りてしまうと全てのハンドでレイズが来たら降りてしまうことになります。

そうなるとSB側はブラフやバリュー等目的を考えずに、とりあえず全てのレンジでベットすることが正解になります。

それだとBBの全レンジダウンは明らかに相手にエクスプロイトされるプレイなので、ある程度のハンドでコールするようコールレンジを広げます。

SB側はBBのその考えを想定し、全ハンドでレイズではなくある程度ハンドを絞ってブラフをし、更にQハイフラッシュ等でバリューを取りに行くことも必要になると考え実行します。

BB側はSBのその考えを元に、コールするハンドを広げるか狭めるかを調整する必要がありそうです。

…………


結果的にどこまでコールするかはAIの計算やゲーム理論上の計算に任せるとして、とりあえず「Kハイフラッシュ(BB側が持ちうるハンドの中で一番強いハンド)ではコールする」ことは間違い無さそうです。


このレンジを絞ったり広げたりする話は、ポーカージョーズさんのこの記事が丁寧で分かりやすいと思います;
【初級編】レンジ part1 〜どうしてレンジって必要なの?〜


でも実際は、BB側のプレイがGTOから大きく乖離し、「リバーでのベットレンジにQハイ以下のフラッシュは入っていないぽい(Kハイフラッシュでもたまにチェックし、ほぼほぼAハイフラッシュ)」ことが周知なこともあります。

プリフロップでVPIP5%以下の超タイトなおじいちゃんプレイヤーから4betが来たらKK+しかない……このQQ降りたくないけど降りるしかないかー……みたいなやつですね。


もし自分がそういうプレイヤーで、周りからそう(超タイトでバリューはほぼナッツと)思われていることを理解していたとしたら、相手がまともならK以下のフラッシュでレイズしてくることはなく、相手のチェックレイズに対してKハイフラッシュはフォールドすることがレンジとオッズの考え上、正解になりえます。


でも、こんなプレイを続け、相手からAハイフラッシュを見せられて(セカンドナッツを降りれてナイスプレイ!)……と思っていては上手い方に一生運以外で勝てないので、単純に「そんな超タイトなプレイをしてること自体が、相手から搾取されている理由なんだ!」と自分を律する必要がある……というのが結論です。


中長期的に大きく勝っているプレイヤーは、瞬間瞬間では大きく負けることもあり、傍から見てると「何そのコール」「そのベットは下手すぎるわ」と見えることもあるものの、負けた時のプレイが正しいのであれば必要経費(自分のハンドが負けていること、チップを取られたことは結果論でしか無い)と割り切ることも必要ということです。


自分か相手のどちらかが誤ったプレイをしていた場合、ゲーム理論上の正解とは違う答えが期待値プラスや最大になることはありますが、一方で相手にアジャストした結果でないのにそんなプレイを続けていると同じボードで自分のハンドが違う時や、別の似たようなシチュエーションの時に相手にエクスプロイトされて中長期的にマイナスになりえます。


結局はポーカーというのはゼロサムゲームで、相手より多く大きなミスをしたら中長期的にマイナスになります。

加えて、レーキのあるテーブルでは、多少相手よりミスが少なくてもプラスに転じることができないこと(自分は小負け、相手は大負け)も多々あります。

自分の持っているハンドと相手のレンジ、そしてオッズだけで考えていては例え計算上正しくてもトータルで期待値マイナスなプレイになりうるので、相手からみた自分の持ちうるハンドレンジを元にした相手のレンジを想定することでより一歩高みにいける……そんなお話でした。


理論は分かってこうして文字に起こせても、実践の場で瞬時に判断することは難しいし、尋常な人間には無理だなーどうしたものかなーと思って白目を剥いています。

(終)


甲子園常連校の現役高校球児(16)、1軍に上がったこのない元プロ野球選手(50)、野球を専門にしたスポーツ科学教授(40)。

一番野球を理解していて、これからプロを目指す素質十分な小学生を教えるのに向いているのはこの中で誰なんだろうなー


コーチングやらオンラインサロンやらnoteやら書籍やら、様々な有料教材が乱立している日本のポーカー界をマレーシアから遠く眺めてのちょっとした独り言です。


➖➖➖➖➖
ちなみにこの記事のタイトルは、学生時代に好きだった山田真哉さんの新書
食い逃げされてもバイトは雇うな―禁じられた数字〈上〉

「食い逃げされてもバイトは雇うな」なんて大間違い―禁じられた数字〈下〉
からパクっています。


当時中学生だった僕は、下巻のタイトルを見て驚き、
「大人って奴は、購買欲をくすぐるためにはなんでもしてくる酷い生き物だ!」
と友人に愚痴った記憶があります。

結局下巻も買って面白かったから良いんですけどね。

TOMO@KL

マレーシア首都のクアラルンプール在住。

ポーカーが趣味で1~2ヶ月に1回程度仁川・マニラ・台北・ホーチミン等に海外遠征。
当初はライブトーナメントのみプレイしていたが、現在はキャッシュ・オンライン等形式は問わず幅広くプレイ。

マレーシア在住の方やポーカー好きの方等、積極的にメッセージいただけると嬉しいです。

おすすめ記事

コメントを残す

メールアドレスが公開されることはありません。