こんにちは。TOMOです。
WSOPがオンラインで始まっているようですね。
マレーシアにいる僕自身は関係のない話なので、知人友人プレイヤーがブレスレットを取ることを応援しつつ普段どおりの生活をする日々です。
さて、普段どおりの生活の中にSnowie先生との付き合いがあるわけですが、昨日なんともなしにSnowieとのヘッズアップを始めて気になることが起こりました。
それがこのハンドです。
リバーのアクション、AQoのトップヒットで1/4ポットベットを選択したところ
Snowie「アクションは適切だけど、ベット額が最適と遠く、ポットベットをすべき」
と怒られました。
普段なら「あーポットベットの方が利益的なのかー」と納得できる話なのですが、今回は別。
なぜなら
自分が選択したリバー1/4ポットベットのEV:6.94
Snowieが推奨するポットベットのEV:6.09
と、1/4ポットベットの方が明らかにEVが高いプレイとなっていたのです。
僕が考えるSnowieの使い方は
1.自分が普段するベット額をチョイスした上で、コールorベット/レイズorフォールドでEVの高いプレイを選ぶ(時には混合戦略)
2.ベット/レイズを選ぶ場合、一番高いEVのベット額を選択する
の2つあると思っています。
1だけでも良いし、1と2を合わせても良いイメージです。
あるシチュエーションで、ベット額によって大きなEVの差がある場合や、「自分が普段するベット額」がそもそも誤ってる場合もあるから1と2を合わせて「一番期待値の高いプレイ」を選択する必要があるシチュが存在するのも分かります。
分かりやすい例で言えば、
Aハイレインボーのボード(A♤T♡4◇等)で「普段このベット額するからー」と言って単なるCBでポットベットを選択することは直感的に良くないプレイと考えられそうです。
もしかしたら「2のルールも絶対」と思ってSnowie使っている人も一定数いるのではとは思います。
ただ、実際今回のヘッズアップでも期待値の低い方のアクションをSnowieが選択する場面もありました。
J43モノトーンボードにおいて、フラッシュドローの無い2ペアを持ったSnowieは1/4ポットベットを選択。
ベット額ごとのEVを見ていくと
1/4ポットのEV:4.32
1/2ポットのEV:4.42
1/2ポットのEV:4.42
と1/2ポットベットの方が少しEVが高いものの、1/4ポットベットをSnowieは正解と捉えているようです。
さて、話を元に戻し、一方で今回のAQでの1/4ポットベットのシチュエーション。
Snowieはわざわざ一番期待値の高いプレイに対して「そうじゃない」と注意しています。
これは何か深い理由がありそうです。
1ハンド単位で見ると期待値最大じゃないプレイが、様々なボードとハンドの集合を鑑みた時にエクスプロイトされない最適なプレイになるんだー
というシチュエーションなんでしょうか?
確かに、リバーでAが落ちたボードはAを使ったブラフができそうです。
そうなると、AQのような強いハンドや65♧♧のようなドローが滑ったハンドを混ぜてポットベットをする方がレンジ全体では期待値の高いプレイになりそうにも思えます。
こういったことをツイッターでなんともなしに呟いてたところ、フォロワーの専業の方から返信をいただき、以下のページを紹介していただきました。
Snowieのテクノロジーに関して、弱みを簡潔に伝えているページです。
英語のページにはなりますが、恐らくかなり優秀な方がまとめたページのようでGoogle翻訳にかけるだけで十分日本語で理解できるページになっています。
(長くもないので、全文読んで見ることを推奨します)
このページの中で
>Allowing only one bet size for the whole range of cards in a specific situation
Google翻訳:特定の状況でカードの全範囲に対して1つのベットサイズのみを許可する
の小タイトルで始まる文章があります。
簡単にまとめると、
・Snowieはポットをxとすると0.5x・1.0x・2.0xのベットサイズのみを採用している
・実際、ハイステータスのポーカープロは強いハンドも弱いハンドも同じようにプレイしている
・例えばプリフロでAAで大きくオープンし、QJで小さくオープンすることは弱みになってしまう
・理論上は0.75xが最良のベット額になることは考えられるが、その場合はレンジ構成を改めて形成する必要があり0.5xや1.0xのいずれかと大きく違うことは無い(0.75xが群を抜いて最高になるわけではない)
といったところでしょうか。
面接でよくある「あなたの弱みはなんですか?」に対して、
「集中しすぎて周りが見えなくなってしまうことがたまーにあることです。(意訳;集中力があるって逆に言えば一つの強みだけどね)」
みたいな嫌らしい弱みの紹介ですよ全く。
実際、強みを伝えるページにも
>The same bet size is used for the whole hand range.
Google翻訳:ハンドの範囲全体で同じベットサイズが使用されます
と記載がされており、
・だから相手からハンドリーディングされにくい
と弱みと紹介していたことを強みとしても主張しています。
今回改めて分かったこととしては、
・Snowieは1ハンド単位では期待値最大のプレイをしないことがあり、開発者自身もそれを認めている
・一方で、ハンドレンジ全体では検証したベットサイズ(1/4ポット、1/2ポット、1ポット、2ポット)の中で最適なベット額を選んでいる
ということです。
(今は1/4ポットベットが普通に表示され使われていますが、文章内には1/4の記載が無いので後から追加されたサイズなのでしょうか?)
→8/2追記:堀内先生の下記動画で、Snowieは最初1/4ポットが無かったとの発言がありました。
つまり、疑問の発祥となったリバーAQのベット額は
「AQを持っている時は期待値最大なプレイにならないけど、レンジ全体で見たら期待値最大となるポットベットを採用すべき」
ということですね。
何万何十万ハンドと同じ人とプレイをしていったらこの強いハンドでの1/4ポットベットが弱み(エクスプロイトされやすい弱点)となりうるということでしょうが、なかなか人間には到達しにくい領域な気がします。
ちなみにSnowieは
>In 99.9% of all poker situations, this is all that is needed.
Google翻訳:すべてのポーカー状況の99.9%では、これで十分です。
と謳っています。
いやいや1000アクションに1回しか弱みを発動する瞬間がないとか流石に言いすぎだろと僕はかなり疑っていますが、開発者は凄く自信を持った愛されたAIなんだなーということが分かる良い機会となりました。
更にちなみに。
Snowieは
>Learned all conceivable strategies
Google翻訳:考えられるすべての戦略を学んだ
と豪語しています。
相変わらず何言ってんだこいつ?と思ったらかなり有意義な箇条書きになっていたのでここで紹介します。
Snowieが学んだポーカーの戦略は以下の13個だそうです。
・ブラフ
・チェックレイズ
・スロープレイ
・セミブラフ
・スロープレイ
・セミブラフ
・ブラフの誘発
・ポットサイズの制御
・インプライドオッズ
・ポジションによるアクションの変化
・フロート
・ベットサイジング
・ドンクベット
・ブロックベット
・ブロックベット
・ブロッカー
かなり上手いとされるポーカーAIを構成する戦略がこの13個です。
もし知らない概念や上手く使えていない戦略があるようでしたら、これらを苦手な部分から潰していったら勉強方法としてかなり有意義な指標になるんじゃないでしょうか。
いやしかしホント、スノーウィー先生メッチャ凄いですし、専業の方の視点ってAIに負けてないんだなーとしみじみ感じてしまいました。
ネットサーフィン中にふらりと読ませてもらった者です。
以前同じ事が気になり自分でも調べた事があります。
自分としての結論はスノーウィーは同じスポットでベットサイズによりレンジをスプリットしないので、シングルベットサイズだけで簡略化されたレンジ全体のEVが高い戦略を提供し、AQの例の様に様々なベットサイズを用意しレンジスプリットしてベットした方がEV高くなるケースは省いているからです。
これはスノーウィーの成り立ちはAIにより編み出された人間が使える範囲の中で最適な戦術を教える学習ツールである、という事に起因し同じスポットでレンジスプリットしてそれぞれのレンジのバランスを取る事は人間には不可能と結論しているのでシングルベットサイズの戦略を最適として提供しています。
コメントありがとうございます!
とても納得感のあるお話で一人なるほどと声が漏れてしまいました
>同じスポットでレンジスプリットしてそれぞれのレンジのバランスを取る事は人間には不可能と結論しているのでシングルベットサイズの戦略を最適として提供しています。
こちら納得感もあり、とても興味深いです!
またふらっと立ち寄った際には見たことあるなこのブログ程度で構わないので思い出して貰えると嬉しいです