Боти OpenAI домінують у фіналі покерного турніру від Google DeepMind
У середу, 4 лютого 2026 року, завершився покерний етап виставкового турніру Google DeepMind/Kaggle Game Arena. На жаль, інтригу не вдалося зберегти до кінця: у фінальному поєдинку зійшлися дві моделі o3 та GPT 5.2 — обидві від OpenAI.
Відомий професійний гравець Даг Полк проаналізував фінальну стадію змагань, зазначивши, що обидві моделі OpenAI використовували схожу стратегію: екстремальну агресію та постійний тиск на будь-які прояви слабкості опонентів.
Перед розбором фіналу Даг Полк виділив аутсайдерів турніру — моделі GPT-5 mini та Grok 4.1 Fast Reasoning. Для ілюстрації низького рівня їхньої гри була наведена роздача, де на флопі 10♣ 8♦ 2♣ гравці пішли в олл-ін:
- GPT-5 mini мав на руках A♦ 7♠.
- Grok 4.1 мав на руках A♣ K♠.
Жодна з моделей не мала навіть пари або дро, проте вони вклали всі фішки в пот. Згідно з логічним обґрунтуванням самих алгоритмів, Grok 4.1 вважав, що має натсове флеш-дро, маючи лише одну трефу на руках при двох на борді 🤦. GPT-5 mini, своєю чергою, помилково ідентифікував у себе натсовий флеш, маючи лише одну бубнову карту 🤦.
Стратегія та помилки фіналістів
Хоча моделі o3 та GPT 5.2 показали значно вищий рівень гри, Даг Полк зауважив, що вони все ще далекі від ідеальної реалізації ігрового дерева в хедз-апі. У одній із ключових роздач GPT 5.2 відкрився з J♠ 10♠, а o3 зробив три-бет із великого блайнда з A♠ 2♠. Даг Полк розкритикував це рішення, зазначивши, що з такою рукою проти рейзу доречніше просто колити.
Після того як GPT 5.2 зробив чотири-бет, модель o3 відповіла пушем. Основним аргументом бота було небажання втрачати вже вкладені в пот фішки.
“Це поширена помилка ШІ. Вони не розуміють, що фолд має нульове EV. Будь-яке рішення в покері має прийматися в конкретний момент, без урахування фішок, які вже знаходяться в поті — вони гравцеві більше не належать” — пояснив Даг Полк.
За даними PokerTracker, за підсумками всієї дистанції турніру найкращі результати показали три найбільш агресивні моделі.
- Лідери: o3, GPT 5.2 та інші гіперагресивні алгоритми.
- Середні результати: Моделі Opus та Sonnet. Вони демонстрували зважену гру на префлопі, але не змогли протистояти постійному тиску з боку агресивніших ботів.
Загальний висновок аналітиків свідчить про те, що поточне покоління ШІ-моделей досягає успіху завдяки інтенсивному тиску, проте їхня логіка все ще містить фундаментальні помилки в оцінці очікуваної вартості (EV) та комбінаториці.
ці боти вже повсюду домінують
Скоро будуть і вдома домінувати)
напевно це неменуче, якщо тільки ми не знищемо людство та прогрес
скоро буде як термінаторі , машини повстануть
І це ж не покерні боти, навіть. Просто той самий GPT, у якого ви питаєте, як подивитися серіал безкоштовно. Просто мовні моделі. Уявіть, яких ботів можуть зробити люди, які знають, як навчити ШІ на базах роздач