Nhiều bài viết, sách, tài liệu khi giới thiệu về GTO (lý thuyết trò chơi) trong poker thường mượn trò oẳn tù tì để minh họa. Thế nhưng theo mình, đây là 1 ví dụ rất dở, gây nhiều hiểu lầm, lẫn lộn cho người đọc. Chẳng hạn, ai cũng biết, “theo GTO”, chiến thuật chuẩn trong oẳn tù tì là 33.3% ra búa, kéo, lá như nhau. Nhưng tưởng tượng 1 người chơi “GTO”, đấu với 1 người chơi “fish” đánh rất ngu, 100% ra búa, thì kết quả cuối cùng đường dài vẫn là hòa nhau. Điều này làm nhiều người nhầm tưởng rằng “chơi GTO trong poker thì tuy không bao giờ thua nhưng cũng chẳng bao giờ thắng, cuối cùng mất hết tiền cho rake“.
Minh họa tốt hơn sẽ là 1 trò chơi mới: giống oẳn tù tì, nhưng có 4 lựa chọn:
- Búa đập được Kéo
- Kéo cắt được Lá, Bao
- Bao bọc được búa
- Lá thì quá mỏng, không bọc được búa, bị đâm thủng, chỉ hòa được với Bao. Có thể coi Lá như 1 phiên bản lỗi của Bao, có cùng điểm yếu, nhưng không có được điểm mạnh của Bao
Chiến thuật GTO khi chơi trò này sẽ vẫn là 33.3% Bao = Kéo = Búa, 0% Lá. Không có bất cứ lý do gì để chọn ra Lá thay vì chọn ra Bao, nên nếu 2 người chơi tối ưu đấu với nhau, trò oẳn tù tì bậc 4 này thực chất vẫn chỉ là oẳn tù tì bậc 3 quen thuộc. Giờ tưởng tượng có 1 người chơi fish khác, với chiến thuật 25% ra Lá = Búa = Kéo = Bao. Người chơi này đã mắc sai lầm lớn khi chọn ra Lá 25%, sai lầm này được gọi là lỗi EV, khác với lỗi tần suất (chẳng hạn nếu 1 người chơi 50% ra Búa thay vì 33.3%). Đây là sự khác biệt so với oẳn tù tì thường, vì trong oẳn tù tì bình thường, không có lỗi EV, khiến nó trở thành minh họa dở cho GTO. Đối đầu người chơi fish này:
- Người chơi GTO sẽ thắng 5 thua 3 trên 12 ván, đường dài sẽ ăn tiền
- Người chơi exploit 100% búa hoặc 100% kéo sẽ thắng 6 thua 3 trên 12 ván, đường dài ăn nhiều hơn chơi GTO
Trong poker cũng vậy, nếu bạn chơi chuẩn theo GTO, đúng là bạn không ăn được tiền nếu đối thủ chỉ mắc lỗi tần suất (thực hiện 1 hành động indifferent x% thay vì y% theo lý thuyết). Chẳng hạn bạn bet đủ 3 vòng trên mặt A752J rainbow, BU đấu BB. Đối diện cú bet lớn ở river, những bài như A9, A8 là bài dạng indifferent, call cũng được, fold cũng được. Solver có thể sẽ call những bài này 20-30%, nhưng nếu đối thủ mắc lỗi tần suất và call 60%, thậm chí 100% hoặc 0%, bạn cũng không ăn được tiền của họ. Chơi theo GTO, bạn chỉ ăn được tiền khi đối thủ mắc lỗi EV, chẳng hạn họ fold bài A5, hoặc họ call bài 44, là những bài lẽ ra phải pure call hoặc pure fold. Trên thực tế, trò poker cực khó, khó hơn nhiều trò oẳn tù tì bậc 4 ở trên, nên tất cả người chơi sẽ thỉnh thoảng mắc những lỗi EV này, call những bài lẽ ra phải fold hoặc ngược lại. Người chơi càng kém, càng mắc nhiều lỗi EV. Lợi nhuận đường dài của bạn đến từ những lỗi EV không tránh khỏi này của đối thủ.
Nếu biết chắc được lỗi của đối thủ, bạn có thể exploit để tăng lợi nhuận cho mình, giống sử dụng 100% Búa/Kéo như ở trên. Tuy nhiên lúc này, bạn lại có nguy cơ bị exploit ngược, chẳng hạn nếu bạn sử dụng 100% Kéo, có nguy cơ đối thủ phản công và dùng 100% Búa. Dùng chiến thuật GTO sẽ bớt lo điều này, vì bạn không quan tâm đối thủ dùng bất cứ chiến thuật nào, kết quả vẫn vậy, chỉ có hòa tiền (đối thủ không mắc lỗi EV nào), thắng ít (đối thủ mắc ít lỗi EV) hoặc thắng nhiều (đối thủ mắc nhiều lỗi EV) mà thôi.
Ví dụ trên cũng phản bác rõ ràng quan điểm “nếu 2 hành động indifferent có EV giống nhau, bạn thích chơi thế nào cũng được“. Nhiều người chơi, thậm chí top pro, trùm cuối cũng mắc sai lầm này trong cách nghĩ. Chẳng hạn Stephen ‘go0se.core!’ Sontheimer từng cười Justin Bonomo vì mất quá nhiều thời gian suy nghĩ ở 1 trường hợp “close decision”, vì theo Stephen, ở đây Bonomo đánh thế nào cũng được. Nhưng suy nghĩ này là sai. 2 hành động indifferent chỉ “thế nào cũng được” nếu bạn đối đầu người chơi GTO không bao giờ điều chỉnh. Giống như nếu bạn chơi oẳn tù tì bậc 4 với 1 con robot, thì bạn ra Búa hay Bao hay Kéo cũng vậy, chẳng khác gì, miễn đừng mắc lỗi EV (ra Lá) là được. Nhưng trên thực tế, bạn không chơi poker đối đầu với máy, vì vậy bạn cần để ý tránh mắc lỗi tần suất, vì lỗi tần suất cũng có thể khiến bạn thua tiền chứ không chỉ có lỗi EV (dù có ưu điểm là khó để đối thủ nhận ra bạn đang mắc lỗi tần suất hơn nhận ra bạn đang mắc lỗi EV):
- Tránh để lộ sơ hở khiến bạn bị exploit ngược. Chẳng hạn đối thủ ra 100% Búa khi nhận ra bạn chơi 100% Kéo, dù trên lý thuyết, hành động 100% ra Kéo của bạn là indifferent
- Thậm chí, bạn có thể bị đối thủ tình cờ ngẫu nhiên exploit, thậm chí bị exploit bởi fish. Chẳng hạn nếu đối thủ là fish chơi 25% Lá (lỗi EV), 75% Búa, bạn cũng sẽ thua anh ta.
Trong poker cũng vậy, nếu bạn thường xuyên fold những bài bắt bluff indifferent (vì “call hay fold cũng được“), bạn có thể bị mấy con fish maniac tình cờ exploit, và ngược lại nếu bạn thường xuyên call chúng, bạn cũng mất tiền nếu đấu với người chơi nit passive. Bạn chỉ có thể “đánh sao cũng được” với các hành động indifferent nếu biết chắc đối thủ là 1 top pro với chiến thuật tiệm cận GTO, nhưng lâu dài, những khuynh hướng này của bạn sẽ bị bộc lộ trên HUD stats, hoặc với 1 người chơi giỏi quan sát, và có nguy cơ bị họ điều chỉnh để exploit.
