Lý thuyết cân bằng Nash là một khái niệm trung tâm trong lý thuyết trò chơi (game theory), được nhà toán học John Forbes Nash Jr. giới thiệu vào năm 1950. Nó mô tả một trạng thái trong trò chơi khi không người chơi nào có động lực đơn phương thay đổi chiến lược của mình, bởi vì mỗi người đều đang lựa chọn chiến lược tối ưu nhất có thể, xét theo chiến lược của những người chơi còn lại.
🧠 Định nghĩa đơn giản:
Cân bằng Nash là một tình huống trong đó:
"Không ai có thể cải thiện kết quả của mình bằng cách thay đổi một mình chiến lược, miễn là những người khác không đổi chiến lược."
📘 Ví dụ đơn giản:
Trò chơi Song đề tù nhân (Prisoner's Dilemma)
Hai người bị bắt và bị thẩm vấn riêng biệt. Mỗi người có 2 lựa chọn:
-
Im lặng (Hợp tác)
-
Khai (Phản bội)
| Tù nhân B im lặng | Tù nhân B khai | |
|---|---|---|
| Tù nhân A im lặng | Cả hai bị 1 năm tù | A bị 3 năm, B được thả |
| Tù nhân A khai | A được thả, B bị 3 năm | Cả hai bị 2 năm tù |
👉 Kết quả: Mỗi người sẽ chọn Khai, vì đó là cách giảm thiểu rủi ro tồi tệ nhất cho bản thân, dù kết quả chung lại tệ hơn so với nếu cả hai cùng im lặng.
→ Đây chính là Cân bằng Nash: không ai có động lực đổi chiến lược nếu biết người kia vẫn giữ nguyên.
⚖️ Đặc điểm của Cân bằng Nash:
-
Có thể tồn tại nhiều hơn một cân bằng trong một trò chơi.
-
Không phải lúc nào kết quả ở Cân bằng Nash cũng là tối ưu về tổng thể (ví dụ như trong Prisoner’s Dilemma).
-
Áp dụng cho nhiều lĩnh vực: kinh tế học, chính trị, sinh học tiến hóa, tâm lý học, trí tuệ nhân tạo...
📍Ứng dụng thực tế:
-
Kinh tế học: xác định hành vi cạnh tranh của doanh nghiệp.
-
Đàm phán và chiến lược trong chính trị.
-
Thiết kế cơ chế: giúp xây dựng hệ thống có kết quả mong muốn dù mỗi người đều hành động ích kỷ.
-
Trí tuệ nhân tạo: xây dựng chiến lược đối kháng trong game, mô hình học tăng cường đa tác nhân.