Lý thuyết trò chơi (Game theory)

Print Friendly, PDF & Email

chess

Tác giả: Trương Minh Huy Vũ

Lý thuyết trò chơi là một cách tiếp cận để hiểu và phân tích hành vi hay quyết định của mỗi cá nhân và các nhóm cá nhân trong một tình huống mâu thuẫn. Bắt nguồn từ cơ sở toán học ứng dụng và sau đó là ngành kinh tế, lý thuyết trò chơi theo đuổi hai giả định căn bản. Thứ nhất, nó giả định mỗi cá nhân hay các nhóm cá nhân là một người tham gia trong một cuộc chơi và mục tiêu của họ là làm thế nào để giành lợi ích (có thể là chiến thắng hay giảm sự thiệt hại). Thứ hai, nó xem mỗi hành động của con người được dẫn dắt dựa trên nguyên tắc lý tính theo ý nghĩa là trước mỗi quyết định, cá nhân đều cố gắng tính toán xem lợi ích/thiệt hại của bản thân mình khi đưa ra quyết định đó như thế nào.

Các loại trò chơi
Phân loại các loại trò chơi thường được dựa vào ba yếu tố là (i) số lượng người chơi, (ii) chiến lược mà các người chơi lựa chọn,  (iii) cơ chế quyết định kết quả của cuộc chơi. Dựa trên ba điểm trên có ba loại trò chơi chính: a) Trò chơi hai người có tổng bằng không, b) Trò chơi hai người với tổng khác không, c) Trò người nhiều người với tổng khác không. Trong khi trò chơi có tổng bằng không hàm ý rằng lợi ích của người này đồng nghĩa với thiệt hại của người khác, thì loại trò chơi với tổng khác không nhấn mạnh đến khả năng cùng thắng giữa các đối thủ trong một cuộc chơi, lợi ích của người này không nhất thiết là thiệt hại của người khác, mà ngược lại: mọi người tham gia cuộc chơi đều có thể giành được lợi ích tương đối cho bản thân.

Trong quá trình người chơi tham gia cuộc chơi, chúng ta có thể phân ra hai loại chiến lược: chiến lược hoàn hảo và chiến lược thông minh. Chiến lược hoàn hảo là chiến lược mà sẽ đem lại lợi ích cao nhất cho người tham gia cuộc chơi, không phụ thuộc vào hành động phản ứng của đối phương. Nói đơn giản là cho dù đối thủ có làm gì đi nữa, thì phần thắng vẫn thuộc về mình. Ngược lại, chiến lược thông minh hướng tới mục tiêu giảm thiểu mức độ rủi ro cho người tham gia cuộc chơi. Nói đơn giản là chiến lược này giúp người chơi chọn đường đi nào tới đích an toàn với rủi ro thấp nhất.

Cần nhắc lại rằng giả định quan trọng nhất của lý thuyết trò chơi là sự duy lý của mỗi cá nhân trong quá trình hành động. Cụ thể hơn, các tác giả phân ra hai hình thức duy lý. Thứ nhất là “duy lý cá nhân”. Theo đó, mỗi người người tham gia cuộc chơi sẽ cố gắng giành lợi ích tuyệt đối về bản thân mình, và hoàn toàn không chú ý tới việc liệu có một giải pháp “tất cả cùng thắng” (win-win situation) cùng những người chơi khác hay không. Trong ý nghĩ đó, người chơi A sẽ làm mọi thứ để giành chiến thắng, hoặc ít nhất không để cho các người chơi  B, C, D không giành được lợi ích. Logic này được thể hiện rõ nhất trong trò chơi “Thế lưỡng nan của tù nhân” (xem hộp phía dưới), một trò chơi được biết đến nhiều nhất trong việc áp dụng lý thuyết trò chơi vào quan hệ quốc tế.

Loại hình duy lý thứ hai được biết với tên gọi “chủ nghĩa duy lý tập thể”. Theo đó, A cố gắng đạt lợi ích, nhưng cũng đồng thời suy nghĩ đến việc liệu có một đáp số cùng thắng cho cả B, C và D hay không. Theo đuổi một giải pháp đôi bên cùng có lợi không chỉ giúp A đảm bảo lợi ích, mà còn giảm thiểu khả năng giải pháp của A bị các đối tác khác phản đối.

Loại hình duy lý tập thể được các học giả nghiên cứu quan hệ quốc tế quan tâm trong việc tìm hiểu lý do tại sao các quốc gia chấp nhận hợp tác với nhau. Trong trò chơi có tổng khác không, các học giả thuộc trường phái chủ nghĩa tự do thể chế (hay còn được gọi là chủ nghĩa tân tự do) lập luận rằng “chủ nghĩa duy lý tập thể” là một lý do quan trọng thúc đẩy các quốc gia tổ chức và tham gia các định chế khu vực và quốc tế vì nó giúp giảm chi phí và tăng hiệu năng trong việc giải quyết các vấn đề chung. Mặt khác nó cũng đưa ra những khuôn khổ giúp giới hạn những hành động cá nhân đơn lẻ gây phương hại đến lợi ích tập thể.

Ngoài ra, lý thuyết trò chơi còn được sử dụng nhiều trong việc phân tích và quản trị mâu thuẫn. Việc tính toán ra các lựa chọn của đối thủ sẽ giúp người chơi hoạch định những giải pháp phù hợp để đối phó, cũng như tìm cách thức hợp lý nhất để thúc đẩy các giải pháp hợp tác với nhau. Một trong những tác phẩm kinh điển của trường phái này là Chiến lược của mâu thuẫn xuất bản năm 1960 của tác giả Thomas Schelling, người từng đoạt giải Nobel Kinh tế năm 2005.

Dù có nhiều ưu điểm về phương pháp, cũng như được đánh giá là một công cụ nghiên cứu hiệu quả để phân tích các hệ quả của hành động, lý thuyết trò chơi cũng gặp nhiều ý kiến phê bình. Một trong số đó là giả định cho rằng kết quả của chính trị quốc tế dựa trên logic của chủ nghĩa duy lý, xem động lực của mỗi người đều tập trung vào lợi ích/thiệt hại của bản thân. Lịch sử và nhiều trường hợp thực tế đã phần nào đi ngược lại giả định này. Trong nhiều trường hợp, kết quả cuối cùng lại phụ thuộc vào các yếu tố khác (thường được xem là những lý do “phi lý tính”) như thành kiến, tự ái, thể diện quốc gia, hay nhận thức về đối phương.

THẾ LƯỠNG NAN CỦA TÙ NHÂN

Trò chơi “Thế lưỡng nan của tù nhân” có thể được tóm tắt như sau: Giả sử cảnh sát bắt được hai người phạm tội tàng trữ một lượng nhỏ ma tuý, với án phạt có thể là một năm tù giam. Cảnh sát có lý do để tin rằng cả hai là những tên buôn ma túy thực thụ, song lại không có đủ bằng chứng để buộc tội họ. Nếu bị chứng minh là những tay buôn ma tuý thực thụ thì cả hai có thể chịu mức án lên đến 25 năm tù giam. Cảnh sát biết rằng chỉ cần lời khai của một tên chống lại tên còn lại là đã đủ kết án tên còn lại mức án của tội buôn ma tuý. Cảnh sát cho biết sẽ tha bổng cho bất cứ ai trong hai người nếu người đó cung cấp chứng cứ buộc tội người còn lại phạm tội buôn ma túy. Trong trường hợp cả hai cùng cung cấp chứng cứ chống lại nhau thì cả hai đều nhận mức án giống nhau là 10 năm tù. Cảnh sát đưa ra phương án này vì muốn giam giữ cả hai trong vòng 10 năm, nếu không cả hai sẽ bị tống giam chỉ một năm và sẽ nhanh chóng ra tù tiếp tục tham gia buôn bán ma túy.

Cả hai kẻ tình nghi bị nhốt vào những buồng giam riêng biệt và không được liên lạc với nhau. Mỗi tù nhân đều có những tình huống lưỡng nan giống nhau: nếu tố cáo tên kia thì tên kia sẽ phải ngồi tù 25 năm còn mình sẽ được tự do, hoặc không tố cáo và giữ im lặng thì sẽ ngồi tù một năm. Nhưng nếu cả hai đều tố cáo nhau thì cả hai sẽ phải ngồi tù 10 năm. Mỗi tên đều nghĩ “Tốt hơn hết là mình nên tố cáo. Nếu tên kia không tố cáo và mình cũng im lặng, thì cả hai ở tù 1 năm. Nhưng liệu nó tố cáo thì sao? Trong trường hợp đó nếu mình cũng tố cáo thì mình phải ngồi tù 10 năm, nhưng nếu mình im lặng thì nó tự do còn mình bóc lịch những 25 năm. Mình sẽ là kẻ giơ đầu chịu báng. Nếu mình giúp nó bằng cách giữ im lặng thì chắc gì nó lại không tố cáo mình?”

Đây là một ví dụ tiêu biểu cho tình trạng tiến thoái lưỡng nan gây nên bởi các hành vi độc lập mang tính duy lý. Kết quả tốt nhất cho một bên là tố cáo bên còn lại và được tự do. Kết quả tốt thứ hai là cả hai cùng im lặng và hưởng án tù 1 năm. Kết quả tệ hơn là cả hai cùng tố cáo nhau và rồi lãnh án 10 năm tù. Nhưng tệ nhất vẫn là bị đâm sau lưng trong trường hợp giữ im lặng trong khi bên còn lại tố cáo, và sau đó kẻ giữ im lặng phải ngồi tù 25 năm. Nếu mỗi bên lựa chọn giải pháp tốt nhất cho mình thì cả hai sẽ phải hứng chịu một kết quả xấu. Chọn phương án tốt nhất, tức là tự do, đồng nghĩa với một lựa chọn duy lý, song nếu cả hai đều đơn phương chọn phương án tốt nhất cho mình thì cả hai lại phải cùng gánh chịu một hậu quả xấu. Khi không có giao tiếp thì việc hợp tác trở nên khó khăn. Nếu có thể nói chuyện với nhau, hai bên có thể thoả thuận cùng giữ im lặng và sẽ cùng ngồi tù chỉ trong một năm.

Tuy nhiên, ngay cả khi có thể giao tiếp với nhau thì vẫn nảy sinh những vấn đề không dễ giải quyết: đó là lòng tin và mức độ đáng tin cậy. Trong câu chuyện lưỡng nan của người tù, mỗi nghi phạm có thể tự nhủ rằng: “Chúng ta đều là những tên buôn ma tuý. Ta đã chứng kiến cách làm ăn của hắn. Sau khi thoả thuận cùng im lặng, ta làm sao biết liệu hắn có phủi tay mà nói: “À ha, ta đã thuyết phục được hắn giữ im lặng. Giờ ta sẽ chọn cho mình giải pháp tốt nhất mà không sợ bị ngồi tù nữa.” Tương tự như vậy, trong chính trị quốc tế, thiếu trao đổi và lòng tin sẽ khiến các quốc gia phải tự lo cho an ninh của mình dù biết rằng nếu làm như vậy cuối cùng sẽ khiến an ninh chung của các quốc gia cùng suy yếu. Nói cách khác, một quốc gia có thể lên tiếng rằng: “Anh đừng có tăng cường vũ trang nhé, tôi cũng sẽ không tăng cường vũ trang và chúng ta sẽ cùng chung sống với nhau hạnh phúc mãi mãi.” Nhưng quốc gia còn lại sẽ phải tự hỏi liệu mình có dám tin những gì quốc gia đầu tiên nói hay không.

-Theo Joseph Nye, Understanding International Conflicts, trang 16-17

Nguồn: Đào Minh Hồng – Lê Hồng Hiệp (chủ biên), Sổ tay Thuật ngữ Quan hệ Quốc tế, (TPHCM: Khoa QHQT – Đại học KHXH&NV TPHCM, 2013).

This entry was posted in Lý thuyết QHQT, Thuật ngữ QHQT and tagged , . Bookmark the permalink.