Khi AI đàm phán giỏi hơn con người: Tương lai nào cho các nhà ngoại giao?

Tác giả: Ngô Di Lân

Trí tuệ nhân tạo – AI (artificial intelligence) đã có nhiều tiến bộ vượt bậc trong khoảng hai thập niên qua. Một trong những chỉ dấu rõ rệt nhất cho sự phát triển của AI là việc nó đã lần lượt đánh bại con người một cách thuyết phục trong gần như tất cả các bộ môn thể thao trí tuệ hàng đầu.

Năm 1997, siêu máy tính Deep Blue của IBM lần đầu giành chiến thắng trước đại kiện tướng cờ vua Gary Kasparov với tỉ số 3½–2½ trong trận tái đấu ở New York. Năm 2016, phần mềm AlphaGo do Google phát triển đã đánh bại kỳ thủ cờ vây 9 đẳng thế giới Lee Sedol với tỉ số 4-1. Và chỉ ba năm sau đó, phần mềm Pluribus do Facebook và các nhà khoa học trường Carnegie Mellon phát triển đã khuất phục những vận động viên poker hàng đầu thế giới trong bộ môn bài hai lá có 6 người chơi (6-max No-limit Texas Hold’Em poker).

Mới đây nhất, nhóm các nhà nghiên cứu tại Meta đã thử nghiệm thành công Cicero, một AI có khả năng đánh bại con người trong Diplomacy, một trò chơi mô phỏng cuộc tranh đấu quyền lực giữa 7 cường quốc Châu Âu trước thềm Chiến tranh thế giới lần thứ nhất (được coi là một trong những trò boardgame ưa thích của các chính khách nổi tiếng). Trên một phương diện nào đó, rõ ràng AI đang ngày một thông minh hơn và có khả năng tư duy giống con người hơn. Liệu điều này sẽ có mang lại những hệ luỵ gì cho ngoại giao trong tương lai?

Bài viết này tập trung giải thích tại sao chúng ta cần đặc biệt chú ý tới việc AI đã đánh bại được con người trong một trò chơi mô phỏng tương đối sát thực chính trị quốc tế, đồng thời chỉ ra một số hàm ý của đà phát triển AI hiện nay đối với chính trị quốc tế nói chung và ngoại giao nói riêng trong tương lai.

Sơ lược về Diplomacy

Lấy bối cảnh châu Âu thời kì trước Chiến tranh thế giới lần thứ nhất, Diplomacy mô phỏng cuộc tranh đấu quyền lực ở châu Âu giữa 7 cường quốc: Anh, Pháp, Nga, Đức, Áo-Hung, Ý và Thổ Nhĩ Kỳ. Để giành chiến thắng tuyệt đối, người chơi phải điều khiển các quân đoàn và hạm đội của mình để chiếm được 18 trên tổng số 34 “vùng hậu cần” (supply center).

Điểm đặc biệt của Diplomacy luật chơi được thiết kế để không ai, dù xuất sắc đến mấy, có thể một mình giành chiến thắng mà không có sự hỗ trợ của ít nhất một đồng minh khác. Trò chơi không sử dụng xúc xắc nên không có yếu tố may rủi hay bất định tác động đến kết quả. Vì vậy, người chơi chỉ có một cách duy nhất để đánh bại các đối thủ của mình là vận dụng những kỹ năng ngoại giao như: phân tích tình huống, hoạch định chiến lược, đàm phán, v.v. Mục tiêu của người chơi là đánh giá đúng ý đồ của cả các “đối tác” lẫn “đối tượng”, xây dựng và duy trì các liên minh bền vững với đồng minh, và đồng thời ly gián những liên quân tiềm năng chống lại mình.

Tuy nhiên, khác với những bộ môn cờ mà trong đó người chơi sẽ đi theo lượt, sau khi đàm phán xong, cả 7 người chơi Diplomacy sẽ ra lệnh cùng một lúc và các mệnh lệnh sẽ được thực thi đồng thời. Hệ quả là sẽ có những người chơi thực hiện đúng cam kết đã đề ra trong quá trình đàm phán và sẽ có những người chơi “nói một đường, làm một nẻo”. Do đó, duy trì lòng tin giữa các đồng minh và phản bội đối tác đúng thời điểm là một phần tất yếu của trò chơi này.

Tựu chung, chơi Diplomacy giống như đánh cờ nhưng thay vì chỉ đánh với một người thì bạn đánh với 6 người, và thay vì chơi theo lượt thì tất cả di chuyển quân cùng lúc. Cuối cùng, giao tiếp, trò chuyện, thương thảo với nhau là một điều bạn bắt buộc phải làm tốt để giành phần thắng.

Cicero đã làm được gì?

Theo một ý kiến đánh giá thì trò chơi Diplomacy đã đặt ra một bài toán hóc búa cho các nhà nghiên cứu AI trong suốt hơn 5 thập kỷ vừa qua. Sự khác biệt giữa Diplomacy và các trò đấu tay đôi kinh điển như cờ vua hay cờ vây nằm ở hai điểm chính: (1) trong Diplomacy bạn phải thi đấu với 6 đối thủ thay vì 1 đối thủ và (2) giao tiếp bằng ngôn ngữ là một phần của trò chơi. Do đó, để AI có thể đánh bại con người ở trò chơi này, nó phải có cả khả năng tư duy chiến lược (strategic reasoning) để nhận biết đối tác/đối tượng và các tình thế thuận lợi/nguy hiểm, lẫn khả năng giao tiếp sử dụng ngôn ngữ con người (natural language). Cũng chính vì sự bất tương xứng về thông tin là một phần của trò chơi nên AI phải biết lúc nào nên chia sẻ ít, lúc nào nên chia sẻ nhiều, lúc nào cần thành thật, lúc nào cần gian trá. Vì lý do này, khác với các môn cờ hay poker, AI không thể tự học cách đánh Diplomacy thành thạo bằng việc tự đánh với bản thân mà buộc phải học từ một bộ dữ liệu đã có sẵn của con người.

Để chuẩn bị cho quá trình thử nghiệm với những người chơi thật, các nhà nghiên cứu đã dạy Cicero cách chơi Diplomacy bằng một bộ dữ liệu gồm 125.261 ván Diplomacy trên mạng, với tổng cộng hơn 12 triệu tin nhắn mà các người chơi gửi cho nhau trong quá trình thảo luận, đàm phán. Từ tháng 8 cho tới tháng 10 năm 2022, Meta đã cho Cicero thi đấu (ẩn danh) với những người chơi ngoài đời thực, bao gồm cả nhà vô địch thế giới Markus Zijlstra. Sau tổng cộng 72 giờ thi đấu với hơn 80 người chơi qua 40 ván Diplomacy khác nhau, Cicero đã lọt vào top 10% những người chơi tốt nhất. Đây là một thành tích quá ấn tượng đối với bất kỳ người chơi Diplomacy nào. Nhưng ấn tượng hơn cả là việc Cicero đã đánh giá tương đối chính xác ý đồ của những người chơi khác, giao tiếp thành thục và không để lộ danh phận AI của mình. Hơn hết, Cicero không bị ảnh hưởng bởi những thiên kiến cố hữu trong tâm lý con người và không ra quyết định dựa trên cảm xúc. Mọi quyết định mà AI đưa ra thuần tuý dựa trên phán đoán của nó về lợi ích mà một nước đi có thể mang lại. Trên đường dài, điều đó khiến cho AI mắc ít sai lầm hơn con người.

Dù vậy, cần nói rằng Cicero mới đánh bại được con người trong trò Diplomacy ở nội dung “siêu tốc” (blitz) khi thời gian để tư duy và thương thảo chỉ giới hạn trong ít phút. Trong những trò chơi có thời gian tư duy dài hơn thì những người chơi hàng đầu vẫn chiếm ưu thế so với máy. Bên cạnh đó, Cicero vẫn có xu hướng hơi thật thà quá và chia sẻ hơi nhiều thông tin với các đối thủ khác, điều có thể khiến nó đôi lúc bị lợi dụng bởi đối thủ.

Tuy nhiên, đây mới chỉ là bước đầu của Cicero. Điều gần như chắc chắn sẽ xảy ra trong vòng 2-3 năm nữa là Cicero sẽ ngày càng phán đoán được chính xác hơn ý đồ (cả thật thà lẫn gian trá) của đối thủ và ngày càng giao tiếp được một cách khéo léo hơn qua các tin nhắn có văn phong “giống người”.

AI và tương lai của quan hệ quốc tế

Vì đa số các vấn đề được đàm phán ở cấp quốc gia đều quá hệ trọng nên sẽ có ít dư địa cho người trẻ nói chung và những sự thử nghiệm nói riêng. Vì vậy, một trong những ứng dụng trực tiếp và thiết thực của các phần mềm trí tuệ nhân tạo như Cicero là nó tạo ra môi trường có độ thực tế tương đối cao để các nhà ngoại giao trẻ có thể trui rèn các kỹ năng cốt lõi của mình và thử nghiệm các chiến thuật đàm phán sáng tạo, mới lạ. Tuy Diplomacy chỉ tập trung vào ngoại giao nước lớn và do đó không phản ánh được chính xác và toàn diện quan hệ quốc tế (đặc biệt từ góc nhìn của các nước nhỏ và tầm trung) nhưng với những bước phát triển này, rất có thể trong tương lai sẽ có thêm các phần mềm mô phỏng giả lập thêm nhiều tình huống đa dạng để mọi nhà ngoại giao có thể sử dụng và chuẩn bị cho các cuộc đàm phán thật của mình.

Sự phát triển của các phần mềm AI như Cicero rất có thể sẽ dẫn tới một công cụ dự báo được tương đối chính xác khả năng xảy ra các sự kiện như chiến tranh. Tại thời điểm này, do công việc dự báo vẫn chủ yếu được thực hiện bởi con người nên độ chính xác có biên độ sai số rất lớn bởi 3 yếu tố hàng đầu gồm: (1) độ chính xác thấp của ngôn ngữ tự nhiên, (2) các lỗi tư duy cố hữu của con người, và (3) ít người có phương pháp suy luận logic chặt chẽ, có hệ thống. Một phần mềm AI được kết nối trực tiếp với một bộ dữ liệu khổng lồ gần như chắc chắn sẽ đưa ra những dự báo khách quan và chính xác hơn con người nhiều lần, góp phần giảm thiểu xác suất các nhà lãnh đạo đưa ra các quyết sách sai lầm.

Cuối cùng, chúng ta hoàn toàn có thể kỳ vọng rằng trong tương lai các nhà khoa học sẽ phát triển thành công một phần mềm AI có khả năng đánh giá chính xác độ tin cậy (credibility) của các phát ngôn công khai của các nhà lãnh đạo quốc tế. Một sản phẩm như vậy sẽ giải quyết được một trong những vấn đề hóc búa nhất trong quan hệ quốc tế, đó là “đọc vị” chính xác ý đồ của các quốc gia khác. Liệu lãnh đạo nước A có thật sự sẵn sàng sử dụng vũ khí hạt nhân hay không? Liệu nguyên thủ nước B có thực sự định rút ra khỏi hiệp định thương mại này hay không? Khi mà AI có thể trả lời được những câu hỏi như vậy mà không bị ảnh hưởng bởi định kiến hay cảm xúc của con người, gần như chắc chắn chất lượng của mọi quyết định ở cấp cao nhất sẽ được cải thiện. Và chúng ta có quyền tin rằng đó sẽ là một thế giới hoà bình và ổn định hơn rất nhiều.