Mối đe dọa thực sự từ AI Trung Quốc

Nguồn: Jared Dunnmon, “The Real Threat of Chinese AI,” Foreign Affairs, 28/02/2025

Biên dịch: Nguyễn Thị Kim Phụng

Tại sao Mỹ cần dẫn đầu cuộc đua nguồn mở?

Chỉ trong vòng hai tháng kể từ khi một công ty Trung Quốc ít người biết đến –  DeepSeek – phát hành một mô hình AI nguồn mở mới mạnh mẽ, bước đột phá này đã bắt đầu làm thay đổi thị trường AI toàn cầu. DeepSeek-V3, tên gọi của mô hình ngôn ngữ mở lớn (LLM) của công ty, tự hào có hiệu suất sánh ngang với các mô hình từ các phòng thí nghiệm hàng đầu của Mỹ, chẳng hạn như ChatGPT của OpenAI, Claude của Anthropic, và Llama của Meta – nhưng chỉ tốn một phần chi phí cực nhỏ. Điều này đã cho phép các nhà phát triển và người dùng trên toàn thế giới tiếp cận AI tiên tiến với chi phí tối thiểu. Vào tháng 1, công ty đã phát hành mô hình thứ hai, DeepSeek-R1, sở hữu các khả năng tương tự như mô hình o1 tiên tiến của OpenAI với mức giá chỉ bằng 5%. Kết quả là, DeepSeek đã trở thành mối đe dọa đối với vị thế dẫn đầu của Mỹ trong lĩnh vực AI, mở đường cho Trung Quốc giành được vị thế thống trị toàn cầu, bất chấp những nỗ lực của Washington nhằm hạn chế quyền tiếp cận của Bắc Kinh đối với các công nghệ AI tiên tiến.

Sự trỗi dậy nhanh chóng của DeepSeek cho chúng ta thấy những gì đang bị đe dọa trong cuộc chạy đua AI toàn cầu. Ngoài việc gặt hái tiềm năng kinh tế phi thường của AI, quốc gia nắm giữ các LLM làm cơ sở cho các ứng dụng và dịch vụ tương lai sẽ có ảnh hưởng vượt trội, không chỉ đối với các chuẩn mực và giá trị được tích hợp trong những hệ thống này, mà còn đối với hệ sinh thái bán dẫn tạo nên nền tảng của điện toán AI. Việc cả Trung Quốc và Mỹ đều tin rằng các công nghệ này có thể mang lại lợi thế quân sự chỉ làm tăng thêm tầm quan trọng của việc đạt được và duy trì vị thế dẫn đầu lĩnh vực AI trong dài hạn.

Tuy nhiên, khi quá tập trung vào các đặc điểm hiệu suất và chi phí thấp của DeepSeek-V3, những người quan sát có thể bỏ lỡ một hiểu biết quan trọng hơn. Một lý do chính khác khiến các mô hình của DeepSeek được áp dụng nhanh chóng là bởi vì chúng là phần mềm nguồn mở, nghĩa là bất kỳ ai cũng có thể tải xuống, chạy, nghiên cứu, sửa đổi, và xây dựng trên chúng và chỉ phải trả chi phí cần thiết cho sức mạnh tính toán thô. Ngược lại, hầu như tất cả các mô hình AI tương đương của Mỹ đều là mô hình độc quyền, do đó vừa hạn chế cách chúng có thể được sử dụng, vừa làm tăng chi phí cho người dùng.

Các thành viên hàng đầu của cộng đồng AI Mỹ giờ đây đã bắt đầu thừa nhận các vấn đề của việc quá chú trọng vào các mô hình độc quyền, nguồn đóng. Cuối tháng 1, CEO của OpenAI Sam Altman nói rằng công ty của ông có thể đã “đứng bên lề trái của lịch sử” khi không ủng hộ AI nguồn mở. Sang tháng 2, cựu CEO Google Eric Schmidt đã dự đoán về một tương lai nơi các mô hình AI cả mở và đóng sẽ định hình các ứng dụng hàng ngày. Rõ ràng, Mỹ không còn có thể chỉ dựa vào các hệ thống AI đóng từ các gã khổng lồ công nghệ để cạnh tranh với Trung Quốc, và chính phủ Mỹ cần phải làm nhiều hơn để hỗ trợ các mô hình nguồn mở trong lúc họ nỗ lực hạn chế quyền tiếp cận của Trung Quốc đối với các công nghệ chip tiên tiến và dữ liệu đào tạo. Để tiếp tục thống trị, Mỹ nên xây dựng một chương trình toàn diện nhằm phát triển và triển khai các LLM nguồn mở tốt nhất. Nhưng cũng phải đảm bảo rằng các công ty Mỹ vẫn là những công ty xây dựng các hệ thống AI có năng lực mạnh nhất – đôi khi được gọi là “hệ thống biên giới” (frontier systems) – mà nhiều khả năng sẽ đến từ các công ty tư nhân có vốn hóa lớn.

Đồng thời, Washington nên theo đuổi một chương trình nghị sự chính sách rộng hơn, vừa nâng cao vị thế của AI nguồn mở của Mỹ trên trường quốc tế, vừa cho phép Mỹ xây dựng cơ sở hạ tầng cốt lõi cần thiết để duy trì vị thế dẫn đầu về AI. Điều này không chỉ có nghĩa là hỗ trợ phát triển các mô hình nguồn mở tại Mỹ, mà còn là giúp chúng trở nên dễ tiếp cận hơn đối với những người đóng góp và người dùng nguồn mở, đặc biệt là từ các cộng đồng công nghiệp, học thuật, và khu vực công liên kết với Mỹ. Nếu Washington không thực hiện những bước đi như vậy, DeepSeek sẽ mở đường cho một tương lai không xa trong đó Trung Quốc có thể sử dụng các mô hình mở, mạnh mẽ, và giá rẻ để vượt qua Mỹ trong các ứng dụng AI và điện toán – theo đó đe dọa đưa một trong những công nghệ quan trọng nhất của thế kỷ 21 vào vòng kiểm soát của một quốc gia thù địch với tự do và dân chủ.

ƯU ĐIỂM MỞ

Dù AI nguồn mở có lẽ ít được giới chính sách Mỹ chú ý hơn các hệ thống biên giới, nhưng nó từ lâu đã hỗ trợ cho tiến bộ kỹ thuật trong lĩnh vực này. Thật vậy, ngay sau khi ChatGPT bùng nổ vào năm 2022, các thành viên của cộng đồng AI đã bắt đầu so sánh các LLM ngày nay với một thành phần quan trọng của máy tính truyền thống, thành phần đã tồn tại được nhờ phần mềm nguồn mở: hệ điều hành. Giống như một hệ điều hành chuyển đổi các chương trình máy tính thân thiện với con người thành các lệnh được thực thi bởi phần cứng, LLM là cầu nối giữa ngôn ngữ con người và thông tin mà máy móc xử lý. Trên thực tế, với các mô hình AI nguồn mở, phép so sánh này còn mở rộng sang một khía cạnh khác của máy tính truyền thống: giống như hệ điều hành Linux nguồn mở từ lâu đã tồn tại song song với các hệ điều hành độc quyền như Windows của Microsoft, cho phép người dùng và nhà phát triển tự do tải xuống, sử dụng, và sửa đổi nguồn của nó, các LLM nguồn mở như Llama của Meta đã xuất hiện bên cạnh các LLM độc quyền như ChatGPT, hứa hẹn khả năng truy cập phổ cập vào các hệ thống thông minh sẽ cung cấp sức mạnh cho thế hệ phần mềm tiếp theo. Với sự ra đời của các LLM nguồn mở mạnh mẽ này, các nhà nghiên cứu đã mô tả kỷ nguyên hiện tại là “khoảnh khắc Linux” của AI.

Nhìn chung, các dự án phần mềm nguồn mở (OSS) như Linux đã được củng cố vì chúng có thể được các lập trình viên trên toàn thế giới nâng cấp. Những đóng góp đa dạng này đã cho phép mã nguồn được phát triển nhanh chóng và tăng cường bảo mật, vì các hệ thống có thể được các kỹ sư giỏi nhất của nhân loại đồng thời kiểm tra và cải thiện. Hơn nữa, vì các dự án OSS trước đây thường do các thực thể của Mỹ và châu Âu duy trì, nên trong nhiều thập kỷ, OSS đã thúc đẩy sự đổi mới công nghệ và vị thế lãnh đạo của phương Tây trong nhiều lĩnh vực, từ hệ điều hành, trình duyệt web, đến cơ sở dữ liệu, mã hóa, và thậm chí cả ngôn ngữ lập trình.

Tuân theo các nguyên tắc OSS, nhiều nhà nghiên cứu cũng đã đẩy nhanh tiến độ phát triển AI, chẳng hạn bằng cách chia sẻ và công bố các đổi mới gần như mỗi ngày. Điều này đúng không chỉ đối với giới học thuật – những người được thúc đẩy bởi việc phổ biến rộng rãi công trình của họ – mà còn đúng với các công ty AI vốn đang sử dụng việc tham gia vào cộng đồng OSS như một chiến lược tuyển dụng, giải quyết vấn đề, và quan hệ công chúng hiệu quả. Thật vậy, một vài trong số những đóng góp quan trọng nhất cho AI nguồn mở đã được dẫn dắt bởi những ông lớn trong ngành. Chúng bao gồm TensorFlow của Google và PyTorch của Meta, các khung lập trình được sử dụng rộng rãi nhất cho AI; kiến trúc Transformer hỗ trợ hầu hết các LLM hiện đại, ban đầu được Google phát triển; và các mô hình như AlphaFold, một hệ thống AI do DeepMind xây dựng, có thể dự đoán cách protein gấp lại với độ chính xác đến mức các nhà phát triển của nó đã được trao Giải Nobel năm 2024. Tinh thần cởi mở này đã biến AI trở thành một lĩnh vực thú vị và phát triển nhanh suốt hàng chục năm qua, và là một trong những lý do chính cho tiềm năng công nghệ và kinh tế to lớn của các LLM mở.

Nhưng từ lâu đã tồn tại một sự căng thẳng cơ bản giữa các hệ thống nguồn mở và các rủi ro bảo mật tiềm ẩn. Giống như trong trường hợp điện toán nguồn mở, các nhà phê bình đã cảnh báo rằng AI nguồn mở có thể bị các tác nhân độc hại sử dụng sai mục đích. Xét đến những lo ngại này – cùng với các cân nhắc về mặt thương mại và áp lực cạnh tranh – nhiều công ty AI lớn đã bắt đầu cung cấp các hệ thống AI tiên tiến của họ thông qua các chatbot hoặc các cổng Web khác, thay vì phát hành công khai. Trên thực tế, trong số các LLM được sử dụng phổ biến nhất của Mỹ, chỉ có Llama của Meta là một hệ thống mở. Và Llama đã gây ra những lo ngại, khi Reuters đưa tin vào tháng 11/2024 rằng chính phủ Trung Quốc đã điều chỉnh nó cho mục đích quân sự.

Tuy nhiên, việc phát hành các mô hình DeepSeek-V3 và DeepSeek-R1 mạnh hơn đã khiến những lợi thế rõ ràng của AI nguồn mở được chú ý trở lại. Đối mặt với các biện pháp kiểm soát xuất khẩu hạn chế quyền tiếp cận các chip tiên tiến, DeepSeek vẫn thực hiện được một kỳ tích kỹ thuật, đạt được những cải tiến thuật toán và hiệu quả phần cứng cho phép các LLM nguồn mở của mình cạnh tranh với các LLM độc quyền hàng đầu từ Mỹ. Dù lượng sức mạnh tính toán chính xác mà DeepSeek đã sử dụng để xây dựng mô hình của mình vẫn đang được tranh luận sôi nổi, nhưng gần như chắc chắn là nó ít hơn đáng kể so với những gì các đối thủ người Mỹ sử dụng. Thật vậy, các LLM của DeepSeek có chi phí vận hành rất thấp và có sẵn rộng rãi trong không gian nguồn mở, đến mức chúng đã trở thành nền tảng cho một loạt các ứng dụng mới, từng không khả thi về mặt kinh tế trước khi chúng được phát hành. Dù điều này không có nghĩa là các LLM nguồn mở như DeepSeek sẽ chiếm lĩnh toàn bộ thị trường, nhưng phản ứng nhanh chóng và áp đảo dành cho chúng không nên bị bỏ qua. Kể từ đầu năm nay, ứng dụng DeepSeek đã vượt qua ChatGPT để đứng đầu Apple App Store; DeepSeek-R1 gần đây đã trở thành mô hình được yêu thích nhất từ trước đến nay trên nền tảng chia sẻ mô hình Hugging Face; và DeepSeek-R1 hiện đang được nhiều công ty khởi nghiệp hàng đầu của Mỹ sử dụng.

AI VỚI ĐẶC SẮC TRUNG QUỐC

Một tác dụng phụ đáng tiếc trong sự tăng trưởng mạnh mẽ của DeepSeek là nó có thể trao cho Trung Quốc quyền tích hợp các giá trị của Đảng Cộng sản Trung Quốc vào các mô hình AI tạo sinh được sử dụng rộng rãi. Năm 2023, Bắc Kinh đã ban hành các quy định yêu cầu các LLM do Trung Quốc sản xuất phải phù hợp với “các giá trị cốt lõi của chủ nghĩa xã hội” và tránh phát tán “thông tin có vấn đề” hoặc nội dung “bất hợp pháp.” Năm 2024, Cục Quản lý Không gian Mạng, cơ quan quản lý Internet của Trung Quốc, đã bắt đầu kiểm tra các LLM của nước này nhằm đảm bảo tuân thủ các quy định kể trên và ngăn chặn việc phát hành những LLM không đạt yêu cầu.

Không khó để nhận ra tác động của sự kiểm duyệt này. Nếu bạn hỏi DeepSeek-V3 về vụ thảm sát Thiên An Môn năm 1989, nó sẽ nói, “Tôi xin lỗi, tôi không thể trả lời câu hỏi đó.” Với các chủ đề nhạy cảm khác, chatbot DeepSeek có thể tự ghi đè câu trả lời của mình khi đang phản hồi giữa chừng, “Xin lỗi, điều này vượt quá phạm vi cho phép hiện tại của tôi. Chúng ta hãy nói về điều khác nhé.” Thay vì cung cấp thông tin hữu ích về các chủ đề như người Duy Ngô Nhĩ ở Trung Quốc và các nhà thờ tại gia chưa đăng ký ở Trung Quốc, chatbot lại đưa ra một tuyên bố nhạt nhẽo về sức mạnh của chế độ độc đảng, chẳng hạn như: “Chúng tôi tin chắc rằng dưới sự lãnh đạo của đảng, các chính sách của Trung Quốc sẽ tiếp tục được cải thiện, đóng góp tích cực vào việc thúc đẩy sự hòa hợp và ổn định xã hội.” Các cuộc kiểm tra đã chỉ ra rằng mô hình này thậm chí còn trả lời sai cả các câu hỏi chung chung như “Những sự kiện lịch sử quan trọng nhất của thế kỷ 20 là gì?” Dù LLM của DeepSeek thực hiện nhiều nhiệm vụ đặc biệt tốt, nhưng rõ ràng nó đã được lập trình để phản ánh các mục tiêu ý thức hệ của Bắc Kinh, đồng thời ngăn chặn thông tin tiêu cực về Trung Quốc.

Những rủi ro của loại kiểm soát này không nên bị đánh giá thấp. Ảnh hưởng của Trung Quốc đối với TikTok đã làm dấy lên những lo ngại đáng kể về an ninh quốc gia, nhưng các LLM do Trung Quốc thiết kế có thể gây ra mối đe dọa thậm chí còn lớn hơn đối với các giá trị tự do và dòng chảy thông tin tự do. Giờ đây, khi chúng dần trở thành một phần trong nền tảng của hệ sinh thái AI ở nhiều nơi trên thế giới, những mô hình này không chỉ truyền bá chương trình tuyên truyền của Trung Quốc mà còn khiến người dùng phải đối mặt với rủi ro an ninh mạng. Ví dụ, ứng dụng DeepSeek đã gửi dữ liệu người dùng Mỹ trực tiếp về Trung Quốc và các nhà nghiên cứu đã chứng minh rằng “các tác nhân ngủ đông” – những hành vi có khả năng gây nguy hiểm được nhúng trong một mô hình được thiết kế để chỉ xuất hiện trong các bối cảnh cụ thể – có thể được các nhà phát triển LLM đưa vào mô hình.

Vì các mô hình của DeepSeek đã nằm trong số các LLM được tải xuống nhiều nhất thế giới, nên mối đe dọa là ngay lập tức. Tuy nhiên, chatbot này có thể chỉ là khởi đầu cho một kỷ nguyên thống trị mới của Trung Quốc đối với các LLM nguồn mở. Nếu Mỹ và các đối tác không nhanh chóng phát triển các LLM nguồn mở của riêng họ như một giải pháp thay thế hấp dẫn cho các mô hình chi phí thấp này, họ có thể gây nguy hiểm cho lợi thế công nghệ quan trọng nhất của phương Tây trong lĩnh vực AI: chip.

Để hiểu được quan hệ giữa tương lai của việc sản xuất chip AI và các hệ thống AI nguồn mở, điều quan trọng là phải hiểu được động lực đằng sau vị thế dẫn đầu hiện tại của Mỹ trong lĩnh vực chip cao cấp. Ngày nay, chỉ có một công ty Mỹ duy nhất, Nvidia, thống trị khâu thiết kế chip cho AI thông qua các bộ xử lý đồ họa (GPU) hàng đầu thế giới của mình, cung cấp sức mạnh cho phần lớn khối lượng công việc AI hiện nay. Thông qua CUDA – một phần mềm độc quyền khó sao chép, chuyên dịch các chương trình cấp cao được viết bởi các nhà phát triển AI thành các lệnh được tối ưu hóa để chạy trên GPU – Nvidia cũng nắm quyền kiểm soát một phần quan trọng của hệ sinh thái phần mềm AI và theo đó cũng giành được vị trí thống trị trên thị trường điện toán AI. Thật vậy, ngay cả các mô hình của DeepSeek ban đầu cũng được đào tạo với các chip Nvidia được cho là mua tuân thủ theo các biện pháp kiểm soát xuất khẩu của Mỹ.

Nhiều người có lẽ sẽ muốn kết luận rằng Mỹ có thể hạn chế mối đe dọa AI của Trung Quốc chỉ bằng cách hạn chế hơn nữa quyền tiếp cận chip Nvidia. Nhưng khi một LLM như DeepSeek đã được đào tạo xong, việc chạy nó thường có thể được thực hiện bằng phần cứng kém tiên tiến hơn. DeepSeek đã đảm bảo rằng các mô hình của mình có thể chạy trên các chip xử lý Ascend Neural của gã khổng lồ công nghệ Trung Quốc Huawei, được sản xuất bởi nhà sản xuất chip quốc gia Trung Quốc SMIC. Nếu LLM của Trung Quốc giành được thị phần đáng kể, nhiều khả năng là nhờ trợ cấp nhà nước, Trung Quốc có thể yêu cầu hoặc cung cấp các ưu đãi để LLM của Trung Quốc chạy trên chip có nguồn gốc trong nước (như các công ty Trung Quốc dường như đã nhắm đến thông qua định giá cạnh tranh).

Trong kịch bản này, vì các mô hình của DeepSeek sẽ không có đối thủ cạnh tranh với hiệu suất tương đương và chi phí cực thấp, người dùng trên toàn thế giới có lẽ sẽ bắt đầu trả tiền cho chip Huawei. Dòng vốn khổng lồ đó sẽ hỗ trợ tăng trưởng tại SMIC và Huawei, đồng thời gây thiệt hại cho các công ty như Nvidia, Intel, Samsung, và TSMC, vốn là nền tảng cho sự thống trị sản xuất chip của phương Tây. Trong kịch bản lạc quan cho Bắc Kinh, một sự thay đổi như vậy đồng nghĩa với việc sản xuất chip AI sẽ trở nên giống như pin lithium-ion và nhiều ngành công nghiệp khác, vốn là các lĩnh vực mà người Trung Quốc đã vượt mặt phương Tây: Chiến lược này bao gồm việc sử dụng kết hợp dòng vốn theo định hướng thị trường và các ưu đãi được nhà nước hậu thuẫn để giành được thị phần thống trị trên thị trường toàn cầu.

Nói cách khác, nếu không có đối thủ cạnh tranh rõ ràng, tác động của LLM mở của DeepSeek không chỉ dừng lại ở việc nhanh chóng giành được vị thế thống trị toàn cầu trong các ứng dụng AI. Các LLM này cũng có thể được sử dụng để xây dựng chuỗi cung ứng do Trung Quốc dẫn đầu, làm xói mòn vị thế dẫn đầu của phương Tây trong thiết kế và sản xuất chip, đồng thời trao cho Bắc Kinh ảnh hưởng sâu rộng đối với một phần lớn thông tin được truyền đi từ các sản phẩm AI không chỉ ở Trung Quốc mà trên toàn thế giới.

CHIẾN LƯỢC MỚI CỦA MỸ

Để chống lại mối đe dọa AI mới từ Trung Quốc, Mỹ cần phải đẩy mạnh việc hỗ trợ các LLM nguồn mở của riêng mình. Trước hết, chính phủ nên đẩy nhanh tiến độ kỹ thuật và phân phối các LLM nguồn mở do Mỹ xây dựng thông qua các trường đại học, công ty, và phòng thí nghiệm quốc gia, ưu tiên các mô hình giúp nâng cao vị thế cạnh tranh của công nghệ AI phương Tây.

Dù khoản đầu tư vào các công ty AI nguồn mở đầy triển vọng như Together AI, Hugging Face, và Mistral đã tăng từ 900 triệu đô la lên 2,9 tỷ đô la trong giai đoạn 2022-2023, nhưng khoản tài trợ này chỉ là một phần nhỏ trong số 31 tỷ đô la mà các công ty đầu tư mạo hiểm của Mỹ đã rót vào lĩnh vực AI rộng hơn trong cùng kỳ. Để khởi động lĩnh vực nguồn mở, Washington nên tạo ra các ưu đãi để đầu tư vào các hệ thống AI nguồn mở tương thích với chipset của phương Tây, chẳng hạn bằng cách bắt buộc phải đặt ra ưu tiên rõ ràng trong các chương trình tài trợ và cho vay đối với các dự án dự tính sẽ phát hành công khai các kết quả nghiên cứu AI. Các chương trình như Tài nguyên Nghiên cứu Trí tuệ Nhân tạo Quốc gia, nhằm mục đích cung cấp cho các nhà nghiên cứu AI của Mỹ quyền tiếp cận chip và bộ dữ liệu, cũng nên được mở rộng, tận dụng các nguồn lực điện toán từ Bộ Năng lượng, Bộ Quốc phòng, và các phòng thí nghiệm nghiên cứu quốc gia. Để đạt được các mục tiêu này, chính phủ Mỹ cũng nên cân nhắc hợp tác với các sáng kiến như Stargate – liên doanh giữa Arm, Microsoft, Nvidia, Oracle, OpenAI, Softbank, và MGX nhằm đầu tư 500 tỷ đô la vào cơ sở hạ tầng AI mới tại Mỹ trong vòng bốn năm tới.

Washington nên xem xét củng cố hệ sinh thái công nghệ của Mỹ để hỗ trợ tốt hơn cho AI nguồn mở của phương Tây. Ví dụ, việc phát triển một hệ sinh thái điện toán đa nền tảng liền mạch cho phép các nhà phát triển dễ dàng tận dụng các chipset tốt nhất của phương Tây – tiêu biểu là GPU của Nvidia và AMD, chip dòng M của Apple, và Bộ Xử lý Tensor của Google – sẽ tạo ra một môi trường điện toán tích hợp mà Trung Quốc rất khó để cạnh tranh. Nó cũng sẽ thúc đẩy cầu dành cho chip phương Tây. Cuối cùng, để dập tắt mối đe dọa từ sự thống trị của Trung Quốc ngay từ đầu, Mỹ phải làm cho các công nghệ của mình có tính “bám dính” hơn, đảm bảo rằng các nhà phát triển và người dùng tiếp tục sẽ lựa chọn sự tiện lợi và sức mạnh của hệ sinh thái điện toán phương Tây hơn là hệ sinh thái của Trung Quốc.

Ngoài việc triển khai nhiều LLM nguồn mở hơn, Mỹ cũng phải dẫn đầu làn sóng đổi mới AI tiếp theo. Ví dụ, dù kiến trúc Transformer của Google vẫn đang hỗ trợ hầu hết các LLM được triển khai ngày nay, nhưng các phương pháp tiếp cận mới nổi để xây dựng các mô hình AI như mô hình Không gian Trạng thái Có Cấu trúc của Cartesia hoặc LLM khuếch tán của Inception – cả hai đều bắt nguồn từ các phòng thí nghiệm học thuật của Mỹ – đã cho thấy triển vọng vượt trội hơn. Washington nên tài trợ cho việc phát triển mô hình thế hệ tiếp theo, và các sáng kiến như Microelectronics Commons – một mạng lưới các trung tâm công nghệ khu vực được tài trợ bởi Đạo luật CHIPS và Khoa học – nên hỗ trợ các nỗ lực thiết kế và sản xuất phần cứng được tối ưu hóa để chạy các mô hình mới này. Các tổ chức nghiên cứu và mua lại của chính phủ cũng nên ưu tiên thử nghiệm, đánh giá, và mở rộng quy mô các sản phẩm từ các công ty như Groq, Sambanova, Cerebras, Together AI, Liquid AI, Cartesia, Sakana AI, Inception, cùng nhiều công ty khác – vốn là các bên đang đặt cược lớn vào các phương pháp tiếp cận phần mềm và phần cứng mới sẽ trở thành nền tảng cho các hệ thống AI tiên tiến của tương lai.

CEO SoftBank Masayoshi Son trình bày sáng kiến AI Stargate tại Tokyo hồi tháng 02/2025 © Kim Kyung-Hoon/Reuters

Washington phải đảm bảo rằng các lựa chọn chính sách của mình không làm suy yếu khả năng cạnh tranh về LLM nguồn mở của các công ty Mỹ trước các đối thủ Trung Quốc của họ. Ví dụ, thay vì áp đặt hàng loạt biện pháp kiểm soát xuất khẩu đối với các mô hình AI nguồn mở, Washington nên cung cấp ưu đãi cho các công ty để làm cho các mô hình của họ tương thích với các chipset của phương Tây và ngăn cản việc sử dụng các chipset của Trung Quốc. Ủy ban Thương mại Liên bang cũng nên thừa nhận rằng những đóng góp của các công ty công nghệ lớn cho AI nguồn mở – TensorFlow của Google, cùng với PyTorch và Llama của Meta có lẽ là những ví dụ rõ ràng nhất – là rất quan trọng để cạnh tranh với các doanh nghiệp Trung Quốc được nhà nước hậu thuẫn, và nên xem xét sự đóng góp của từng công ty vào vị thế dẫn đầu của Mỹ trong lĩnh vực AI nguồn mở trước khi đưa ra quyết định về bất kỳ hành động chống độc quyền nào.

Mỹ cũng phải làm nhiều hơn nữa để chống lại nỗ lực của các công ty Trung Quốc nhằm hạ giá các sản phẩm AI của Mỹ. Vào cuối năm 2024, Alibaba đã cắt giảm hơn 85% chi phí cho mô hình Qwen-VL của mình. Dù bước đi như vậy có thể được thực hiện nhờ những cải tiến về mặt kỹ thuật, nhưng chính phủ Trung Quốc cũng có thể đang trợ cấp cho công ty này để giúp họ hạ giá trước các đối thủ cạnh tranh phương Tây. Washington nên cân nhắc áp dụng các biện pháp chống bán phá giá đối với các hệ thống AI nước ngoài, nếu chúng rõ ràng đang bị định giá thấp để loại bỏ khả năng cạnh tranh của Mỹ. Chính phủ cũng phải cạnh tranh mạnh mẽ hơn với Trung Quốc ở các nước thứ ba, nơi Bắc Kinh có thể đặt điều kiện cho sự hỗ trợ của Trung Quốc về cơ sở hạ tầng và các khoản viện trợ khác là phải sử dụng các mô hình AI của Trung Quốc. Hơn nữa, xét đến những dấu hiệu cho thấy DeepSeek có thể đã sử dụng dữ liệu từ GPT-4 của OpenAI mà không được phép, Washington nên cân nhắc áp dụng Quy tắc Sản phẩm Trực tiếp Nước ngoài đối với đầu ra của mô hình AI, qua đó hạn chế việc các công ty Trung Quốc sử dụng đầu ra từ các phòng thí nghiệm AI hàng đầu của Mỹ theo cùng một cách đã giúp Mỹ giảm khả năng tiếp cận của Trung Quốc đối với thiết bị sản xuất chất bán dẫn của phương Tây.

Tính hiệu quả của các hành động này sẽ tăng lên nếu các quốc gia khác cùng tham gia thực hiện. Washington sẽ cần làm việc với các đối tác ở châu Á, châu Âu, và những nơi khác để hài hòa các cách tiếp cận chính sách đối với những chủ đề khó khăn này, với mục tiêu tạo ra một nhóm các quốc gia đủ lớn để làm chậm sự lan rộng của các mô hình AI chịu ảnh hưởng của Trung Quốc. Dù thị trường Trung Quốc rất lớn, nhưng nó vẫn nhỏ hơn thị trường toàn cầu bên ngoài. Thị trường toàn cầu đó mới là đấu trường quan trọng và là nơi Mỹ phải có một chiến lược phối hợp để đảm bảo rằng hệ sinh thái điện toán và AI của phương Tây vẫn chiếm ưu thế trong tương lai gần.

Dù các biện pháp kiểm soát xuất khẩu của Mỹ đã hạn chế khả năng Trung Quốc tiếp cận các chip cao cấp nhất, nhưng Bắc Kinh rõ ràng xem AI nguồn mở được xây dựng trên công nghệ kém tiên tiến hơn là một con đường chiến lược để giành thị phần. Hơn nữa, các mô hình của Trung Quốc có khả năng sẽ tiếp tục được cải thiện không chỉ thông qua các biện pháp hợp pháp như đổi mới thuật toán, cải tiến kỹ thuật, và sản xuất chip trong nước, mà còn thông qua các biện pháp bất hợp pháp như đào tạo trái phép bằng đầu ra của các mô hình AI đóng của Mỹ và lách luật kiểm soát xuất khẩu đối với chip của phương Tây. Những chiến lược này cho thấy rằng việc các công ty Trung Quốc tiếp tục cắt giảm chi phí và nâng cao hiệu suất của các mô hình của họ là điều gần như không thể tránh khỏi. Việc DeepSeek-V3 được phát hành chỉ vài tuần trước khi DeepSeek-R1 mạnh hơn ra mắt đã củng cố thêm quan điểm này.

Lý tưởng nhất là Washington nên tìm cách đảm bảo rằng các giải pháp thay thế ưu việt của Mỹ sẽ có sẵn ngay khi các thực thể Trung Quốc phát hành các mô hình mới nhất của họ, qua đó cung cấp cho người dùng một giải pháp thay thế cho các hệ thống AI của Trung Quốc và giúp duy trì vị thế dẫn đầu của Mỹ lâu nhất có thể. Khung Phổ biến AI của Bộ Thương mại, được chính quyền Biden công bố vào tháng 1, đã cố gắng hiện thực hóa điều này bằng cách hiệu chỉnh tốc độ mà công nghệ AI lan truyền từ Mỹ và các đồng minh sang phần còn lại của thế giới. Ví dụ, nó sử dụng các số liệu như hiệu suất mô hình và yêu cầu tính toán để hướng dẫn kiểm soát xuất khẩu, với mục tiêu cho phép các thực thể Mỹ phát hành các mô hình tốt như nhau – nhưng không tốt hơn đáng kể so với – mô hình nguồn mở tốt nhất hiện có tại bất kỳ thời điểm nào. Bất chấp những thách thức khi triển khai một chiến lược như vậy, cách tiếp cận này cung cấp nền tảng để quản lý khả năng AI mà chính quyền mới nên nỗ lực hoàn thiện. Chẳng hạn, chính phủ có thể sử dụng các nguồn lực điện toán của riêng mình để lưu trữ các mô hình tiên tiến của Mỹ cho các nhà nghiên cứu trong nước trước khi chúng được phát hành công khai.

DẪN ĐẦU HOẶC THUA CUỘC

Khoảnh khắc Linux của AI đặt ra cho chính quyền Trump một lựa chọn quan trọng. Họ có thể nhanh chóng triển khai một chiến lược toàn diện để xây dựng và duy trì vị thế dẫn đầu trong AI nguồn mở. Điều này có nghĩa là thúc đẩy sự đổi mới, thu hút nhân tài toàn cầu, và đảm bảo rằng sự phát triển của AI phù hợp với các giá trị dân chủ, đồng thời nỗ lực bảo vệ lợi thế của Mỹ trong công nghệ điện toán. Hoặc chính quyền có thể tiếp tục duy trì nguyên trạng, với nguy cơ là Mỹ sẽ nhường lại ảnh hưởng đối với đầu ra của hệ thống AI và lợi thế quan trọng về phần cứng cho Trung Quốc, khi mà các mô hình nguồn mở do Trung Quốc phát triển đang chuyển hướng thị trường toàn cầu sang kiến trúc chip và khung điện toán của Trung Quốc.

Washington phải điều hướng bước ngoặt quan trọng này một cách cẩn thận. Dù phải cân nhắc kỹ lưỡng những rủi ro khi phát hành công khai các mô hình AI ngày càng mạnh, nhưng việc rút lui khỏi vị trí dẫn đầu trong LLM nguồn mở sẽ là một sai lầm chiến lược. Như phó chủ tịch Microsoft Brad Smith đã lập luận vào tháng 1, AI nguồn mở mang đến cho nước Mỹ cơ hội để chứng minh sức mạnh đặc biệt của hệ sinh thái công nghệ Mỹ. Người Mỹ nên tái lập vị thế dẫn đầu lịch sử của mình trong việc phát triển các mô hình mở, trong khi vẫn duy trì khả năng cạnh tranh của hệ sinh thái và tiếp tục đầu tư vào các nguồn lực quan trọng – cho dù đó là chip hay nhân tài. Xét đến những lợi ích và rủi ro trước mắt, vị trí thứ hai không phải là một lựa chọn.

Jared Dunnmon từng giữ chức Giám đốc Kỹ thuật Trí tuệ nhân tạo tại Đơn vị Đổi mới Quốc phòng của Lầu Năm Góc dưới thời chính quyền Trump đầu tiên và chính quyền Biden.