Nguồn: Madhumita Murgia, Richard Waters, và Eleanor Olcott, “The global AI race: Is China catching up to the US?,” Financial Times, 01/02/2025
Biên dịch: Nguyễn Thị Kim Phụng
Việc DeepSeek phát hành mô hình AI mới đã làm lung lay những giả định về việc ai là người nắm quyền phát triển công nghệ này.
Vào thứ Hai ngày 27/01, thế giới đã chứng kiến cảnh 1 nghìn tỷ đô la bốc hơi khỏi thị trường chứng khoán chỉ trong một ngày, một đám cháy khổng lồ được châm ngòi bởi một công ty khởi nghiệp trí tuệ nhân tạo kém tiếng của Trung Quốc: DeepSeek.
Việc công ty này phát hành mô hình AI mới, được gọi là R1, đã đảo ngược hoàn toàn các giả định về sự thống trị của Mỹ trong lĩnh vực AI và làm dấy lên khả năng rằng người Trung Quốc đang học cách đánh bại Thung lũng Silicon trong chính trò chơi của họ.
Mô hình R1 có thể “lý luận” để giải quyết các vấn đề khoa học phức tạp và hoạt động với hiệu suất tương đương các phần mềm tiên tiến từ những gã khổng lồ công nghệ Mỹ, nhưng rõ ràng được phát triển với cái giá chỉ bằng một phần rất nhỏ so với các mô hình Mỹ.
Ứng dụng này nhanh chóng vượt mặt ChatGPT của OpenAI để trở thành ứng dụng miễn phí được tải xuống nhiều nhất trên cửa hàng ứng dụng iOS của Mỹ.
Bên cạnh thách thức về địa chính trị, bước đột phá của DeepSeek còn mang ý nghĩa kép đối với ngành công nghệ. Đầu tiên, nó có khả năng thúc đẩy sự phát triển thương mại và ứng dụng AI, giống như ChatGPT đã làm vào năm 2022.
Đồng thời, nó cũng đe dọa phá hủy các giả định đầu tư vốn là nền tảng của toàn bộ thị trường chứng khoán Mỹ, bằng cách chứng minh rằng việc phát triển các mô hình AI tiên tiến không đòi hỏi một lượng lớn cơ sở hạ tầng và do đó cũng không cần nhiều vốn.
Câu hỏi được đặt ra một cách cấp bách đột ngột từ California đến Phố Wall là: Liệu Trung Quốc có bắt kịp trong cuộc đua AI vào đúng thời điểm mà nhiều người làm việc trong lĩnh vực này tuyên bố rằng họ đang đến rất gần bước đột phá lịch sử sẽ đưa máy móc lên ngang hàng với trí tuệ của con người – một ngưỡng được gọi là trí tuệ nhân tạo tổng quát (AGI)?
“Các thuật toán của DeepSeek nhắc nhở chúng ta rằng Trung Quốc và Mỹ đang cạnh tranh quyết liệt và lợi thế công nghệ của chúng ta không được đảm bảo, từ đó thúc đẩy ngành công nghiệp của chúng ta phải làm cho AI hiệu quả hơn,” Eric Schmidt, cựu giám đốc điều hành và chủ tịch của Google, nhận định.
“Để trở thành người đầu tiên tạo ra AGI, chúng ta cần tiếp tục đầu tư vào nhân tài, hỗ trợ hệ sinh thái nguồn mở năng động của mình và đảm bảo rằng chúng ta không chỉ đổi mới mà còn chi tiêu nhiều hơn đối thủ cạnh tranh.”
DeepSeek đã được thành lập với tham vọng theo kiểu Thung lũng Silicon. Công ty này ra đời vào năm 2023 như một dự án phụ của tỷ phú quỹ đầu cơ lập dị Lương Văn Phong, ngay khi cuộc đua sao chép ChatGPT đang nóng lên. Kể từ đó đến nay, nó đã trở thành một trong những phòng thí nghiệm AI hàng đầu của Trung Quốc.
“Tại sao Thung lũng Silicon lại sáng tạo đến vậy? Bởi vì họ dám làm mọi thứ,” Lương nói trong một cuộc phỏng vấn hồi năm ngoái. “Khi ChatGPT ra đời, cộng đồng công nghệ ở Trung Quốc vẫn thiếu tự tin vào sự đổi mới tiên phong.”
Ông nói thêm: “Từ các nhà đầu tư đến các công ty công nghệ lớn [ở Trung Quốc], tất cả đều nghĩ rằng khoảng cách là quá lớn, nên thay vào đó, họ chọn tập trung vào các ứng dụng. Nhưng đổi mới bắt đầu với sự tự tin.”
Vì các quỹ nhà nước Trung Quốc đang đóng vai trò lớn hơn trong việc tài trợ cho các công ty khởi nghiệp trong vài năm qua, hệ sinh thái khởi nghiệp cũng cảm thấy áp lực phải đảm bảo lợi nhuận vì sợ mất tài sản của đất nước.
DeepSeek khác biệt so với các công ty khởi nghiệp AI tạo sinh của Trung Quốc ở chỗ họ không huy động bất kỳ nguồn tài chính bên ngoài nào và do đó không gặp phải những hạn chế này.
Là một phòng nghiên cứu thuần túy, gợi nhớ đến những ngày đầu của DeepMind ở Anh và OpenAI ở Mỹ, DeepSeek đã tập trung mọi nỗ lực vào việc thúc đẩy công nghệ AI tiến lên, thay vì cố gắng kiếm tiền. Và dù tự hào vì hoàn toàn được thành lập dựa trên tài năng trong nước, công ty đã áp dụng một nền văn hóa thường thấy ở các trung tâm công nghệ Mỹ.
“Nó là độc nhất trong số các công ty AI của Trung Quốc,” một nhà đầu tư AI tại Trung Quốc cho biết. “Không có chính trị hay ma sát trong quản lý như ở các công ty công nghệ lớn hoặc các công ty khởi nghiệp lớn. Mọi người không có chức danh hoặc cấp báo cáo cụ thể.”
Việc DeepSeek bắt nguồn từ một quỹ đầu cơ định lượng cũng có nghĩa là công ty này sở hữu các tài năng kỹ thuật với hiểu biết sâu sắc về chip. Bước đột phá của họ đã dựa vào thành công rõ ràng trong việc đào tạo các mô hình AI tiên tiến mà không cần chi hàng trăm triệu đô la như các đối thủ cạnh tranh người Mỹ.
Công ty này tuyên bố rằng bước đào tạo cuối cùng cho R1 chỉ tốn 5,6 triệu đô la. Tuy nhiên, con số này chưa bao gồm nhiều chi phí khác liên quan đến việc phát triển các mô hình, bao gồm cơ sở hạ tầng máy tính và các lần đào tạo trước đó, khiến việc đưa ra những so sánh chính xác trở nên khó khăn.
Nhưng họ cũng có thể đã đi đường tắt để cắt giảm chi phí: OpenAI tuyên bố có bằng chứng cho thấy DeepSeek đã đào tạo dựa trên kết quả từ các mô hình của chính OpenAI – vốn là điều không được phép theo các điều khoản sử dụng của công ty, dù đây là một hoạt động gian lận mà nhiều công ty Mỹ được cho là đang sử dụng.
Trớ trêu thay, nỗ lực của Washington nhằm cản trở ngành AI của Trung Quốc bằng cách áp đặt lệnh kiểm soát xuất khẩu lên các loại chip cao cấp của Mỹ từ năm 2022 trở đi có thể đã góp phần vào bước đột phá của DeepSeek.
Vì không thể tiếp cận với các dòng chip silicon tiên tiến, công ty Trung Quốc buộc phải tìm ra những cách sáng tạo để tăng hiệu suất cho những con chip kém tiên tiến hơn mà họ có thể mua được.
Những tuyên bố của DeepSeek về chi phí thấp và khả năng tiên tiến của các mô hình của họ đã mở đường cho một cuộc tranh luận sôi nổi về mức độ đột phá mà công ty này sẽ mang lại. Các nhà lãnh đạo của Thung lũng Silicon đã ca ngợi những cải tiến của DeepSeek, nhưng đồng thời cũng hạ thấp tầm quan trọng của chúng.
Giám đốc điều hành của OpenAI, Sam Altman, gọi R1 là một mô hình “ấn tượng,” trong khi Mark Zuckerberg, giám đốc điều hành của Meta, ghi nhận DeepSeek đã đạt được “những tiến bộ mà chúng tôi hy vọng sẽ triển khai trong hệ thống của mình.”
Tuy nhiên, Zuckerberg cũng xem bước đột phá của DeepSeek chỉ là một trong số nhiều bước đột phá trong một lĩnh vực đang phát triển với tốc độ chóng mặt. Ông cho biết khó có thể nói cách tiếp cận chi phí thấp của công ty này sẽ thay đổi động lực của ngành sâu sắc như thế nào.
Theo một số người theo dõi công nghệ Trung Quốc, những tiến bộ của DeepSeek không đủ lớn để thay đổi thực tế là các công ty AI của nước này là những người theo đuôi, chủ yếu tập trung vào việc bắt chước các đối tác Mỹ thay vì tự mình xác định hướng đi.
“Công trình của DeepSeek nằm trong phạm trù đó. Điều thực sự có thể thay đổi cục diện của cuộc cạnh tranh Mỹ-Trung là nếu họ xây dựng được thứ gì đó thực sự thay đổi ranh giới. Cần chờ xem liệu họ có làm được điều đó không,” Helen Toner, một nhà phân tích chính sách AI tại Trung tâm An ninh và Công nghệ Mới nổi của Đại học Georgetown và là cựu thành viên hội đồng quản trị tại OpenAI cho biết.
Tuy nhiên, những người khác lại cho rằng việc một công ty khởi nghiệp công nghệ Trung Quốc đứng sau bước tiến đáng kinh ngạc này chính là một khoảnh khắc mang tính bước ngoặt, làm thay đổi cục diện cuộc đua AI giữa hai nước.
Tilly Zhang, một nhà phân tích công nghệ tại Gavekal Dragonomics, một công ty nghiên cứu tập trung vào Trung Quốc, đã viết trong một lưu ý được công bố tuần này rằng: “Các mô hình mới nhất của DeepSeek không có nghĩa là Trung Quốc đang vượt lên trước Mỹ trong cuộc đua AI, nhưng nó đã chứng minh rằng các công ty Trung Quốc đang có những bước tiến đáng kể trong đổi mới phần mềm, giúp giảm bớt những hạn chế gây ra bởi các biện pháp kiểm soát xuất khẩu của Mỹ.”
“Cuộc đua giành vị trí dẫn đầu trong lĩnh vực AI không còn đơn thuần là cuộc đua ai có quyền tiếp cận những con chip tốt nhất, mà là cuộc đua ai có thể sử dụng chúng một cách hiệu quả nhất.”
Dù tầm quan trọng của những đột phá kỹ thuật của DeepSeek vẫn còn là vấn đề gây tranh cãi, nhưng một làn sóng chấn động rõ ràng đang lan truyền khắp thị trường chứng khoán khi các nhà đầu tư nhận ra ý nghĩa của cải tiến chính của công ty này: cắt giảm đáng kể chi phí đào tạo cho các mô hình AI tiên tiến nhất.
Các mô hình của DeepSeek dường như đã làm suy yếu lập luận mà các công ty AI của Mỹ liên tục đưa ra trong năm qua: rằng những tiến bộ về AI đòi hỏi lượng vốn và cơ sở hạ tầng khổng lồ để phát triển và triển khai công nghệ của họ ở quy mô lớn.
Thay vào đó, người ta cho rằng các mô hình đắt tiền hơn rất nhiều do Mỹ phát triển sẽ không có nhiều điểm khác biệt, làm dấy lên lo ngại trong giới đầu tư về một cú sốc giảm phát mạnh.
“Có một cảm giác về sự đặc biệt của người Mỹ – rằng chỉ có người Mỹ mới có công nghệ này, và chỉ có người Mỹ mới có tiền để làm điều này,” Jim Tierney, một nhà đầu tư cổ phiếu tăng trưởng của Mỹ tại AllianceBernstein nhận xét. “Việc biến các mô hình này trở thành hàng hóa đang diễn ra nhanh hơn nhiều so với chúng ta nghĩ.”
Phần lớn Thung lũng Silicon đã bắt đầu lập luận rằng những cái tên khác trong ngành sẽ nhanh chóng sao chép các cải tiến của DeepSeek, giúp cắt giảm chi phí đào tạo các mô hình AI trên diện rộng. Các giám đốc điều hành như Satya Nadella của Microsoft tuyên bố rằng điều này sẽ giúp công nghệ trở nên dễ tiếp cận hơn đối với khách hàng và thúc đẩy việc sử dụng nó – theo đó mang lại lơi ích cho toàn bộ ngành.
Để thể hiện sự tự tin vào vị thế của mình, DeepSeek đã công bố nghiên cứu và phát hành các mô hình dưới dạng “trọng số mở” (open-weights), một phiên bản giới hạn hơn của phần mềm nguồn mở (open-source), cho phép bất kỳ ai cũng có thể tải xuống, sử dụng, và sửa đổi công nghệ.
Động thái này sẽ thu hút sự ủng hộ rộng rãi của các nhà phát triển phần mềm quốc tế đang tìm kiếm các mô hình “mở” để xây dựng ứng dụng. Hầu hết các mô hình do các công ty AI hàng đầu của Thung lũng Silicon phát triển vẫn là mô hình đóng, dù có một số ngoại lệ – đáng chú ý là Meta, công ty với các mô hình mở đang có mức độ phổ biến tăng vọt.
Nhưng mô hình của Deepseek có thể truy cập được với chi phí thấp hơn nhiều. Công ty Trung Quốc cho biết họ chỉ tính phí 1,4 xu cho mỗi 1 triệu token mà họ tạo ra – tương đương với khoảng 700.000 từ. Ngược lại, Meta tính phí 2,80 đô la cho cùng một lượng đầu ra từ các mô hình lớn nhất của họ.
Keegan McBride, một nhà nghiên cứu tại Viện Internet Oxford, người tập trung vào địa chính trị của AI, cho biết: “Rất nhiều nhà phát triển đang thử nghiệm giải pháp dựa trên AI nguồn mở của Trung Quốc. Điều này thực sự cho thấy rằng trong lĩnh vực AI, Mỹ không phải là lựa chọn duy nhất.”
Dù Yann LeCun, nhà khoa học AI hàng đầu tại Meta, đã mô tả DeepSeek bằng những lời lẽ hoa mỹ như bằng chứng cho thấy “các mô hình nguồn mở đang vượt trội hơn các mô hình độc quyền,” thì công ty khởi nghiệp này vẫn đặt ra thách thức trực tiếp đối với Meta.
Toner nói rằng “niềm tự hào của công ty [Meta] là tạo ra các mô hình trọng số mở không quá lạc hậu so với công nghệ tiên tiến nhất, và DeepSeek đã đánh bại họ ngay trong chính lĩnh vực của mình.”
Ngoài tác động của Deepseek lên thị trường sản phẩm AI, bước đột phá của công ty này còn hứa hẹn sẽ gây ra những hậu quả về mặt địa chính trị, diễn ra trong giai đoạn mà nhiều người tin là thời điểm quan trọng của cuộc cạnh tranh giành vị thế thống trị về AI giữa Mỹ và Trung Quốc.
Nếu R1 và những sản phẩm kế nhiệm nó trở thành tiêu chuẩn toàn cầu cho các mô hình AI “mở,” điều đó sẽ gây bất lợi cho Mỹ, Zuckerberg của Meta cảnh báo. “Vì lợi ích quốc gia của chúng ta, điều quan trọng là tiêu chuẩn phải là của Mỹ,” ông nói. “Chúng tôi muốn xây dựng hệ thống AI mà mọi người trên khắp thế giới sử dụng.”
Theo Craig Mundie, một nhân vật kỳ cựu của Microsoft và cũng từng là cố vấn Nhà Trắng, người tư vấn cho Sam Altman của OpenAI về chính sách và chiến lược công nghệ, DeepSeek đã “làm tăng tính cấp bách đối với mọi người và mọi quốc gia… của việc đánh giá cán cân quyền lực công nghệ đang nổi lên giữa các quốc gia.”
Dario Amodei, CEO của công ty khởi nghiệp AI Anthropic của Mỹ, cảnh báo rằng nếu Trung Quốc có thể đạt được vị thế ngang bằng với Mỹ về AI, điều này sẽ tác động đến mọi thứ mà công nghệ này có thể được sử dụng trong tương lai.
“Dường như Trung Quốc có thể điều hướng nhiều nhân tài, vốn, và sự tập trung hơn vào các ứng dụng quân sự của công nghệ này,” Amodei viết về những tiến bộ của DeepSeek. “Kết hợp với cơ sở công nghiệp lớn và lợi thế chiến lược quân sự, điều này có thể giúp Trung Quốc dẫn đầu trên trường quốc tế, không chỉ về AI mà còn về mọi thứ.”
Mundie, người cũng là chủ tịch diễn đàn ngoại giao Đối thoại AI giữa Mỹ và Trung Quốc do cố ngoại trưởng Mỹ Henry Kissinger thành lập, chỉ ra rằng AI là “công nghệ lưỡng dụng tối thượng,” nghĩa là nó có cả mục đích tích cực và tiêu cực.
Sự trỗi dậy của DeepSeek nhiều khả năng sẽ là chủ đề chính trong các cuộc trò chuyện khi nhóm ngoại giao này họp trong vòng 90 ngày tới, để thảo luận về một cấu trúc an toàn đa phương và chung cho phần mềm AI, chủ đề mà Mundie đã viết trong cuốn sách mới nhất của mình có tên Genesis, đồng tác giả với Kissinger và Schmidt.
Mundie nhận xét “Điều này không có nghĩa là mọi người sẽ có cùng luật lệ hay quy tắc, nhưng [việc xây dựng] kiến trúc để những cỗ máy này phát triển theo cách giúp chúng hiểu được các giá trị của con người và phù hợp với các lựa chọn xã hội trên khắp thế giới, tôi nghĩ đó là một nhiệm vụ cấp bách.”
Trong khi đó, những doanh nhân trẻ đầy tham vọng ở Trung Quốc đang nhìn vào DeepSeek và nhà sáng lập công ty như một nguồn cảm hứng để xây dựng một thế hệ công nghệ mạnh mẽ mới.
Một thiếu niên đến thăm nhà của Lương ở làng Mễ Lí Lĩnh tuần này nói rằng: “Ông ấy là một nhà công nghệ thực dụng. Ông ấy đã tập hợp một đội ngũ… vượt trội hơn những công ty như OpenAI, mà trước đây chúng tôi không thể cạnh tranh. Ông ấy là một người tuyệt vời, với những đóng góp tuyệt vời cho Trung Quốc.”