Các công cụ AI có vi phạm tác quyền hay không?

Nguồn: “Does generative artificial intelligence infringe copyright?”, The Economist, 02/03/2024.

Biên dịch: Đỗ Đặng Nhật Huy

Trí tuệ nhân tạo tạo sinh (AI) sẽ biến đổi thị trường lao động. IMF cho rằng các công cụ AI, như những phần mềm tạo văn bản hoặc hình ảnh, cuối cùng sẽ ảnh hưởng đến 40% việc làm. Ngân hàng Goldman Sachs thì cho rằng chúng có thể thay thế 300 triệu việc làm trên toàn thế giới. Những người hoài nghi cho rằng các ước tính như thế là phóng đại. Nhưng một số ngành dường như đã cảm nhận được tác động. Một bài báo xuất bản hồi tháng 8 năm 2023 trên SSRN, một kho lưu trữ các nghiên cứu chưa qua bình duyệt chính thức, cho thấy thu nhập của các lao động tự do “sáng tạo” — chẳng hạn như nhà văn và họa sĩ minh họa — đã giảm kể từ tháng 11 năm 2022 khi ChatGPT được phát hành.

Trong năm qua, giới nghệ sĩ, tác giả, và diễn viên hài đã đệ đơn kiện các công ty công nghệ đứng sau các công cụ AI, bao gồm Openai, Microsoft, và Anthropic. Những đơn kiện này cáo buộc các công ty, bằng cách sử dụng tài liệu có bản quyền để huấn luyện mô hình AI, đã vi phạm quyền của người sáng tạo. Theo pháp lý thì tuyên bố như vậy có đúng không?

Các công cụ AI tạo sinh biến những câu lệnh bằng văn bản — chẳng hạn như “vẽ đường chân trời New York theo phong cách của Vincent van Gogh” — thành các lệnh mà máy có thể đọc được. Các mô hình được huấn luyện trên kho dữ liệu khổng lồ về văn bản, hình ảnh, âm thanh hoặc video. Trong nhiều trường hợp, các công ty công nghệ dường như đã tự động lấy nhiều thông tin từ Internet mà không xin phép. Vào năm 2022, nhà sáng lập David Holz của Midjourney, một trong những công cụ tạo hình ảnh AI phổ biến nhất, thừa nhận công cụ của ông đã thu thập 100 triệu hình ảnh mà không biết chúng đến từ đâu hoặc xin phép chủ sở hữu của chúng.

Các công cụ AI tạo sinh có nhiệm vụ tạo ra đầu ra hoàn toàn mới và do đó các nhà phát triển AI lập luận những gì công cụ của họ tạo ra không vi phạm bản quyền. Họ dựa vào “học thuyết sử dụng hợp lý,” vốn cho phép sử dụng tài liệu có bản quyền trong một số trường hợp nhất định. Học thuyết này thường bảo vệ các nhà báo, giáo viên, nhà nghiên cứu, và những người khác khi họ sử dụng các đoạn trích ngắn của tài liệu có bản quyền trong tác phẩm của chính họ, chẳng hạn như trong bài phê bình sách. Song các nhà sáng tạo cho rằng công cụ AI không được hưởng sự bảo vệ đó vì trên thực tế, chúng đang tiếp thu và sắp xếp lại các tác phẩm có bản quyền thay vì trích các phần nhỏ.

AI tạo sinh còn quá mới nên hầu như không có án lệ nào hướng dẫn tòa án. Điều đó khiến dự đoán phán quyết của toà là rất khó. Một số nhà quan sát cho rằng nhiều vụ kiện tập thể chống lại các công ty AI có thể sẽ thất bại. Andres Guadamuz, một chuyên gia về luật sở hữu trí tuệ tại Đại học Sussex, cho rằng sức mạnh của học thuyết sử dụng hợp lý sẽ đánh bại các nguyên đơn.

Có một vụ được theo dõi đặc biệt chặt chẽ. Vào ngày 27 tháng 12, tờ New York Times đã kiện Microsoft và Openai sau khi đàm phán thất bại. Họ cáo buộc các công ty này nợ “hàng tỷ đô la” vì sử dụng tác phẩm có bản quyền để đào tạo ChatGPT. Các luật sư của tờ báo đã đưa ra nhiều ví dụ về việc ChatGPT tạo đầu ra bằng cách trích New York Times từng chữ một. Họ tuyên bố điều này cho thấy các công cụ AI không làm biến đổi đáng kể tài liệu mà chúng được cho để huấn luyện và do đó không được bảo vệ bởi học thuyết sử dụng hợp lý.

Vào ngày 8 tháng 1, OpenAI trả lời họ không làm gì sai. AI tạo sinh là một công nghệ so khớp mẫu để viết phản hồi bằng cách dự đoán từ tiếp theo có khả năng xảy ra cao nhất dựa trên dữ liệu huấn luyện. Như trong các trường hợp khác thuộc loại này, OpenAI nói rằng điều đó được bảo vệ bởi việc sử dụng hợp lý. Họ tuyên bố New York Times đã phóng đại quá mức nguy cơ ChatGPT trích nguyên văn, mà họ cho rằng chỉ là một lỗi hiếm. Trong hồ sơ được gửi vào ngày 26 tháng 2, OpenAI nói New York Times đã chọn lọc các câu trả lời từ “hàng chục nghìn” truy vấn mà họ nhập vào ChatGPT. Họ cáo buộc trong số này có cả các “câu lệnh lừa dối” – vốn vi phạm điều khoản sử dụng của ChatGPT.

Các nhà sáng tạo lo lắng nếu tòa ra phán quyết có lợi cho các công ty AI thì công cụ này sẽ thay thế khả năng sáng tạo của con người. Nhưng các nhà phát triển nói nếu họ phải ngừng huẫn luyện mô hình bằng dữ liệu có bản quyền, các mô hình AI tiên tiến sẽ không thể tồn tại. Có một cách thứ ba, mà ông Guadamuz xem là khả năng dễ xảy ra nhất trong vụ kiện của New York Times: các nhà phát triển AI phải trả tiền để được phép sử dụng dữ liệu có bản quyền. Dù kết quả thế nào, những vụ kiện như thế này sẽ định hình tương lai của công nghệ AI./.