Giám đốc điều hành Microsoft AI: Việc đánh cắp nội dung trên web mở là hoàn toàn bình thường

Giám đốc điều hành Microsoft AI Mustafa Suleyman tin rằng thời điểm bạn xuất bản bất kỳ thứ gì trên web mở, nó sẽ trở thành “nội dung miễn phí” mà bất kỳ ai cũng có thể tự do sao chép và sử dụng.

Khi Andrew Ross Sorkin của CNBC hỏi ông liệu “các công ty AI có đánh cắp IP của thế giới một cách hiệu quả hay không”, ông nói:

Tôi nghĩ rằng đối với nội dung đã có trên web mở, hợp đồng xã hội của nội dung đó kể từ những năm 90 đã cho phép sử dụng hợp lý (fair use). Bất cứ ai cũng có thể sao chép và tái tạo nó. Đó là “nội dung miễn phí”.

Microsoft hiện là mục tiêu của nhiều vụ kiện cáo buộc rằng hãng - và OpenAI - đang đánh cắp những nội dung trực tuyến có bản quyền để đào tạo các mô hình Generative AI, vì vậy, không ngạc nhiên khi nghe giám đốc điều hành của Microsoft cho rằng điều này là hoàn toàn hợp pháp.

Tại Hoa Kỳ, thời điểm bạn tạo ra một tác phẩm, tác phẩm đó sẽ tự động được bảo vệ bản quyền ở nước này. Người tạo nội dung thậm chí không cần phải đăng ký và chắc chắn tác quyền không bị mất chỉ vì tác giả đã xuất bản nó trên web. Trên thực tế, việc từ bỏ tác quyền tại đây còn khó đến mức các luật sư phải đưa ra các giấy phép web đặc biệt để hỗ trợ!

Trong khi đó, quyền sử dụng hợp lý không được cấp bởi một “hợp đồng xã hội” mà do tòa án xử lý. Đó là biện pháp bảo vệ pháp lý cho phép một số hoạt động sử dụng tài liệu có bản quyền sau khi tòa án cân nhắc những gì đang được sao chép, lý do, số lượng bao nhiêu và liệu điều đó có gây hại cho chủ sở hữu bản quyền hay không.

Điều đó chắc chắn không ngăn được nhiều công ty AI cho rằng việc đào tạo về nội dung có bản quyền là “sử dụng hợp lý”, nhưng hầu hết đều không "trắng trợn" như những gì ông Suleyman phát biểu.

Ông Suleyman dường như nghĩ rằng có điều gì đó liên quan đến ý tưởng robots.txt - chỉ định bot nào không thể quét một trang web cụ thể trong một file văn bản có thể khiến mọi người không lấy được nội dung của nó. Ông nói:

Có một danh mục riêng trong đó một trang web, nhà xuất bản hoặc tổ chức tin tức đã nói rõ ràng rằng 'không tìm kiếm hoặc thu thập thông tin về tôi vì bất kỳ lý do nào khác ngoài việc lập chỉ mục để người khác có thể tìm thấy nội dung này'. Việc này nằm giữa ranh giới đúng sai và phải được tòa án phân định.

Nhưng robots.txt không phải là một tài liệu pháp lý. Nó là hợp đồng xã hội đã có từ những năm 90 - tuy nhiên một số công ty AI dường như đang phớt lờ nó. Đối tác của Microsoft, OpenAI được cho là nằm trong số này.

Thứ Bảy, 29/06/2024 09:28
51 👨 154
0 Bình luận
Sắp xếp theo
    ❖ Chuyện công nghệ