Nvidia lại bị cáo buộc thu thập dữ liệu AI từ Netflix và YouTube

Phạm Hải

Theo một báo cáo đang nhận được rất nhiều sự chú ý từ 404 Media, Nvidia đã có hành vi lén lút thu thập nội dung video từ các nguồn trực tuyến như Netflix và YouTube để sử dụng cho các sản phẩm trí tuệ nhân tạo của mình mà hoàn toàn không xin phép.

Kết luận này được đưa ra sau khi 404 Media thu thập được với nguồn thông tin rò rỉ từ các cuộc trò chuyện nội bộ của Nvidia trên Slack, email và tài liệu nội bộ của hãng. Nvidia đã tự giúp mình có được "trải nghiệm hình ảnh tương đương với dữ liệu đào tạo trong suốt cuộc đời con người mỗi ngày", Ming-Yu Liu, phó chủ tịch phụ trách nghiên cứu tại Nvidia kiêm trưởng nhóm dự án Cosmos, thừa nhận trong một email vào tháng 5. Dự án Cosmos này nhằm mục đích xây dựng một mô hình ngôn ngữ lớn mang tính nền tảng cho Nvidia, tương tự như các dự án Gemini 1.5 của Google, OpenAI GPT-4 hay Llama 3.1 của Meta.

Các cựu nhân viên giấu tên của Nvidia nói với 404 Media rằng họ đã được yêu cầu thu thập nội dung video từ Netflix, YouTube và các nguồn trực tuyến lớn khác, biến chúng thành dữ liệu đào tạo để sử dụng với các sản phẩm AI khác nhau của công ty.

Để thực hiện điều này, dự án Cosmos được cho là đã sử dụng một trình download video nguồn mở và sử dụng máy học để xử lý IP, do đó tránh được các nỗ lực chặn của YouTube. Theo thông tin rò rỉ, các nhà quản lý dự án đã thảo luận về việc sử dụng tới 30 máy ảo chạy trên Amazon Web Services để tải xuống một lượng video có thời lượng tương đương khoảng 80 năm, cùng vô số clip riêng lẻ mỗi ngày. Khi những nhân viên này thắc mắc về tính hợp pháp của dự án Cosmos, ban lãnh đạo công ty đảm bảo rằng họ đã được các đối tác cho phép sử dụng nội dung đó.

Về phần mình, Nvidia tuyên bố không có hành vi sai trái nào. "Chúng tôi tôn trọng quyền của tất cả những người sáng tạo nội dung và tin tưởng rằng các mô hình và nỗ lực nghiên cứu của chúng tôi tuân thủ đầy đủ theo đúng nghĩa đen và tinh thần của luật bản quyền", một phát ngôn viên của Nvidia đã nói với 404 Media qua email. "Luật bản quyền bảo vệ các biểu đạt cụ thể nhưng không bảo vệ các sự kiện, ý tưởng, dữ liệu hoặc thông tin. Bất kỳ ai cũng có quyền tự do tìm hiểu các sự kiện, ý tưởng, dữ liệu hoặc thông tin từ một nguồn khác và sử dụng chúng để tạo ra các biểu đạt của riêng họ. Sử dụng hợp lý cũng bảo vệ khả năng sử dụng một tác phẩm cho mục đích chuyển đổi, chẳng hạn như đào tạo mô hình AI".

Đây không phải là lần đầu tiên Nvidia (chưa kể đến phần lớn các công ty còn lại trong lĩnh vực AI) áp dụng cách làm theo kiểu "tiền trảm hậu tấu" trong việc thu thập dữ liệu đào tạo AI của mình. Vào tháng 7, Nvidia cũng đã bị réo tên trong một báo cáo khác về việc thu thập bất hợp pháp các video có bản quyền làm dữ liệu training AI.

Tại CES 2024, Nvidia đã gây tranh cãi với những câu trả lời mơ hồ về cách thức đào tạo công cụ AI tạo sinh mới cho trò chơi. Đáp lại, công ty khẳng định lại rằng các công cụ của họ "an toàn về mặt thương mại". Nhưng sự thật thế nào? Hãy cùng chờ xem!

Thứ Sáu, 09/08/2024 15:45

3 ★ 1 👨 48

Bạn nên đọc

Xác thực tài khoản!

Theo Nghị định 147/2024/ND-CP, bạn cần xác thực tài khoản trước khi sử dụng tính năng này. Chúng tôi sẽ gửi mã xác thực qua SMS hoặc Zalo tới số điện thoại mà bạn nhập dưới đây:

Số điện thoại chưa đúng định dạng!

0 Bình luận

Sắp xếp theo

Xóa Đăng nhập để Gửi

Chuyện công nghệ

Cũ vẫn chất

Xem thêm

Giấy phép số 362/GP-BTTTT. Bộ Thông tin và Truyền thông cấp ngày 30/06/2016. Cơ quan chủ quản: CÔNG TY CỔ PHẦN MẠNG TRỰC TUYẾN META. Địa chỉ: 56 Duy Tân, Phường Cầu Giấy, Hà Nội. Điện thoại: 024 2242 6188. Email: info@meta.vn. Chịu trách nhiệm nội dung: Lê Ngọc Lam.

Nvidia lại bị cáo buộc thu thập dữ liệu AI từ Netflix và YouTube

Phạm Hải

Bạn nên đọc

Chiếc điện thoại Android này vừa phá kỷ lục về thời lượng pin trên smartphone

Phát hiện bất ngờ về Wi-Fi mà chúng ta dùng lướt web hàng ngày

CSCĐ - Vietnam Mobile Police: Tựa game bắn súng Việt chính thức đặt chân lên Steam

Vì sao không thể “thu hồi” AI như một loại thuốc lỗi: thách thức quản lý AI toàn cầu

Bkav công bố BkavGPT, giải quyết được vấn đề mà OpenAI, Google đang gặp phải

Trải nghiệm tự thay pin iPhone tại nhà với bộ công cụ trong 2 chiếc vali nặng 35 kg của Apple

Cũ vẫn chất

Cách xác định ngày đăng của một trang web hay một thông tin trên Internet

Công thức tính thể tích khối tròn xoay và ví dụ minh họa

Cách kiểm tra phiên bản Excel đang sử dụng

Cách tạo mã QR bằng Google Sheets cực đơn giản

‘Để giành’ hay ‘để dành’, ‘dành cho’ hay ‘giành cho’, cách viết nào đúng chính tả?

Những câu chuyện ý nghĩa về cuộc sống bạn nên đọc một lần trong đời

Câu đố thả thính hài hước nhưng ngọt ngào ‘đốn tim’ crush

Sui gia hay Xui gia là đúng chính tả?

Top 10 trình duyệt web tốt nhất 2026

Loli là gì? BB là gì?