DeepSeek, công ty Trung Quốc sở hữu mô hình AI miễn phí làm rung chuyển thế giới công nghệ, đang phải đối mặt với nhiều cáo buộc tiêu cực, trong đó có việc sử dụng GPU Nvidia nhập lậu để đào tạo và vận hành mô hình AI cùng tên.
Theo đó, Bộ Thương mại Mỹ đang xem xét điều tra xem liệu DeepSeek có tiếp cận và thu thập bất hợp pháp GPU của Nvidia thông qua các đầu mối trung gian ở Singapore hay không. Trong vài năm trở lại đây, Hoa Kỳ duy trì áp đặt các hạn chế nghiêm ngặt đối với việc xuất khẩu chip tiên tiến vào Trung Quốc, nhằm đảm bảo duy trì vị thế hàng đầu về công nghệ cũng như kìm hãm đà phát triển thần tốc của đối thủ.
DeepSeek gần đây đã trở nên nổi tiếng khi ra mắt mô hình suy luận R1. Mô hình này được đánh giá là có hiệu năng tiệm cận với mô hình o1 của OpenAI, vốn chỉ khả dụng trong gói thuê bao ChatGPT Pro yêu cầu đăng ký trả phí. Yếu tố khiến DeepSeek được đánh gia cao ở chỗ nó không chỉ sở hữu hiệu năng tương tự mà, còn được tung ra dưới dạng mã nguồn mở và miễn phí cho tất cả mọi người. Những người chưa từng có cơ hội trải nghiệm mô hình suy luận tiên tiến của OpenAI giờ đây đã có DeepSeek R1 là giải pháp thay thế xứng tầm.
DeepSeek “hot” đến mức ứng dụng này đã vươn lên vị trí số 1 trên bảng xếp hạng App Store của Mỹ, đồng thời khiến thị trường chứng khoán Mỹ lao dốc với 2 nghìn tỷ USD vốn hóa thị trường bị thổi bay chỉ trong vài ngày.
Đáng chú ý, DeepSeek tuyên bố rằng họ đã làm được tất cả điều này chỉ với 2000 GPU Nvidia H800 và khoảng 6 triệu USD chi phí đầu tư ước tính, một con số quá nhỏ so với những khoản đầu tư khổng lồ đã rót vào OpenAI hay nhiều mô hình AI tương tự khác.
Theo Citigroup, các "ông lớn" công nghệ Mỹ như Microsoft, Meta, Amazon và Alphabet phải bỏ ra tổng cộng khoảng 209 tỷ USD vào cơ sở hạ tầng dữ liệu trong năm ngoái, trong đó 80% dành cho trung tâm dữ liệu. Điều này khiến nhiều người nghi ngờ liệu DeepSeek có thực sự tao ra điều khác biệt so với OpenAI và các công ty trí tuệ nhân tạokhác của Mỹ, và liệu có thực sự khả thi để huấn luyện các mô hình AI với ít tài nguyên hơn nhiều như vậy hay không.
David Sacks, cựu quan chức phụ trách trí tuệ nhân tạo dưới thời Tổng thống Donald Trump, đã phát biểu trong một cuộc phỏng vấn gần đây rằng có "bằng chứng đáng kể" cho thấy DeepSeek đã chắt lọc đầu ra của OpenAI để huấn luyện mô hình của riêng mình. Quá trình chắt lọc này liên quan đến việc một "mô hình con" (DeepSeek) bắt chước cách suy luận của "mô hình cha" (OpenAI), tương tự như cách con người học hỏi, bằng cách đặt hàng triệu câu hỏi. Microsoft và OpenAI cũng đã khởi động các cuộc điều tra riêng về vấn đề này, chủ yếu là làm rõ liệu DeepSeek có truy cập dữ liệu của OpenAI theo cách không phù hợp hay không.
DeepSeek cho biết họ sử dụng chip H800 - chipset AI mà Nvidia phát triển dành riêng cho thị trường Trung Quốc sau khi các biện pháp kiểm soát xuất khẩu lần đầu tiên được áp dụng. Không rõ DeepSeek đã có được Nvidia H800 như thế nào, nhưng công ty có thể mua chúng vào cuối năm 2022 hoặc 2023.
Hiện chưa có bằng chứng nào cho thấy DeepSeek đã sử dụng chip buôn lậu. Nhưng nhiều công ty AI của Trung Quốc được cho là đã làm như vậy. Hoạt động buôn lậu chip AI có tổ chức vào Trung Quốc đã được theo dõi tại nhiều quốc gia, bao gồm Malaysia, Singapore và Các Tiểu vương quốc Arab Thống nhất.