Meta đang phát triển bộ xử lý đào tạo AI nội bộ đầu tiên của mình. Theo Reuters, công ty đã bắt đầu thử nghiệm thí điểm một lô nhỏ chip đào tạo AI mới và sẽ đặt hàng thêm nếu giai đoạn thử nghiệm cho kết quả tích cực. Đang chú ý, dòng vi xử lý này hiện đang được sản xuất bởi TSMC.
Quyết định tự phát triển chip AI của Meta cũng là một phần trong chiến lược dài hạn nhằm giảm sự phụ thuộc vào các nhà cung cấp bên thứ ba, đặc biệt là Nvidia - nhà sản xuất hàng đầu thế giới hiện nay về bộ xử lý đồ họa (GPU) sử dụng trong các tác vụ liên quan đến AI. Theo ước tính sơ bộ, dự án này dự có thể “ngốn” của Meta tổng chi phí đầu tư lên tới 119 tỷ USD tính đến hết năm 2025—phần lớn trong số đó được dùng để xây dựng cơ sở hạ tầng AI.
Chip do Meta thiết kế về cơ bản là một bộ tăng tốc AI chuyên dụng. Nó được tối ưu hóa cho các tác vụ liên quan đến AI so với các tính toán chung. Kiến trúc chuyên dụng như vậy có thể giúp chip tiết kiệm năng lượng hơn so với các GPU hiện đang được sử dụng trong đào tạo AI.
Meta ban đầu dự định sử dụng chip này trong các thuật toán đề xuất xác định nội dung hiển thị trên Facebook và Instagram. Mục tiêu cuối cùng của công ty là hướng đến việc mở rộng quy mô sử dụng chip để hỗ trợ các sản phẩm AI tạo sinh của mình, chẳng hạn như chatbot AI được gọi là Meta AI.
Hành trình của Meta trong việc phát triển chip tùy chỉnh cho đến nay có kết quả khá hỗn độn. Công ty trước đây đã hủy bỏ một chip suy luận nội bộ sau khi triển khai thí điểm thất bại, thay vào đó chọn mua GPU của Nvidia trị giá hàng tỷ USD. Tuy nhiên, dự án mới dường như đang cho kết quả khả quan hơn. Meta hiện đã vượt qua cột mốc quan trọng "tape-out" trong quá trình phát triển.
Meta không phải là công ty phần mềm duy nhất quyết định tự phát triển chip AI của để giảm sự phụ thuộc vào các bên thứ ba. OpenAI cũng đang hoàn thiện thiết kế chip đào tạo AI tùy chỉnh đầu tiên của mình. Chip mới có thể sẽ có kiến trúc mảng tâm thu cùng với bộ nhớ băng thông cao, giống như bộ tăng tốc AI mới nhất của Nvidia. Kiến trúc này được biết đến với hiệu suất cao và hiệu quả trong việc xử lý các phép tính dày đặc, phức tạp.