Với việc Trí tuệ nhân tạo (AI) đang trở thành xu hướng chủ đạo, NPU đã trở thành yếu tố cần cân nhắc quan trọng khi mua PC hoặc máy tính xách tay thế hệ tiếp theo. Nhưng bạn có biết sự khác biệt giữa NPU và bộ xử lý đồ họa (GPU) không?
NPU là gì?
NPU là bộ xử lý chuyên dụng được sử dụng để tăng tốc các hoạt động của mạng nơ-ron nhân tạo, bao gồm những tác vụ tính toán AI và Machine Learning (ML). Nó bao gồm các tối ưu hóa phần cứng cụ thể giúp nó hoạt động hiệu quả hơn trong khi vẫn đạt được hiệu quả sử dụng năng lượng cao.
NPU có khả năng xử lý song song (có thể thực hiện nhiều hoạt động cùng lúc) và với việc tối ưu hóa kiến trúc phần cứng, chúng có thể thực hiện các tác vụ AI và ML như suy luận và đào tạo một cách hiệu quả. NPU có thể được sử dụng để thực hiện các nhiệm vụ AI khác nhau, như nhận dạng khuôn mặt và thậm chí đào tạo hệ thống AI.
GPU là gì?
GPU là bộ xử lý đặc biệt được sử dụng để tăng tốc các tác vụ đồ họa như xử lý và hiển thị hình ảnh/video. Tương tự như NPU, GPU hỗ trợ xử lý song song và có thể thực hiện hàng nghìn tỷ thao tác mỗi giây.
Ban đầu được sử dụng để tăng tốc các tác vụ xử lý và kết xuất đồ họa như chỉnh sửa hình ảnh/video và chơi game, GPU hiện được sử dụng cho nhiều tác vụ tính toán. Do thông lượng cao, GPU thực hiện các hoạt động sử dụng nhiều dữ liệu như xử lý dữ liệu quy mô lớn và những phép tính phức tạp như khai thác tiền điện tử.
Vì lý do tương tự, GPU cũng được sử dụng để đào tạo các mạng nơ-ron nhân tạo lớn. Ví dụ, các công ty công nghệ sử dụng GPU H-100 cấp doanh nghiệp của Nvidia để đào tạo những mô hình ngôn ngữ lớn (LLM) của họ.
So sánh NPU và GPU
Sự khác biệt quan trọng giữa NPU và GPU là NPU giúp tăng tốc khối lượng công việc AI và ML trong khi GPU tăng tốc các tác vụ xử lý và kết xuất đồ họa. Nói cách khác, mỗi cái là một bộ xử lý chuyên dụng cho một chức năng cụ thể trên thiết bị.
Ngoài chức năng chuyên biệt, GPU còn được sử dụng ngày càng nhiều trong các tác vụ tính toán chung khác, bao gồm đào tạo hệ thống AI và suy luận Deep Learning. Nhưng nếu GPU cũng có thể được sử dụng cho các tác vụ AI/ML thì tại sao các công ty lại bận tâm đến việc có bộ xử lý chuyên dụng cho việc đó? Câu trả lời ngắn gọn là hiệu suất và hiệu quả.
Việc sử dụng bộ xử lý chuyên dụng trong máy tính cho một tác vụ cụ thể (thường là để tăng tốc hiệu suất của tác vụ) được gọi là tăng tốc phần cứng. Nó giúp cải thiện hiệu suất vì các thành phần khác nhau được thiết kế để thực hiện những tác vụ cụ thể hiệu quả hơn so với việc sử dụng thành phần có mục đích chung như CPU cho mọi việc.
Do đó, khả năng tăng tốc phần cứng khá cần thiết trên các PC hiện đại. Ví dụ, bạn sẽ tìm thấy GPU để xử lý đồ họa và card âm thanh cho âm thanh.
Hiệu suất của cả GPU và NPU đều được đo bằng số nghìn tỷ hoạt động mà bộ xử lý có thể thực hiện mỗi giây. Điều này thường được biểu thị bằng Tera (hoặc nghìn tỷ) hoạt động mỗi giây (TOPS). Ví dụ, chip Snapdragon X Elite của Qualcomm có tới 45 TOPS (chỉ tính từ NPU), trong khi GPU GeForce RTX 4090 của NVIDIA có hơn 1300 TOPS.
GPU có thể là loại rời (tách khỏi CPU) hoặc tích hợp (ở trong CPU). Ở thời điểm bài viết, NPU được tích hợp vào CPU. Ví dụ, bộ xử lý A-Series và M-Series của Apple có NPU (còn gọi là Apple Neural Engine) được tích hợp trong CPU. Tuy nhiên, một số NPU là dạng rời, như NPU chính thức của Raspberry Pi.
Tóm lại, NPU là bộ xử lý giúp tăng tốc quá trình xử lý mạng nơ-ron nhân tạo, trong khi GPU là bộ xử lý chuyên dụng để xử lý đồ họa. Do kiến trúc xử lý song song, cả hai đều có thể thực hiện hàng nghìn tỷ thao tác mỗi giây.
Mặc dù NPU chỉ chuyên dùng cho các tác vụ AI và ML nhưng trường hợp sử dụng cho GPU đã mở rộng ra khỏi lĩnh vực đồ họa trong những năm gần đây. Chúng cũng được sử dụng trong các ứng dụng có mục đích chung khác, đặc biệt là trong những hoạt động sử dụng nhiều dữ liệu như đào tạo mô hình AI và khai thác tiền điện tử.