NVIDIA vừa công bố kết quả đánh giá benchmark (nội bộ) của dòng CPU Grace dựa trên kiến trúc Arm sắp ra mắt. Đây dự kiến sẽ là mẫu chip cung cấp năng lượng cho các trung tâm dữ liệu, máy chủ thế hệ tiếp theo, và kết quả benchmark bước đầu cho thấy các “fan” của NVIDIA có lý do để đặt kỳ vọng vào một dòng sản phẩm thực sự mang tính đột phá trên thị trường.
Với nền tảng sức mạnh từ lõi Arm Neoverse N2, CPU Grace sẽ được sử dụng trong các Superchip của NVIDIA có cả hai loại CPU+CPU và CPU+GPU. Công ty gần đây đã công bố dòng GPU mạnh nhất dành cho khối lượng công việc liên quan đến AI và Điện toán được gọi là GH200, đi kèm với bộ nhớ HBM3e nhanh nhất thế giới và đồng thời sẽ được áp dụng với Grace Hopper Superchip.
Một số điểm nổi bật chính của CPU Grace bao gồm:
- CPU hiệu suất cao cho HPC và điện toán đám mây
- Thiết kế siêu chip với tới 144 nhân CPU Arm v9
- LPDDR5x đầu tiên trên thế giới có bộ nhớ ECC, tổng băng thông 1TB/s
- SPECrate2017_int_base trên 740 (ước tính)
- Giao diện 900GB/s, nhanh hơn 7 lần so với PCIe Gen 5
- Mật độ đóng gói gấp 2 lần của các giải pháp dựa trên DIMM
- Hiệu suất trên mỗi watt gấp 2 lần so với CPU hàng đầu hiện nay
- Chạy tất cả các nền tảng phần mềm NVIDIA, bao gồm RTX, HPC, AI và Omniverse
Trong khuôn khổ sự kiện Hot Chips 2023, kỹ sư trưởng NVIDIA Bill Dally đã trình bày những so sánh về hiệu suất giữa Grace Superchip và giải pháp x86 socket kép từ các đối thủ cạnh tranh. Chúng bao gồm EPYC 9654, CPU 96 lõi 192 luồng nhanh nhất của AMD, và đặc biệt là dòng sản phẩm hàng đầu của Intel: Xeon Platinum 8480+ với 56 lõi 112 luồng. Vì các giải pháp này đều đang chạy trên cấu hình dual-socket nên tổng cộng có 192 lõi cho AMD và 112 lõi cho nền tảng của Intel.
Đối với với Grace Superchip, giải pháp của NVIDIA cung cấp tổng cộng 144 lõi (72 Arm Neoverse V2 trên mỗi chip), hỗ trợ bộ nhớ LPDDR5X lên tới 960GB với băng thông thô lên tới 1 TB/s và có tổng công suất 500W. Các thông số kỹ thuật bổ sung bao gồm 117 MB bộ đệm L3 và 58 làn Gen5, tất cả đều sử dụng nút xử lý TSMC 4N.
Kết quả được NVIDIA tổng hợp bao gồm nhiều ứng dụng máy chủ khác nhau như Weather WRF, MD CP2K, Climate NEMO, CFD OpenFOAM và Graph Analytics GapBS BFS. Trong số đó, CPU Grace Superchip của NVIDIA cung cấp hiệu suất tốt hơn tới 40% so với CPU Genoa của AMD, đồng thời cũng vượt xa CPU Sapphire Rapids của Intel. Đáng chú ý, nếu so sánh mức hiệu suất trên công suất, Grace còn gây ấn tượng hơn khi cho hiệu suất tốt dù chạy ở mức TDP thấp hơn các đối thủ.
Việc so sánh hiệu suất thậm chí còn thú vị hơn khi đặt vào mô hình một ứng dụng trung tâm dữ liệu quy mô lớn thực tế. Kết quả benchmark thông lượng của một trung tâm dữ liệu 5 MW cho thấy Siêu chip Grace của NVIDIA có thể mang lại hiệu suất gấp 2,5 lần, trong khi vẫn đạt hiệu quả vượt trội trên cùng một thang đánh giá. Đối với các máy khách chủ và trung tâm dữ liệu được đầu tư vào các khối lượng công việc dạng này, Grace có thể là yếu tố thay đổi cuộc chơi lớn giống như GPU Tensor Core của NVIDIA đã thống trị không gian HPC và AI.