Siêu máy tính nhanh nhất thế giới liên tục lỗi cứ sau vài giờ vận hành, hiệu năng thấp hơn thiết kế

Frontier của Phòng thí nghiệm Quốc gia Oak Ridge (ORNL) được mệnh danh là siêu máy tính nhanh nhất thế giới với hiệu năng lên đến 1,685 ExaFLOPS FP64. Frontier có sức mạnh tính toán lên tới 1.102 ExaFlops/s, là siêu máy tính đầu tiên phá vỡ “rào cản exascale”.

Sức mạnh của siêu máy tính Frontier đến từ bộ xử lý EPYC Trento 64 nhân, 4 GPU tính toán Instinct MI250X của AMD với bộ nhớ VRAM 128 GB HBM2E, cũng như liên kết HPE Slingshot với công suất 21MW. Hệ thống có tất cả 602.112 lõi CPU và 8.138.240 lõi GPU, cùng bộ nhớ 4,6 PB của cả DDR4 và HBM2e. Để truyền dữ liệu, Frontier còn được hỗ trợ bởi bộ nhớ 700 petabyte và đường mạng ethernet hiệu suất cao Slingshot.

Siêu máy tính Frontier

Về mặt lý thuyết, siêu máy tính Frontier trông khá tốt nhưng lại gặp những về đề phần cứng khiến nó chỉ có thể mang đến hiệu năng khoảng 1 ExaFLOPS FP64. Điều này khiến nhiều người tỏ ra thất vọng.

Justin Whitt, giám đốc chương trình tại Oak Ridge Leadership Computing Facility (OLCF) cho biết, Frontier đang gặp hàng "núi" vấn đề đối với phần cứng với thời gian phát sinh sự cố là hàng giờ chứ không phải hàng ngày. Xây dựng siêu máy tính luôn là một thách thức. Và việc một cỗ máy sử dụng tổng cộng 60 triệu bộ phận gặp vấn đề là điều hoàn toàn có thể hiểu được.

Theo tin đồn, hệ thống đã gặp sự cố với kết nối Slingshot hoặc GPU tính toán Instinct MI250X của AMD không đáng tin cậy như mong đợi. Tuy nhiên, ông Whitt không khẳng định lỗi phát sinh từ thành phần nào.

Whitt thừa nhận rằng việc điều chỉnh Frontier gặp “chút khó khăn” bởi quy mô chưa từng có của nó. Ông cho biết thêm, nếu Frontier có thể vận hành quá một ngày mà không gặp vấn đề là việc "rất xuất sắc" bởi mục tiêu hiện tại của nhóm nghiên cứu là vận hành hệ thống này theo giờ.

Siêu máy tính Frontier hiện vẫn chưa được triển khai chính thức và cũng chưa thể chắc chắn nó có thể vận hành đúng vào năm 2023 như dự định ban đầu hay không.

Thứ Sáu, 14/10/2022 08:08
31 👨 3.509
0 Bình luận
Sắp xếp theo
    ❖ Chuyện công nghệ