Lộ thông tin các mẫu GPU hàng đầu thế hệ tiếp theo của AMD NVIDIA: RDNA 3 Radeon RX 7900 XT vs Ada Lovelace GeForce RTX 4090

Greymon55, leaker nổi tiếng với những nhận định có độ chính xác cực cao về các sản phẩm phần cứng máy tính đình đám sắp ra mắt, vừa tiếp tục tiết lộ loạt thông tin rất đáng chú ý liên quan đến các mẫu GPU hàng đầu thế hệ tiếp theo của AMD và NVIDIA. Đó chính là AMD RDNA 3 Radeon RX 7900 XT vs NVIDIA Ada Lovelace GeForce RTX 4090. Cả hai đều sở hữu cho riêng mình những lợi thế cạnh tranh lớn, hứa hẹn tạo nên cuộc đua song mã thú vị trong phân khúc GPU cao cấp thời gian tới.

RDNA 3 Radeon RX 7900 XT vs Ada Lovelace GeForce RTX 4090

GPU Navi 31 được hỗ trợ bởi nền tảng AMD RDNA 3, và GPU AD102 dựa trên kiến trúc NVIDIA Ada Lovelace dự kiến sẽ là những “vũ khí chiến lược", được hai hãng mang ra “thi thố” trên các sản phẩm hàng đầu ra mắt trong năm tới. Cả hai đều hứa hẹn lại những cải tiến đáng kể hiệu suất so với thế hệ tiền nhiệm, nhưng đồng thời cũng sẽ là những con chip ngốn điện nhất từng được sản xuất.

Tiết lộ từ Greymon55

Trong khi NVIDIA đang hướng tới một cách tiếp cận nguyên khối với kiến trúc Ada Lovelace, thì AMD sẽ tận dụng thiết kế MCM đầy đủ, vốn đã đem về cho họ khá nhiều thành công sau màn ra mắt của dòng MI200 hỗ trợ CDNA 2 'Aldebaran'. Mỗi bên đều sở hữu cho mình những thế mạnh riêng, cùng với đó là sự khác biệt trong thông số kỹ thuật.

AMD Radeon RX 7900 XT

GPU AMD Navi 31, chipset RDNA 3 cao cấp nhất của AMD ở thời điểm hiện tại, sẽ là trái tim cung cấp sức mạnh cho con “quái vật” mang tên Radeon RX 7900 XT. Thông tin từ các nguồn uy tín đã chỉ ra rằng AMD sẽ loại bỏ đại lượng CU (Compute Units), và thay thế bằng WGP (Work Group Processors) trên GPU RDNA 3 thế hệ tiếp theo của hãng. Nếu điều này là thật, vì Navi 31 là GPU MCM nên nó sẽ sở hữu 2 IP chính, một GCD (Graphics Core Die) dựa trên quy trình 5nm của TSMC và 1 MCD (Multi-Cache Die) dựa trên nút quy trình 6nm cũng của nhà sản xuất bán dẫn Đài Loan.

Cấu hình GPU Navi 31 được hiển thị ở đây có 2 GCD (Graphics Core Die) và 1 MCD (Multi-Cache Die). Mỗi GCD có 3 Shader Engine (tổng cộng là 6) và mỗi Shader Engine có 2 Shader Arrays (tổng cộng 2 trên SE / 6 trên GCD / 12 ). Mỗi Mảng Shader bao gồm 5 WGP (tổng cộng 10 trên SE / 30 trên GCD / 60) và mỗi WGP có 8 đơn vị SIMD32 với 32 ALU (tổng cộng 40 SIMD32 trên SA / 80 trên SE / 240 trên GCD / 480). Kết hợp với nhau, các đơn vị SIMD32 này sẽ tạo ra 7.680 lõi trên mỗi GCD, và tổng cộng là 15.360 lõi.

Về hiệu suất, Radeon RX 7900 XT dự kiến sẽ có tốc độ xung nhịp 2,4 - 2,5 GHz, đặt hiệu suất lý thuyết của nó vào khoảng 75 TFLOP (FP32). Đây là một cải tiến “điên rồ”, lên tới 226% so với sản phẩm tiền nhiệm Radeon RX 6900 XT.

MCD Navi 31 (RDNA 3) sẽ được liên kết với GCD kép thông qua kết nối Infinity Fabric thế hệ tiếp theo và có 256-512 MB Infinity Cache. Mỗi GPU cũng sẽ có 4 memory connect links (32-bit), tổng cộng 8 memory controller 32 bit cho giao diện bus 256 bit. Một tin đồn khác xuất hiện gần đây cho thấy AMD sẽ sử dụng công nghệ 3D Infinity Cache trên dòng sản phẩm RDNA 3 của mình. Công nghệ này sẽ tích hợp bộ nhớ đệm mới trong các ngăn xếp dọc trên GPU, tương tự như cách chip Vermeer-X xếp bộ nhớ đệm L3 trên CCD.

Thông tin GPU Navi 31

NVIDIA GeForce RTX 4090

Đang có không ít tin đồn từ nhiều nguồn uy tín khẳng định rằng NVIDIA sẽ sử dụng nút quy trình N5 (5nm) của TSMC cho các GPU Ada Lovelace đầu bảng ra mắt năm 2022. Điều này bao gồm cả AD102 SKU, sẽ là một thiết kế hoàn toàn nguyên khối. Theo tiết lộ của Greymon55, GPU AD102 nhiều khả năng sẽ sở hữu tốc độ xung nhịp cao tới 2,5GHz (mức tăng trung bình 2,3GHz). Cụ thể, Greymon55 nói rằng xung nhịp GPU của Ada Lovelace 'AD102' sẽ là 2,3 GHz hoặc cao hơn, vì vậy có thể lấy mức đó làm cơ sở, kết hợp với các thông số kỹ thuật đã bị rò rỉ trước đó để tìm ra mức hiệu suất đạt được trong thực tế.

Dựa trên thông số kỹ thuật sơ bộ (có thể thay đổi), NVIDIA AD102 "ADA GPU" dường như sẽ sở hữu 18432 lõi CUDA, nằm trong 144 đơn vị SM. Con số này gần gấp đôi số lõi có trong kiến trúc Ampere vốn cũng đã là một bước tiến lớn so với Turing. Tốc độ xung nhịp 2,3-2,5 GHz sẽ mang đến hiệu suất tính toán lên tới 85 đến 92 TFLOP (FP32). Đây là mức tăng gấp 2 lần so với hiệu suất FP32 của RTX 3090 hiện tại - một con số ấn tượng.

Tuy vậy, bước nhảy hiệu suất 150% trông có vẻ lớn, nhưng nên nhớ rằng NVIDIA cũng đã từng có một bước nhảy vọt về số lượng FP32 trong thế hệ này với Ampere. Cụ thể, GPU Ampere GA102 (RTX 3090) cung cấp 36 TFLOP trong khi GPU Turing TU102 (RTX 2080 Ti) cung cấp 13 TFLOP. Đó là mức tăng hơn 150% về FP32 Flops, nhưng mức tăng hiệu suất chơi game trong thế giới thực đối với RTX 3090 trung bình cũng “chỉ” nhanh hơn khoảng 50-60% so với RTX 2080 Ti. Do vậy, đừng để bị “đánh lừa” bởi những con số hào nhoáng. Hơn nữa, cũng chưa thể biết liệu 2,3-2,5 GHz là mức xung nhịp trung bình hay cao nhất.

Bên cạnh đó, nguồn tin rò rỉ cũng cho thấy mẫu flagship GeForce RTX 40 sẽ giữ lại giao diện bus 384-bit, tương tự như RTX 3090. Điều thú vị là Greymon55 đề cập đến G6X, đồng nghĩa với việc NVIDIA sẽ không chuyển sang một tiêu chuẩn bộ nhớ mới cho đến sau thế hệ Ada Lovelace, và sử dụng tốc độ pin cao hơn của G6X là 21 Gbps cho các thẻ thế hệ tiếp theo của nó, trước khi có thể thấy một tiêu chuẩn mới hơn (ví dụ: GDDR7). Card sẽ có bộ nhớ 24GB nên có thể mong đợi các mô-đun DRAM 16Gb đơn hoặc 8Gb kép.

GPU NVIDIA Ada Lovelace sẽ cung cấp sức mạnh cho các card đồ họa GeForce RTX 40 thế hệ tiếp theo, cũng như đối đầu trực tiếp với các sản phẩm Radeon RX 7000 series dựa trên RDNA 3 của AMD. Vẫn khá nhiều suy đoán về việc sử dụng MCM của NVIDIA. GPU Hopper, chủ yếu nhắm vào phân khúc trung tâm dữ liệu & AI, được cho là sẽ sớm bị loại biên và sẽ được thay thế bằng MCM. NVIDIA nhiều khả năng không sử dụng thiết kế MCM trên GPU Ada Lovelace của mình, nên họ sẽ giữ thiết kế nguyên khối truyền thống.

Thông tin GPU AD102

Bạn có suy nghĩ gì về 2 sản phẩm trên? Hãy để lại ý kiến bình luận nhé!

Thứ Ba, 23/11/2021 23:58
55 👨 362
0 Bình luận
Sắp xếp theo
    ❖ Chuyện công nghệ