Từ làm mát không khí đến làm mát bằng chất lỏng, AI thúc đẩy đổi mới công nghiệp
Nguyên nhân cơ bản để các thiết bị điện tử sinh ra nhiệt là quá trình chuyển đổi năng lượng hoạt động thành nhiệt năng. Tản nhiệt được thiết kế để giải quyết các vấn đề quản lý nhiệt trong các thiết bị điện toán hiệu năng cao, tối ưu hóa hiệu suất thiết bị và kéo dài tuổi thọ bằng cách loại bỏ nhiệt trực tiếp khỏi bề mặt chip hoặc bộ xử lý. Với sự gia tăng mức tiêu thụ điện năng của chip, công nghệ tản nhiệt đã phát triển từ cân bằng nhiệt độ tuyến tính của ống dẫn nhiệt một chiều đến cân bằng nhiệt độ phẳng của VC hai chiều, đến cân bằng nhiệt độ tích hợp của đường dẫn công nghệ VC ba chiều, và cuối cùng là sang công nghệ làm mát bằng chất lỏng.

3D VC có các ưu điểm làm mát tốt hơn như "làm mát hiệu quả, phân bổ nhiệt độ đồng đều và giảm các điểm nóng", có thể đáp ứng các yêu cầu tắc nghẽn về tản nhiệt cho các thiết bị công suất cao và cân bằng nhiệt độ ở những khu vực có mật độ dòng nhiệt cao. Nó cũng có thể đảm bảo hiệu suất ép xung mạnh hơn và độ ổn định của hệ thống sau khi ép xung. Độ dẫn nhiệt giữa ống dẫn nhiệt/tấm cân bằng là truyền nhiệt đến nhiều ống dẫn nhiệt/tấm cân bằng được lắp ráp, có khả năng chịu nhiệt tiếp xúc và khả năng chịu nhiệt của bản thân đồng; Và 3D VC, thông qua kết nối cấu trúc ba chiều, trải qua quá trình chuyển pha chất lỏng bên trong và khuếch tán nhiệt, truyền nhiệt chip trực tiếp và hiệu quả đến đầu xa của răng để tản nhiệt.

Công nghệ làm mát bao gồm hai loại: làm mát bằng không khí và làm mát bằng chất lỏng. Trong công nghệ làm mát bằng không khí, khả năng tản nhiệt của ống dẫn nhiệt và VC tương đối thấp. Giới hạn trên của tản nhiệt 3D VC có thể được mở rộng lên 1000W và cả hai đều cần có quạt để tản nhiệt. Công nghệ này đơn giản, rẻ tiền và phù hợp với hầu hết các thiết bị. Công nghệ làm mát bằng chất lỏng có hiệu suất làm mát cao hơn, gồm 2 loại: tấm lạnh và loại ngâm. Trong số đó, tấm lạnh là một phương pháp làm mát gián tiếp với mức đầu tư ban đầu vừa phải, chi phí vận hành và bảo trì thấp hơn và tương đối trưởng thành. Nvidia GB200 NVL72 áp dụng giải pháp làm mát bằng chất lỏng tấm lạnh; Làm mát ngâm là phương pháp làm mát trực tiếp có yêu cầu kỹ thuật cao và chi phí vận hành, bảo trì cao.

Việc đào tạo và quảng bá các mô hình AI lớn đòi hỏi sức mạnh tính toán cao hơn từ các chip và cải thiện mức tiêu thụ điện năng của các chip đơn lẻ. Nhiệt độ của chip ảnh hưởng đến hiệu suất của nó. Khi nhiệt độ hoạt động của chip gần đến 70-80 độ, cứ tăng nhiệt độ 2 độ thì hiệu suất của chip sẽ giảm khoảng 10%. Do đó, việc tăng mức tiêu thụ điện năng của một con chip càng làm tăng nhu cầu tản nhiệt. Ngoài ra, Nvidia B200 có mức tiêu thụ điện năng trên 1000W và gần đạt giới hạn trên của khả năng làm mát bằng không khí; Các chính sách như "carbon kép" và "Tính toán Đông Tây" yêu cầu nghiêm ngặt PUE cho trung tâm dữ liệu và PUE trung bình cho làm mát bằng chất lỏng thấp hơn PUE trung bình cho làm mát bằng không khí; Về mặt TCO, so với làm mát bằng không khí, chi phí đầu tư ban đầu của làm mát bằng chất lỏng dạng tấm lạnh gần bằng làm mát bằng không khí và chi phí vận hành sau đó sẽ thấp hơn.

Tủ làm mát bằng chất lỏng ngâm một pha: Là máy chủ làm mát bằng chất lỏng được tích hợp trong bể, với CDU và bể được kết nối bằng đường ống. Đường ống phía dưới vận chuyển môi trường làm mát ở nhiệt độ thấp vào bể và môi trường làm mát bằng chất lỏng sẽ hấp thụ nhiệt từ máy chủ làm mát bằng chất lỏng. Sau khi nhiệt độ tăng lên, nó chảy trở lại CDU và nhiệt được CDU mang đi. Cấu trúc này có thể đạt được khả năng làm mát hoàn toàn bằng chất lỏng cho máy chủ và thiết kế không quạt mang lại mật độ năng lượng cao hơn và PUE thấp hơn so với làm mát bằng không khí. Nhưng độ khó kỹ thuật cao và tỷ lệ thâm nhập tương đối thấp.

Ngâm hai pha: Với yêu cầu kỹ thuật cao có thể làm tăng đáng kể mật độ công suất của hệ thống. Do chip chính trong máy chủ có công suất cao nên bề mặt chip cần trải qua quá trình xử lý sôi nâng cao để tăng lõi khí hóa trên bề mặt, nâng cao hiệu suất truyền nhiệt chuyển pha và đạt mật độ tản nhiệt tối đa trên 100W/ c ㎡.

Được thúc đẩy bởi sự phát triển của sức mạnh tính toán AI và chính sách PUE, công nghệ làm mát cần được nâng cấp liên tục để kiểm soát nhiệt độ hoạt động của các thiết bị điện tử. Khả năng tản nhiệt ở cấp độ chip sẽ chuyển từ ống dẫn nhiệt/VC sang các giải pháp làm mát bằng tấm lạnh và 3DVC hiệu quả hơn, thúc đẩy sự đổi mới liên tục trong công nghệ làm mát chip.






