안녕하세요! H3솔루션입니다.
요즘 하루하루 인공지능 기술이 눈에 띄게 발전하고 있죠.
오늘은 전문 기술적인 내용보다는, 수냉식 서버에 대해 조금 더 흥미롭게 풀어보는 이야기를 준비했습니다.
기술에 익숙하지 않으신 분들도 쉽게 읽으실 수 있도록 가볍게 작성해 보았습니다.
본격적인 이야기로 들어가기 앞서, 요즘 인공지능 기술이 얼마나 빠르게 발전하고 있는지, 그리고 저희가 그 변화를 어떻게 체감하고 있는지를 잠깐 나눠보려 합니다.
저희 역시 사진처럼 업무에 있어 상당히 많은 부분을 CHATGPT에게 도움을 받을 정도로, 이제는 실생활에서도 인공지능이 크게 한 자리를 차지하고 있다는 생각이 듭니다
이렇게 인공지능이 발전하게 된 것에는 그래픽카드의 역할이 굉장히 컸는데요 , 과거엔 CPU로만 신경망 학습을 진행하였던것에 반해 , GPU는 수천 개의 코어를 활용해 병렬처리에 특화되어 있어, 인공지능의 방대한 연산 작업에 매우 적합합니다.
그 시초를 찾기 위해선 2009년까지 거슬러 올라가 봐야 합니다. Andrew Ng 교수의 논문 『Large-scale Deep Unsupervised Learning using Graphics Processors』(2009)에 따르면, 그의 연구팀은 두 대의 NVIDIA GPU(GTX 280) 를 활용하여 딥러닝 모델을 CPU 대비 최대 70배 빠른 속도로 학습시켰습니다.
그 결과 CPU로는 몇 주가 걸리던 작업이 단 하루 만에 완료되었습니다. 이 논문은 GPU가 가진 병렬처리 능력이 인공지능 분야, 특히 딥러닝 모델의 학습 속도를 얼마나 획기적으로 높일 수 있는지 잘 보여주는 최초의 사례인듯 합니다.
하지만, 이렇게 강력한 GPU를 수백, 수천 대 단위로 운영하는 데이터센터(IDC)는 전 세계 전력 사용량에서 매년 더 큰 비중을 차지하고 있습니다. 실제로 국제에너지기구(IEA)의 자료에 따르면, 2022년 기준 데이터센터는 전 세계 전력 사용량의 약 2%(약 460 TWh)를 소비하고 있으며 국제에너지기구(IEA)가 2024년 1월에 발표한 Electricity 2024 보고서에서 데이터센터의 전력 소비량이 2026년에는 최대 1,050 TWh까지 증가할 것으로 예상하고 있습니다.
거기다 , 데이터센터 내부의 전력 소모 요인을 살펴보면, 서버 연산에 약 40%가 사용되며, 냉각 및 발열 제어에도 같은 수준인 약 40%의 높은 전력이 소모되고 있습니다.
그만큼 냉각 시스템이 데이터센터 운영에 있어 중요한 전력 소비 요인임을 알 수 있습니다.
그 뿐만이 아니라 , 현재 PCIE 타입의 AI 개발용 GPU들의 TDP는 점점 증가하는 추세입니다.
결국 높아진 온도는 제품의 쓰로틀링이나 , 셧다운을 야기하고 , 높은 온도는 차차 칩셋 자체의 수명을 줄이기도 합니다.
실제로 최근에 많은 서버 제조사들이나 , 데이터 센터를 운용하는 많은 회사들이 공랭식 쿨링의 한계로 , 수냉식 서버를 채택하고 있습니다.
공랭식 쿨링은 초기 세팅이 간편하고 , 수냉에 비해서 가격이 저렴하다는 장점이 있지만 , 결국 발열 제어를 위한 냉각에 있어서 많은 비용을 지불하게 됩니다.
근본적으로 , 공랭식 서버에는 높은 전력을 소모하는 , 팬 한개당 50W정도로 고전력을 소모하는 팬들이 장착되어 있어
일반적인 구성 기준으로 GPU 서버 6대에서 냉각팬만으로 약 2400W에 가까운 전력 소모가 발생할 수 있습니다
수냉식 솔루션은 공랭식 솔루션의 비해 확실하게 냉방 비용의 절감을 가져다 줄 수 있습니다.
Korea Cloud & Data Center Conference 2024 발표에 따르면 공랭식에서 DLC 쿨링으로 데이터 센터의 냉각을 변경시 30~50%(PUE 1.4~2.0 ) 에서 5~15%(PUE 1.05 ~1.20) 으로 낮출 수 있다고 합니다.
또한, 낮은 온도로 더 높은 성능의 제공이 가능하며 , 소음문제도 해소가 가능합니다.
정말 길고 길었던 서론…
5분 분량으로 60분 떠들기는 쉬워도, 60분 분량을 5분으로 압축하기가 어렵다고 , 수냉식 서버의 필요성과 수냉이 무엇인지를 설명하기 위해서 서론이 정말 길었습니다. 그렇다면 이제 수냉이 뭔지 한번 알아보도록 하겠습니다.
수냉이란-?
수냉(液冷, Liquid Cooling)이란 물이나 특수 냉각액과 같은 액체를 이용하여 열을 효과적으로 전달하고 분산시키는 냉각 기술입니다. 공기보다 열 전달 효율이 뛰어나 고발열 환경에서 주로 사용되며, 특히 고밀도 서버, GPU 기반 컴퓨팅, 데이터센터와 같은 고발열 환경에서 점점 더 주목받는 냉각 방식으로 자리잡고 있습니다
어느정도 PC에 관심이 있으신 분들이라면 ‘수냉식 쿨러’ 에 대해서는 많이들 들어 보셨을거라고 생각이 듭니다.
일체형 수냉쿨러의 왕좌에 있으며 , 오랜기간 동안 수냉쿨러에 대한 특허가 있었던 아세텍(Asetek)의 특허가 만료되면서 , 저렴한 수냉 일체형 수냉쿨러들, 일명 짭수라고 불리는 제품들이 시장에 많이 출시되게 되었고 , 이전에 비해서 접근성이 많이 높아지게 되었거든요. 이런 형태의 쿨링을 뒤에서 다시 설명하겠지만 DLC 쿨링이라고 합니다
수냉의 방식(Cooling Method)에 따른 차이 –
수냉은 냉각 방식(Cooling Method) 에 따라서 , 이머전 ( 액침냉각 ) / DLC (Direct Liquid Cooling) 으로 나뉘게 됩니다.
그 중에서 먼저 이머전( 액침냉각 ) 을 잠깐 살펴보고 가도록 하겠습니다.
이머전(액침냉각) 이란 – ?
액침냉각(Immersion Cooling), 침수냉각 이라고도 불림
서버 자체를 냉각 용액에 직접 담가 냉각하는 방식입니다.
장점 : 냉각 효율 측면에서 가장 뛰어남
발열 해소 효율이 높고, 팬이 필요없어 소음이 거의 없음
단점 : 초기 구축 비용이 높고 유지보수가 상대적으로 까다로움
알고리즘에서 혹시 이런 영상을 보신적 있으신가요 ? 이런 형태의 냉각이 액침 냉각으로 , 가끔 쇼츠나 유튜브 영상들을 보다보면 컴퓨터를 물에 넣는 기행(?)을 볼 수 있는데요. 저런 형태의 냉각을 액침냉각이라고 이해하시면 될 것 같습니다.
사진은 SKT의 액침냉각 서버인데요 , 원체 크기가 크다보니 . 액침의 방식은 초기에 액침 냉각을 위한 공간과 구축에 조금 더 공을 들여야 한다는 단점이 있습니다.
우스갯소리가 아니라 정말로 바다에 담궈버리는 조금 극단적인 형태의 액침 냉각도 존재하기는 합니다만 , 흔한 경우는 아니긴 하네요.
DLC(Direct Liquid Cooling) 이란 -?
DTC, D2C, DCLC 등으로도 불림 CPU, GPU에 콜드플레이트를 부착하여 냉각 용액을 직접 순환시키는 방식으로 현재 주력으로 사용되고 있는 수냉 방식입니다.
장점으로는 기존 데이터 센터와 같은 서버실 에서 사용하는 규격에서 사용이 가능합니다.
또 이머전 쿨링 대비 적은 비용으로도 설치 , 사용이 가능합니다.
저희 제품이나 , 위에서 보여드렸던 일체형 수냉 , 일명 짭수같은 제품군들이 전부 다 DLC 방식 수냉입니다.
이렇게 수냉 방식에 크게 두가지가 있다고 말씀을 드렸는데요 . 이 안에서도 또 냉각 방식에 따라서 나뉘게 됩니다.
열 방출 방식에 따른 차이 –
지금까지 수냉의 방에 대한 기본적인 정보를 살펴봤다면, 이제는 수냉의 열 방출 방식에 대해서 알아보겠습니다.
용어 정리가 조금 어려우실 수 있어서 간단히 다시 설명을 드리자면,
앞서 언급한 DLC나 이머전 방식은 칩셋의 열을 직접 식히는 수냉의 방식이며, 여기서 다루는 냉각 방식은 그 칩셋에서 흡수한 열을 전달한 냉각수를 어떻게 다시 식힐 것인가에 대한 부분입니다.
쉽게 말하면, 칩셋에서 열을 흡수한 물을 어떻게 다시 차갑게 식힐 것인가에 대한 방식입니다.
이렇게 크게 두가지 방식으로 나뉘는데요 ,
그렇지만 사실상 L2L 쿨링에 있어서는 대부분 서버실(IDC) 구축단계 부터 L2L 을 고려해서 공사가 진행되어야 해서 국내 실정상 L2A 형식의 열 방출 방식이 압도적으로 많다고 생각하시면 될 것 같습니다.
그리고 저희 에이치쓰리솔루션은 DLC / L2A 쿨링 솔루션을 제공하는 업체입니다 !
예 | 예시 | |
---|---|---|
칩셋을 식히는 방식 | DLC, Immersion | 수냉의 냉각 방식 |
냉각수를 식히는 방식 | L2L, L2A | 수냉의 열 방출 방식 또는 열 제거 구조 |
이렇게 표로 정리해서 보면 조금 쉽게 이해가 가능하실것 같습니다 !
이 안에서도 조금 더 세부적으로 나누자면 다양한 방식이 있기도 하고 , 너무 깊이 들어가면 내용이 길어지고 루즈해질 뿐만 아니라 , 사실 서버가 거진 다 비슷 비슷하게 생기기도 해서… 오늘은 이 정도로 큰 틀에서 가볍게 읽어 보실 수 있게 준비했습니다.
최근 저희 H3솔루션에서는 이와 관련된 다양한 업계 관계자분들을 모시고,
실제 사례와 최신 기술 동향을 공유하는 수냉식 솔루션 세미나를 성공적으로 진행했습니다.
당시 세미나에서 다뤘던 유익한 정보와 논의들을, 참석하지 못하신 분들께도 소개해 드리면 좋겠다는 생각이 들어 이렇게 조금 더 상세히 정리하여 포스팅하게 되었습니다.
긴 글 읽어 주셔서 감사합니다 !
저희 에이치쓰리솔루션은
이러한 분들을 위해 활짝 열려 있습니다.
✔️ 딥러닝, LLM, 인공지능 등
연구 및 개발을 위한 서버 및
워크스테이션이 필요하신 분!
✔️ 기존 시스템의 냉각 및 집적도 개선이 필요하신 분!
✔️기타 데스크탑 및 서버, 워크스테이션이 필요하신 분!
견적 및 문의사항 있으시면,
아래의 경로로 편하게 문의 남겨주세요.
최선을 다해 도와드리겠습니다 🙂
TEL.📞 02-6953-0880
FAX.📠 0504-401-0400
MAIL.📧 h3solution@h3soln.com
ADD.🏢 서울 용산구 효창원로12길 37
감사합니다! 🙂