PC 조립 후기: Titan RTX, Ryzen 9 3950X 워크스테이션급 듀얼 부팅 시스템(리눅스, 윈도우) – 전체 조립 과정

최근에 용산 선인상가(21동)에 가서 장만하였던 워크스테이션 급의 가정용 PC의 조립 과정에 대해 소개하도록 하겠다. 사실, 검색 중 우연히 내 PC의 조립 과정을 보게 되었다. 컴샤인 사장님의 블로그에 올라와있었는데, 조립 작업을 했던 PC들을 하나씩 포스팅하며 정리해나가시는 것 같았다. 직접 조립하지 않았던 터라 조립 과정에 대한 사진들을 남기지 못하게 되어 아쉬운 마음이 있었는데, 감사하게도 사장님께서 이렇게 잘 남겨주셨다니… 따로 부탁을 드렸던 것은 없었다. 이전 포스팅에서 소개했던 대로, PC의 스펙은 다음과 같다.

Spec CPU: AMD Ryzen 9 3950X (16 cores, 32 threads) GPU: NVIDIA Titan RTX (24GB) Mainboard: ASUS X570-F GAMING Memory: Samsung DDR4 21300 32GB x4 (128GB) Storage: Samsung 970 EVO 1TB x2 (2TB), Western Digital Ultrastar 4TB Cooler: NZXT KRAKEN X73 Power: SuperFlower 2000F14HP PLATINUM (Max. 2000W) Case: 3RSYS T900

위 GPU 스펙에서 Titan RTX는 2018년 12월에 출시되어 국내에서 300만원 중반대 가격에 판매되고 있으며, 현재 가정용 딥러닝 개발용으로 선택할 수 GPU 중 가장 좋은 옵션이다. 딥러닝 모델의 학습 속도는 둘째 치고, GPU의 메모리가 충분이 확보되지 않으면 아예 돌려보지조차 못하는 경우들도 종종 발생하므로 GPU 메모리 용량은 매우 중요하다. 물론, 엄청 큰 작업을 돌리기 위해서는 연구실 또는 슈퍼컴퓨팅센터, HPC Cloud 서비스 등에서 제공하는 large-scale의 computing resource를 활용해야 할 것이다. Titan RTX는 GPU Memory가 24GB가 제공되는데, 참고로 200만원 정도로 판매되는 RTX 2080 Ti가 11GB를 제공하고, 16GB, 32GB를 제공하는 Tesla V100은 1000만원대 초반에서 중반정도로 판매 되고 있다.

Titan RTX는 Turing 아키텍쳐 기반의 GPU 중 가장 거대한 TU102 GPU이며, TU102 중에서도 풀칩(Full Chip)인 TU102-400A-A1를 탑재하고 있다(384-bit의 버스 인터페이스4608개의 CUDA Cores를 갖추고 있다). 이론적 연산 성능은 FP16의 경우 32.6 TFLOPS, FP32의 경우 16.3 TFLOPS, FP64의 경우 509.8 GFLOPS이다. 메모리 대역폭은 672GB/s, Thermal Design Power(TDP)는 280W이다. Titan RTX에 대한 세부적인 내용들은 다른 글에 정리해두겠다.

쿨러는 이전 포스트에서 언급했던 것처럼 NZXT, EVGA 등 누수보증기간(각각 6년, 5년)이 충분히 길고 되도록 국내에서 A/S 및 보상 처리가 가능한 회사 제품을 선택하는 것이 매우 중요하다. 누수로 인한 컴퓨터 고장시 전체 수리 비용 보증이 걸려있기 때문이다.

RAM 용량 또한 최대한 높게 잡는 게 중요하다. 위 메인보드의 경우 128GB까지 지원 가능하였고, 한계치까지 잡았다. 물론, 가격대를 높이면 더 늘리는 것도 가능하다(CPU가 두개씩 들어가는 레알 워크스테이션 용도의 메인보드를 사용하게 될 것이다). 딥러닝 또는 시뮬레이션을 할 때 되도록 메모리상에서 데이터를 엑세스하며 진행하는 게 매우 중요하다. 메모리 용량이 충분치 않으면 물리 디스크에서 I/O하며 computing 하는 것이 불가피하게 되는데 이 때 작업 완료에 필요한 시간은 아주 큰 단위로 늘어난다. Samsung 제품을 설치하였는데, 안정성이 좋다고 하였다.

SSD 1TB 2개를 잡은 건 2개의 OS를 각각의 SSD에 깔아서 듀얼 부팅하여 사용하기 위함이고, 웨스턴 디지털 Ultrastar를 잡은 이유는 일반 저장용 디스크에 비해 캐시 용량이 크고(256MB) RPM도 7200이라, 캐시 64MB RPM 5400짜리 저가 제품보다 데이더 읽고 쓰기가 더 빠르다. 데이터 저장 안정성도 더 좋다.

Power를 2000W로 높게 잡은 건 추후 GPU 추가 설치(w/ NVLink Bridge)몇년 뒤 파워 성능이 저하되더라도 멀티 GPU 시스템에 대한 충분한 에너지 공급을 보장받기 위함이다. AMD Ryzen 9 3950X를 선택한 것은 가성비, 성능, 호환성, 에너지 효율 부분에서 큰 문제가 없기 때문(가성비는 3600 모델이 Best)이고, 추후 Titan RTX를 2개에서 최대 3개까지 쓸 때는 Ryzen 9 3600으로는 어려울 것 같다 판단하였다. 3950X가 3개를 커버할 수 있을지는 모르겠다. 제한된 예산 내 3개를 모두 꼽을 수 있는 본체를 구성하는 것 자체도 생각보다 쉽지 않다. 이 needs에 대해 사장님께서 고민을 많이 해 주셨다.

아래는 구매된 부품들이다. 조립 전 단계이다. 위의 Spec 각각의 항목에 해당하는 제품들이다. 이들이 언박싱되어 하나하나 조립이 된다. 삼성 메모리(DDR4)는 따로 상자가 없다.

%d