고성능 컴퓨터(HPC)에 대한 이해

본 자료는 수치해석을 업무로 수행하는 엔지니어들의 고성능 컴퓨터에 대한 이해를 돕기 위해 https://www.amd.com/ko/technologies/hpc-explained 를 인용한 자료입니다.
본 자료의 모든 저작권은 https://www.amd.com에 있습니다.

고성능 컴퓨팅 안내

신약 개발에 걸리는 기간이 수년에서 수일로 단축된다고 상상해 보십시오. 고성능 컴퓨팅(HPC)은 시뮬레이션, 모델 및 분석을 통해 이러한 유형은 물론 기타 첨단 과학 문제를 해결할 수 있습니다. 이러한 시스템은 세계의 여러 주요 문제에 대한 해결책을 제공하여 “4차 산업혁명”으로 가는 길을 제시합니다.1 HPC 시스템은 이미 다음과 같은 용도로 사용되고 있습니다.

  • 여러 유형의 암과 기타 질병 퇴치를 위한 신약 화합물 개발 및 시험2
  • 방탄복과 같은 신소재 개발을 위한 분자 역학 시뮬레이션3
  • 영향을 받는 지역사회가 더 효과적으로 대비하도록 돕기 위한 중요한 기상 변화 예측4

슈퍼컴퓨터는 최첨단 HPC 시스템을 대표합니다. 슈퍼컴퓨터의 고유한 역량은 기능의 발전에 따라 시간이 지나면서 변화하는 표준에 좌우됩니다. 단일 슈퍼컴퓨팅 클러스터에는 수만 개의 프로세서가 포함될 수 있으며 세계 최고 성능의 최고가 시스템의 가격은 1억 달러 이상에 달합니다.5

HPC의 작동 방식

HPC에서 정보를 처리하는 두 가지 주요 방법:

직렬 처리를 중앙 처리 장치(CPU)에서 수행합니다. 일반적으로 각 CPU 코어에서 한 번에 한 작업만 처리합니다. CPU는 운영체제 및 기본적인 애플리케이션(예: 워드 프로세싱, 사무 생산성)과 같은 기능에 있어 필수적입니다.serial processing chart

병렬 처리를 여러 CPU 또는 그래픽 처리 장치(GPU)를 통해 수행할 수 있습니다. 원래는 전용 그래픽 용으로 개발된 GPU는 데이터 매트릭스(예: 화면 픽셀)에 대해 동시에 여러 산술 연산을 수행할 수 있습니다. GPU는 수많은 데이터 계층에서 동시에 작업할 수 있기 때문에 동영상에서 객체를 인식하는 것과 같은 머신 러닝(ML) 애플리케이션 작업에서 병렬 처리를 수행하는 데 적합합니다.parallel processing chart

슈퍼컴퓨팅의 잠재력을 극대화하기 위해서는 다양한 시스템 아키텍처가 필요합니다. 대부분의 HPC 시스템은 초고대역폭 상호 연결을 통해 여러 프로세서 및 메모리 모듈을 취합하여 병렬 처리를 지원합니다. 일부 HPC 시스템은 CPU와 GPU를 결합하는 데 이를 이기종 컴퓨팅이라고 합니다.

컴퓨터의 컴퓨팅 성능은 “FLOPS”(초당 부동 소수점 연산)라는 단위로 측정됩니다. 2019년 초반 현재 최고 수준의 슈퍼 컴퓨터는 143.5페타FLOPS(143 × 1015)를 처리할 수 있습니다. 페타스케일라고 하는 이러한 수준의 슈퍼컴퓨터는 천조 이상의 FLOPS를 수행합니다. 그에 비해, 하이엔드 게이밍 데스크탑은 속도가 1/1,000배 미만으로 약 200기가FLOPS(1 × 109)를 처리하는 데 그칩니다. 프로세싱과 처리 성능 모두에서 슈퍼컴퓨팅 혁신이 이루어지면 머지않아 엑사스케일 수준의 슈퍼컴퓨팅으로 발전하여 페타스케일보다 약 1,000배 빠른 속도가 실현될 것입니다. 이는 엑사스케일 슈퍼컴퓨터가 초당 1018(또는 10억 x 10억)의 연산을 수행할 수 있음을 의미합니다.evolution processing power

“FLOPS”는 이론적 처리 속도를 나타냅니다 – 프로세서에 지속적으로 데이터를 전송하는 데 필요한 속도를 파악합니다. 그러므로, 데이터 처리율이 반드시 시스템 디자인에 반영되어야 합니다. 프로세싱 노드 간 상호 연결과 함께 시스템 메모리가 데이터의 프로세서 도달 속도에 영향을 줍니다.supercomputer representative power

차세대 슈퍼컴퓨터가 구현하는 1 exaFLOP의 처리 성능은 5,000,000대에 달하는 데스크탑 컴퓨터의 성능에 필적합니다.*

*각 데스크탑의 처리 성능을 200기가FLOPS로 가정

스마트한 용어

  • 고성능 컴퓨팅 (HPC): 단일 컴퓨터(예: 1개의 CPU + 8개의 GPU)부터 세계적 수준의 슈퍼컴퓨터를 아우르는 폭넓은 범위의 강력한 컴퓨팅 시스템
  • 슈퍼컴퓨터: 진화하는 성능 표준에 기반한 최고 수준의 HPC
  • 이기종 컴퓨팅: 직렬(CPU) 및 병렬(GPU) 처리 기능을 최적화하는 HPC 아키텍처
  • 메모리: 데이터에 신속하게 액세스하기 위해 HPC 시스템에서 데이터가 저장되는 위치
  • 인터커넥트: 프로세싱 노드 간 통신을 지원하는 시스템 계층, 여러 수준의 상호 연결이 슈퍼컴퓨터 내에 존재
  • 페타스케일: 초당 1,000조(1015)의 계산을 수행하기 위해 설계된 슈퍼컴퓨터
  • 엑사스케일: 초당 100경(1018)의 계산을 수행하기 위해 설계된 슈퍼컴퓨터

새로운 이용 사례

기술 수준이 향상되면서, HPC는 더욱 폭넓은 기능으로 확장되었습니다. 오늘날 처리 능력과 메모리가 그 어느 때보다 향상되어 보다 복잡한 문제를 해결할 수 있게 되었습니다.

  • 머신 러닝: 인공지능(AI), 머신 러닝(ML)의 하위집합으로서 수행 지침을 수동적으로 받아들이는 대신 스스로 학습할 수 있는 시스템을 말합니다. HPC 시스템은 사진에서 흑색 종을 감지하는 암 연구와 같이 방대한 양의 데이터를 분석하는 높은 수준의 ML에 사용할 수 있습니다.6
  • 빅 데이터 분석: 학술, 과학, 금융, 비즈니스, 의료, 사이버 보안 및 정부 애플리케이션 부문의 연구 및 문제 해결을 보완하기 위해 대량의 데이터 세트를 신속하게 비교하고 상관 관계를 분석합니다. 이 작업에는 대규모 처리 및 컴퓨팅 기능이 필요합니다. 매년 50페타바이트의 임무 데이터가 생성되는 NASA에서는 슈퍼컴퓨팅을 활용해 관측을 분석하고 방대한 정보를 바탕으로 시뮬레이션을 실행합니다.7
  • 고급 모델링 및 시뮬레이션: 기업은 초기 단계에서 물리적 구축을 수행하지 않고도, 고급 모델링 및 시뮬레이션을 통해 혁신적인 제품을 더 빨리 출시하고 시간, 재료 및 인건비를 절약할 수 있습니다. HPC 모델링 및 시뮬레이션은 신약 개발 및 시험, 자동차 및 항공 우주 설계, 기후 예측/기상 관측, 에너지 애플리케이션 부문에서 활용됩니다.8

AMD가 엑사스케일에 대한 드라이브를 실현하는 방식

미국에너지국(DOE)/버클리 연구소(Berkeley Lab), 로렌스 리버모어 국립 연구소(U.S. Lawrence Livermore National Laboratory), 슈투트가르트 대학(University of Stuttgart) 및 CSC(핀란드 IT 과학 센터)의 최신 시스템과 같은 세계 최고 성능의 슈퍼컴퓨터가 바로 AMD 기술에 기반합니다.9

가까운 미래에 엑사스케일 수준의 최적의 슈퍼컴퓨터 설계를 실현하기 위해서는 더욱 강력한 처리 성능 및 프로세싱 기능(CPU 및 GPU 모두에서)이 필요합니다. 고성능 컴퓨팅과 그래픽 기술 부문 모두에서 업계 리더인 AMD는 HPC 시스템을 최적화하는 데 있어 몇 가지 고유한 이점을 제시합니다. 미국에너지국(DOE)에서 추진하는 엑사스케일 컴퓨팅 프로젝트의 일환으로, AMD는 미국 최초로 엑사스케일 수준의 슈퍼컴퓨터를 개발하기 위한 기술을 발전시키기 위해 미국 정부와 파트너십을 맺었습니다.10 이 작업에는 CPU 및 GPU 마이크로아키텍처, 메모리 시스템, 구성 요소 통합 및 고속 인터커넥트에 중점을 둔 연구가 포함되었습니다.

exascale desktop icon데스크탑

지역 전력망에 대한 하나의 동적 시나리오를 실시간으로 시뮬레이션합니다.

petascale iconn페타스케일

국가 전력망에 대한 수만 개의 동적 시나리오를 실시간으로 시뮬레이션합니다.

exascale  icon엑사스케일

전 세계 전력망에 대한 수백만 개의 동적 시나리오를 생성 및 수요에 관한 정의되지 않은 변수를 적용해 실시간으로 시뮬레이션합니다.

미래로 나아가는 힘과 자유

엑사스케일 컴퓨팅은 맞춤형 의료, 탄소 포집, 천체 물리학, 시장 경제학 및 바이오 연료 분야의 발전에 기여할 잠재성이 있습니다. 전문가들이 날씨를 더 정확히 예측하고, 더 복잡한 수학적 문제를 해결하며, 우주의 더 먼 곳까지 탐험하고, 에너지 절감형 전력망을 구축하는 데 도움이 될 것입니다.11 차세대 슈퍼컴퓨팅을 위한 공동의 노력과 이러한 시스템이 사회에 기여할 수 있는 긍정적인 영향을 바탕으로, AMD는 미래의 컴퓨팅 시스템의 성능, 에너지 효율성, 신뢰성 및 프로그래밍의 향상을 위한 연구와 자원에 주력하고 있습니다.

자세히 알아보기: https://www.amd.com/hpc

수치해석 담당자가 궁금한 현재 살 수 있는 최강 성능의 PC 하드웨어

수치해석 업무를 담당하는 엔지니어들은 항상 시간에 쫒기며 산다고 해도 과언은 아니다. 새로운 강력한 컴퓨터를 갖는 것이 항상 소원이 되가는 수치해석 엔지니어에게 유용한 정보를 제공합니다.
아래에 한국 ITWORLD에서 PCWorld의 기사를 번역 게시한 기사를 소개합니다.

현재 살 수 있는 최강 성능의 PC 하드웨어

PCWorld
PC의 장점 가운데 하나는 뛰어난 유연성이다. 다양한 형태와 크기, 제조업체 및 모델을 갖춘 수많은 하드웨어가 있기 때문에 구매자가 아무리 돈이 많더라도 혼선이 생기게 마련이다. 이번 기사에서 AMD의 괴물 같은 스레드리퍼(Threadripper) 칩에서부터 지포스 RTX 2080 Ti에 이르기까지 오늘날 구입할 수 있는 최고 성능의 PC 구성 요소를 소개한다.

Credit: Gordon Mah Ung/IDG

CPU
PC의 핵심은 프로세서다. AMD의 32코어, 64 스레드 라이젠 스레드리퍼 2990WX만큼 강력한 CPU는 없다(아마존 1,750달러). 다만 비즈니스 및 데이터센터 장비는 일반 소비자용보다 더 강력하다.

이 CPU는 인텔 18코어 대표작인 코어 i9-7980XE(아마존 2,000달러)보다 거의 2배 많은 코어와 쓰레드를 갖고 있음에도 200달러 이상 싸다. 인텔의 코어는 개별적으로는 더 빠르지만, 2990WX의 엄청난 코어 수를 제대로 활용할 수 있다면 그 어떤 것도 비교할 수 없다.

최상의 PC 게임 성능을 원한다면 코어 i7-8700K(아마존 350달러)가 가장 적합한 프로세스로, 6코어, 12쓰레드는 3.7GHz와 4.7GHz 사이에서 동작하면서 인텔의 18코어보다 훨씬 더 높은 성능이다.

바로 지금 사용할 수 있는 것을 구매한다면, 첫번째 코어 i7-8086K(이 칩은 창립 40주년을 기념해 만들어졌다)은 싱글 쓰레드 애플리케이션에서 5GHz로 출시된 최초의 인텔 칩이다. 또한 수동으로 오버클럭된 경우, 모든 코어에서 5GHz를 기록하는 것이 확실하다. 그러나 표준 성능은 훨씬 저렴한 8700K와 유사하다. 이 칩은 5만 개만 만들어졌다. 뉴에그, 아마존, 베스트바이에서 425달러에 판매하고 있다.

Credit: Gordon Mah Ung

메인보드
프로세서를 골랐다면 메인보드 유형을 알 수 있다. 스레드리퍼 칩은 AMD의 X399 메인보드와 호환된다. 본지는 MSI MEG X399 크리에이션(Creation)(뉴에그 499달러)으로, 스레드리퍼 2990WX를 검토했다. 이 메인보드는 연결성이 좋으며 스틱 형태의 SSD를 냉각할 M.2 프로저 히트싱크, 견고한 전력 공급 시스템을 자랑한다.

여기에서는 간략하게 정리하고 AMD X399 메인보드에 대한 자세한 내용은 여기에서 확인하라.

Credit: MSI

메모리
인텔의 X99 플랫폼은 64GB RAM 한계를 넘어섰으며 DDR4는 이전보다 더 빠른 메모리를 지원한다. 128GB 키트까지 보장하는 3,200MHz 커세어 도미네이터 플레티넘(Corsair Dominator Platinum) 메모리(아마존 1,750달러), 세계에서 가장 큰 RAM 디스크를 만든 이유는 무엇일까. 적절한 속도를 느끼고 싶다면 벤전스(Vengeance) LPX DDR4의 16GB 키트(아마존 430달러)가 적합하다.

이렇게 많은 RAM을 가진 PC를 가질 적절한 이유가 없다는 점에서 이 가격은 단점이 될 수 있다. 용량이 더 작은 키트나 다른 공급업체의 제품을 선택하더라도 DDR3가 아닌 DDR4 메모리여야 한다. X299 메인보드는 최첨단이다.

Credit: Gordon Mah Ung

그래픽 카드
지금 당장 가장 강력한 그래픽 카드를 구입해야 한다면, 대부분의 게임 사용자는 지포스 GTX 1080Ti 또는 EVGA GTX Ti SC2(아마존 670달러)와 같은 맞춤형 오버클럭킹 버전을 선택할 것이다. 이 제품은 GTX 1080보다 25~35% 더 빠르며 4K 해상도로 60fps를 기록할 수 있는 최초의 저렴한 일반 소비자용 그래픽 카드로, 이미 많은 게임에서 적절하게 호환을 이뤘다.

그러나 조금 시간적 여유가 있다면 지금 이를 살 필요는 없다. 엔비디아는 이미 차세대 지포스 RTX 2080 Ti의 예약 구매 신청을 받고 있다. 이는 전작을 날려버릴 준비가 됐다. 2080 Ti 제품의 리뷰는 아직 나오지 않았지만 9월 20일이면 출시된다. 가능한 한 본지의 리뷰를 읽어 검토하고 사전 예약을 해도 늦지 않다.

Credit: Brad Chacos/IDG

모니터
그래픽카드에 큰 돈을 쓸 계획이라면, 하이엔드 디스플레이도 원할 것이다. 하이엔드 디스플레이의 경우, 기본적으로 G싱크(G-Sync) HDR 디스플레이라는 걸출한 제품이 있다.

에이서 프레데터(Acer Predator) X27, 에이수스(Asus) ROG 스위프트(Swift) PG27UQ(뉴에그 각각 2,000달러) 또한 최대 144Hz로, 고급스러운 27인치 4K 패널이다. 말 그대로 이 패널들은 384개 백라이트 영역과 함께 최대 1,000니트의 밝기로 HDR(High-Dynamic Range) 영상을 지원한다. 비-HDR 콘텐츠 또한 아름답게 보인다. 이 모니터는 어도비RGB(AdobeRGB) 색역의 99%를 차지하고 지싱크는 게임 플레이를 부드럽게 해준다.

Credit: Martyn Williams/IDG

주 스토리지
스토리지는 다양한 옵션을 제공한다. 4TB 삼성 860 EVO(아마존 1,400달러)와 WD 골드(아마존 500달러)는 각각 소비자용 SSD와 HDD 시장에서 최고의 성능을 자랑하는데, 본지의 리뷰에서 최고 점수를 받았다.

삼성의 SSD는 분명히 빠르지만 많은 비용이 든다. WD 골드의 7,200rpm 플래터는 기계식 하드드라이브에서 놀라운 엑세스 속도를 제공한다. 이 제품은 같은 가격 제품대에서는 찾아볼 수 없는 엔터프라이즈급 기능으로 자랑한다.

Credit: Western Digital

급속 스토리지
저장 용량과 상관없이 순수하게 속도가 주요 목표라면 좋은 제품이 있다. 약간의 공간에 대한 대가로, 사용자는 M.2 PCI-e NVMe SSD의 엄청난 전송 속도를 즐길 수 있다. 4TB 삼성 960 프로(뉴에그 1,50달러)는 크리스탈디스크마크(CrystalDiskMark) 리뷰에서 읽기 속도가 3.5GBps를 훨씬 웃도는 가장 빠른 드라이브 가운데 하나다.

이 제품을 부팅 드라이브로 삼으면 지연에 대해 걱정할 필요가 없다. 시간 절약을 위해 아주 많은 비용을 투자하는 것이 부담스럽다면 1TB WD 블랙 3D NVMe(아마존 450달러)를 대신 사용하자.

또한 인텔의 혁신적인 옵테인 900P SSD(뉴에그 600달러)는 삼성이 독차지하는 시장에 타격을 가하고 작은 파일을 많이 읽을 때 엄청난 성능을 자랑하지만 280GB 및 480GB 용량으로만 제공한다.

다른 제품을 찾고자 한다면 본지의 “나에게 맞는” SSD 선택 가이드 2018에서 최고의 SSD를 찾을 수 있을 것이다.

Credit: Samsung

사운드카드
PC의 다른 부분에 엄청난 비용을 지불했다면 최고 수준의 오디오에도 투자할 수 있을 것이다. 크리에이티브 테크놀로지의 사운드블라스트(Sound Blaster)X AE-5(아마존 150달러)는 32비트, 384KHz ESS ES9016K2M SABRE32 Ultra DAC 칩셋을 사용한다. 가격은 기본적으로 고가의 전문 사운드 장치에서 볼 수 있는 DAC 수준이다.

이 제품은 최초의 프리미엄 일반 소비자용 사운드카드로, 5.1 아날로그 서라운드 사운드, 600 옴 헤드셋까지 구동할 수 있는 듀얼 앰프 Xamp, RGB 조명 등을 제공한다.

Credit: Gordon Mah Ung/IDG

전원공급장치
현재 인텔 프로세서와 엔비디아 그래픽카드의 놀라운 전력 효율성으로 인해 대부분의 단일 GPU 시스템은 아마도 600W 이상의 전원공급장치를 필요로 하지 않을 것이다.
그러나 이번 기사는 최상의 제품에 관한 것이기에 최고 전원공급장치를 소개한다. 여러 개의 그래픽 카드를 사용하거나 미래 확장을 위해 공간을 확보하길 원한다면, 이 제품을 사용해도 좋다.

커세어(Corsair) AX1500i(아마존 450달러)는 본질적으로 전력 공급에 있어 모범적이다. 요즘 코인 채굴작업으로 인해 수요가 많아 종종 재고가 없을 수 있다. 이 모듈식 커세어 AX1500i PSU는 최첨단 디지털 제어시스템 덕분에 모든 면에서 완벽한 등급을 자랑한다. 최근 커세어는 한단계 진보한 AX1600i(뉴에그 500달러)도 발표했다.

이번 기사에서 설명한 바와 같이 유사한 장비를 설치하고 하나 또는 2개의 그래픽 카드를 사용할 경우, 좀더 낮은 전원 공급장치를 구입할 수 있다.

editor@itworld.co.kr