FLOW-3D 수치해석용 컴퓨터 선택 가이드

Hardware Selection for FLOW-3D Products – FLOW-3D

2021-01-19 업데이트 / ㈜에스티아이씨앤디 솔루션사업부

In this blog, Flow Science’s IT Manager Matthew Taylor breaks down the different hardware components and suggests some ideal configurations for getting the most out of your FLOW-3D products.

개요

본 자료는 Flow Science의 IT 매니저 Matthew Taylor가 작성한 자료를 기반으로 STI C&D에서 일부 자료를 보완한 자료입니다. 본 자료를 통해 FLOW-3D 사용자는 최상의 해석용 컴퓨터를 선택할 때 도움을 받을 수 있을 것으로 기대합니다.

수치해석을 하는 엔지니어들은 사용하는 컴퓨터의 성능에 무척 민감합니다. 그 이유는 수치해석을 하기 위해 여러 준비단계와 분석 시간들이 필요하지만 당연히 압도적으로 시간을 소모하는 것이 계산 시간이기 때문일 것입니다.

따라서 수치해석용 컴퓨터의 선정을 위해서 단위 시간당 시스템이 처리하는 작업의 수나 처리량, 응답시간, 평균 대기 시간 등의 요소를 복합적으로 검토하여 결정하게 됩니다.

또한 수치해석에 적합한 성능을 가진 컴퓨터를 선별하는 방법으로 CPU 계산 처리속도인 Flops/sec 성능도 중요하지만 수치해석을 수행할 때 방대한 계산 결과를 디스크에 저장하고, 해석결과를 분석할 때는 그래픽 성능도 크게 좌우하기 때문에 SSD 디스크와 그래픽카드에도 관심을 가져야 합니다.

FLOW SCIENCE, INC. 에서는 일반적인 FLOW-3D를 지원하는 최소 컴퓨터 사양과 O/S 플랫폼 가이드를 제시하지만, 도입 담당자의 경우, 최상의 조건에서 해석 업무를 수행해야 하기 때문에 가능하면 최고의 성능을 제공하는 해석용 장비 도입이 필요합니다. 이 자료는 2021 현재 FLOW-3D 제품을 효과적으로 사용하기 위한 하드웨어 선택에 대해 사전에 검토되어야 할 내용들에 대해 자세히 설명합니다. 그리고 실행 중인 시뮬레이션 유형에 따라 다양한 구성에 대한 몇 가지 아이디어를 제공합니다.

CPU의 선택

CPU는 전반적인 성능에 큰 영향을 미치며, 대부분의 경우 컴퓨터의 가장 중요한 구성 요소입니다. 그러나 데스크탑 프로세서를 구입할 때가 되면 Intel 과 AMD의 모델 번호와 사양을 이해하는 것이 어려워 보일 것입니다.
그리고, CPU 성능을 평가하는 방법에 의해 가장 좋은 CPU를 고른다고 해도 보드와, 메모리, 주변 Chip 등 여러가지 조건에 의해 성능이 달라질 수 있기 때문에 성능평가 결과를 기준으로 시스템을 구입할 경우, 단일 CPU나 부품으로 순위가 정해진 자료보다는 시스템 전체를 대상으로 평가한 순위표를 보고 선정하는 지혜가 필요합니다.

PassMark – CPU Mark High End CPUs

2021년 1월 18일 기준

PassMark – CPU Mark High End CPUs Updated 19th of January 2021

<출처> https://www.cpubenchmark.net/high_end_cpus.html

PassMark – CPU Mark Single Thread Performance

수치해석을 수행하는 CPU의 경우 예산에 따라 Core가 많지 않은 CPU를 구매해야 하는 경우도 있을 수 있습니다. 보통 Core가 많다고 해석 속도가 선형으로 증가하지는 않으며, 해석 케이스에 따라 적정 Core수가 있습니다. 이 경우 예산에 맞는 성능 대비 최상의 코어 수가 있을 수 있기 때문에 Single thread Performance 도 매우 중요합니다. 아래 성능 도표를 참조하여 예산에 맞는 최적 CPU를 찾는데 도움을 받을 수 있습니다.

PassMark – CPU Mark Single Thread Performance Updated 18th of January 2021

출처 : https://www.cpubenchmark.net/singleThread.html

CPU 성능 분석 방법

부동소수점 계산을 하는 수치해석과 밀접한 Computer의 연산 성능 벤치마크 방법은 대표적으로 널리 사용되는 아래와 같은 방법이 있습니다.

FLOW-3D의 CFD 솔버 성능은 CPU의 부동 소수점 성능에 전적으로 좌우되기 때문에 계산 집약적인 프로그램입니다. FlowSight 또한 CPU에 크게 의존합니다. 현재 출시된 사용 가능한 모든 CPU를 벤치마킹할 수는 없지만 상대적인 성능을 합리적으로 비교할 수는 있습니다.

특히, 수치해석 분야에서 주어진 CPU에 대해 FLOW-3D 성능을 추정하거나 여러 CPU 옵션 간의 성능을 비교하기 위한 최상의 옵션은 Standard Performance Evaluation Corporation의 SPEC CPU2017 벤치마크(현재까지 개발된 가장 최신 평가기준임)이며, 특히 SPECspeed 2017 Floating Point 결과가 CFD Solver 성능을 매우 잘 예측합니다.

이는 유료 벤치마크이므로 제공된 결과는 모든 CPU 테스트 결과를 제공하지 않습니다. 보통 제조사가 ASUS, Dell, Lenovo, HP, Huawei 정도의 제품에 대해 RAM이 많은 멀티 소켓 Intel Xeon 기계와 같은 값비싼 구성으로 된 장비 결과들을 제공합니다.

CPU 비교를 위한 또 다른 옵션은 Passmark Software의 CPU 벤치마크입니다. PerformanceTest 제품군은 유료 소프트웨어이지만 무료 평가판을 사용할 수 있습니다. 대부분의 CPU는 저렴한 옵션을 포함하여 나열됩니다. 부동 소수점 성능은 전체 벤치마크의 한 측면에 불과하지만 다양한 워크로드에서 전반적인 성능을 제대로 테스트합니다.

예산을 결정하고 해당 예산에 해당하는 CPU를 선택한 후에는 벤치마크를 사용하여 가격에 가장 적합한 성능을 결정할 수 있습니다.

<참고>

SPEC의 벤치 마크https://www.spec.org/benchmarks.html#cpu )

SPEC CPU 2017 (현재까지 가장 최근에 개발된 CPU 성능측정 기준)

다른 컴퓨터 시스템에서 컴퓨팅 계산에 대한 집약적인 워크로드를 비교하는데 사용할 수 있는 성능 측정을 제공하도록 설계된 SPEC CPU 2017에는 SPECspeed 2017 정수, SPECspeed 2017 부동 소수점, SPECrate 2017 정수 및 SPECrate 2017 부동 소수점의 4 가지 제품군으로 구성된 43 개의 벤치 마크가 포함되어 있습니다. SPEC CPU 2017에는 에너지 소비 측정을 위한 선택적 메트릭도 포함되어 있습니다.

<SPEC CPU 벤치마크 보고서>

벤치마크 결과보고서는 제조사별, 모델별로 테스트한 결과를 아래 사이트에 가면 볼 수 있습니다.

https://www.spec.org/cgi-bin/osgresults

<보고서 샘플>

  • SPEC CPU 2017

Designed to provide performance measurements that can be used to compare compute-intensive workloads on different computer systems, SPEC CPU 2017 contains 43 benchmarks organized into four suites: SPECspeed 2017 Integer, SPECspeed 2017 Floating Point, SPECrate 2017 Integer, and SPECrate 2017 Floating Point. SPEC CPU 2017 also includes an optional metric for measuring energy consumption.

클럭 대 코어

일반적으로 클럭 속도가 높은 칩은 CPU 코어를 더 적게 포함합니다. FLOW-3D는 병렬화가 잘되어 있지만, 디스크 쓰기와 같이 일부 작업은 기본적으로 단일 스레드 방식으로 수행됩니다. 따라서 데이터 출력이 빈번하거나 큰 시뮬레이션은 종종 더 많은 코어가 아닌, 더 높은 클럭 속도를 활용합니다. 마찬가지로 코어 및 소켓의 다중 스레딩은 오버헤드를 발생시키므로 작은 문제의 해석일 경우 사용되는 코어 수를 제한하면 성능이 향상될 수 있습니다.

CPU 아키텍처

CPU 아키텍처는 중요합니다. 최신 CPU는 일반적으로 사이클당 더 많은 기능을 제공합니다. 즉, 현재 세대의 CPU는 일반적으로 동일한 클럭 속도에서 이전 CPU보다 성능이 우수합니다. 또한 전력 효율이 높아져 와트당 성능이 향상될 수 있습니다. Flow Science에는 구형 멀티 소켓 12, 16, 24 코어 Xeon보다 성능이 뛰어난 최근 세대 10~12 Core i9 CPU 시스템을 보유하고 있습니다.

오버클럭

해석용 장비에서는 CPU를 오버클럭 하지 않는 것이 좋습니다. 하드웨어를 다년간의 투자라고 생각한다면, 오버클럭화는 발열을 증가시켜 수명을 단축시킵니다. CPU에 따라 안정성도 저하될 수 있습니다. CPU를 오버클럭 할 때는 세심한 열 관리가 권장됩니다.

하이퍼스레딩

<이미지출처:https://gameabout.com/krum3/4586040>

하이퍼스레딩은 물리적으로 1개의 CPU를 가상으로 2개의 CPU처럼 작동하게 하는 기술로 파이프라인의 단계수가 많고 각 단계의 길이가 짧을때 유리합니다. 다만 수치해석 처럼 모든 코어의 CPU를 100% 사용중인 장시간 수행 시뮬레이션은 일반적으로 Hyper Threading이 비활성화 된 상태에서 더 잘 수행됩니다. FLOW-3D는 100% CPU 사용률이 일반적이므로 새 하드웨어를 구성할 때 Hyper Threading을 비활성화하는 것이 좋습니다. 설정은 시스템의 BIOS 설정에서 수행합니다.

몇 가지 워크로드의 경우에는 Hyper Threading을 사용하여 약간 더 나은 성능을 보이는 경우가 있습니다. 따라서, 최상의 런타임을 위해서는 두 가지 구성중에서 어느 구성이 더 적합한지 시뮬레이션 유형을 테스트하는 것이 좋습니다.

스케일링

여러 코어를 사용할 때 성능은 선형적이지 않습니다. 예를 들어 12 코어 CPU에서 24 코어 CPU로 업그레이드해도 시뮬레이션 런타임이 절반으로 줄어들지 않습니다. 시뮬레이션 유형에 따라 16~32개 이상의 CPU 코어를 선택할 때는 FLOW-3D 및 FLOW-3D CAST의 HPC 버전을 사용하거나 FLOW-3D CLOUD로 이동하는 것을 고려하여야 합니다.

AMD Ryzen 또는 Epyc CPU

AMD는 일부 CPU로 벤치마크 차트를 석권하고 있으며 그 가격은 매우 경쟁력이 있습니다. FLOW SCIENCE, INC. 에서는 소수의 AMD CPU로 FLOW-3D를 테스트했습니다. 현재 Epyc CPU는 이상적이지 않고 Ryzen은 성능이 상당히 우수합니다. 발열은 여전히 신중하게 다뤄져야 할 문제입니다. 현재 32 코어 옵션에 영향을 주는 Windows 버그가 초기 버전에서 성능을 크게 저하시키는 것으로 알려져 있습니다. Bug Fix가 되었는지 업데이트 하여 확인하고, 해결되지 않은 경우 이러한 CPU에는 Linux를 권장됩니다.

<관련 기사>

https://www.techspot.com/news/78122-report-software-fix-can-double-threadripper-2990wx-performance.html

Graphics 고려 사항

FLOW-3D는 OpenGL 드라이버가 만족스럽게 수행되는 최신 그래픽 카드가 필요합니다. 최소한 OpenGL 3.0을 지원하는 것이 좋습니다. FlowSight는 DirectX 11 이상을 지원하는 그래픽 카드에서 가장 잘 작동합니다. 권장 옵션은 엔비디아의 쿼드로 K 시리즈와 AMD의 파이어 프로 W 시리즈입니다.

특히 엔비디아 쿼드로(NVIDIA Quadro)는 엔비디아가 개발한 전문가 용도(워크스테이션)의 그래픽 카드입니다. 일반적으로 지포스 그래픽 카드가 게이밍에 초점이 맞춰져 있지만, 쿼드로는 다양한 산업 분야의 전문가가 필요로 하는 영역에 광범위한 용도로 사용되고 있습니다. 주로 산업계의 그래픽 디자인 분야, 영상 콘텐츠 제작 분야, 엔지니어링 설계 분야, 과학 분야, 의료 분석 분야 등의 전문가 작업용으로 사용되고 있습니다. 따라서 일반적인 소비자를 대상으로 하는 지포스 그래픽 카드와는 다르계 산업계에 포커스 되어 있으며 가격이 매우 비싸서 도입시 예산을 고려해야 합니다.

유의할 점은 엔비디아의 GTX 게이밍 하드웨어는 볼륨 렌더링의 속도가 느리거나 오동작 등 몇 가지 제한 사항이 있습니다. 일반적으로 노트북에 내장된 통합 그래픽 카드보다는 개별 그래픽 카드를 강력하게 추천합니다. 최소한 그래픽 메모리는 512MB 이상을 권장합니다.

PassMark – G3D Mark High End Videocards

출처 : https://www.videocardbenchmark.net/high_end_gpus.html

원격데스크탑 사용시 고려 사항

Flow Science는 nVidia 드라이버 버전이 341.05 이상인 nVidia Quadro K, M 또는 P 시리즈 그래픽 하드웨어를 권장합니다. 이 카드와 드라이버 조합을 사용하면 원격 데스크톱 연결이 완전한 3D 가속 기능을 갖춘 기본 하드웨어에서 자동으로 실행됩니다.

원격 데스크톱 세션에 연결할 때 nVidia Quadro 그래픽 카드가 설치되어 있지 않으면 Windows는 소프트웨어 렌더링을 사용합니다. 이는 FLOW-3D 및 FlowSight 모두 성능에 부정적인 영향을 미칩니다. FLOW-3D 가 소프트웨어 렌더링을 사용하고 있는지 확인하려면 FLOW-3D 도움말 메뉴에서 정보를 선택하십시오. GDI Generic을 소프트웨어 렌더링으로 사용하는 경우 GL_RENDERER 항목에 표시됩니다.

하드웨어 렌더링을 활성화하는 몇 가지 옵션이 있습니다. 쉬운 방법 중 하나는 실제 콘솔에서 FLOW-3D를 시작한 다음 원격 데스크톱 세션을 연결하는 것입니다. Nice Software DCV 와 같은 일부 VNC 소프트웨어는 기본적으로 하드웨어 렌더링을 사용합니다.

RAM 고려 사항

프로세서 코어당 최소 4GB의 RAM은 FLOW-3D의 좋은 출발입니다. FlowSight POST Processor를 사용하여 후처리 작업을 할 경우 상당한 양의 RAM을 사용하는 것이 좋습니다.

현재 주력제품인 DDR4보다 2배 빠른 DDR5가 곧 출시된다는 소식도 있습니다.

일반적으로 FLOW-3D를 이용하여 해석을 할 경우 격자(Mesh)수에 따라 소요되는 적정 메모리 크기는 아래와 같습니다.페이지 보기

  • 초대형 (2억개 이상의 셀) : 최소 128GB
  • 대형 (60 ~ 1억 5천만 셀) : 64 ~ 128GB
  • 중간 (30-60백만 셀) : 32-64GB
  • 작음 (3 천만 셀 이하) : 최소 32GB

HDD 고려 사항

수치해석은 해석결과 파일의 데이터 양이 매우 크기 때문에 읽고 쓰는데, 속도면에서 매우 빠른 SSD를 적용하면 성능면에서 큰 도움이 됩니다. 다만 SSD 가격이 비싸서 가성비 측면을 고려하여 적정수준에서 결정이 필요합니다.

CPU와 저장장치 간 데이터가 오고 가는 통로가 그림과 같이 3가지 방식이 있습니다. 이를 인터페이스라 부르며 SSD는 흔히 PCI-Express 와 SATA 통로를 이용합니다.

흔히 말하는 NVMe는 PCI-Express3.0 지원 SSD의 경우 SSD에 최적화된 NVMe (NonVolatile Memory Express) 전송 프로토콜을 사용합니다. 주의할 점은 MVMe중에서 SATA3 방식도 있기 때문에 잘 구별하여 구입하시기 바랍니다.

그리고 SSD를 선택할 경우에도 SSD 종류 중에서 PCI Express 타입은 매우 빠르고 가격이 고가였지만 최근에는 많이 저렴해졌습니다. 따라서 예산 범위내에서 NVMe SSD등 가장 효과적인 선택을 하는 것이 좋습니다.
( 참고 : 해석용 컴퓨터 SSD 고르기 참조 )

기존의 물리적인 하드 디스크의 경우, 디스크에 기록된 데이터를 읽기 위해서는 데이터를 읽어내는 헤드(바늘)가 물리적으로 데이터가 기록된 위치까지 이동해야 하므로 이동에 일정한 시간이 소요됩니다. (이러한 시간을 지연시간, 혹은 레이턴시 등으로 부름) 따라서 하드 디스크의 경우 데이터를 읽기 위한 요청이 주어진 뒤에 데이터를 실제로 읽기까지 일정한 시간이 소요되는데, 이 시간을 일정한 한계(약 10ms)이하로 줄이는 것이 불가능에 가까우며, 데이터가 플래터에 실제 기록된 위치에 따라서 이러한 데이터에의 접근시간 역시 차이가 나게 됩니다.

하지만 HDD의 최대 강점은 가격대비 용량입니다. 현재 상용화되어 판매하는 대용량 HDD는 12TB ~ 15TB가 공급되고 있으며, 이는 데이터 저장이나 백업용으로 가장 좋은 선택이 됩니다.
결론적으로 데이터를 직접 읽고 쓰는 드라이브는 SSD를 사용하고 보관하는 용도의 드라이브는 기존의 HDD를 사용하는 방법이 효과적인 선택이 될 수 있습니다.

PassMark – Disk Rating High End Drives

출처 : https://www.harddrivebenchmark.net/high_end_drives.html

상기 벤치마크 테스트는 테스트 조건에 따라 그 성능 곡선이 달라질 수 있기 때문에 조건을 확인할 필요가 있습니다. 예를 들어 Windows7, windows8, windows10 모두에서 테스트한 결과를 평균한 점수와 자신이 사용할 컴퓨터 O/S에서 테스트한 결과는 다를 수 있습니다. 상기 결과에 대한 테스트 환경에 대한 내용은 아래 사이트를 참고하시기 바랍니다.

참고 : 테스트 환경

페이지 보기

FLOW-3D HYDRO Conveyance Infrastructure

FLOW-3D & computational fluid dynamics for civil engineering

Conveyance systems

  • Tunnels
  • Overflows
  • Hydraulic controls
    • Gates
    • Weirs
    • Orifice
  • Drop structures
  • Flow splitting
  • Open channel conveyance
  • Pumps
  • Flap gates (moving objects)
  • Air flow / air supply
  • Entrained air (entrainment, evolution, drift flux, buoyancy, bulking, de-aeration)

Baffle dropshaft

Tangential dropshaft

Sample GUI packaged conveyance examples

Conveyance systems: simulation outputs

해석 결과로 얻을 수 있는 Simulation outputs

  • Pressure, velocity field
  • Water elevation profiles
  • 3D transient behaviors
  • Surges & sloshing
  • Pump approach flow
  • Pump discharge & operations
  • Air phase
  • Entrained air
  • Forces & coupled motion for moving objects

고성능 컴퓨터(HPC)에 대한 이해

본 자료는 수치해석을 업무로 수행하는 엔지니어들의 고성능 컴퓨터에 대한 이해를 돕기 위해 https://www.amd.com/ko/technologies/hpc-explained 를 인용한 자료입니다.
본 자료의 모든 저작권은 https://www.amd.com에 있습니다.

고성능 컴퓨팅 안내

신약 개발에 걸리는 기간이 수년에서 수일로 단축된다고 상상해 보십시오. 고성능 컴퓨팅(HPC)은 시뮬레이션, 모델 및 분석을 통해 이러한 유형은 물론 기타 첨단 과학 문제를 해결할 수 있습니다. 이러한 시스템은 세계의 여러 주요 문제에 대한 해결책을 제공하여 “4차 산업혁명”으로 가는 길을 제시합니다.1 HPC 시스템은 이미 다음과 같은 용도로 사용되고 있습니다.

  • 여러 유형의 암과 기타 질병 퇴치를 위한 신약 화합물 개발 및 시험2
  • 방탄복과 같은 신소재 개발을 위한 분자 역학 시뮬레이션3
  • 영향을 받는 지역사회가 더 효과적으로 대비하도록 돕기 위한 중요한 기상 변화 예측4

슈퍼컴퓨터는 최첨단 HPC 시스템을 대표합니다. 슈퍼컴퓨터의 고유한 역량은 기능의 발전에 따라 시간이 지나면서 변화하는 표준에 좌우됩니다. 단일 슈퍼컴퓨팅 클러스터에는 수만 개의 프로세서가 포함될 수 있으며 세계 최고 성능의 최고가 시스템의 가격은 1억 달러 이상에 달합니다.5

HPC의 작동 방식

HPC에서 정보를 처리하는 두 가지 주요 방법:

직렬 처리를 중앙 처리 장치(CPU)에서 수행합니다. 일반적으로 각 CPU 코어에서 한 번에 한 작업만 처리합니다. CPU는 운영체제 및 기본적인 애플리케이션(예: 워드 프로세싱, 사무 생산성)과 같은 기능에 있어 필수적입니다.serial processing chart

병렬 처리를 여러 CPU 또는 그래픽 처리 장치(GPU)를 통해 수행할 수 있습니다. 원래는 전용 그래픽 용으로 개발된 GPU는 데이터 매트릭스(예: 화면 픽셀)에 대해 동시에 여러 산술 연산을 수행할 수 있습니다. GPU는 수많은 데이터 계층에서 동시에 작업할 수 있기 때문에 동영상에서 객체를 인식하는 것과 같은 머신 러닝(ML) 애플리케이션 작업에서 병렬 처리를 수행하는 데 적합합니다.parallel processing chart

슈퍼컴퓨팅의 잠재력을 극대화하기 위해서는 다양한 시스템 아키텍처가 필요합니다. 대부분의 HPC 시스템은 초고대역폭 상호 연결을 통해 여러 프로세서 및 메모리 모듈을 취합하여 병렬 처리를 지원합니다. 일부 HPC 시스템은 CPU와 GPU를 결합하는 데 이를 이기종 컴퓨팅이라고 합니다.

컴퓨터의 컴퓨팅 성능은 “FLOPS”(초당 부동 소수점 연산)라는 단위로 측정됩니다. 2019년 초반 현재 최고 수준의 슈퍼 컴퓨터는 143.5페타FLOPS(143 × 1015)를 처리할 수 있습니다. 페타스케일라고 하는 이러한 수준의 슈퍼컴퓨터는 천조 이상의 FLOPS를 수행합니다. 그에 비해, 하이엔드 게이밍 데스크탑은 속도가 1/1,000배 미만으로 약 200기가FLOPS(1 × 109)를 처리하는 데 그칩니다. 프로세싱과 처리 성능 모두에서 슈퍼컴퓨팅 혁신이 이루어지면 머지않아 엑사스케일 수준의 슈퍼컴퓨팅으로 발전하여 페타스케일보다 약 1,000배 빠른 속도가 실현될 것입니다. 이는 엑사스케일 슈퍼컴퓨터가 초당 1018(또는 10억 x 10억)의 연산을 수행할 수 있음을 의미합니다.evolution processing power

“FLOPS”는 이론적 처리 속도를 나타냅니다 – 프로세서에 지속적으로 데이터를 전송하는 데 필요한 속도를 파악합니다. 그러므로, 데이터 처리율이 반드시 시스템 디자인에 반영되어야 합니다. 프로세싱 노드 간 상호 연결과 함께 시스템 메모리가 데이터의 프로세서 도달 속도에 영향을 줍니다.supercomputer representative power

차세대 슈퍼컴퓨터가 구현하는 1 exaFLOP의 처리 성능은 5,000,000대에 달하는 데스크탑 컴퓨터의 성능에 필적합니다.*

*각 데스크탑의 처리 성능을 200기가FLOPS로 가정

스마트한 용어

  • 고성능 컴퓨팅 (HPC): 단일 컴퓨터(예: 1개의 CPU + 8개의 GPU)부터 세계적 수준의 슈퍼컴퓨터를 아우르는 폭넓은 범위의 강력한 컴퓨팅 시스템
  • 슈퍼컴퓨터: 진화하는 성능 표준에 기반한 최고 수준의 HPC
  • 이기종 컴퓨팅: 직렬(CPU) 및 병렬(GPU) 처리 기능을 최적화하는 HPC 아키텍처
  • 메모리: 데이터에 신속하게 액세스하기 위해 HPC 시스템에서 데이터가 저장되는 위치
  • 인터커넥트: 프로세싱 노드 간 통신을 지원하는 시스템 계층, 여러 수준의 상호 연결이 슈퍼컴퓨터 내에 존재
  • 페타스케일: 초당 1,000조(1015)의 계산을 수행하기 위해 설계된 슈퍼컴퓨터
  • 엑사스케일: 초당 100경(1018)의 계산을 수행하기 위해 설계된 슈퍼컴퓨터

새로운 이용 사례

기술 수준이 향상되면서, HPC는 더욱 폭넓은 기능으로 확장되었습니다. 오늘날 처리 능력과 메모리가 그 어느 때보다 향상되어 보다 복잡한 문제를 해결할 수 있게 되었습니다.

  • 머신 러닝: 인공지능(AI), 머신 러닝(ML)의 하위집합으로서 수행 지침을 수동적으로 받아들이는 대신 스스로 학습할 수 있는 시스템을 말합니다. HPC 시스템은 사진에서 흑색 종을 감지하는 암 연구와 같이 방대한 양의 데이터를 분석하는 높은 수준의 ML에 사용할 수 있습니다.6
  • 빅 데이터 분석: 학술, 과학, 금융, 비즈니스, 의료, 사이버 보안 및 정부 애플리케이션 부문의 연구 및 문제 해결을 보완하기 위해 대량의 데이터 세트를 신속하게 비교하고 상관 관계를 분석합니다. 이 작업에는 대규모 처리 및 컴퓨팅 기능이 필요합니다. 매년 50페타바이트의 임무 데이터가 생성되는 NASA에서는 슈퍼컴퓨팅을 활용해 관측을 분석하고 방대한 정보를 바탕으로 시뮬레이션을 실행합니다.7
  • 고급 모델링 및 시뮬레이션: 기업은 초기 단계에서 물리적 구축을 수행하지 않고도, 고급 모델링 및 시뮬레이션을 통해 혁신적인 제품을 더 빨리 출시하고 시간, 재료 및 인건비를 절약할 수 있습니다. HPC 모델링 및 시뮬레이션은 신약 개발 및 시험, 자동차 및 항공 우주 설계, 기후 예측/기상 관측, 에너지 애플리케이션 부문에서 활용됩니다.8

AMD가 엑사스케일에 대한 드라이브를 실현하는 방식

미국에너지국(DOE)/버클리 연구소(Berkeley Lab), 로렌스 리버모어 국립 연구소(U.S. Lawrence Livermore National Laboratory), 슈투트가르트 대학(University of Stuttgart) 및 CSC(핀란드 IT 과학 센터)의 최신 시스템과 같은 세계 최고 성능의 슈퍼컴퓨터가 바로 AMD 기술에 기반합니다.9

가까운 미래에 엑사스케일 수준의 최적의 슈퍼컴퓨터 설계를 실현하기 위해서는 더욱 강력한 처리 성능 및 프로세싱 기능(CPU 및 GPU 모두에서)이 필요합니다. 고성능 컴퓨팅과 그래픽 기술 부문 모두에서 업계 리더인 AMD는 HPC 시스템을 최적화하는 데 있어 몇 가지 고유한 이점을 제시합니다. 미국에너지국(DOE)에서 추진하는 엑사스케일 컴퓨팅 프로젝트의 일환으로, AMD는 미국 최초로 엑사스케일 수준의 슈퍼컴퓨터를 개발하기 위한 기술을 발전시키기 위해 미국 정부와 파트너십을 맺었습니다.10 이 작업에는 CPU 및 GPU 마이크로아키텍처, 메모리 시스템, 구성 요소 통합 및 고속 인터커넥트에 중점을 둔 연구가 포함되었습니다.

exascale desktop icon데스크탑

지역 전력망에 대한 하나의 동적 시나리오를 실시간으로 시뮬레이션합니다.

petascale iconn페타스케일

국가 전력망에 대한 수만 개의 동적 시나리오를 실시간으로 시뮬레이션합니다.

exascale  icon엑사스케일

전 세계 전력망에 대한 수백만 개의 동적 시나리오를 생성 및 수요에 관한 정의되지 않은 변수를 적용해 실시간으로 시뮬레이션합니다.

미래로 나아가는 힘과 자유

엑사스케일 컴퓨팅은 맞춤형 의료, 탄소 포집, 천체 물리학, 시장 경제학 및 바이오 연료 분야의 발전에 기여할 잠재성이 있습니다. 전문가들이 날씨를 더 정확히 예측하고, 더 복잡한 수학적 문제를 해결하며, 우주의 더 먼 곳까지 탐험하고, 에너지 절감형 전력망을 구축하는 데 도움이 될 것입니다.11 차세대 슈퍼컴퓨팅을 위한 공동의 노력과 이러한 시스템이 사회에 기여할 수 있는 긍정적인 영향을 바탕으로, AMD는 미래의 컴퓨팅 시스템의 성능, 에너지 효율성, 신뢰성 및 프로그래밍의 향상을 위한 연구와 자원에 주력하고 있습니다.

자세히 알아보기: https://www.amd.com/hpc

수치해석 담당자가 궁금한 현재 살 수 있는 최강 성능의 PC 하드웨어

수치해석 업무를 담당하는 엔지니어들은 항상 시간에 쫒기며 산다고 해도 과언은 아니다. 새로운 강력한 컴퓨터를 갖는 것이 항상 소원이 되가는 수치해석 엔지니어에게 유용한 정보를 제공합니다.
아래에 한국 ITWORLD에서 PCWorld의 기사를 번역 게시한 기사를 소개합니다.

현재 살 수 있는 최강 성능의 PC 하드웨어

PCWorld
PC의 장점 가운데 하나는 뛰어난 유연성이다. 다양한 형태와 크기, 제조업체 및 모델을 갖춘 수많은 하드웨어가 있기 때문에 구매자가 아무리 돈이 많더라도 혼선이 생기게 마련이다. 이번 기사에서 AMD의 괴물 같은 스레드리퍼(Threadripper) 칩에서부터 지포스 RTX 2080 Ti에 이르기까지 오늘날 구입할 수 있는 최고 성능의 PC 구성 요소를 소개한다.

Credit: Gordon Mah Ung/IDG

CPU
PC의 핵심은 프로세서다. AMD의 32코어, 64 스레드 라이젠 스레드리퍼 2990WX만큼 강력한 CPU는 없다(아마존 1,750달러). 다만 비즈니스 및 데이터센터 장비는 일반 소비자용보다 더 강력하다.

이 CPU는 인텔 18코어 대표작인 코어 i9-7980XE(아마존 2,000달러)보다 거의 2배 많은 코어와 쓰레드를 갖고 있음에도 200달러 이상 싸다. 인텔의 코어는 개별적으로는 더 빠르지만, 2990WX의 엄청난 코어 수를 제대로 활용할 수 있다면 그 어떤 것도 비교할 수 없다.

최상의 PC 게임 성능을 원한다면 코어 i7-8700K(아마존 350달러)가 가장 적합한 프로세스로, 6코어, 12쓰레드는 3.7GHz와 4.7GHz 사이에서 동작하면서 인텔의 18코어보다 훨씬 더 높은 성능이다.

바로 지금 사용할 수 있는 것을 구매한다면, 첫번째 코어 i7-8086K(이 칩은 창립 40주년을 기념해 만들어졌다)은 싱글 쓰레드 애플리케이션에서 5GHz로 출시된 최초의 인텔 칩이다. 또한 수동으로 오버클럭된 경우, 모든 코어에서 5GHz를 기록하는 것이 확실하다. 그러나 표준 성능은 훨씬 저렴한 8700K와 유사하다. 이 칩은 5만 개만 만들어졌다. 뉴에그, 아마존, 베스트바이에서 425달러에 판매하고 있다.

Credit: Gordon Mah Ung

메인보드
프로세서를 골랐다면 메인보드 유형을 알 수 있다. 스레드리퍼 칩은 AMD의 X399 메인보드와 호환된다. 본지는 MSI MEG X399 크리에이션(Creation)(뉴에그 499달러)으로, 스레드리퍼 2990WX를 검토했다. 이 메인보드는 연결성이 좋으며 스틱 형태의 SSD를 냉각할 M.2 프로저 히트싱크, 견고한 전력 공급 시스템을 자랑한다.

여기에서는 간략하게 정리하고 AMD X399 메인보드에 대한 자세한 내용은 여기에서 확인하라.

Credit: MSI

메모리
인텔의 X99 플랫폼은 64GB RAM 한계를 넘어섰으며 DDR4는 이전보다 더 빠른 메모리를 지원한다. 128GB 키트까지 보장하는 3,200MHz 커세어 도미네이터 플레티넘(Corsair Dominator Platinum) 메모리(아마존 1,750달러), 세계에서 가장 큰 RAM 디스크를 만든 이유는 무엇일까. 적절한 속도를 느끼고 싶다면 벤전스(Vengeance) LPX DDR4의 16GB 키트(아마존 430달러)가 적합하다.

이렇게 많은 RAM을 가진 PC를 가질 적절한 이유가 없다는 점에서 이 가격은 단점이 될 수 있다. 용량이 더 작은 키트나 다른 공급업체의 제품을 선택하더라도 DDR3가 아닌 DDR4 메모리여야 한다. X299 메인보드는 최첨단이다.

Credit: Gordon Mah Ung

그래픽 카드
지금 당장 가장 강력한 그래픽 카드를 구입해야 한다면, 대부분의 게임 사용자는 지포스 GTX 1080Ti 또는 EVGA GTX Ti SC2(아마존 670달러)와 같은 맞춤형 오버클럭킹 버전을 선택할 것이다. 이 제품은 GTX 1080보다 25~35% 더 빠르며 4K 해상도로 60fps를 기록할 수 있는 최초의 저렴한 일반 소비자용 그래픽 카드로, 이미 많은 게임에서 적절하게 호환을 이뤘다.

그러나 조금 시간적 여유가 있다면 지금 이를 살 필요는 없다. 엔비디아는 이미 차세대 지포스 RTX 2080 Ti의 예약 구매 신청을 받고 있다. 이는 전작을 날려버릴 준비가 됐다. 2080 Ti 제품의 리뷰는 아직 나오지 않았지만 9월 20일이면 출시된다. 가능한 한 본지의 리뷰를 읽어 검토하고 사전 예약을 해도 늦지 않다.

Credit: Brad Chacos/IDG

모니터
그래픽카드에 큰 돈을 쓸 계획이라면, 하이엔드 디스플레이도 원할 것이다. 하이엔드 디스플레이의 경우, 기본적으로 G싱크(G-Sync) HDR 디스플레이라는 걸출한 제품이 있다.

에이서 프레데터(Acer Predator) X27, 에이수스(Asus) ROG 스위프트(Swift) PG27UQ(뉴에그 각각 2,000달러) 또한 최대 144Hz로, 고급스러운 27인치 4K 패널이다. 말 그대로 이 패널들은 384개 백라이트 영역과 함께 최대 1,000니트의 밝기로 HDR(High-Dynamic Range) 영상을 지원한다. 비-HDR 콘텐츠 또한 아름답게 보인다. 이 모니터는 어도비RGB(AdobeRGB) 색역의 99%를 차지하고 지싱크는 게임 플레이를 부드럽게 해준다.

Credit: Martyn Williams/IDG

주 스토리지
스토리지는 다양한 옵션을 제공한다. 4TB 삼성 860 EVO(아마존 1,400달러)와 WD 골드(아마존 500달러)는 각각 소비자용 SSD와 HDD 시장에서 최고의 성능을 자랑하는데, 본지의 리뷰에서 최고 점수를 받았다.

삼성의 SSD는 분명히 빠르지만 많은 비용이 든다. WD 골드의 7,200rpm 플래터는 기계식 하드드라이브에서 놀라운 엑세스 속도를 제공한다. 이 제품은 같은 가격 제품대에서는 찾아볼 수 없는 엔터프라이즈급 기능으로 자랑한다.

Credit: Western Digital

급속 스토리지
저장 용량과 상관없이 순수하게 속도가 주요 목표라면 좋은 제품이 있다. 약간의 공간에 대한 대가로, 사용자는 M.2 PCI-e NVMe SSD의 엄청난 전송 속도를 즐길 수 있다. 4TB 삼성 960 프로(뉴에그 1,50달러)는 크리스탈디스크마크(CrystalDiskMark) 리뷰에서 읽기 속도가 3.5GBps를 훨씬 웃도는 가장 빠른 드라이브 가운데 하나다.

이 제품을 부팅 드라이브로 삼으면 지연에 대해 걱정할 필요가 없다. 시간 절약을 위해 아주 많은 비용을 투자하는 것이 부담스럽다면 1TB WD 블랙 3D NVMe(아마존 450달러)를 대신 사용하자.

또한 인텔의 혁신적인 옵테인 900P SSD(뉴에그 600달러)는 삼성이 독차지하는 시장에 타격을 가하고 작은 파일을 많이 읽을 때 엄청난 성능을 자랑하지만 280GB 및 480GB 용량으로만 제공한다.

다른 제품을 찾고자 한다면 본지의 “나에게 맞는” SSD 선택 가이드 2018에서 최고의 SSD를 찾을 수 있을 것이다.

Credit: Samsung

사운드카드
PC의 다른 부분에 엄청난 비용을 지불했다면 최고 수준의 오디오에도 투자할 수 있을 것이다. 크리에이티브 테크놀로지의 사운드블라스트(Sound Blaster)X AE-5(아마존 150달러)는 32비트, 384KHz ESS ES9016K2M SABRE32 Ultra DAC 칩셋을 사용한다. 가격은 기본적으로 고가의 전문 사운드 장치에서 볼 수 있는 DAC 수준이다.

이 제품은 최초의 프리미엄 일반 소비자용 사운드카드로, 5.1 아날로그 서라운드 사운드, 600 옴 헤드셋까지 구동할 수 있는 듀얼 앰프 Xamp, RGB 조명 등을 제공한다.

Credit: Gordon Mah Ung/IDG

전원공급장치
현재 인텔 프로세서와 엔비디아 그래픽카드의 놀라운 전력 효율성으로 인해 대부분의 단일 GPU 시스템은 아마도 600W 이상의 전원공급장치를 필요로 하지 않을 것이다.
그러나 이번 기사는 최상의 제품에 관한 것이기에 최고 전원공급장치를 소개한다. 여러 개의 그래픽 카드를 사용하거나 미래 확장을 위해 공간을 확보하길 원한다면, 이 제품을 사용해도 좋다.

커세어(Corsair) AX1500i(아마존 450달러)는 본질적으로 전력 공급에 있어 모범적이다. 요즘 코인 채굴작업으로 인해 수요가 많아 종종 재고가 없을 수 있다. 이 모듈식 커세어 AX1500i PSU는 최첨단 디지털 제어시스템 덕분에 모든 면에서 완벽한 등급을 자랑한다. 최근 커세어는 한단계 진보한 AX1600i(뉴에그 500달러)도 발표했다.

이번 기사에서 설명한 바와 같이 유사한 장비를 설치하고 하나 또는 2개의 그래픽 카드를 사용할 경우, 좀더 낮은 전원 공급장치를 구입할 수 있다.

editor@itworld.co.kr