FLOW-3D 수치해석용 컴퓨터 선택 가이드 (update)

Hardware Selection for FLOW-3D Products – FLOW-3D

2021-04-14 최신 CPU 부분 업데이트 / ㈜에스티아이씨앤디 솔루션사업부

In this blog, Flow Science’s IT Manager Matthew Taylor breaks down the different hardware components and suggests some ideal configurations for getting the most out of your FLOW-3D products.

개요

본 자료는 Flow Science의 IT 매니저 Matthew Taylor가 작성한 자료를 기반으로 STI C&D에서 일부 자료를 보완한 자료입니다. 본 자료를 통해 FLOW-3D 사용자는 최상의 해석용 컴퓨터를 선택할 때 도움을 받을 수 있을 것으로 기대합니다.

수치해석을 하는 엔지니어들은 사용하는 컴퓨터의 성능에 무척 민감합니다. 그 이유는 수치해석을 하기 위해 여러 준비단계와 분석 시간들이 필요하지만 당연히 압도적으로 시간을 소모하는 것이 계산 시간이기 때문일 것입니다.

따라서 수치해석용 컴퓨터의 선정을 위해서 단위 시간당 시스템이 처리하는 작업의 수나 처리량, 응답시간, 평균 대기 시간 등의 요소를 복합적으로 검토하여 결정하게 됩니다.

또한 수치해석에 적합한 성능을 가진 컴퓨터를 선별하는 방법으로 CPU 계산 처리속도인 Flops/sec 성능도 중요하지만 수치해석을 수행할 때 방대한 계산 결과를 디스크에 저장하고, 해석결과를 분석할 때는 그래픽 성능도 크게 좌우하기 때문에 SSD 디스크와 그래픽카드에도 관심을 가져야 합니다.

FLOW SCIENCE, INC. 에서는 일반적인 FLOW-3D를 지원하는 최소 컴퓨터 사양과 O/S 플랫폼 가이드를 제시하지만, 도입 담당자의 경우, 최상의 조건에서 해석 업무를 수행해야 하기 때문에 가능하면 최고의 성능을 제공하는 해석용 장비 도입이 필요합니다. 이 자료는 2021 현재 FLOW-3D 제품을 효과적으로 사용하기 위한 하드웨어 선택에 대해 사전에 검토되어야 할 내용들에 대해 자세히 설명합니다. 그리고 실행 중인 시뮬레이션 유형에 따라 다양한 구성에 대한 몇 가지 아이디어를 제공합니다.

CPU 최신 뉴스

2021년 4월 15일 기준 (https://www.itworld.co.kr/print/190283 기사 원문 발췌)

ⓒ Rob Schultz/IDG
ⓒ Rob Schultz/IDG
  • 현재 라이젠 5000 제품군과 인텔 11세대 코어 CPU가 그 어느 때보다 뛰어난 성능과 코어를 제공한다. 
    하이엔드 프로세서를 구입하고자 한다면, 라이젠 9 5900X가 최고의 선택지다. 인텔의 새로운 8코어 코어 i9-11900K 대표 제품과 동등한 수준의 성능을 제공하지만, 라이젠 칩의 12코어 24스레드 덕분에 훨씬 더 높은 생산성 성능을 제공한다. 데스크탑에서 최고 성능을 원한다면 750달러로 가격이 치솟은 라이젠 9 5950X는 무려 16코어 덕분에 훨씬 더 많은 성능을 제공한다.
    워크스테이션에서 최고 사양은 AMD Ryzen™ Threadripper™ PRO 3995WX 로 CPU 코어 수는 64개이고 스레드 수는 128코어로 거의 슈퍼컴퓨터 수준이다. 가격 조회 사이트인 다나와에서 현재 일자(2021년 4월 15일) 기준으로 검색해 보면 CPU 가격만 700만원대인 매우 고가의 CPU인 것을 알 수 있다.
AMD 3995wx
  • 인텔의 코어 i9-11900K 가격은 550달러이므로, AMD 라이젠 9 5900K와 가격이 동일하지만, 로켓 레이크의 출시 초기에는 약 615달러에 판매되고 있다. 전력 소모가 심하고 AMD 칩보다 속도가 그리 빠르지 않다. 또한 코어 i9-11900K는 8개의 코어 및 16개 스레드만 제공되므로 생산성 작업에서도 크게 뒤쳐진다. 실제로 코어 i9-11900K는 소매 가격이 450달러인 8코어 라이젠 7 5800X와 더 비슷한 성능을 보인다.  
  • CPU는 최근 수개월 동안 그래픽 카드와 함께 부족 현상을 겪고 있어 가용성이 많이 떨어지고 있다. 특히 AMD 라이젠 프로세서의 가격이 인상돼 사용자는 현명하게 구매할 필요가 있다. 
  • 인텔의 최신 칩인 11세대 로켓 레이크(Rocket Lake) 코어 프로세서는 여전히 오래된 14nm 제조 공정을 기반으로 제작됐지만, 아키텍처 자체는 인텔의 최신 10nm 아이스 레이크(Ice Lake) 코어로 만들어졌다. 코어 i9-11900K에서 볼 수 있듯이 이는 흥미롭고, 복합적인 결과를 도출한 필사적인 아이디어다. 
  • 하지만 앞으로 더 밝은 미래가 있다. 인텔의 새로운 CEO 팻 겔싱어는 최근 다른 기업을 위한 x86 칩을 구축하고 수년간 14nm에서 허덕이던 인텔의 ‘틱톡(tick-tock)’ 아키텍처를 되살리는 등 인텔의 장기적인 기술 계획을 발표했다. 
  • 성능을 향상시키는 PCIe 리사이저블 BAR(Resizable BAR) 기능은 AMD의 스마트 엑세스 메모리(Smart Access Memory)와 유사한 형태로 등장한 후에 널리 사용 가능해졌다. AMD가 라이젠 5000에 이 기능을 도입한 이후, 인텔의 최신 로켓 레이크 칩으로 확산됐다. BIOS 업데이트는 양 제조업체의 구형 프로세서 및 메인보드에 이 기능을 추가하고 있다.     

CPU의 선택

CPU는 전반적인 성능에 큰 영향을 미치며, 대부분의 경우 컴퓨터의 가장 중요한 구성 요소입니다. 그러나 데스크탑 프로세서를 구입할 때가 되면 Intel 과 AMD의 모델 번호와 사양을 이해하는 것이 어려워 보일 것입니다.
그리고, CPU 성능을 평가하는 방법에 의해 가장 좋은 CPU를 고른다고 해도 보드와, 메모리, 주변 Chip 등 여러가지 조건에 의해 성능이 달라질 수 있기 때문에 성능평가 결과를 기준으로 시스템을 구입할 경우, 단일 CPU나 부품으로 순위가 정해진 자료보다는 시스템 전체를 대상으로 평가한 순위표를 보고 선정하는 지혜가 필요합니다.

PassMark – CPU Mark High End CPUs

2021년 4월 14일 기준

PassMark - CPU Mark Updated 14th of April 2021
PassMark – CPU Mark Updated (14th of April 2021)

<출처> https://www.cpubenchmark.net/high_end_cpus.html

PassMark – CPU Mark Single Thread Performance

2021년 4월 14일 기준

수치해석을 수행하는 CPU의 경우 예산에 따라 Core가 많지 않은 CPU를 구매해야 하는 경우도 있을 수 있습니다. 보통 Core가 많다고 해석 속도가 선형으로 증가하지는 않으며, 해석 케이스에 따라 적정 Core수가 있습니다. 이 경우 예산에 맞는 성능 대비 최상의 코어 수가 있을 수 있기 때문에 Single thread Performance 도 매우 중요합니다. 아래 성능 도표를 참조하여 예산에 맞는 최적 CPU를 찾는데 도움을 받을 수 있습니다.

출처 : https://www.cpubenchmark.net/singleThread.html

PassMark - CPU Mark Single Thread Performance (Updated 14th of April 2021)
PassMark – CPU Mark Single Thread Performance (Updated 14th of April 2021)

CPU 성능 분석 방법

부동소수점 계산을 하는 수치해석과 밀접한 Computer의 연산 성능 벤치마크 방법은 대표적으로 널리 사용되는 아래와 같은 방법이 있습니다.

FLOW-3D의 CFD 솔버 성능은 CPU의 부동 소수점 성능에 전적으로 좌우되기 때문에 계산 집약적인 프로그램입니다. FlowSight 또한 CPU에 크게 의존합니다. 현재 출시된 사용 가능한 모든 CPU를 벤치마킹할 수는 없지만 상대적인 성능을 합리적으로 비교할 수는 있습니다.

특히, 수치해석 분야에서 주어진 CPU에 대해 FLOW-3D 성능을 추정하거나 여러 CPU 옵션 간의 성능을 비교하기 위한 최상의 옵션은 Standard Performance Evaluation Corporation의 SPEC CPU2017 벤치마크(현재까지 개발된 가장 최신 평가기준임)이며, 특히 SPECspeed 2017 Floating Point 결과가 CFD Solver 성능을 매우 잘 예측합니다.

이는 유료 벤치마크이므로 제공된 결과는 모든 CPU 테스트 결과를 제공하지 않습니다. 보통 제조사가 ASUS, Dell, Lenovo, HP, Huawei 정도의 제품에 대해 RAM이 많은 멀티 소켓 Intel Xeon 기계와 같은 값비싼 구성으로 된 장비 결과들을 제공합니다.

CPU 비교를 위한 또 다른 옵션은 Passmark Software의 CPU 벤치마크입니다. PerformanceTest 제품군은 유료 소프트웨어이지만 무료 평가판을 사용할 수 있습니다. 대부분의 CPU는 저렴한 옵션을 포함하여 나열됩니다. 부동 소수점 성능은 전체 벤치마크의 한 측면에 불과하지만 다양한 워크로드에서 전반적인 성능을 제대로 테스트합니다.

예산을 결정하고 해당 예산에 해당하는 CPU를 선택한 후에는 벤치마크를 사용하여 가격에 가장 적합한 성능을 결정할 수 있습니다.

<참고>

SPEC의 벤치 마크https://www.spec.org/benchmarks.html#cpu )

SPEC CPU 2017 (현재까지 가장 최근에 개발된 CPU 성능측정 기준)

다른 컴퓨터 시스템에서 컴퓨팅 계산에 대한 집약적인 워크로드를 비교하는데 사용할 수 있는 성능 측정을 제공하도록 설계된 SPEC CPU 2017에는 SPECspeed 2017 정수, SPECspeed 2017 부동 소수점, SPECrate 2017 정수 및 SPECrate 2017 부동 소수점의 4 가지 제품군으로 구성된 43 개의 벤치 마크가 포함되어 있습니다. SPEC CPU 2017에는 에너지 소비 측정을 위한 선택적 메트릭도 포함되어 있습니다.

<SPEC CPU 벤치마크 보고서>

벤치마크 결과보고서는 제조사별, 모델별로 테스트한 결과를 아래 사이트에 가면 볼 수 있습니다.

https://www.spec.org/cgi-bin/osgresults

<보고서 샘플>

  • SPEC CPU 2017

Designed to provide performance measurements that can be used to compare compute-intensive workloads on different computer systems, SPEC CPU 2017 contains 43 benchmarks organized into four suites: SPECspeed 2017 Integer, SPECspeed 2017 Floating Point, SPECrate 2017 Integer, and SPECrate 2017 Floating Point. SPEC CPU 2017 also includes an optional metric for measuring energy consumption.

클럭 대 코어

일반적으로 클럭 속도가 높은 칩은 CPU 코어를 더 적게 포함합니다. FLOW-3D는 병렬화가 잘되어 있지만, 디스크 쓰기와 같이 일부 작업은 기본적으로 단일 스레드 방식으로 수행됩니다. 따라서 데이터 출력이 빈번하거나 큰 시뮬레이션은 종종 더 많은 코어가 아닌, 더 높은 클럭 속도를 활용합니다. 마찬가지로 코어 및 소켓의 다중 스레딩은 오버헤드를 발생시키므로 작은 문제의 해석일 경우 사용되는 코어 수를 제한하면 성능이 향상될 수 있습니다.

CPU 아키텍처

CPU 아키텍처는 중요합니다. 최신 CPU는 일반적으로 사이클당 더 많은 기능을 제공합니다. 즉, 현재 세대의 CPU는 일반적으로 동일한 클럭 속도에서 이전 CPU보다 성능이 우수합니다. 또한 전력 효율이 높아져 와트당 성능이 향상될 수 있습니다. Flow Science에는 구형 멀티 소켓 12, 16, 24 코어 Xeon보다 성능이 뛰어난 최근 세대 10~12 Core i9 CPU 시스템을 보유하고 있습니다.

오버클럭

해석용 장비에서는 CPU를 오버클럭 하지 않는 것이 좋습니다. 하드웨어를 다년간의 투자라고 생각한다면, 오버클럭화는 발열을 증가시켜 수명을 단축시킵니다. CPU에 따라 안정성도 저하될 수 있습니다. CPU를 오버클럭 할 때는 세심한 열 관리가 권장됩니다.

하이퍼스레딩

<이미지출처:https://gameabout.com/krum3/4586040>

하이퍼스레딩은 물리적으로 1개의 CPU를 가상으로 2개의 CPU처럼 작동하게 하는 기술로 파이프라인의 단계수가 많고 각 단계의 길이가 짧을때 유리합니다. 다만 수치해석 처럼 모든 코어의 CPU를 100% 사용중인 장시간 수행 시뮬레이션은 일반적으로 Hyper Threading이 비활성화 된 상태에서 더 잘 수행됩니다. FLOW-3D는 100% CPU 사용률이 일반적이므로 새 하드웨어를 구성할 때 Hyper Threading을 비활성화하는 것이 좋습니다. 설정은 시스템의 BIOS 설정에서 수행합니다.

몇 가지 워크로드의 경우에는 Hyper Threading을 사용하여 약간 더 나은 성능을 보이는 경우가 있습니다. 따라서, 최상의 런타임을 위해서는 두 가지 구성중에서 어느 구성이 더 적합한지 시뮬레이션 유형을 테스트하는 것이 좋습니다.

스케일링

여러 코어를 사용할 때 성능은 선형적이지 않습니다. 예를 들어 12 코어 CPU에서 24 코어 CPU로 업그레이드해도 시뮬레이션 런타임이 절반으로 줄어들지 않습니다. 시뮬레이션 유형에 따라 16~32개 이상의 CPU 코어를 선택할 때는 FLOW-3D 및 FLOW-3D CAST의 HPC 버전을 사용하거나 FLOW-3D CLOUD로 이동하는 것을 고려하여야 합니다.

AMD Ryzen 또는 Epyc CPU

AMD는 일부 CPU로 벤치마크 차트를 석권하고 있으며 그 가격은 매우 경쟁력이 있습니다. FLOW SCIENCE, INC. 에서는 소수의 AMD CPU로 FLOW-3D를 테스트했습니다. 현재 Epyc CPU는 이상적이지 않고 Ryzen은 성능이 상당히 우수합니다. 발열은 여전히 신중하게 다뤄져야 할 문제입니다. 현재 32 코어 옵션에 영향을 주는 Windows 버그가 초기 버전에서 성능을 크게 저하시키는 것으로 알려져 있습니다. Bug Fix가 되었는지 업데이트 하여 확인하고, 해결되지 않은 경우 이러한 CPU에는 Linux를 권장됩니다.

<관련 기사>

https://www.techspot.com/news/78122-report-software-fix-can-double-threadripper-2990wx-performance.html

Graphics 고려 사항

FLOW-3D는 OpenGL 드라이버가 만족스럽게 수행되는 최신 그래픽 카드가 필요합니다. 최소한 OpenGL 3.0을 지원하는 것이 좋습니다. FlowSight는 DirectX 11 이상을 지원하는 그래픽 카드에서 가장 잘 작동합니다. 권장 옵션은 엔비디아의 쿼드로 K 시리즈와 AMD의 파이어 프로 W 시리즈입니다.

특히 엔비디아 쿼드로(NVIDIA Quadro)는 엔비디아가 개발한 전문가 용도(워크스테이션)의 그래픽 카드입니다. 일반적으로 지포스 그래픽 카드가 게이밍에 초점이 맞춰져 있지만, 쿼드로는 다양한 산업 분야의 전문가가 필요로 하는 영역에 광범위한 용도로 사용되고 있습니다. 주로 산업계의 그래픽 디자인 분야, 영상 콘텐츠 제작 분야, 엔지니어링 설계 분야, 과학 분야, 의료 분석 분야 등의 전문가 작업용으로 사용되고 있습니다. 따라서 일반적인 소비자를 대상으로 하는 지포스 그래픽 카드와는 다르계 산업계에 포커스 되어 있으며 가격이 매우 비싸서 도입시 예산을 고려해야 합니다.

유의할 점은 엔비디아의 GTX 게이밍 하드웨어는 볼륨 렌더링의 속도가 느리거나 오동작 등 몇 가지 제한 사항이 있습니다. 일반적으로 노트북에 내장된 통합 그래픽 카드보다는 개별 그래픽 카드를 강력하게 추천합니다. 최소한 그래픽 메모리는 512MB 이상을 권장합니다.

PassMark – G3D Mark High End Videocards

출처 : https://www.videocardbenchmark.net/high_end_gpus.html

원격데스크탑 사용시 고려 사항

Flow Science는 nVidia 드라이버 버전이 341.05 이상인 nVidia Quadro K, M 또는 P 시리즈 그래픽 하드웨어를 권장합니다. 이 카드와 드라이버 조합을 사용하면 원격 데스크톱 연결이 완전한 3D 가속 기능을 갖춘 기본 하드웨어에서 자동으로 실행됩니다.

원격 데스크톱 세션에 연결할 때 nVidia Quadro 그래픽 카드가 설치되어 있지 않으면 Windows는 소프트웨어 렌더링을 사용합니다. 이는 FLOW-3D 및 FlowSight 모두 성능에 부정적인 영향을 미칩니다. FLOW-3D 가 소프트웨어 렌더링을 사용하고 있는지 확인하려면 FLOW-3D 도움말 메뉴에서 정보를 선택하십시오. GDI Generic을 소프트웨어 렌더링으로 사용하는 경우 GL_RENDERER 항목에 표시됩니다.

하드웨어 렌더링을 활성화하는 몇 가지 옵션이 있습니다. 쉬운 방법 중 하나는 실제 콘솔에서 FLOW-3D를 시작한 다음 원격 데스크톱 세션을 연결하는 것입니다. Nice Software DCV 와 같은 일부 VNC 소프트웨어는 기본적으로 하드웨어 렌더링을 사용합니다.

RAM 고려 사항

프로세서 코어당 최소 4GB의 RAM은 FLOW-3D의 좋은 출발입니다. FlowSight POST Processor를 사용하여 후처리 작업을 할 경우 상당한 양의 RAM을 사용하는 것이 좋습니다.

현재 주력제품인 DDR4보다 2배 빠른 DDR5가 곧 출시된다는 소식도 있습니다.

일반적으로 FLOW-3D를 이용하여 해석을 할 경우 격자(Mesh)수에 따라 소요되는 적정 메모리 크기는 아래와 같습니다.페이지 보기

  • 초대형 (2억개 이상의 셀) : 최소 128GB
  • 대형 (60 ~ 1억 5천만 셀) : 64 ~ 128GB
  • 중간 (30-60백만 셀) : 32-64GB
  • 작음 (3 천만 셀 이하) : 최소 32GB

HDD 고려 사항

수치해석은 해석결과 파일의 데이터 양이 매우 크기 때문에 읽고 쓰는데, 속도면에서 매우 빠른 SSD를 적용하면 성능면에서 큰 도움이 됩니다. 다만 SSD 가격이 비싸서 가성비 측면을 고려하여 적정수준에서 결정이 필요합니다.

CPU와 저장장치 간 데이터가 오고 가는 통로가 그림과 같이 3가지 방식이 있습니다. 이를 인터페이스라 부르며 SSD는 흔히 PCI-Express 와 SATA 통로를 이용합니다.

흔히 말하는 NVMe는 PCI-Express3.0 지원 SSD의 경우 SSD에 최적화된 NVMe (NonVolatile Memory Express) 전송 프로토콜을 사용합니다. 주의할 점은 MVMe중에서 SATA3 방식도 있기 때문에 잘 구별하여 구입하시기 바랍니다.

그리고 SSD를 선택할 경우에도 SSD 종류 중에서 PCI Express 타입은 매우 빠르고 가격이 고가였지만 최근에는 많이 저렴해졌습니다. 따라서 예산 범위내에서 NVMe SSD등 가장 효과적인 선택을 하는 것이 좋습니다.
( 참고 : 해석용 컴퓨터 SSD 고르기 참조 )

기존의 물리적인 하드 디스크의 경우, 디스크에 기록된 데이터를 읽기 위해서는 데이터를 읽어내는 헤드(바늘)가 물리적으로 데이터가 기록된 위치까지 이동해야 하므로 이동에 일정한 시간이 소요됩니다. (이러한 시간을 지연시간, 혹은 레이턴시 등으로 부름) 따라서 하드 디스크의 경우 데이터를 읽기 위한 요청이 주어진 뒤에 데이터를 실제로 읽기까지 일정한 시간이 소요되는데, 이 시간을 일정한 한계(약 10ms)이하로 줄이는 것이 불가능에 가까우며, 데이터가 플래터에 실제 기록된 위치에 따라서 이러한 데이터에의 접근시간 역시 차이가 나게 됩니다.

하지만 HDD의 최대 강점은 가격대비 용량입니다. 현재 상용화되어 판매하는 대용량 HDD는 12TB ~ 15TB가 공급되고 있으며, 이는 데이터 저장이나 백업용으로 가장 좋은 선택이 됩니다.
결론적으로 데이터를 직접 읽고 쓰는 드라이브는 SSD를 사용하고 보관하는 용도의 드라이브는 기존의 HDD를 사용하는 방법이 효과적인 선택이 될 수 있습니다.

PassMark – Disk Rating High End Drives

출처 : https://www.harddrivebenchmark.net/high_end_drives.html

상기 벤치마크 테스트는 테스트 조건에 따라 그 성능 곡선이 달라질 수 있기 때문에 조건을 확인할 필요가 있습니다. 예를 들어 Windows7, windows8, windows10 모두에서 테스트한 결과를 평균한 점수와 자신이 사용할 컴퓨터 O/S에서 테스트한 결과는 다를 수 있습니다. 상기 결과에 대한 테스트 환경에 대한 내용은 아래 사이트를 참고하시기 바랍니다.

참고 : 테스트 환경

페이지 보기

Best Ultrabooks and Premium Laptops 2021

FLOW-3D 해석용 노트북 선택 가이드

Best Ultrabooks and Premium Laptops 2021
Best Ultrabooks and Premium Laptops 2021

일반적으로 수치해석을 주 업무로 사용하는 경우 노트북을 사용하는 경우는 그리 많지 않습니다. 그 이유는 CPU 성능을 100%로 사용하는 해석 프로그램의 특성상 발열과 부품의 성능 측면에서 데스크탑이나 HPC의 성능을 따라 가기는 어렵기 때문입니다.

그럼에도 불구하고, 이동 편의성이나 발표,  Demo 등의 업무 필요성이 자주 있는 경우, 또는 계산 시간이 짧은 경량 해석을 주로 하는 경우, 노트북이 주는 이점이 크기 때문에 수치해석용 노트북을 고려하기도 합니다.

보통 수치해석용 컴퓨터를 검토하는 경우 CPU의 Core수나 클럭, 메모리, 그래픽카드 등을 신중하게 검토하게 되는데 모든 것이 예산과 직결되어 있기 때문입니다.  따라서 해석용 컴퓨터 구매 시 어떤 것을 선정 우선순위에 두는지에 따라 사양이 달라지게 됩니다.

해석용으로 노트북을 고려하는 경우, 보통 CPU의 클럭은 비교적 선택 기준이 명확합니다. 메모리 또한 용량에 따라 가격이 정해지기 때문에 이것도 비교적 명확합니다. 나머지 가격에 가장 큰 영향을 주는 것이 그래픽카드인데, 이는 그래픽 카드의 경우 일반적인 게임용이나 포토샵으로 일반적인 이미지 처리 작업을 수행하는 그래픽카드와 3차원 CAD/CAE에 사용되는 업무용 그래픽 카드는 명확하게 분리되어 있고, 이는 가격 측면에서 매우 차이가 많이 납니다.

한가지 안타까운 현실은 최근에 디지털화폐 (비트코인 등)열풍으로 인해 채굴용으로 수요가 급증하여 좋은 그래픽 카드를 적정가격으로 구입하기 어려운 상황입니다.

통상 게임용 그래픽카드는 수치해석의 경우 POST 작업시 문제가 발생하는 경우가 종종 발생하기 때문에 일반적으로 선택 우선 순위에서 충분한 확인을 한 후 구입하는 것이 좋습니다.

FLOW-3D는 OpenGL 드라이버가 만족스럽게 수행되는 최신 그래픽 카드가 적합합니다. 최소한 OpenGL 3.0을 지원하는 것이 좋습니다. FlowSight는 DirectX 11 이상을 지원하는 그래픽 카드에서 가장 잘 작동합니다. 권장 옵션은 NVIDIA의 Quadro K 시리즈와 AMD의 Fire Pro W 시리즈입니다.

특히 엔비디아 쿼드로(NVIDIA Quadro)는 엔비디아가 개발한 전문가 용도(워크스테이션)의 그래픽 카드입니다. 일반적으로 지포스 그래픽 카드가 게이밍에 초점이 맞춰져 있지만, 쿼드로는 다양한 산업 분야의 전문가가 필요로 하는 영역에 광범위한 용도로 사용되고 있습니다. 주로 산업계의 그래픽 디자인 분야, 영상 콘텐츠 제작 분야, 엔지니어링 설계 분야, 과학 분야, 의료 분석 분야 등의 전문가 작업용으로 사용되고 있습니다. 따라서 일반적인 소비자를 대상으로 하는 지포스 그래픽 카드와는 다르계 산업계에 포커스 되어 있으며 가격이 매우 비싸서 도입시 예산을 고려해야 합니다.

2021-03-23 현재 AMD FirePro Naver Shopping 검색 결과

2021-03-23 현재 NVIDIA Quadro pro graphic card : 네이버 쇼핑 (naver.com)

코어가 많은 그래픽카드의 경우 가격이 상상 이상으로 높습니다. 빠르면 빠를수록 좋겠지만 어디까지나 예산에 맞춰 구매를 해야 하는 현실을 감안할 수 밖에 없는 것 같습니다.

한가지 유의할 점은 엔비디아의 GTX 게이밍 하드웨어는 모델에 따라 다르기는 하지만, 볼륨 렌더링의 속도가 느리거나 오동작 등 몇 가지 제한 사항이 있습니다. 일반적으로 노트북에 내장된 통합 그래픽 카드보다는 개별 그래픽 카드를 강력하게 추천합니다. 최소한 그래픽 메모리는 512MB 이상이어야 하고 1GB이상을 권장합니다.


2021-03-23 현재 그래픽카드의 성능 순위는 위와 다음과 같습니다.
출처: https://www.videocardbenchmark.net/high_end_gpus.html

High End Video Card Chart
High End Video Card Chart

주요 Notebook

출시된 모든 그래픽 카드가 노트북용으로 장착되어 출시되지는 않기 때문에, 현재 오픈마켓 검색서비스를 제공하는 네이버에서 Lenovo Quadro 그래픽카드를 사용하는 노트북을 검색하면 아래와 같습니다. 검색 시점에 따라 상위 그래픽카드를 장착한 노트북의 대략적인 가격을 볼 수 있을 것입니다.

<검색 방법>
네이버 쇼핑 검색 키워드 : 컴퓨터 제조사 + 그래픽카드 모델 + NoteBook 형태로 검색
dPtl : Lenovo quadro notebook or HP quadro notebook 또는 Lenovo firepro notebook or HP firepro notebook


( 2021-03-23 기준)

Lenovo Quadro Notebook
HP Quadro Notebook
HP Quadro Notebook

대부분 검색 시점에 따라 최신 CPU와 최신 그래픽카드를 선택하여 검색을 하면 예산에 적당한 노트북을 자신에게 맞는 최상의 노트북을 어렵지 않게 선택할 수 있습니다.

(주)에스티아이씨앤디 솔루션사업부

2019년 소개된 강력한 PC 하드웨어 소개

고성능 컴퓨팅(HPC)

고성능 컴퓨팅(HPC)은 과학, 공학 또는 거대한 비지니스 요구 사항들을 해결하기 위해, 우리가 흔히 사용하는 일반적인 데스크탑 컴퓨터나 워크스테이션보다 훨씬 더 높은 성능을 발휘하도록 컴퓨팅 파워를 결합하여 고성능을 발휘하도록 하는 것을 의미합니다.
시뮬레이션이나 분석과 같은 HPC  워크로드는 계산 속도, 메모리 사용 및 데이터 관리가 매우 중요합니다.
클러스터나 슈퍼컴퓨터라고도 불리는 일반적인 HPC 시스템은 고속의 네트워크에 연결된 다수의 서버를 이용한 확장을 통해, 여러 애플리케이션들을 병렬 실행하도록 설계됩니다.
HPC 시스템에는 관련 소프트웨어, 도구, 구성요소, 스토리지 및 서비스가 포함된 경우가 많습니다.

고성능 컴퓨팅은 일반적으로

  • 100Gbps의 초고속 네트워킹
  • 확장 가능한 고성능 스토리지
  • 고성능 컴퓨팅 소프트웨어 스텍 (최근에는 거의 Linux가 대세로 자리 잡음)
  • 에너지 효율성
  • GPU 가속지원

등이 핵심 성능지표로 고려되어 개발됩니다.
이러한 컴퓨터는 매우 고가이고 특별한 관리환경과 전문가들이 필요하여, 일반인들은 쉽게 접하기가 어렵습니다.
그러나 최근에는 시스템 구성은 전문가들이 하고, 시스템 사용은 일반 엔지니어들이 사용할 수 있도록 UI나 시스템 사용환경이 많이 편리해져서 대기업이나 국책 연구기관의 연구원들이 쉽게 사용할 수 있는 기반이 많이 갖추어져 있습니다.

이러한 HPC와는 스케일 규모면에서는 차이가 많지만, 최근에는 단일 컴퓨터에서도 많은 core로 구성된, 수퍼컴에 가까운 단일 컴퓨팅 고성능 PC가 판매되고 있습니다.
따라서 본 기사에서는 고성능 PC 하드웨어를 통해 수치해석을 수행할 수 있는 전세계의 최신 컴퓨터 기술을 소개하는 PC 기반 하드웨어 기사를 소개합니다.
본 기사는 itworld 에서 작성된 자료입니다.

AMD 라이젠 3000 리뷰 | 인텔의 시대를 끝내러 왔다

2019.07.09
업데이트 기사에서는 성능 테스트 결과 중 3D 뷰포트와 시너지 시네스코어(Cinescore) 성능 결과를 더했다. 또한, 게임 외적인 이유로 데이터에 나타나지 않았던 파 크라이(Far Cry) 5와 데우스 엑스: 맨카인드 유나이티드(Deus Ex: Mankind United)에서의 구형 라이젠 칩 게이밍 벤치마크 차트도 추가했다.

AMD의 12코어 라이젠 9 3900X CPU 리뷰를 한마디로 요약한 문장은 이렇지 않을까?“와, 이 CPU 진짜 빠르다.”

그러나 결론만 보기는 아쉽다. 라이젠 9 3900X는 1GHz를 처음으로 넘어섰던 AMD의 오리지널 K7 애슬론 시리즈 CPU, 데스크톱 PC의 64비트 시대를 열었던 애슬론 64 CPU만큼이나 중요한, 시장을 바꾸는 CPU가 될 물건이기 때문이다.

라이젠 9 3900X가 앞으로 저런 제품이 세운 위대함을 달성하기 어려울 것이라고 생각할지 모른다. 이전 세대의 무시무시한 게이밍 성능 지표를 모두 넘어서는 정도는 아니다. 그러나 발매 직후의 혼란이 가라앉으면 AMD 라이젠 3000 시리즈는 단숨에 가장 인기 있는 CPU가 될 것이다.

라이젠 3000 시리즈는 어찌됐든 7나노 공정으로 생산된 최초의 사용자 x86 칩이다. 인텔의 현재 데스크톱 칩은 모두 아직도 14나노 공정으로 제작된다. 올해 말쯤 되어야 10나노 공정으로의 이전이 시작될 것이다. AMD가 7나노 공정에 먼저 도달한 것을 부러워하면서 말이다.

기술적인 우위를 바탕으로 AMD는 라이젠 3000을 위해 재설계된 2세대 젠 코어를 발표했다. 이전 라이젠 2000 시리즈에 비해 부동 소수점 성능이 2배 증가했고, 클럭당 명령어 처리 횟수가 15% 향상되었다.

AMD는 명령 프리-패치를 개선했고, 명령 캐시를 한층 강화했고, 마이크로-op 캐시를 2배로 늘렸다고 말했다. AMD는 부동 소수점 성능을 2배로 늘린 것에 더해 이제 AVX-256까지 도입했다(256비트 고급 벡터 확장). 인텔 코어는 AVX-512이다. 오늘날 AVX는 주로 동영상 인코딩 분야에 영향을 주지만, 다른 분야에서도 진가를 발휘한다.

AMD는 기본적으로 라이젠 3000 칩에서 L3 캐시를 2배 늘리고, 이것을 게임 캐시라고 부르면서 애플과 비슷한 마케팅을 펼치고 있다. 라이젠 9 3900X에서 70MB를 차지하는 이 캐시는 라이젠 3000 시리즈의 메모리 지연성을 크게 줄인다. 또 CPU의 게이밍 성능을 극적으로 향상한다. 그래서 게임 캐시라고 부르면서 일반 사용자의 이해를 돕고 있다.  게임 캐시는 애플리케이션 성능 개선에도 유용하지만, 앱 캐시라고 불렀을 때 기뻐할 사람은 아무도 없을 테니까.

라이젠 3000 시리즈에는 7나노 CCD가 2개 들어간다. ⓒAMD

코어와 함께 칩셋 설계도 크게 손을 보았다. 처음의 젠 기반 라이젠은 메모리 및 PCIe 컨트롤러가 인피니티 패브릭으로 결합된 2개의 14 나노 CCD를 특징으로 했다. 젠 2에 기반한 라이젠 3000은 메모리 컨트롤러와 PCIe 4.0 컨트롤러를 별개의 IO 다이로 분리한다. 7나노 연산 코어와 달리 IO 다이는 12나노 공정으로 제작된다. 이는 CPU의 전체 원가 절감에 기여한다. 7나노 공정 웨이퍼가 훨씬 가치 있는데, AMD의 팹 협력사인 TSMC가 IO 다를 제작에 사용하지 않아도 되기 때문이다.

여기서 중요한 질문은 GPU가 제한 요소가 아닌 상황에서, 오랫동안 라이젠 성능의 발목을 잡았던 게이밍 문제가 마침내 해소되었느냐는 것이다. 차이는 이제 매우 근소해졌다. 심지어 엔비디아의 무자비하게 빠른 RTX 2080 Ti를 구동하더라도 거의 99% 문제가 없을 것이다.

PCIe4.0?!

그렇다. PCIe4.0이다. PCIe의 차세대 버전 PCIe4.0은 기본적으로 클럭 속도와 스루풋을 PCIe3.0보다 2배로 늘린다. AMD가 PCIe4.0으로 이동한 것도 또 한가지 유리한 점이다. 인텔은 CPU에서 PCIe3.0 속도로 정체되어 있고, 마찬가지로 엔비디아도 PCIe3.0 기반 GPU만을 보유한 상황이다.

현재 PCIe 4.0 실제 성능은 SSD를 제외하고 손쉽게 구현하기 어려울 것이다. 그러나 새 표준은 PC에서 더 많은 경로와 더 많은 포트를 지원한다. PCIe4.0 SSD의 혜택을 원한다면 AMD의 라이젠 3000과 새 X570 칩셋이 유일한 수단이다.

PCIe의 설명 자료는 여기서 소개한다(all about PCIe 4.0). 개발 초기 단계인 PCIe5.0과 PCIe6.0이 동시에 존재해 혼란을 준다면, 초기 사양이 실제 하드웨어로 구현되기까지는 시간이 걸린다는 점을 기억하기 바란다. 기본적으로 PCIe 4.0가 현재의 유일한 해법이고, AMD는 이 성과를 자랑할만하다.

가격

아직 가격이 남았다. 인텔의 플래그십 제품인 8코어의 코어 i9-9900K는 488달러인 반면, 더 빠르지는 않더라도 최소한 같다고 주장하는 AMD의 12코어는 499달러에 RGB 쿨러를 더했다.

AMD 라이젠 3000 제품군은 가격으로 인텔 제품을 압박한다. ⓒAMD

쓰레드당 가격은 AMD가 인텔보다 우세하다. 각종 CPU의 쓰레드당 가격 차트를 보면 라이젠 9 3900X는 쓰레드당 21달러이고, 코어 i9-9900K는 31달러로 게임이 되지 않는 지경이다.

ⓒAMD

그러나 쓰레드당 가격, 환상적인 7나노 공정도 성능이 뒷받침되지 않는다면 가치가 없다. 그럼 이제부터 라이젠 9 3900X가 얼마나 빠른지 살펴보자.

테스트 방법

이번 리뷰에는 대표적 CPU 3개를 선택했다. AMD의 2세대 라이젠 7 2700X가 테스트의 기준으로 활용된다. 두 번째는 최고의 경쟁자인 488달러의 인텔의 코어 i9-9900K이다. 마지막은 AMD의 499달러짜리 라이젠 9 3900K이다.

CPU는 나란히 테스트되었다. 라이젠 7 2700X는 MSI X470 게이밍 M7 AC에, 코어 i9-9900K는 아수스 막스무스 XI 히어로에, 라이젠 9 3900X는 MSI X5700 가드라이크에 각각 탑재했다.

그래픽의 경우 초반 CPU와 게임 테스트는 파운더스 에디션 지포스 GTX 1080를 사용하였다. 추가적 게임 테스트에서는 파운더스 에디션 지포스 RTX2080 Ti 카드를 이용하였다.

세 PC 모두 최신 UEFI/BIOS와 드라이버를 이용하고, 윈도우 10 프로페셔널 1903을 새로 설치하였다. 윈도우 버전은 특히 중요하다. AMD가 이제 버전 1903에 스케줄 최적화가 포함되어 라이젠 3000에서 더 효율적으로 쓰레드를 전송할 수 있다고 말했기 때문이다.

기억할 점은 AMD의 CPU는 CPU 코어의 작은 집단과 빠른 속도를 갖도록 구축되지만 CPU 코어 집단 사이의 액세스 속도는 더 느리다는 것이다. 구 버전 윈도우에서 스케줄러는 클러스터 내의 한 집단으로 한 쓰레드를 전송한다. 윈도우는 멀티 다이 설계를 감안하여 설계되지 않았기 때문에 두 번째 쓰레드를 다른 CPU 코어 클러스터로 전송할 것이고 이는 성능을 낮추는 원인이 된다.

단순히 두 쓰레드를 같은 CPU 코어 클러스터로 전송하는 경우가 아니면, 두 코어 클러스터 사이의 교차를 처리해야 하기 때문에 속도가 느려지는 것이다. 이제 이 문제가 해소되었다. 윈도우 1903은 가능한 경우 동일한 CPU 코어 클러스터로 쓰레드를 전송할 것이다. AMD의 주장에 따르면 윈도우의 변화를 통해 최대 15%의 성능 향상을 가져올 수 있다. 다만, 모든 애플리케이션에서 적용되는 것은 아니므로 애플리케이션마다 차이가 있을 것이라고 전했다.

ⓒAMD

세 빌드에서 모두 듀얼 채널 모드의 DDR4를 동일하게 이용했지만, 한 가지 차이를 두었다. 코어i9-9900K와 라이젠 7 2700X는 16GB DDR4/3200 CL 14를 이용했고, 라이젠 9 3900K는 16GB DDR4/3600 CL 15를 이용했다. 라이젠 9를 최적의 메모리 클럭인 3,600MHz로 테스트하고 싶었기 때문이다. 3,200 MHz에서도 역시 테스트할 예정이다. 시간적 제약으로 인해 먼저 DDR4/3600 성능만 제시하고, 시간이 허락하면 DDR4/3200 테스트 결과를 추가로 업데이트할 예정이다. 그러나 AMD가 PCWorld에 밝힌 바에 따르면 DDR4/3200CL14는 DDR4/3600CL15에 비해 성능에서 큰 차이가 없다고 한다.

여기서 다른 변수는 저장 공간이다. 라이젠 7과 코어 i9은 초고속 MLC 기반의 삼성 960 프로 512GB SSD을 사용해 PCIe3의 3세대 속도로 테스트되었다. 라이젠 9 3900X는 PCIe4.0을 지원하는 최초의 CPU이자 플랫폼이다. PCIe4.0은 새 플랫폼의 핵심 기능이므로 CPU의 PCI 레인으로 직접 연결된 2TB의 커세어 MP600 PCIe 4.0 SSD를 이용하였다. 이번에 PCWorld가 실행한 테스트에서 스토리지는 CPU 성능에 영향을 주지 않을 것이다.

커세어 MP600 ⓒAMD

MCE인가, 아닌가?

코어 i9-9900K 리뷰와 마찬가지로 이번에도 ‘다중 코어 강화(Multi-Core Enhancement, MCE)’ 기능을 이용할 것인지를 놓고 의견이 엇갈렸다. MCE는 메인보드 지원 기능으로, 인텔 ‘K’ CPU를 더 높은 클럭 속도로 실행한다. 하지만, 전력 소비도 더 크고 열도 더 많이 발생한다. MCE는 기술적으로 인텔의 표준 규격을 넘긴 ‘오버클럭’으로 간주된다.

그렇다면 이 기능을 끄면 되지 않느냐고 생각할 수 있을 것이다. 그런데 문제는 거의 모든 중급 이상의 인텔 메인보드는 즉시 사용할 수 있도록 MCE가 자동으로 설정되어 있다는 점이다. 이 기능을 끈 상태로 새 CPU를 테스트한 결과는 대부분의 사용자가 경험하게 될 코어 i9-9900K의 진정한 속도와는 거리가 멀 것이다.

켠 상태로 두는 것은 더 난감하다. 왜냐하면 메인보드 업체마다 이 설정을 조금씩 다르게 구현하기 때문이다. MCE가 켜진 상태에서 성능을 정확히 측정할 수 있는 쉬운 방법은 없다.

결국 인텔 CPU에 대해 MCE를 끈 채로 테스트를 했고, AMD의 유사한 정밀 부스트 오버드라이브(Precision Boost Overdrive) 역시 끈 상태로 테스트했다. 다른 기사에서 이 부분을 한층 깊이 있게 다룰 것이다. 그러나 현재까지는 MCE를 끈 채 인텔 CPU를 실행하는 것은 PBO를 끈 채 AMD CPU를 실행하는 것보다 인텔 CPU에 훨씬 불리하다는 점은 유의해야 한다.

그렇다면 이제부터 차트의 세계로 나가도록 하자.

라이젠 9 3900x 3D 모델링 성능

12코어 CPU가 8코어를 쉽게 압도할 것이라는 점은 그다지 놀랍지 않다. ⓒIDG
라이젠 9 3900X의 싱글 쓰레드 성능이 인상적이다. ⓒIDG
시네벤치 R20으로 옮겨가면 라이젠 9 3900X의 싱글 쓰레드 성능이 더 돋보인다. ⓒIDG
라이젠 9 3900X가 인텔 코어 i9를 멀티 쓰레드 성능에서 압도하는 것은 어쩌면 당연하다. ⓒIDG
코로나 모델러 테스트 결과도 8코어보다 12코어 성능이 더 높게 나왔다. ⓒIDG
비슷한 결과다. V레이 넥스트 테스트에서도 다른 모델링 앱과 별반 다르지 않은 결과를 냈다. ⓒIDG
ⓒIDG
놀랍지도 않다. 라이젠 9가 코어 i9을 가지고 노는 수준이다. ⓒIDG
5GHz 클럭이라는 강점을 지닌 코어 i9가 라이젠 9를 싱글 쓰레드로 설정된 POV레이 테스트에서 근소하게 앞섰다. ⓒIDG
H.265 코덱을 활용한 4K 인코딩 작업에서도 라이젠 9 3900X가 월등했다. ⓒ

라이젠 9 3900X 인코딩 성능

라이젠 9 3900X는 H.265 코덱을 사용한 4K 인코딩에서 코어i9를 간단히 앞질렀다. ⓒIDG
시너지 시네스코어 10.4 테스트에서도 라이젠 9의 성능이 코어 i9 칩을 상당히 앞섰다. ⓒIDG
프리미어 CC 2019 작업에서는 코어 i9가 더 우세하다. ⓒIDG
프리미어 HEVC 인코더 프로젝트에서도 코어 i9가 우세했지만 차이는 조금 줄어들었다. ⓒIDG

포토샵 성능 테스트

포토샵 성능에서는 라이젠 9 2900X가 근소하게 앞섰다. ⓒIDG

압축 테스트

압축 테스트 결과. 라이젠 9 3900X와 라이젠 7 2700X의 성능 차가 크다. ⓒIDG
WinRAR결과는 좋게도 나쁘게도 해석할 수 있다. 라이젠 7 2700X 결과에서 보듯, WinRAR는 전통적으로 인텔 CPU와 상성이 좋았는데, 라이젠 9 3900X가 코어 i9와 크게 차이나지 않는 수준의 결과를 냈다. ⓒIDG
7ZIP 압축 테스트에서의 싱글 쓰레드 성능은 코어 i9가 조금 더 앞섰다. ⓒIDG
멀티쓰레드 성능은 라이젠 9가 압도적이었다. ⓒIDG
압축 풀기 테스트는 전통적으로 성능 확인의 정수이자 CPU가 브랜치 오예측을 얼마나 잘 감당하는지와 관련이 있었다.  ⓒIDG​​​​​
7Zip 압축 풀기 테스트에서는 3개 제품이 모두 엇비슷한 성능을 나타냈다. 가장 우수한 것은 코어 i9였다. ⓒIDG

라이젠 9 3900X의 게이밍 성능 테스트

섀도우 오브 툼 레이더는 1,920×1,080 해상도에서 플레이했는데도 GPU에 의한 병목 현상이 나타났다. ⓒIDG
최신 게임을 플레이할 때는 두 제품 모두 빠른 GPU가 필요하다. ⓒIDG
조금 더 오래된 라이즈 오브 더 툼레이더로 옮겨 가면 역시 구형인 지포스 GTX 1080 FE가 병목 현상임을 알 수 있다. ⓒIDG
라이젠 9 3900X가 코어 i9를 앞서지는 못했지만, 차이는 아주 근소하다. ⓒIDG
ⓒIDG
파 크라이 5는 코어 i9가 라이젠 시리즈를 앞선 성능을 보인 게임 중 하나다. ⓒIDG
데우스 엑스 맨카인드 디바이디드 결과. 라이젠 7과 라이젠 9의 차이에서 게임 성능 개선 폭을 짐작할 수 있다.  ⓒIDG
레인보우 식스 시지 결과 ⓒIDG
CPU 포커스드 테스트 결과는 전적으로 CPU 테스트나 다름 없다. 지포스 GTX 1080과 RTX 2080Ti에서의 프레임 차이가 거의 없었기 때문이다.  ⓒIDG

결론

1쓰레드에서 24 쓰레드까지의 시네벤치 테스트로 리뷰를 마치고 싶다. 시네벤치 R20은 3D 모델링 벤치마크로서 게이밍 성능이나 여타 애플리케이션 성능을 예측하지 않는다. 그러나 수많은 게임과 애플리케이션이 현대 CPU의 쓰레드를 모두 활용하는 혜택을 누릴 수는 없다. 그런 면에서 시네벤치 R20이 가치가 있다. CPU를 1개 쓰레드에서 시작해 끝까지 로딩 했을 때의 성능을 살펴볼 수 있기 때문이다.

아래의 차트에서 AMD는 통상적으로 차트 우측에서 두드러진다. 거의 언제나 인텔 칩에 비해 코어 수에서 우세하기 때문이다.

반면 인텔은 통상적으로 우측에서는 패배하지만, 좌측에서는 승리한다. 인텔 칩은 AMD 칩에 비해 클럭 속도와 IPC가 우세하기 때문이다. 인텔의 코어 칩이 강점을 지닌 부분은 기본적으로 여기뿐이다. 대다수 애플리케이션과 게임은 차트의 좌측에 있는 성능에 의존한다. 라이젠 9 3900K와 코어 i9-9900K 사이의 차트를 보면 그 강점은 이제 사라졌다.

시네벤치 r20을 1쓰레드에서 24쓰레드까지 돌리자, 전 구간에서 라이젠 9 3900x의 진정한 강점이 드러났다. ⓒIDG

동일 데이터를 다른 관점으로 보기 위해 성능 우세 정도를 비율로 보여주는 차트를 만들었다. 차트에서 알 수 있듯이 12코어는 8코어를 간단히 압도한다.

이번에도 인텔의 코어 i9에 있어 가장 나쁜 소식은 차트의 좌측에 있다. 여기서도 인텔의 우위가 사라졌다. 두 CPU는 6쓰레드까지 거의 대등하고 이후부터 라이젠 9가 앞서기 시작한다.

라이젠 9는 8쓰레드 이후부터 코어 수로 인텔 코어 i9를 제압했다. ⓒIDG

쓰레드 수가 적은 경우를 봐도 라이젠 9 3900K는 언제나 코어 i9 9900K만큼이나 빠르다. 이는 기본적으로 이제 코어 i9을 사야 할 이유가 거의 없음을 의미한다. 남은 이유도 분명 존재하지만, 고급 CPU를 구입하려는 사용자 10명 중 9명은 라이젠 9 3900X를 선택할 것이 틀림없다. editor@itworld.co.kr


컴퓨텍스 2018에서 소개된 강력한 PC 하드웨어 소개

본 기사는 PCWorld 및 itworld에서 부분 발췌된 내용입니다.

컴퓨텍스 2018에서는 게이밍이 뜨겁다.
PC의 핵심 칩들이 크게 발전하면서 성능을 크게 높였다.

스레드리퍼(Threadripper) 2 인텔의 발표 직후, AMD는 32코어 64스레드 플래그십인 스레드리퍼 2를 소개하면서 코어 전쟁에 불을 붙였다. 새 24코어 CPU도 출시되며 새 칩들은 2세대 라이젠(Ryzen)과 같은 기본 기술에 기초하여 개발되었다. 또한 AMD는 쿨러 마스터와 협력하여 32코어의 온도를 관리할 수 있는 거대한 공냉식 쿨러인 레이스 리퍼(Wraith Ripper)를 제작했다.

AMD를 전격 채용한 에이서 헬리오스(Acer Helios) 500 컴퓨텍스에서 AMD의 기술이 예상치 못한 곳에서 공개되었다. AMD를 전격 채용한 이 모델에는 6코어 12스레드 라이젠 7 2700 데스크톱 프로세서뿐만이 아니라 라데온 베가(Radeon Vega) 56 그래픽이 탑재되어 있으며, 외장 베가 GPU가 탑재된 노트북은 이번이 처음이다. 에이서는 이 노트북에 144Hz 프리싱크 디스플레이를 매치하여 베가의 성능을 최대한 발휘할 수 있도록 했다.

MSI 노트북(치터(Cheater) 모드 적용) MSI는 컴퓨텍스에서 모든 가격 대의 노트북을 선보였다. MSI가 엔비디아 GTX 1050 그래픽을 내장한 프레스티지(Prestige) PS42가 있다. 매우 인상적일 것이며 기록을 달성할 수 있을지 기대된다. 보급형의 경우 MSI GF63은 999달러란 저렴한 가격에 6코어 8세대 인텔 코어 CPU와 GTX 1050이 내장되어 있다.

독특한 에이수스 노트북 에이수스는 컴퓨텍스에서 프로젝트 프리코그 외에도 혁신적인 하드웨어를 선보였다. 또한 기본적으로 트랙패드(Trackpad)를 상황에 따라 PC용 보조 화면으로 변신시키는 “스크린패드(ScreenPad)” 기술이 포함된 젠북 프로(ZenBook Pro) 15의 새로운 버전을 공개했다.

2017년 수치해석 분야에 기대되는 최신 컴퓨터 소식

수치해석을 하는 많은 분들은 대부분 시간과의 전쟁을 치루고 있습니다.
좀 더 빨리, 좀 더 상세한 결과를 얻어야 하기 때문에, 많은 분들이 예산이 허락하는 한 성능 좋은 컴퓨터를 확보하는 것이 최대의 목표가 되고 있습니다.

한 동안 AMD가 인텔의 경쟁자로 존재하면서 두 회사는 선의의 성능 경쟁을 치열하게 전개해 왔는데, AMD가 서서히 경쟁력을 잃고 있다가 최근에 젠 CPU를 통해 다시 경쟁에 불을 지피고 있습니다.
여기에 두 회사의 최신 주력 CPU 의 내용을 기사에서 인용하여 소개합니다.


인텔, 18코어 36스레드 갖춘 코어 i9 칩 발표 “AMD 쓰레드리퍼와 전면전” (기사 출처 : itworld)

인텔이 코어 i9을 무기로 본격적인 AMD와의 전쟁에 돌입했다. 인텔은 30일 대만 컴퓨텍스에서 하이엔드 PC시장에서 AMD의 16코어 32스레드 스레드리퍼(Threadripper)와 경쟁할 18코어 36스레드의 ‘몬스터 마이크로프로세서’를 발표했다.

이 프로세서에는 코어 i9 익스트림 에디션 i9-7980XE라는 이름이 붙었다. 첫 번째 테라플롭(Teraflop) 데스크톱 PC프로세스로 아주 고가이다. 올해 말 출하되는 프로세서의 가격은 1,999달러이다. 한 단계 낮은 코어 i9 제품군 제품들은 가격이 조금 더 저렴하다. 10코어, 12코어, 14코어, 16코어로 구성된 코어 i9 X 시리즈 가격은 999~1,699달러 사이다. 모두 스카이레이크 기반 프로세스이며, 기존 브로드웰-E보다 높은 성능을 제공한다. 인텔에 따르면, 싱글스레드 앱은 15%, 멀티스레드는 10% 빠르다.

인텔은 ‘베이진 폴스(Basin Falls)”라는 코드 네임을 가진 코어 i9 X 시리즈가 너무 비싼 사람들을 위해 3종의 새로운 코어 i7 X 시리즈 칩(339~599달러)과 1종의 쿼드 코어 코어 i5(242달러)도 공개했다. 인텔은 몇 주 이내에 신제품 칩을 출하할 예정이라고 설명했다.

대부분의 코어 i9칩에 터보 부스트 맥스 기술 업데이트(Updated Turbo Boost Max Technology) 3.0이 탑재될 예정이다. 터보 부스트 맥스는 칩이 최고의 코어 2개를 파악하고, 필요할 때 가변적으로 속도를 높여 오버클러킹을 하는 기능이다. 옵테인 메모리도 지원한다. 인텔은 130개 이상의 옵테인 지원 메인보드가 출시될 예정이라고 설명했다.

신제품 165W, 140W, 112W 칩은 역시 새로운 소켓인 R4에 맞춰 설계되어 있다. 2,066핀 LGA 소켓과 호환되는 인텔 칩셋은 X299가 유일하다.

다시 한번, 인텔과 AMD가 제대로 한 판 붙을 전망이다. 둘 중 누가 승리할지 지켜보는 사용자들의 관심도 뜨겁다. 인텔은 코어 i9을 발표하면서 하이엔드 시장에 공격적으로 접근했다. AMD도 스레드리퍼의 10코어, 12코어, 14코어 버전과 가격을 공개할 수밖에 없는 실정이다. 인텔이 먼저 패를 공개했다. 게임은 이제부터가 시작이다.

인텔의 새 코어 i9 칩은 모든 PC관련 제품이 전시되는 종합 전시회로 발전한 컴퓨텍스에서 가장 중요한 발표 중 하나로 꼽혔다. 기대되는 소식은 아직 많이 남아있다. 홍보 담당자에 따르면, 인텔 경영진이 차세대 10nm 칩인 캐논 레이크에 대해 발표할 예정이라고 한다. 기존 케이비 레이크 칩보다 30% 높은 성능을 자랑하는 제품이다.

또, HTC 바이브 VR 헤드셋을 WiGig 기술을 이용해 무선 연결하는 기술에 대해 더 자세한 정보가 발표될 계획이다. 인텔과 HTC는 지난 1월 CES에서 파트너십 체결을 발표했다. 인텔은 또 8월부터 컴퓨트 카드(Compute Card)를 출시한다고 발표할 계획이다.

코어 i9의 속도와 피드
클록 속도가 4GHz를 넘으면서, 제조업체들이 직면한 도전 과제는 추가된 코어를 모두 사용하는 방법을 찾는 것이었다. 앞서 링크된 기사에서 설명했듯, 하나의 프로세스 코어만 집중적으로 사용하는 게임들이 여전히 많다. 인텔은 게임 플레이는 물론, 게임에 이용하지 않는 다른 코어로 트위치나 유튜브 스트리밍을 인코딩하고, 더 나아가 백그라운드에서 음악도 재생할 수 있는 새로운 세대의 ‘스트리머(Streamer)’로 눈길을 돌렸다. 인텔은 이런 동시다발 작업에 ‘메가태스킹’이라는 명칭을 붙였다. 이 회사는 이를 갈수록 증가하는 코어 수에 맞게 ‘수요’를 유지하는 아주 좋은 방법으로 판단하고 있다.

이와 관련, X시리즈 마케팅 매니저인 토니 베라는 “게이머가 콘텐츠 창작자로 변모하는 추세”라고 강조했다.

제품 가격은 자연스럽게 최고 2,000달러로 아주 비싸고, 경제력이 있거나 기업의 후원을 받는 사용자만 최신 코어 i9 제품들을 구입할 수 있을 전망이다. 다음은 제품 별 가격과 코어, 스레드 수를 정리한 내용이다.

Core i9-7980XE: 18코어/ 36스레드, 1,999달러
Core i9-7960X: 16코어/ 32스레드, 1,699달러
Core i9-7940X: 14코어/ 28스레드, 1,399달러
Core i9-7920X: 12코어/ 24스레드, 1,199달러
Core i9-7900X (3.3GHz): 10코어/ 20스레드, 999달러

인텔은 또 한정된 예산에 제약 받는 사용자를 대상으로 3종의 새로운 코어 i7 X 시리즈 칩을 판매할 계획이다.

Core i7 7820X (3.6GHZ), 8코어/ 16스레드, 599달러
Core i7-7800X (3.5GHz), 6코어/ 12스레드, 389달러
Core i7-7740X (4.3GHz), 4코어/ 8스레드, 339달러
케이비 레이크 코어에 맞춰 설계된 i7-7740X를 제외한 모든 칩이 인텔의 ‘스카이레이크-X’에 기반을 두고 있다.

새 칩에서 가장 큰 관심을 끄는 기능은 터보 부스트 맥스 기술 업데이트 3.0이다. 고든 마 웅이 인텔 브로드웰-E 리뷰에서 설명한 것처럼, 터보 부스트 맥스 기술 3.0은 (칩에 따라 차이가 있지만) 최고의 코어를 식별한다. 그리고 CPU 집약적 싱글 스레드 애플리케이션을 이 코어로 연결해 전체 성능을 향상한다.
또, 최고의 코어 2개를 식별하고, 가장 CPU 집약적인 스레드에 할당한다. 더 많은 코어를 더 효과적으로 활용하는 게임과 애플리케이션에 도움을 주는 기능이다. 그러나 이 새로운 기능을 탑재하지 않은 칩도 있다. 새 6코어, 2종의 4코어 X시리즈 칩이 여기에 포함된다.

다음은 속도와 피드를 요약 설명한 표다.

오버클럭이 포인트
인텔은 새 X시리즈에 공냉 쿨러를 추천하지 않는다. 인텔은 165W와 140W의 새 칩이 방출할 열을 효과적으로 냉각시킬 수 있는 TS13X 쿨러를 판매할 예정이다.

TS13X는 PG(Propylene Glycol)을 이용, 열을 73.84-CFM 팬으로 보낸다. 이 팬의 소음은 21~35dBA이고, 회전 속도는 800~2,200rpm이다. 별도 판매될 TS13X의 가격은 85~100달러 사이이다.

인텔은 또 XTU(Extreme Tuning Utility)를 이용, 코어 당 오버클러킹과 전압 조절을 계속 지원할 계획이다. AVX 512 비율 오프셋, 메모리 전압 조절, PEG/DMI 오버클러킹 등 새 기능이 포함되어 있다.
또 ‘성능 튜닝 보증 서비스(Performance tuning protection plan)’를 제공할 계획이다. 이는 오버클로킹 사용자를 위한 일종의 ‘보험’이다. 칩이 고장 날 경우, 1회 교체를 해주는 보증 서비스이며, 두 번째부터는 유료로 진행된다.

데이터 전송 성능을 향상한 새 X299 칩셋
테라플롭급 연산력을 갖춘 PC의 경우, 다른 부품과의 데이터 전송 성능이 아주 중요하다. x299 칩셋은 최신 DMI 3.0을 도입해 SATA 3.0포트와 USB 포트 연결 대역폭을 2배로 증가시킨다. X299 칩셋에는 최대 8개의 SATA 3.0포트, 10개의 USB 3.0 포트가 장착되어 있다. 기존 X99 칩셋의 USB 3.0포트 수는 최대 6개였다.

브로드웰-E X99 칩셋은 8개의 PCIe 레인을 지원했었다. 그러나 X299은 최대 24개의 PCIe 3.0 레인을 지원한다. 고속 PCIe NVM3 드라이브 등 추가 PCIe를 CPU와 연결된 PCI3에 직접 연결할 수 있다. 코어가 10개 이상인 CPU의 경우, 최대 44개의 PCIe 3.0 레인을 이용할 수 있다.

X299는 속도가 빨라진 DDR4-2066을 지원한다. 그러나 어느 정도 RAM 용량을 지원하는지 확실하지 않다. 인텔은 캐시 계층(Cache Hierarchy)을 조정했다. 이를 통해 개별 프로세서 근처에 더 많은 캐시를 배치하는 방법보다 캐시 크기를 더 많이 줄일 수 있다. 인텔은 새로운 캐시의 ‘히트(Hit)’ 레이트가 더 높다고 설명한다. 칩 크기를 줄였지만 캐시 성능을 유지할 수 있었다는 의미이다.

이번 신제품 소식은 코어 i9, 코어 i7 X 시리즈 사용자 모두 크게 기뻐할 기능 및 성능 향상이다. 메인보드와 PC 제조사도 하이엔드 시장에서 수익을 증대하기 위해 코어 i9 제품들을 출시할 것으로 예상된다. 이번 주 컴퓨텍스에서 전해질 더 많은 소식에 사용자들의 관심이 쏠리고 있다. editor@itworld.co.kr


2018년 인텔 6코어 코어 i9 CPU 발표

본 기사는 itworld.co.kr 기사를 인용하였습니다.

아래 기사를 보면 이젠 해석용 컴퓨터도 고성능 노트북으로 가능하게 되어 가는 것 같습니다. ItWorld의 기사를 게재합니다.

인텔의 새로운 6코어 모바일 코어 i9 칩은 가장 빠른 노트북 CPU로, 새로운 코어 i9-8950HK의 기본 클럭 속도는 2.9GHz이며 여기에 “열 속도 가속(Thermal Velocity Boost)”이라는 신기술을 사용해 최대 4.8GHz까지 올라간다. 새로운 언락 8세대 코어 i9를 최상위 제품으로, 그 아래에 5개의 신형 코어 i5와 코어 i7 고성능 모바일 H 시리즈 칩, 그리고 저전력 시스템을 위한 4개의 U 시리즈 코어 칩이 포진한다. 모두 14나노 커피레이크 칩이다. 인텔은 새로운 데스크톱 코어 프로세서 제품군과 노트북 PC 내의 하드 드라이브 성능을 강화하는 옵테인 메모리 내장을 나타내기 위한 브랜드 로고(코어 i7+)도 새로 발표했다.

인텔에 따르면 코어 i9는 7세대 코어 프로세서에 비해 게임 프레임 재생률 기준 최대 41% 더 우수하며, 게임 플레이 스트리밍 및 녹화 성능은 32% 더 빠르다. 인텔은 새로운 코어 i9는 언락 상태로 제공되므로 게임 PC 제조 업계에서 5GHz 시스템도 출시하게 될 것이라고 밝혔다. 옵테인 메모리가 포함되면 성능 향상 폭은 더욱 커진다. 다만 인텔이 성능 비교에 사용한 7세대 시스템에는 SSD가 아닌 느린 기계식 하드 드라이브가 탑재돼 있어 SSD에서의 성능 향상이 어느 정도인지는 정확히 알 수 없다.

인텔 프리미엄 및 게이밍 노트북 부문 총괄 책임자인 프레드릭 햄버거는 “코어 i9는 인텔이 지금까지 발표한 가장 빠른 게이밍 프로세서”라며, “데스크톱에 거의 근접한 성능을 노트북에서 얻을 수 있다”고 강조했다.

새로운 모바일 코어 칩은 인텔이 스펙터 및 멜트다운 취약점을 수정하기 위해 패치한 소프트웨어 완화책을 지원한다(이후 나올 하드웨어 재설계는 적용되지 않는다). 인텔 측은 제시된 성능 수치가 이러한 완화책으로 인한 성능 감소를 반영한 것이라고 밝혔다.

인텔이 출시하는 모든 모바일 프로세스가 그렇듯이, 중요한 점은 가격이다. 인텔은 보통 모바일 칩 가격을 공개하지 않으며, 이번에도 마찬가지다. 다만 새로운 제품군 중에서 코어 i9 칩의 경우 게임 노트북 중에서도 상위 기종에만 들어갈 것으로 보인다. 그 외의 다른 칩은 훨씬 더 폭넓게 보급될 전망이다.

인텔 코어 H 시리즈 CPU

인텔은 현재 폭발적으로 성장 중인 PC 게임 시장을 노골적으로 정조준하고 있다. 햄버거는 인텔 코어 칩을 내장한 일반 판매용 게임 노트북이 전년 대비 45% 성장했다고 말했다.

인텔의 새로운 45W H 시리즈에는 각각 2종의 새로운 코어 i7과 코어 i5 칩 및 신형 제온이 포함된다. 사실 모바일 코어 i9 칩은 제온 E-2186과 상당히 흡사해 보인다. 클럭 속도, 코어 수, 열 설계 전력 등이 동일하다. 그러나 코어 i9의 클럭 속도는 완전히 언락된 상태로 제공된다. 코어 i9의 가격이 너무 부담스럽다면, 동일한 6개의 코어와 12개 쓰레드를 탑재한 새로운 코어 i7-8850H이 있다.

새로 출시되는 칩은 모두 인텔이 노트북을 대상으로 밀고 있는 옵테인 메모리를 지원하며, 기업용 시스템을 위한 vPro 기술이 옵션으로 제공된다.
인텔의 라데온 RX 베가(“케이비레이크-G”) 칩은 울트라북 수준에서 1080p 성능을 제공하도록 설계됐지만, 신형 8세대 코어 i9 칩은 햄버거의 표현대로라면 “머슬북(Musclebook)”에 맞게 설계돼 노트북에서 얻을 수 있는 절대적인 최고의 성능을 제공한다. 햄버거는 “이 칩으로 만족할 수 없다면 어떤 칩으로도 만족하지 못할 것”이라고 덧붙였다.

Intel

인텔은 이번에 처음으로 이른바 “열 속도 가속” 기능을 포함했다. 이 기능은 클럭 속도를 정상보다 더 높여준다. 평상시 코어 i9-8950HK에서 터보 부스트가 활성화된 후 최대 클럭 속도는 4.6GHz다. 그러나 햄버거는 칩의 온도가 충분히 낮은 상태에서 최대 속도로 작동 중이라면, 클럭 속도가 한층 더 올라간다면서 단일 코어를 200MHz 더 높여 4.8GHz로 작동하거나 모든 코어를 약 100MHz 높여 작동하게 된다고 설명했다.

다만 햄버거는 열 속도 가속 기술이 “자동적인 기능이 아닌 기회에 따라 작동하는 기능”이며, 인텔은 시스템 온도 섭씨 50도 이하에서 이 기능이 작동하도록 설계했다고 거듭 강조했다. 햄버거는 “OEM 파트너와 함께 전력 성능을 최적화하고 열 특성을 조정해 성능을 더 끌어올리기 위해 많은 시간을 투자했다”면서 “지금의 추세는 가장 얇게 만들기 위해 성능을 희생하는 게 아니라, 더 오래 지속되는 더 얇은 규격에 더 효율적인 성능을 집어넣는 것”이라고 말했다.

인텔 코어 U 시리즈 CPU

성능은 좀 낮아도 배터리가 오래 가는 제품을 찾는 사용자를 위해 인텔은 새로운 U 시리즈 칩 4종도 함께 출시했다. 28W TDP 저전력 8세대 코어 칩은 모두 4코어 8스레드 구성이 적용되며 모바일 구성의 옵테인 메모리 기술을 지원한다.

Intel

모든 칩은 인텔이 선보인 새로운 300 시리즈 칩셋인 H370, H310, Q370, B360에 연결된다. 또한 인텔 대변인에 따르면 모든 칩은 향상된 오디오 및 I/O, 기가비트 처리량을 갖춘 통합 인텔 802.11ac 와이파이, 10Gbit/s 통합 2세대 USB 3.1 I/O 등 플랫폼 수준에서 더 많은 기능을 제공한다.

게이밍 노트북 판매가 “폭증”하고 시장 성장에 보조를 맞춰 유통업체들도 매장 진열대에서 이런 제품의 비중을 계속 늘리고 있다. 인텔도 투자를 지속할 계획이다. 게이밍 노트북에서 코어 수를 늘리고 5GHz 벽을 돌파하게 되면 인텔은 성능의 한계를 확실히 더 높이게 될 것이다.  editor@itworld.co.kr

원문보기:
http://www.itworld.co.kr/news/108803#csidx218d62dae70faefa8f8cdc4efd8ea92 


AMD 마이크로아키텍처 (기사 출처 : itworld)

AMD 라이젠 3월 2일 출시…코어 i7보다 가격도 성능도 “우세”

Mark Hachman | PCWorld

“40% 성능 향상”이라는 말은 보수적인 자체 평가였다. AMD는 첫 번째 라이젠 프로세서 3가지를 오는 3월 2일 출시할 계획이라고 밝혔다. 인텔 코어 제품군을 능가하는 성능으로 기대를 받고 있는 라이젠 프로세서는 가격도 절반 가까이 저렴하다.

22일 열린 라이젠 출시 행사에서 발표에 나선 AMD 임원들은 인텔 코어 i7을 공략하기 위한 세 가지 데스크톱용 CPU를 공개했다. 신형 라이젠 CPU는 여러 곳의 주요 메인보드 업체와 전문가용 맞춤형 PC 업체가 지원한다. 특히 AMD는 신형 라이젠 프로세서가 더 적은 비용으로 더 높은 성능을 제공한다는 점을 강조했다. 최고 성능 제품인 라이젠 7 1800X는 인텔의 1,000달러짜리 코어 i7-6900K의 절반에도 못 미치는 가격이지만, 성능은 더 뛰어나다.

인텔과 마찬가지로 AMD의 라이젠 프로세서 역시 역시 3가지 제품군으로 구성되어 있는데, 고급형 라이젠 7, 중급형 라이젠 5, 가장 저렴한 보급형 라이젠 3이 그것이다. AMD는 고성능 라이젠 7부터 먼저 출시하는데, 1800X(499달러), 1700X(399달러), 1700(329달러)의 세 가지 모델이다. 라이젠 5와 라이젠 3은 올해 하반기에 출시할 예정인데, 구체적인 출시 일정은 밝히지 않았다.

이번 행사 직전까지 공개되지 않은 라이젠 관련 정보는 가격과 정확한 출시일이었다. 애널리스트들은 AMD가 그간의 실책을 모두 개선한 것 같다고 평가했으며, 인텔은 자칫 기반이 되는 PC용 마이크로프로세서 시장의 점유율을 잃을 수 있는 위험에 처했다. 물론 인텔도 대응책은 있다. 가격 인하도 그중 하나일 가능성이 있고, 더 많은 코어를 가진 신제품이나 옵테인 기술을 적극 내세우는 것도 방법이 될 수 있다.

인텔이 지난 1월 케이비 레이크 칩 40가지를 대대적으로 출시한 것과는 달리 AMD는 서두르지 않고 있다. 이번에 출시된 라이젠 7 칩의 세부 사양을 살펴보자.

Mark Hachman

라이젠 7 1800X. 95와트 8코어 16쓰레드 프로세서로, 기본 클럭 속도는 3.6GHz, 부스트 모드에서는 4GHz로 동작한다. 499달러 1800X의 대응 제품은 8코어 인텔 코어 i7-6900K로 무려 1,089달러짜리이다. AMD에 따르면, 1800X는 시네벤치 상에서 단일 쓰레드 점수가 162로 동점을 기록했다. 하지만 코어를 모두 구동하자 1,601점으로 6900K보다 9% 높은 점수를 기록했다.

라이젠 7 1700X. 95와트 8코어 16쓰레드 프로세서로, 기본 클럭 속도는 3.4GHz, 부스트 모드에서는 3.8GHz로 동작한다. AMD에 따르면, 399달러 1700X는 시네벤치 멀티코어 벤치마크 테스트에서 1,537점을 기록해 6900K보다 4% 높은 성능을 보였다.

라이젠 7 1700. 655와트 8코어 16쓰레드 프로세서로, 기본 클럭 속도는 3GHz, 부스트 모드에서는 3.7GHz로 동작한다. AMD에 따르면, 1700은 시네벤치 멀티코어 테스트에서 1,410점으로 339달러짜리 코어 i7 7700K보다 46% 더 높은 성능을 기록했다. 핸드브레이크 비디오 인코딩 테스트에서는 1700은 61.8초를, 7700K는 71.8초를 기록했다.

Mark Hachman

AMD에 따르면 라이젠 7 1700은 신형 레이스 스파이어(Wraith Spire) 쿨러를 기본 쿨러로 제공해 소음이 32데시벨에 불과하다.

라이젠의 눈에 띄는 성능 향상에는 설계팀의 역할이 컸다. AMD는 자사의 목표 중 하나가 젠 아키텍처의 클럭당 명령어 처리수(IPC, instructions per clock)를 40% 늘리는 것이라고 밝힌 바 있다. 그리고 실제로 AMD는 IPC를 52% 향상했다. CEO 리사 수는 “단지 목표를 맞춘 것이 아니라 크게 초과 달성했다”라고 강조했다. editor@itworld.co.kr

원문보기:
http://www.itworld.co.kr/news/103594#csidx36e903474b838daa0638fbf87957a25


CFD 업무에 종사하는 사람들은 빠른 컴퓨터는 갖고 싶은 품목1위가 아닐까 싶습니다.
최근에는 소위 슈퍼컴퓨터라 불릴만한 성능을 가진 데스크탑 CPU 의 발전이 놀라운데, 이번에 AMD에서 발표한 CPU도 놀라울 정도의 가벽 대비 성능을 자랑하는 CPU를 발표하였습니다.
저렴한 비용으로 책상위의 슈퍼컴을 장만할 수 있는 기회가 오고 있는 것 같습니다.
아래 ITWOLD에서 2018.08.07에 게재한 기사를 인용 소개합니다.

AMD 32코어 쓰레드리퍼, 코어수와 가격으로 인텔에 정면 승부

Gordon Mah Ung | PCWorld
자료출처 : 본 기사는 ITWORLD의 기사를 인용게재한 내용입니다. (원문보기)
AMD가 2세대 라이젠 쓰레드리퍼(Ryzen Threadrippers, 또는 쓰레드리퍼 2)를 공식 발표했다. 코어수도 놀랍지만 가격이 인텔을 정조준하고 있다.

2세대 라이젠 쓰레드리퍼 2990WX는 32코어 64쓰레드로, 권장 가격은 1,799달러(뉴에그나 아마존 예약 주문 가격)이다. 물론 엄청난 가격이지만, 인텔의 최상위 제품과 비교하면 상당히 저렴하다. 지난 해 출시된 인텔의 코어 i9-7980XE는 18코어 제품이지만 가격은 2,000달러이다.

쓰레드당 가격으로 따지면, 인텔의 코어 i9-7980XE는 약 55달러인데 반해 쓰레드리퍼 2는 약 28달러에 불과하다.

IDG
마치 대형 할인판매점과 같다. 쓰레드가 많을수록, 쓰레드당 가격은 떨어진다.

32코어 2990WX는 주력 제품이며, AMD는 다음과 같은 다양한 쓰레드리퍼 제품을 발표했다.

– 2세대 라이젠 쓰레드리퍼 2920X, 12코어 24쓰레드, 기본 클럭속도 3.5GHz, 부스트 클럭속도 4.3GHz, 가격 649달러.
– 2세대 라이젠 쓰레드리퍼 2950X, 16코어 32쓰레드, 기본 클럭속도 3.5GHz, 부스트 클럭속도 4.4GHz, 가격 899달러.
– 2세대 라이젠 쓰레드리퍼 2970WX, 24코어 48쓰레드, 기본 클럭속도 3.0GHz, 부스트 클럭속도 4.2GHz, 가격 1,299달러.
– 2세대 라이젠 쓰레드리퍼 2990WX, 32코어 64쓰레드, 기본 클럭속도 3.0GHz, 부스트 클럭속도 4.2GHz, 가격 1,799달러.

32코어 쓰레드리퍼 2990WX는 현재 예약 주문이 가능하며, 정식 출하일은 8월 13일로 예상된다. 16코어 2950X의 출시일은 8월 31일이며, 나머지 24코어, 12코어 제품은 10월에 출시된다.

2세대 쓰레드리퍼는 모두 AMD가 올해 초 2세대 라이젠 칩과 함께 내놓은 향상된 12나노 젠+ 아키텍처를 기반으로 한다. 또한 모든 CPU는 기존 X399 메인보드와 호환되며, 구형 CPU 없이도 BIOS 업데이트를 지원한다.

신형 CPU는 1세대 제품과 비교해 확연한 성능 향상을 제공하며, 동급 인텔 제품과의 비교를 불허한다. AMD는 32코어 쓰레드리퍼 2990WX가 시네벤치 R15를 기준으로 인텔의 18코어 코어 i9-7980XE보다 50% 더 빠르다고 밝혔다. POV-Ray 같은 다른 멀티쓰레드 기반 테스트에서도 47% 앞섰다.

모델명에 추가된 W
사실 AMD가 일부 2세대 쓰레드리퍼의 모델명에 W를 추가한 것도 이 때문이다. AMD는 많은 애플리케이션과 게임이 쓰레드나 코어수보다는 더 높은 클럭속도를 선호한다며, W가 없는 두 모델은 바로 이런 사용자를 위한 것이라고 설명했다.

24코어와 32코어 제품의 모델명에 WX를 붙인 것은 이들 CPU가 창작자나 혁신가를 정조준하고 있음을 나타내기 위한 것이다. 즉 W가 추가된 모델은 픽셀이나 프레임, 그리고 광선을 극한까지 추구하는 사람들을 위한 것으로, 이들은 가능한 많은 코어와 쓰레드를 필요로 한다.

주요 이정표
일반 소비자용 CPU에 32코어를 도입하면서 CPU 전쟁은 새로운 전기를 맞이한다. 불과 2년 전, 인텔은 10코어 코어 i7-6950X를 무려 1,723달러에 출시했는데, 지금은 32코어 CPU가 1,799달러에 나왔다.

IDG
날로 치열해지는 코어 전쟁

조만간 나올 인텔의 대응 기대
물론 인텔이 한가로이 앉아 레모네이드나 홀짝거리는 것은 아니지만, 경쟁은 치열하다. AMD가 지난 컴퓨텍스에서 32코어 괴물을 공개하기 하루 전날, 인텔은 28코어에 클럭속도 5GHz짜리 괴물을 소개했다. 이 제품은 올해말 출시될 것으로 예상된다.

인텔의 문제는 이 CPU의 시연을 솔직하게 보여주지 않은 것이다. 인텔 임원은 28코어 CPU가 5GHz로 동작한다고 밝혔지만, 이를 위해 산업용 수랭 시스템을 사용했는지를 밝히지 않았다. 나중에 인텔은 시연이란 것이 언제나 그렇듯이 오버클러킹 시연처럼 가능성을 확인하기 위한 것이라고 설명했다.

이런 논란과 관계없이 AMD 쓰레드리퍼 2990WX는 몇 개월 먼저 출시된 상태이다. 더구나 인텔이 28코어 CPU를 어떤가격에 판매해야 AMD의 신작과 경쟁할 수 있을지도 의문이다. 기업 사용자와의 형평성이 걸림돌이 되는데, 현재 28코어 제온 플래티넘 8176의 가격은 8,719달러이다.

기존 워크스테이션 고객을 걱정할 필요가 없는 AMD는 다시 한 번 가격 파괴 전략을 펼치고있다. 이런 식으로 AMD는 인텔과 코어와 가격으로 정면 대결하기를 원하지만, 인텔은 이런 직접 대결을 최대한 피하고자 한다.  editor@itworld.co.kr

CFD 업무에 종사하는 사람들에게 희소식인 최신 컴퓨터 CPU 소식

CFD 업무에 종사하는 사람들은 빠른 컴퓨터는 갖고 싶은 품목1위가 아닐까 싶습니다.
최근에는 소위 슈퍼컴퓨터라 불릴만한 성능을 가진 데스크탑 CPU 의 발전이 놀라운데, 이번에 AMD에서 발표한 CPU도 놀라울 정도의 가벽 대비 성능을 자랑하는 CPU를 발표하였습니다.
저렴한 비용으로 책상위의 슈퍼컴을 장만할 수 있는 기회가 오고 있는 것 같습니다.
아레에 ITWOLD에서 게재한 기사를 인용 소개합니다.

AMD 32코어 쓰레드리퍼, 코어수와 가격으로 인텔에 정면 승부

Gordon Mah Ung | PCWorld
자료출처 : 본 기사는 ITWORLD의 기사를 인용게재한 내용입니다. (http://www.itworld.co.kr/insight/110307)
AMD가 2세대 라이젠 쓰레드리퍼(Ryzen Threadrippers, 또는 쓰레드리퍼 2)를 공식 발표했다. 코어수도 놀랍지만 가격이 인텔을 정조준하고 있다.

2세대 라이젠 쓰레드리퍼 2990WX는 32코어 64쓰레드로, 권장 가격은 1,799달러(뉴에그나 아마존 예약 주문 가격)이다. 물론 엄청난 가격이지만, 인텔의 최상위 제품과 비교하면 상당히 저렴하다. 지난 해 출시된 인텔의 코어 i9-7980XE는 18코어 제품이지만 가격은 2,000달러이다.

쓰레드당 가격으로 따지면, 인텔의 코어 i9-7980XE는 약 55달러인데 반해 쓰레드리퍼 2는 약 28달러에 불과하다.

IDG
마치 대형 할인판매점과 같다. 쓰레드가 많을수록, 쓰레드당 가격은 떨어진다.

32코어 2990WX는 주력 제품이며, AMD는 다음과 같은 다양한 쓰레드리퍼 제품을 발표했다.

– 2세대 라이젠 쓰레드리퍼 2920X, 12코어 24쓰레드, 기본 클럭속도 3.5GHz, 부스트 클럭속도 4.3GHz, 가격 649달러.
– 2세대 라이젠 쓰레드리퍼 2950X, 16코어 32쓰레드, 기본 클럭속도 3.5GHz, 부스트 클럭속도 4.4GHz, 가격 899달러.
– 2세대 라이젠 쓰레드리퍼 2970WX, 24코어 48쓰레드, 기본 클럭속도 3.0GHz, 부스트 클럭속도 4.2GHz, 가격 1,299달러.
– 2세대 라이젠 쓰레드리퍼 2990WX, 32코어 64쓰레드, 기본 클럭속도 3.0GHz, 부스트 클럭속도 4.2GHz, 가격 1,799달러.

32코어 쓰레드리퍼 2990WX는 현재 예약 주문이 가능하며, 정식 출하일은 8월 13일로 예상된다. 16코어 2950X의 출시일은 8월 31일이며, 나머지 24코어, 12코어 제품은 10월에 출시된다.

2세대 쓰레드리퍼는 모두 AMD가 올해 초 2세대 라이젠 칩과 함께 내놓은 향상된 12나노 젠+ 아키텍처를 기반으로 한다. 또한 모든 CPU는 기존 X399 메인보드와 호환되며, 구형 CPU 없이도 BIOS 업데이트를 지원한다.

신형 CPU는 1세대 제품과 비교해 확연한 성능 향상을 제공하며, 동급 인텔 제품과의 비교를 불허한다. AMD는 32코어 쓰레드리퍼 2990WX가 시네벤치 R15를 기준으로 인텔의 18코어 코어 i9-7980XE보다 50% 더 빠르다고 밝혔다. POV-Ray 같은 다른 멀티쓰레드 기반 테스트에서도 47% 앞섰다.

모델명에 추가된 W
사실 AMD가 일부 2세대 쓰레드리퍼의 모델명에 W를 추가한 것도 이 때문이다. AMD는 많은 애플리케이션과 게임이 쓰레드나 코어수보다는 더 높은 클럭속도를 선호한다며, W가 없는 두 모델은 바로 이런 사용자를 위한 것이라고 설명했다.

24코어와 32코어 제품의 모델명에 WX를 붙인 것은 이들 CPU가 창작자나 혁신가를 정조준하고 있음을 나타내기 위한 것이다. 즉 W가 추가된 모델은 픽셀이나 프레임, 그리고 광선을 극한까지 추구하는 사람들을 위한 것으로, 이들은 가능한 많은 코어와 쓰레드를 필요로 한다.

주요 이정표
일반 소비자용 CPU에 32코어를 도입하면서 CPU 전쟁은 새로운 전기를 맞이한다. 불과 2년 전, 인텔은 10코어 코어 i7-6950X를 무려 1,723달러에 출시했는데, 지금은 32코어 CPU가 1,799달러에 나왔다.

IDG
날로 치열해지는 코어 전쟁

조만간 나올 인텔의 대응 기대
물론 인텔이 한가로이 앉아 레모네이드나 홀짝거리는 것은 아니지만, 경쟁은 치열하다. AMD가 지난 컴퓨텍스에서 32코어 괴물을 공개하기 하루 전날, 인텔은 28코어에 클럭속도 5GHz짜리 괴물을 소개했다. 이 제품은 올해말 출시될 것으로 예상된다.

인텔의 문제는 이 CPU의 시연을 솔직하게 보여주지 않은 것이다. 인텔 임원은 28코어 CPU가 5GHz로 동작한다고 밝혔지만, 이를 위해 산업용 수랭 시스템을 사용했는지를 밝히지 않았다. 나중에 인텔은 시연이란 것이 언제나 그렇듯이 오버클러킹 시연처럼 가능성을 확인하기 위한 것이라고 설명했다.

이런 논란과 관계없이 AMD 쓰레드리퍼 2990WX는 몇 개월 먼저 출시된 상태이다. 더구나 인텔이 28코어 CPU를 어떤가격에 판매해야 AMD의 신작과 경쟁할 수 있을지도 의문이다. 기업 사용자와의 형평성이 걸림돌이 되는데, 현재 28코어 제온 플래티넘 8176의 가격은 8,719달러이다.

기존 워크스테이션 고객을 걱정할 필요가 없는 AMD는 다시 한 번 가격 파괴 전략을 펼치고 있다. 이런 식으로 AMD는 인텔과 코어와 가격으로 정면 대결하기를 원하지만, 인텔은 이런 직접 대결을 최대한 피하고자 한다.  editor@itworld.co.kr

FLOW-3D 해석용 컴퓨터 안내 – 2018년 2분기 업데이트

FLOW-3D 수치해석용 컴퓨터 선택 가이드

수치해석을 하는 엔지니어들은 사용하는 컴퓨터의 성능에 무척 민감합니다. 그 이유는 수치해석을 하기 위해 여러 준비단계와 분석 시간들이 필요하지만 당연히 압도적으로 시간을 소모하는 것이 계산 시간이기 때문일 것입니다.

따라서 수치해석용 컴퓨터의 선정을 위해서 단위 시간당 시스템이 처리하는 작업의 수나 처리량, 응답시간, 평균 대기 시간 등의 요소를 복합적으로 검토하여 결정하게 됩니다.

또한 수치해석에 적합한 성능을 가진 컴퓨터를 선별하는 방법으로 CPU 계산 처리속도인 Flops/sec 성능도 중요하지만 수치해석을 수행할 때 방대한 계산 결과를 디스크에 저장하고, 해석결과를 분석할 때는 그래픽 성능도 크게 좌우하기 때문에 SSD 디스크와 그래픽카드에도 관심을 가져야 합니다.

현재 고성능컴퓨터는 장기적인 전망으로 보는 Quantum Computing, DNA-based Computing, Optical Computing 등의 미래의 컴퓨팅 기술과 단기적인 고성능 컴퓨터 기술인  Symmetric -Multi Processing 기술과 MPP(Massively Pallel Processing)기술이 일반화되고 있습니다. (아래 그림 참조)

일반적으로 슈퍼컴퓨터로 불리는 고성능 HPC는 규모가 큰 운영관리시설과 전문인력이 필요하고 매우 고가이기 때문에, 실제 업무를 수행하는 대부분의 기업이나 기관에서는 단일 SMP 컴퓨터를 많이 사용하고 있습니다.

FLOW-3D에 적합한 일반적인 최소 권장사양은 아래 사양을 참고하시면 됩니다.

다만, 가능하면 최신 CPU의 고성능, 저전력 등 최신기술이 반영된 제품을 선택하는 것은 언제나 투자비와 연관되어 있기 때문에 항상 고민의 대상인 것은 틀림없는것 같습니다.

1) Processors

– FLOW-3D는  x86-64 (Intel/AMD) 프로세스를 지원합니다.

CPU는 전반적인 성능에 큰 영향을 미치며, 대부분의 경우 컴퓨터의 가장 중요한 구성 요소입니다. 그러나 데스크탑 프로세서를 구입할 때가되면 인텔과 AMD의 모델 번호와 사양이 어려워 보일 것입니다.
그리고, CPU 성능을 평가하는 방법에 의해 가장 좋은 CPU를 고른다고 해도 보드와, 메모리, 주변 Chip 등 여러가지 조건에 의해 성능이 달라질 수 있기 때문에 성능평가 결과를 기준으로 시스템을 구입할 경우, 단일 CPU나 부품으로 순위가 정해진 자료보다는 시스템 전체를 대상으로 평가한 순위표를 보고 선정하는 지혜가 필요합니다.

부동소숫점 계산을 하는 수치해석과 밀접한 Computer의 연산 성능 벤치마크 방법은 대표적으로 널리 사용되는 아래와 같은 방법이 있습니다.

2) Operating Systems
  • 64-bit Windows 7, Windows 8, Windows 8.1, Windows 10, Windows Server 2008, and Windows Server 2012
  • 64-bit Red Hat Enterprise Linux 6, Red Hat Enterprise Linux 7 and SUSE 11*

Windows 및 Linux에 대한 시뮬레이션 시간은 대등합니다. 사용자가 사용하기 편리한 운영 체제를 선택하면 됩니다.

3) Graphics Support
FLOW-3D는 OpenGL 드라이버가 만족스럽게 수행되는 최신 그래픽 카드가 필요합니다. 최소한 OpenGL 3.0을 지원하는 것이 좋습니다. FlowSight는 DirectX 11 이상을 지원하는 그래픽 카드에서 가장 잘 작동합니다. 권장 옵션은 엔비디아의 쿼드로 K 시리즈와 AMD의 파이어 프로 W 시리즈입니다. 엔비디아의 GTX 게이밍 하드웨어는 볼륨 렌더링의 속도가 느리거나 오동작 등 몇 가지 제한 사항이 있습니다. 일반적으로 노트북에 내장된 통합 그래픽 카드보다는 개별 그래픽 카드를 강력하게 추천합니다. 최소한 그래픽 메모리는 512MB 이상을 권장합니다.
4) Memory and Processor Speed

프로세서 코어 당 최소 2GB의 RAM을 권장합니다. 예를 들어, 두 개의 6 코어 CPU가 있을 경우 워크스테이션의 메모리는 최소 24 GB가 있어야합니다. 필요한 RAM의 양은 해석 대상 문제에 매우 의존적입니다. 큰 도메인 또는 복잡한 형상에서 좋은 해상도를 원하는 시뮬레이션은 필요한 최소한 RAM보다 훨씬 더 많은 RAM이 필요합니다. 메모리 속도는 시뮬레이션 시간에 영향을 적게 받지만 통상적으로 1333MHz 또는 1600 MHz이면 충분합니다.

5) HDD

수치해석은 해석결과 데이터 양이 매우 크기 때문에 읽고 쓰는데 속도면에서 매우 빠른 SSD를 적용하면 성능면에서 큰 도움이 됩니다. 다만 SSD 가격이 비싸서 가성비 측면을 고려하여 적정수준에서 결정이 필요합니다.
그리고 SSD를 선택할 경우에도 SSD 종류 중에서 PCI Express 타입은 매우 빠르지만 가격 또한 매우 고가이므로 예산 범위내에서 선택을 고민해야 합니다.

기존의 물리적인 하드 디스크의 경우, 디스크에 기록된 데이터를 읽기 위해서는 데이터를 읽어내는 헤드(바늘)가 물리적으로 데이터가 기록된 위치까지 이동해야 하므로 이동에 일정한 시간이 소요됩니다. (이러한 시간을 지연시간, 혹은 레이턴시 등으로 부름) 따라서 하드 디스크의 경우 데이터를 읽기 위한 요청이 주어진 뒤에 데이터를 실제로 읽기 까지 일정한 시간이 소요되는데, 이 시간을 일정한 한계(약 10ms)이하로 줄이는 것이 불가능에 가까우며, 데이터가 플래터에 실제 기록된 위치에 따라서 이러한 데이터에의 접근시간 역시 차이가 나게 됩니다.

하지만 HDD의 최대 강점은 가격대비 용량입니다. 현재 상용화되어 판매하는 대용량 HDD는 12TB ~ 15TB가 공급되고 있으며, 이는 데이터 저장이나 백업용으로 가장 좋은 선택이 됩니다.
결론적으로 데이터를 직접 읽고 쓰는 드라이브는 SSD를 사용하고 보관하는 용도의 드라이브는 기존의 HDD를 사용하는 방법이 효과적인 선택이 될 수 있습니다.

컴퓨텍스 2018에서 소개된 강력한 PC 하드웨어 소개

고성능 컴퓨팅(HPC)

고성능 컴퓨팅(HPC)는 과학, 공학 또는 거대한 비지니스 요구 사항들을 해결하기 위해 일반적인 데스크탑 컴퓨터나 워크스테이션보다 훨씬 더 높은 성능을 발휘하도록 컴퓨팅 파워를 결합하는 것을 의미합니다.
시뮬레이션이나 분석과 같은 HPC 워크로드는 계산, 메모리 사용 및 데이터 관리가 매우 중요합니다.
클러스터나 슈퍼컴퓨터라고도 불리는 일반적인 HPC 시스템은 고속의 네트워크에 연결된 다수의 서버를 이용한 확장을 통해 여러 애플리케이션들을 병렬 실행하도록 설계됩니다.
HPC 시스템에는 관련 소프트웨어, 도구, 구성요소, 스토리지 및 서비스가 포함된 경우가 많습니다.

고성능 컴퓨팅은 일반적으로

– 100Gbps의 초고속 네트워킹
– 확장 가능한 고성능 스토리지
– 고성능 컴퓨팅 소프트웨어 스텍 (최근에는 거의 Linux가 대세로 자리 잡음)
– 에너지 효율성
– GPU 가속지원

등이 핵심 성능지표로 개발됩니다.

HPC와는 스케일 규모면에서는 차이가 많지만 단일 컴퓨팅 기반에서 뛰어난 성능을 발휘하는 고성능 PC 하드웨어를 중심으로  전세계의 최신 컴퓨터 기술을 소개하는 컴퓨덱스에서 발표된 2018년  PC 기반 하드웨어 소개의 일부 기사를 소개합니다.

컴퓨텍스 2018에서 소개된 강력한 PC 하드웨어 소개

본 기사는 PCWorld 및 itworld에서 부분 발췌된 내용입니다.

컴퓨텍스 2018에서는 게이밍이 뜨겁다.
PC의 핵심 칩들이 크게 발전하면서 성능을 크게 높였다.

스레드리퍼(Threadripper) 2 인텔의 발표 직후, AMD는 32코어 64스레드 플래그십인 스레드리퍼 2를 소개하면서 코어 전쟁에 불을 붙였다. 새 24코어 CPU도 출시되며 새 칩들은 2세대 라이젠(Ryzen)과 같은 기본 기술에 기초하여 개발되었다. 또한 AMD는 쿨러 마스터와 협력하여 32코어의 온도를 관리할 수 있는 거대한 공냉식 쿨러인 레이스 리퍼(Wraith Ripper)를 제작했다.

AMD를 전격 채용한 에이서 헬리오스(Acer Helios) 500 컴퓨텍스에서 AMD의 기술이 예상치 못한 곳에서 공개되었다. AMD를 전격 채용한 이 모델에는 6코어 12스레드 라이젠 7 2700 데스크톱 프로세서뿐만이 아니라 라데온 베가(Radeon Vega) 56 그래픽이 탑재되어 있으며, 외장 베가 GPU가 탑재된 노트북은 이번이 처음이다. 에이서는 이 노트북에 144Hz 프리싱크 디스플레이를 매치하여 베가의 성능을 최대한 발휘할 수 있도록 했다.

MSI 노트북(치터(Cheater) 모드 적용) MSI는 컴퓨텍스에서 모든 가격 대의 노트북을 선보였다. MSI가 엔비디아 GTX 1050 그래픽을 내장한 프레스티지(Prestige) PS42가 있다. 매우 인상적일 것이며 기록을 달성할 수 있을지 기대된다. 보급형의 경우 MSI GF63은 999달러란 저렴한 가격에 6코어 8세대 인텔 코어 CPU와 GTX 1050이 내장되어 있다.

독특한 에이수스 노트북 에이수스는 컴퓨텍스에서 프로젝트 프리코그 외에도 혁신적인 하드웨어를 선보였다. 또한 기본적으로 트랙패드(Trackpad)를 상황에 따라 PC용 보조 화면으로 변신시키는 “스크린패드(ScreenPad)” 기술이 포함된 젠북 프로(ZenBook Pro) 15의 새로운 버전을 공개했다.

 

2017년 수치해석 분야에 기대되는 최신 컴퓨터 소식

수치해석을 하는 많은 분들은 대부분 시간과의 전쟁을 치루고 있습니다.
좀 더 빨리, 좀 더 상세한 결과를 얻어야 하기 때문에, 많은 분들이 예산이 허락하는 한 성능 좋은 컴퓨터를 확보하는 것이 최대의 목표가 되고 있습니다.

한 동안 AMD가 인텔의 경쟁자로 존재하면서 두 회사는 선의의 성능 경쟁을 치열하게 전개해 왔는데, AMD가 서서히 경쟁력을 잃고 있다가 최근에 젠 CPU를 통해 다시 경쟁에 불을 지피고 있습니다.
여기에 두 회사의 최신 주력 CPU 의 내용을 기사에서 인용하여 소개합니다.


인텔, 18코어 36스레드 갖춘 코어 i9 칩 발표 “AMD 쓰레드리퍼와 전면전” (기사 출처 : itworld)

인텔이 코어 i9을 무기로 본격적인 AMD와의 전쟁에 돌입했다. 인텔은 30일 대만 컴퓨텍스에서 하이엔드 PC시장에서 AMD의 16코어 32스레드 스레드리퍼(Threadripper)와 경쟁할 18코어 36스레드의 ‘몬스터 마이크로프로세서’를 발표했다.

이 프로세서에는 코어 i9 익스트림 에디션 i9-7980XE라는 이름이 붙었다. 첫 번째 테라플롭(Teraflop) 데스크톱 PC프로세스로 아주 고가이다. 올해 말 출하되는 프로세서의 가격은 1,999달러이다. 한 단계 낮은 코어 i9 제품군 제품들은 가격이 조금 더 저렴하다. 10코어, 12코어, 14코어, 16코어로 구성된 코어 i9 X 시리즈 가격은 999~1,699달러 사이다. 모두 스카이레이크 기반 프로세스이며, 기존 브로드웰-E보다 높은 성능을 제공한다. 인텔에 따르면, 싱글스레드 앱은 15%, 멀티스레드는 10% 빠르다.

인텔은 ‘베이진 폴스(Basin Falls)”라는 코드 네임을 가진 코어 i9 X 시리즈가 너무 비싼 사람들을 위해 3종의 새로운 코어 i7 X 시리즈 칩(339~599달러)과 1종의 쿼드 코어 코어 i5(242달러)도 공개했다. 인텔은 몇 주 이내에 신제품 칩을 출하할 예정이라고 설명했다.

대부분의 코어 i9칩에 터보 부스트 맥스 기술 업데이트(Updated Turbo Boost Max Technology) 3.0이 탑재될 예정이다. 터보 부스트 맥스는 칩이 최고의 코어 2개를 파악하고, 필요할 때 가변적으로 속도를 높여 오버클러킹을 하는 기능이다. 옵테인 메모리도 지원한다. 인텔은 130개 이상의 옵테인 지원 메인보드가 출시될 예정이라고 설명했다.

신제품 165W, 140W, 112W 칩은 역시 새로운 소켓인 R4에 맞춰 설계되어 있다. 2,066핀 LGA 소켓과 호환되는 인텔 칩셋은 X299가 유일하다.

다시 한번, 인텔과 AMD가 제대로 한 판 붙을 전망이다. 둘 중 누가 승리할지 지켜보는 사용자들의 관심도 뜨겁다. 인텔은 코어 i9을 발표하면서 하이엔드 시장에 공격적으로 접근했다. AMD도 스레드리퍼의 10코어, 12코어, 14코어 버전과 가격을 공개할 수밖에 없는 실정이다. 인텔이 먼저 패를 공개했다. 게임은 이제부터가 시작이다.

인텔의 새 코어 i9 칩은 모든 PC관련 제품이 전시되는 종합 전시회로 발전한 컴퓨텍스에서 가장 중요한 발표 중 하나로 꼽혔다. 기대되는 소식은 아직 많이 남아있다. 홍보 담당자에 따르면, 인텔 경영진이 차세대 10nm 칩인 캐논 레이크에 대해 발표할 예정이라고 한다. 기존 케이비 레이크 칩보다 30% 높은 성능을 자랑하는 제품이다.

또, HTC 바이브 VR 헤드셋을 WiGig 기술을 이용해 무선 연결하는 기술에 대해 더 자세한 정보가 발표될 계획이다. 인텔과 HTC는 지난 1월 CES에서 파트너십 체결을 발표했다. 인텔은 또 8월부터 컴퓨트 카드(Compute Card)를 출시한다고 발표할 계획이다.

코어 i9의 속도와 피드
클록 속도가 4GHz를 넘으면서, 제조업체들이 직면한 도전 과제는 추가된 코어를 모두 사용하는 방법을 찾는 것이었다. 앞서 링크된 기사에서 설명했듯, 하나의 프로세스 코어만 집중적으로 사용하는 게임들이 여전히 많다. 인텔은 게임 플레이는 물론, 게임에 이용하지 않는 다른 코어로 트위치나 유튜브 스트리밍을 인코딩하고, 더 나아가 백그라운드에서 음악도 재생할 수 있는 새로운 세대의 ‘스트리머(Streamer)’로 눈길을 돌렸다. 인텔은 이런 동시다발 작업에 ‘메가태스킹’이라는 명칭을 붙였다. 이 회사는 이를 갈수록 증가하는 코어 수에 맞게 ‘수요’를 유지하는 아주 좋은 방법으로 판단하고 있다.

이와 관련, X시리즈 마케팅 매니저인 토니 베라는 “게이머가 콘텐츠 창작자로 변모하는 추세”라고 강조했다.

제품 가격은 자연스럽게 최고 2,000달러로 아주 비싸고, 경제력이 있거나 기업의 후원을 받는 사용자만 최신 코어 i9 제품들을 구입할 수 있을 전망이다. 다음은 제품 별 가격과 코어, 스레드 수를 정리한 내용이다.

Core i9-7980XE: 18코어/ 36스레드, 1,999달러
Core i9-7960X: 16코어/ 32스레드, 1,699달러
Core i9-7940X: 14코어/ 28스레드, 1,399달러
Core i9-7920X: 12코어/ 24스레드, 1,199달러
Core i9-7900X (3.3GHz): 10코어/ 20스레드, 999달러

인텔은 또 한정된 예산에 제약 받는 사용자를 대상으로 3종의 새로운 코어 i7 X 시리즈 칩을 판매할 계획이다.

Core i7 7820X (3.6GHZ), 8코어/ 16스레드, 599달러
Core i7-7800X (3.5GHz), 6코어/ 12스레드, 389달러
Core i7-7740X (4.3GHz), 4코어/ 8스레드, 339달러
케이비 레이크 코어에 맞춰 설계된 i7-7740X를 제외한 모든 칩이 인텔의 ‘스카이레이크-X’에 기반을 두고 있다.

새 칩에서 가장 큰 관심을 끄는 기능은 터보 부스트 맥스 기술 업데이트 3.0이다. 고든 마 웅이 인텔 브로드웰-E 리뷰에서 설명한 것처럼, 터보 부스트 맥스 기술 3.0은 (칩에 따라 차이가 있지만) 최고의 코어를 식별한다. 그리고 CPU 집약적 싱글 스레드 애플리케이션을 이 코어로 연결해 전체 성능을 향상한다.
또, 최고의 코어 2개를 식별하고, 가장 CPU 집약적인 스레드에 할당한다. 더 많은 코어를 더 효과적으로 활용하는 게임과 애플리케이션에 도움을 주는 기능이다. 그러나 이 새로운 기능을 탑재하지 않은 칩도 있다. 새 6코어, 2종의 4코어 X시리즈 칩이 여기에 포함된다.

다음은 속도와 피드를 요약 설명한 표다.

오버클럭이 포인트
인텔은 새 X시리즈에 공냉 쿨러를 추천하지 않는다. 인텔은 165W와 140W의 새 칩이 방출할 열을 효과적으로 냉각시킬 수 있는 TS13X 쿨러를 판매할 예정이다.

TS13X는 PG(Propylene Glycol)을 이용, 열을 73.84-CFM 팬으로 보낸다. 이 팬의 소음은 21~35dBA이고, 회전 속도는 800~2,200rpm이다. 별도 판매될 TS13X의 가격은 85~100달러 사이이다.

인텔은 또 XTU(Extreme Tuning Utility)를 이용, 코어 당 오버클러킹과 전압 조절을 계속 지원할 계획이다. AVX 512 비율 오프셋, 메모리 전압 조절, PEG/DMI 오버클러킹 등 새 기능이 포함되어 있다.
또 ‘성능 튜닝 보증 서비스(Performance tuning protection plan)’를 제공할 계획이다. 이는 오버클로킹 사용자를 위한 일종의 ‘보험’이다. 칩이 고장 날 경우, 1회 교체를 해주는 보증 서비스이며, 두 번째부터는 유료로 진행된다.

데이터 전송 성능을 향상한 새 X299 칩셋
테라플롭급 연산력을 갖춘 PC의 경우, 다른 부품과의 데이터 전송 성능이 아주 중요하다. x299 칩셋은 최신 DMI 3.0을 도입해 SATA 3.0포트와 USB 포트 연결 대역폭을 2배로 증가시킨다. X299 칩셋에는 최대 8개의 SATA 3.0포트, 10개의 USB 3.0 포트가 장착되어 있다. 기존 X99 칩셋의 USB 3.0포트 수는 최대 6개였다.

브로드웰-E X99 칩셋은 8개의 PCIe 레인을 지원했었다. 그러나 X299은 최대 24개의 PCIe 3.0 레인을 지원한다. 고속 PCIe NVM3 드라이브 등 추가 PCIe를 CPU와 연결된 PCI3에 직접 연결할 수 있다. 코어가 10개 이상인 CPU의 경우, 최대 44개의 PCIe 3.0 레인을 이용할 수 있다.

X299는 속도가 빨라진 DDR4-2066을 지원한다. 그러나 어느 정도 RAM 용량을 지원하는지 확실하지 않다. 인텔은 캐시 계층(Cache Hierarchy)을 조정했다. 이를 통해 개별 프로세서 근처에 더 많은 캐시를 배치하는 방법보다 캐시 크기를 더 많이 줄일 수 있다. 인텔은 새로운 캐시의 ‘히트(Hit)’ 레이트가 더 높다고 설명한다. 칩 크기를 줄였지만 캐시 성능을 유지할 수 있었다는 의미이다.

이번 신제품 소식은 코어 i9, 코어 i7 X 시리즈 사용자 모두 크게 기뻐할 기능 및 성능 향상이다. 메인보드와 PC 제조사도 하이엔드 시장에서 수익을 증대하기 위해 코어 i9 제품들을 출시할 것으로 예상된다. 이번 주 컴퓨텍스에서 전해질 더 많은 소식에 사용자들의 관심이 쏠리고 있다. editor@itworld.co.kr


AMD 마이크로아키텍처 (기사 출처 : itworld)

AMD 라이젠 3월 2일 출시…코어 i7보다 가격도 성능도 “우세”

Mark Hachman | PCWorld

“40% 성능 향상”이라는 말은 보수적인 자체 평가였다. AMD는 첫 번째 라이젠 프로세서 3가지를 오는 3월 2일 출시할 계획이라고 밝혔다. 인텔 코어 제품군을 능가하는 성능으로 기대를 받고 있는 라이젠 프로세서는 가격도 절반 가까이 저렴하다.

22일 열린 라이젠 출시 행사에서 발표에 나선 AMD 임원들은 인텔 코어 i7을 공략하기 위한 세 가지 데스크톱용 CPU를 공개했다. 신형 라이젠 CPU는 여러 곳의 주요 메인보드 업체와 전문가용 맞춤형 PC 업체가 지원한다. 특히 AMD는 신형 라이젠 프로세서가 더 적은 비용으로 더 높은 성능을 제공한다는 점을 강조했다. 최고 성능 제품인 라이젠 7 1800X는 인텔의 1,000달러짜리 코어 i7-6900K의 절반에도 못 미치는 가격이지만, 성능은 더 뛰어나다.

인텔과 마찬가지로 AMD의 라이젠 프로세서 역시 역시 3가지 제품군으로 구성되어 있는데, 고급형 라이젠 7, 중급형 라이젠 5, 가장 저렴한 보급형 라이젠 3이 그것이다. AMD는 고성능 라이젠 7부터 먼저 출시하는데, 1800X(499달러), 1700X(399달러), 1700(329달러)의 세 가지 모델이다. 라이젠 5와 라이젠 3은 올해 하반기에 출시할 예정인데, 구체적인 출시 일정은 밝히지 않았다.

이번 행사 직전까지 공개되지 않은 라이젠 관련 정보는 가격과 정확한 출시일이었다. 애널리스트들은 AMD가 그간의 실책을 모두 개선한 것 같다고 평가했으며, 인텔은 자칫 기반이 되는 PC용 마이크로프로세서 시장의 점유율을 잃을 수 있는 위험에 처했다. 물론 인텔도 대응책은 있다. 가격 인하도 그중 하나일 가능성이 있고, 더 많은 코어를 가진 신제품이나 옵테인 기술을 적극 내세우는 것도 방법이 될 수 있다.

인텔이 지난 1월 케이비 레이크 칩 40가지를 대대적으로 출시한 것과는 달리 AMD는 서두르지 않고 있다. 이번에 출시된 라이젠 7 칩의 세부 사양을 살펴보자.

Mark Hachman

라이젠 7 1800X. 95와트 8코어 16쓰레드 프로세서로, 기본 클럭 속도는 3.6GHz, 부스트 모드에서는 4GHz로 동작한다. 499달러 1800X의 대응 제품은 8코어 인텔 코어 i7-6900K로 무려 1,089달러짜리이다. AMD에 따르면, 1800X는 시네벤치 상에서 단일 쓰레드 점수가 162로 동점을 기록했다. 하지만 코어를 모두 구동하자 1,601점으로 6900K보다 9% 높은 점수를 기록했다.

라이젠 7 1700X. 95와트 8코어 16쓰레드 프로세서로, 기본 클럭 속도는 3.4GHz, 부스트 모드에서는 3.8GHz로 동작한다. AMD에 따르면, 399달러 1700X는 시네벤치 멀티코어 벤치마크 테스트에서 1,537점을 기록해 6900K보다 4% 높은 성능을 보였다.

라이젠 7 1700. 655와트 8코어 16쓰레드 프로세서로, 기본 클럭 속도는 3GHz, 부스트 모드에서는 3.7GHz로 동작한다. AMD에 따르면, 1700은 시네벤치 멀티코어 테스트에서 1,410점으로 339달러짜리 코어 i7 7700K보다 46% 더 높은 성능을 기록했다. 핸드브레이크 비디오 인코딩 테스트에서는 1700은 61.8초를, 7700K는 71.8초를 기록했다.

Mark Hachman

AMD에 따르면 라이젠 7 1700은 신형 레이스 스파이어(Wraith Spire) 쿨러를 기본 쿨러로 제공해 소음이 32데시벨에 불과하다.

라이젠의 눈에 띄는 성능 향상에는 설계팀의 역할이 컸다. AMD는 자사의 목표 중 하나가 젠 아키텍처의 클럭당 명령어 처리수(IPC, instructions per clock)를 40% 늘리는 것이라고 밝힌 바 있다. 그리고 실제로 AMD는 IPC를 52% 향상했다. CEO 리사 수는 “단지 목표를 맞춘 것이 아니라 크게 초과 달성했다”라고 강조했다. editor@itworld.co.kr

 

원문보기:
http://www.itworld.co.kr/news/103594#csidx36e903474b838daa0638fbf87957a25