Fig. 2. Semi-Lagrangian cellwise advection. (a) Forward advection scheme, (b) Backward advection scheme.

Three-dimensional cellwise conservative unsplit geometric VOF schemes

3차원 셀별 보수 미분할 기하학적 VOF 체계

Raphaël Comminal, JonSpangenberg

Abstract

This work presents two unsplit geometric VOF schemes that extend the two-dimensional cellwise conservative unsplit (CCU) scheme [Comminal et al., J. Comput. Phys. 283 (2015) 582–608] to three dimensions. The novelty of the 3D-CCU schemes lies in the representation of the streaksurfaces of donating regions by polyhedral surfaces whose vertices are calculated with the 4th order Runge-Kutta scheme. Moreover, the advected liquid volumes are computed using a truncation algorithm [López et al., J. Comput. Phys. 392 (2019) 666–693] suited for arbitrary non-convex and self-intersecting polyhedra, which removes the need for tetrahedral decomposition. The 3D-CCU advection schemes were coupled to three interface reconstruction methods (Youngs’ method, the Mixed Youngs-Centered scheme, and the Least-Square Fit algorithm). The resulting VOF methods were tested in classical benchmark advection tests, including translation, rigid-body rotation, shear and deformation flows. The proposed 3D-CCU schemes conserve the liquid volume and maintain the physical boundedness of liquid volume fractions to the machine precision. The 3D-CCU schemes perform favorably compared to other unsplit geometric VOF schemes when coupled to Youngs’ interface reconstruction method. Moreover, the 3D-CCU schemes coupled to the Least-Square Fit algorithm are more accurate than most other VOF schemes that use a second-order accurate interface reconstruction, except those where a 3D extension of the Mosso-Swartz interface reconstruction is employed. The comparison of the different VOF schemes highlights the importance of coupling accurate interface reconstruction methods with accurate unsplit advection schemes.

이 연구는 2 차원 CCU (Cellwise Conservative Unsplit) 방식을 확장하는 두 가지 분할되지 않은 기하학적 VOF 방식을 제시합니다 [Comminal et al., J. Comput. Phys. 283 (2015) 582–608]을 3 차원으로 변경했습니다. 3D-CCU 체계의 참신함은 4 차 Runge-Kutta 체계로 정점이 계산되는 다면체 표면으로 기부 지역의 줄무늬 표면을 표현하는 데 있습니다.

더욱, 가변 액체 부피는 절단 알고리즘을 사용하여 계산됩니다 [López et al., J. Comput. Phys. 392 (2019) 666–693]은 임의의 볼록하지 않고 자기 교차하는 다면체에 적합하며, 이는 사면체 분해의 필요성을 제거합니다. 3D-CCU 이류 계획은 세 가지 인터페이스 재구성 방법 (Youngs의 방법, Mixed Youngs-Centered 계획 및 Least-Square Fit 알고리즘)과 결합되었습니다. 결과 VOF 방법은 평행 이동, 강체 회전, 전단 및 변형 흐름을 포함한 고전적인 벤치 마크 이류 테스트에서 테스트되었습니다.

제안된 3D-CCU 방식은 액체 부피를 보존하고 기계 정밀도에 대한 액체 부피 분율의 물리적 경계를 유지합니다. 3D-CCU 방식은 Youngs의 인터페이스 재구성 방식과 결합 할 때 다른 분할되지 않은 기하학적 VOF 방식에 비해 우수한 성능을 발휘합니다.

또한 Least-Square Fit 알고리즘과 결합 된 3D-CCU 체계는 Mosso-Swartz 인터페이스 재구성의 3D 확장이 사용되는 경우를 제외하고 2 차 정확한 인터페이스 재구성을 사용하는 대부분의 다른 VOF 체계보다 더 정확합니다. 서로 다른 VOF 체계의 비교는 정확한 인터페이스 재구성 방법과 정확한 분할되지 않은 이류 체계를 결합하는 것의 중요성을 강조합니다.

Keywords

Volume-of-fluid methodUnsplit geometric schemeCellwise advectionSemi-Lagrangian trackingVolume conservation

Fig. 1. Eulerian fluxwise advection. (a) Positive donating region with respect to the left cell; (b) Negative donating region; (c) Intersection of a donating region with the cell's face, yielding a positive and a negative region; (d) Temporally-consistent donating regions equivalent to a cellwise advection; (e) Temporal inconsistency of adjacent donating regions.
Fig. 1. Eulerian fluxwise advection. (a) Positive donating region with respect to the left cell; (b) Negative donating region; (c) Intersection of a donating region with the cell’s face, yielding a positive and a negative region; (d) Temporally-consistent donating regions equivalent to a cellwise advection; (e) Temporal inconsistency of adjacent donating regions.
Fig. 2. Semi-Lagrangian cellwise advection. (a) Forward advection scheme, (b) Backward advection scheme.
Fig. 2. Semi-Lagrangian cellwise advection. (a) Forward advection scheme, (b) Backward advection scheme.
Fig. 3. (a) Cartesian grid cell. (b) Images of the cell's vertices with ruled surfaces. (c) Polyhedral cell's image with triangulated faces.
Fig. 3. (a) Cartesian grid cell. (b) Images of the cell’s vertices with ruled surfaces. (c) Polyhedral cell’s image with triangulated faces.
Fig. 4. Construction of donating regions. (a) Streakline of a cell's vertex P0 represented by the 2-segment polygonal line P0–P1/2–P1. (b) Triangulated streaksurface of a cell's edge P0Q0. (c) Streaktube of a cell's face P0Q0R0S0. (d) Pyramidal volume flux correction  ⁎  capping the donating region of the face P0Q0R0S0.
Fig. 4. Construction of donating regions. (a) Streakline of a cell’s vertex P0 represented by the 2-segment polygonal line P0–P1/2–P1. (b) Triangulated streaksurface of a cell’s edge P0Q0. (c) Streaktube of a cell’s face P0Q0R0S0. (d) Pyramidal volume flux correction ⁎ capping the donating region of the face P0Q0R0S0.
Fig. 5. Interface reconstruction. (a) PLIC polygon in the grid cell, (b) Non-planar image of the PLIC polygon inside the cell's image by isomorphism, (c) Planar PLIC inside the cell's image by computation of the average normal vector. (Triangulation of the cell's image faces are omitted for clarity.)
Fig. 5. Interface reconstruction. (a) PLIC polygon in the grid cell, (b) Non-planar image of the PLIC polygon inside the cell’s image by isomorphism, (c) Planar PLIC inside the cell’s image by computation of the average normal vector. (Triangulation of the cell’s image faces are omitted for clarity.)
Fig. 6. Convergence of the geometric errors in the translation tests.
Fig. 6. Convergence of the geometric errors in the translation tests.
Fig. 7. Reconstructed PLIC polygons (in light blue) superimposed to the exact sphere position (in dark blue) at the end of the rotation tests for the LSF method and CFL = 1.
Fig. 7. Reconstructed PLIC polygons (in light blue) superimposed to the exact sphere position (in dark blue) at the end of the rotation tests for the LSF method and CFL = 1.
Fig. 8. Reconstructed PLIC polygons in the shear tests, at Tf/2 (top row) and Tf (bottom row). Blue polygons are computed with the LSF procedure; green polygons with centered column differences; red polygons with Youngs' method.
Fig. 8. Reconstructed PLIC polygons in the shear tests, at Tf/2 (top row) and Tf (bottom row). Blue polygons are computed with the LSF procedure; green polygons with centered column differences; red polygons with Youngs’ method.
Fig. 9. Reconstructed PLIC polygons in the deformation tests, at Tf/2 (top row) and Tf (bottom row). Blue polygons are computed with the LSF procedure; green polygons with centered column differences; red polygons with Youngs' method.
Fig. 9. Reconstructed PLIC polygons in the deformation tests, at Tf/2 (top row) and Tf (bottom row). Blue polygons are computed with the LSF procedure; green polygons with centered column differences; red polygons with Youngs’ method.

References
[1]
C.W. Hirt, B.D. Nichols, Volume of fluid (VOF) method for the dynamics of free boundaries, Journal of Computational Physics 39 (1981) 201–225. https://doi.org/10.1016/0021-9991(81)90145-5.
Google Scholar
[2]
F.H. Harlow, J.E. Welch, Numerical Calculation of Time-Dependent Viscous Incompressible Flow of Fluid with Free Surface, The Physics of Fluids 8 (1965) 2182–2189. https://doi.org/10.1063/1.1761178.
Google Scholar
[3]
S. McKee, M.F. Tomé, V.G. Ferreira, J.A. Cuminato, A. Castelo, F.S. Sousa, N. Mangiavacchi, The MAC method, Computers & Fluids 37 (2008) 907–930. https://doi.org/10.1016/j.compfluid.2007.10.006.
Google Scholar
[4]
G. Tryggvason, B. Bunner, A. Esmaeeli, D. Juric, N. Al-Rawahi, W. Tauber, J. Han, S. Nas, Y.-J. Jan, A front-tracking method for the computations of multiphase flow, Journal of Computational Physics 169 (2001) 708–759. https://doi.org/10.1006/jcph.2001.6726.
Google Scholar
[5]
S. Shin, D. Juric, Modeling three-dimensional multiphase flow using a level contour reconstruction method for front tracking without connectivity, Journal of Computational Physics 180 (2002) 427–470. https://doi.org/10.1006/jcph.2002.7086.
Google Scholar
[6]
M. Sussman, P. Smereka, S. Osher, A level set approach for computing solutions to incompressible two-phase flow, Journal of Computational Physics 114 (1994) 146–159. https://doi.org/10.1006/jcph.1994.1155.
Google Scholar
[7]
E. Olsson, G. Kreiss, A conservative level set method for two phase flow, Journal of Computational Physics 210 (2005) 225–246. https://doi.org/10.1016/j.jcp.2005.04.007.
Google Scholar
[8]
D. Jacqmin, Calculation of two-phase Navier–Stokes flows using phase-field modeling, Journal of Computational Physics 155 (1999) 96–127. https://doi.org/10.1006/jcph.1999.6332.
Google Scholar
[9]
M. Sussman, E.G. Puckett, A coupled level set and volume-of-fluid method for computing 3D and axisymmetric incompressible two-phase flows, Journal of Computational Physics 162 (2000) 301–337. https://doi.org/10.1006/jcph.2000.6537.
Google Scholar
[10]
M. Sussman, A second order coupled level set and volume-of-fluid method for computing growth and collapse of vapor bubbles, Journal of Computational Physics 187 (2003) 110–136. https://doi.org/10.1016/S0021-9991(03)00087-1.
Google Scholar
[11]
N. Balcázar, O. Lehmkuhl, L. Jofre, J. Rigola, A. Oliva, A coupled volume-of-fluid/level-set method for simulation of two-phase flows on unstructured meshes, Computers & Fluids 124 (2016) 12–29. https://doi.org/10.1016/j.compfluid.2015.10.005.
Google Scholar
[12]
Y. Liu, X. Yu, A coupled phase–field and volume-of-fluid method for accurate representation of limiting water wave deformation, Journal of Computational Physics 321 (2016) 459–475. https://doi.org/10.1016/j.jcp.2016.05.059.
Google Scholar
[13]
E. Aulisa, S. Manservisi, R. Scardovelli, A surface marker algorithm coupled to an area-preserving marker redistribution method for three-dimensional interface tracking, Journal of Computational Physics 197 (2004) 555–584. https://doi.org/10.1016/j.jcp.2003.12.009.
Google Scholar
[14]
D. Enright, R. Fedkiw, J. Ferziger, I. Mitchell, A hybrid particle level set method for improved interface capturing, Journal of Computational Physics 183 (2002) 83–116. https://doi.org/10.1006/jcph.2002.7166.
Google Scholar
[15]
T. Marić, H. Marschall, D. Bothe, lentFoam – A hybrid Level Set/Front Tracking method on unstructured meshes, Computers & Fluids 113 (2015) 20–31. https://doi.org/10.1016/j.compfluid.2014.12.019.
Google Scholar
[16]
S. Mirjalili, S.S. Jain, M. Dodd, Interface-capturing methods for two-phase flows: An overview and recent developments, In: Center for Turbulence Research Annual Research Briefs (2017) 117–135.
Google Scholar
[17]
D. Fuster, A. Bagué, T. Boeck, L. Le Moyne, A. Leboissetier, S. Popinet, P. Ray, R. Scardovelli, S. Zaleski, Simulation of primary atomization with an octree adaptive mesh refinement and VOF method, International Journal of Multiphase Flow 35 (2009) 550–565. https://doi.org/10.1016/j.ijmultiphaseflow.2009.02.014.
Google Scholar
[18]
X. Chen, D. Ma, V. Yang, S. Popinet, High-fidelity simulations of impinging jet atomization, Atomization and Sprays 23 (2013) 1079–1101. https://doi.org/10.1615/AtomizSpr.2013007619.
Google Scholar
[19]
J. Delteil, S. Vincent, A. Erriguible, P. Subra-Paternault, Numerical investigations in Rayleigh breakup of round liquid jets with VOF methods, Computers & Fluids 50 (2011) 10–23. https://doi.org/10.1016/j.compfluid.2011.05.010.
Google Scholar
[20]
Agbaglah, S. Delaux, D. Fuster, J. Hoepffner, C. Josserand, S. Popinet, P. Ray, R. Scardovelli, S. Zaleski, Parallel simulation of multiphase flows using octree adaptivity and the volume-of-fluid method, Comptes Rendus Mecanique 339 (2011) 194–207. https://doi.org/10.1016/j.crme.2010.12.006.
Google Scholar
[21]
H. Grosshans, A. Movaghar, L. Cao, M. Oevermann, R.Z. Szász, L. Fuchs, Sensitivity of VOF simulations of the liquid jet breakup to physical and numerical parameters, Computers & Fluids 136 (2016) 312–323. https://doi.org/10.1016/j.compfluid.2016.06.018.
Google Scholar
[22]
D. Lörstad, L. Fuchs, High-order surface tension VOF-model for 3D bubble flows with high density ratio, Journal of Computational Physics 200 (2004) 153–176. https://doi.org/10.1016/j.jcp.2004.04.001.
Google Scholar
[23]
D. Fuster, S. Popinet, An all-Mach method for the simulation of bubble dynamics problems in the presence of surface tension, Journal of Computational Physics 374 (2018) 752–768. https://doi.org/10.1016/j.jcp.2018.07.055.
Google Scholar
[24]
N. Nikolopoulos, K.S. Nikas, G. Bergeles, A numerical investigation of central binary collision of droplets, Computers & Fluids 38 (2009) 1191–1202. https://doi.org/10.1016/j.compfluid.2008.11.007.
Google Scholar
[25]
G. Strotos, I. Malgarinos, N. Nikolopoulos, M. Gavaises, Predicting droplet deformation and breakup for moderate Weber numbers, International Journal of Multiphase Flow 85 (2016) 96–109. https://doi.org/10.1016/j.ijmultiphaseflow.2016.06.001.
Google Scholar
[26]
D. Jiao, K. Jiao, F. Zhang, Q. Du, Direct numerical simulation of droplet deformation in turbulent flows with different velocity profiles, Fuel 247 (2019) 302–314. https://doi.org/10.1016/j.fuel.2019.03.010.
Google Scholar
[27]
F. Giussani, F. Piscaglia, G. Saez-Mischlich, J. Hèlie, A three-phase VOF solver for the simulation of in-nozzle cavitation effects on liquid atomization, Journal of Computational Physics 406 (2020) 109068. https://doi.org/10.1016/j.jcp.2019.109068.
Google Scholar
[28]
M.R. Pendar, E. Roohi, Investigation of cavitation around 3D hemispherical head-form body and conical cavitators using different turbulence and cavitation models, Ocean Engineering 112 (2016) 287–306. https://doi.org/10.1016/j.oceaneng.2015.12.010.
Google Scholar
[29]
Flow Science, Inc., Santa Fe, NM, USA. FLOW-3D® Version 12.0 (2019). https://www.flow3d.com.
Google Scholar
[30]
O. Ubbink, R.I. Issa, A method for capturing sharp fluid interfaces on arbitrary meshes, Journal of Computational Physics 153 (1999) 26–50. https://doi.org/10.1006/jcph.1999.6276.
Google Scholar
[31]
S. Muzaferija, A two-fluid Navier-Stokes solver to simulate water entry, In: Proceedings of 22nd Symposium on Naval Architecture (1999) 638–651.
Google Scholar
[32]
M. Darwish, F. Moukalled, Convective schemes for capturing interfaces of free-surface flows on unstructured grids, Numerical Heat Transfer, Part B: Fundamentals 49 (2006) 19–42. https://doi.org/10.1080/10407790500272137.
Google Scholar
[33]
S.S. Deshpande, L. Anumolu, M.F. Trujillo, Evaluating the performance of the two-phase flow solver interFoam, Computational Science & Discovery 5 (2012) 014016. https://doi.org/10.1088/1749-4699/5/1/014016.
Google Scholar
[34]
J.A. Heyns, A.G. Malan, T.M. Harms, O.F. Oxtoby, Development of a compressive surface capturing formulation for modelling free-surface flow by using the volume-of-fluid approach, International Journal for Numerical Methods in Fluids 71 (2013) 788–804. https://doi.org/10.1002/fld.3694.
Google Scholar
[35]
S. Ii, K. Sugiyama, S. Takeuchi, S. Takagi, Y. Matsumoto, F. Xiao, An interface capturing method with a continuous function: The THINC method with multi-dimensional reconstruction, Journal of Computational Physics 231 (2012) 2328–2358. https://doi.org/10.1016/j.jcp.2011.11.038.
Google Scholar
[36]
B. Xie, S. Ii, F. Xiao, An efficient and accurate algebraic interface capturing method for unstructured grids in 2 and 3 dimensions: The THINC method with quadratic surface representation, International Journal for Numerical Methods in Fluids 76 (2014) 1025–1042. https://doi.org/10.1016/j.jcp.2013.11.034.
Google Scholar
[37]
Q. Zhang, On Donating Regions: Lagrangian Flux through a Fixed Curve, SIAM Review 55 (2013) 443–461. https://doi.org/10.1137/100796406.
Google Scholar
[38]
E. Aulisa, S. Manservisi, R. Scardovelli, S. Zaleski, Interface reconstruction with least-squares fit and split advection in three-dimensional Cartesian geometry, Journal of Computational Physics 225 (2007) 2301–2319. https://doi.org/10.1016/j.jcp.2007.03.015.
Google Scholar
[39]
G.D. Weymouth, D.K.-P. Yue, Conservative Volume-of-Fluid method for free-surface simulations on Cartesian-grids, Journal of Computational Physics 229 (2010) 2853–2865. https://doi.org/10.1016/j.jcp.2009.12.018.
Google Scholar
[40]
C.S. Wu, D.L. Young, H.C. Wu, Simulations of multidimensional interfacial flows by an improved volume-of-fluid method, International Journal of Heat and Mass Transfer 60 (2013) 739–755. https://doi.org/10.1016/j.ijheatmasstransfer.2012.12.049.
Google Scholar
[41]
T. Marić, D.B. Kothe, D. Bothe, Unstructured un-split geometrical Volume-of-Fluid methods – A review, Journal of Computational Physics 420 (2020) 109695. https://doi.org/10.1016/j.jcp.2020.109695.
Google Scholar
[42]
Q. Zhang, On a Family of Unsplit Advection Algorithms for Volume-of-Fluid Methods, SIAM Journal on Numerical Analysis 51 (2013) 2822–2850. https://doi.org/10.1137/120897882.
Google Scholar
[43]
W.J. Rider, D.B. Kothe, Reconstructing Volume Tracking, Journal of Computational Physics 141 (1998) 112–152. https://doi.org/10.1006/jcph.1998.5906.
Google Scholar
[44]
J. López, J. Hernández, P. Gómez, F. Faura, A volume of fluid method based on multidimensional advection and spline interface reconstruction, Journal of Computational Physics 195 (2004) 718–742. https://doi.org/10.1016/j.jcp.2003.10.030.
Google Scholar
[45]
D.J.E. Harvie, D.F. Fletcher, A new volume of fluid advection algorithm: the defined donating region scheme, International Journal for Numerical Methods in Fluids 35 (2001) 151–172. https://doi.org/10.1002/1097-0363(20010130)35:2<151::AID-FLD87>3.0.CO;2-4.
Google Scholar
[46]
D.J.E. Harvie, D.F. Fletcher, A New Volume of Fluid Advection Algorithm: The Stream Scheme, Journal of Computational Physics 162 (2000) 1–32. https://doi.org/10.1006/jcph.2000.6510.
Google Scholar
[47]
J.E. Pilliod Jr., E.G. Puckett, Second-order accurate volume-of-fluid algorithms for tracking material interfaces, Journal of Computational Physics 199 (2004) 465–502. https://doi.org/10.1016/j.jcp.2003.12.023.
Google Scholar
[48]
A. Cervone, S. Manservisi, R. Scardovelli, S. Zaleski, A geometrical predictor–corrector advection scheme and its application to the volume fraction function, Journal of Computational Physics 228 (2009) 406–419. https://doi.org/10.1016/j.jcp.2008.09.016.
Google Scholar
[49]
R. Comminal, J. Spangenberg, J.H. Hattel, Cellwise conservative unsplit advection for the volume of fluid method, Journal of Computational Physics 283 (2015) 582–608. https://doi.org/10.1016/j.jcp.2014.12.003.
Google Scholar
[50]
J. Mencinger, I. Žun, A PLIC–VOF method suited for adaptive moving grids, Journal of Computational Physics 230 (2011) 644–663. https://doi.org/10.1016/j.jcp.2010.10.010.
Google Scholar
[51]
P. Liovic, M. Rudman, J.-L. Liow, D. Lakehal, D. Kothe, A 3D unsplit-advection volume tracking algorithm with planarity-preserving interface reconstruction, Computers & Fluids 35 (2006) 1011–1032. https://doi.org/10.1016/j.compfluid.2005.09.003.
Google Scholar
[52]
J. Hernández, J. López, P. Gómez, C. Zanzi, F. Faura, A new volume of fluid method in three dimensions—Part I: Multidimensional advection method with face-matched flux polyhedra, International Journal for Numerical Methods in Fluids 58 (2008) 897–921. https://doi.org/10.1002/fld.1776.
Google Scholar
[53]
V. Le Chenadec, H. Pitsch, A 3D Unsplit Forward/Backward Volume-of-Fluid Approach and Coupling to the Level Set Method, Journal of Computational Physics 233 (2013) 10–33. https://doi.org/10.1016/j.jcp.2012.07.019.
Google Scholar
[54]
M. Owkes, O. Desjardins, A computational framework for conservative, three-dimensional, unsplit, geometric transport with application to the volume-of-fluid (VOF) method, Journal of Computational Physics 270 (2014) 587–612. https://doi.org/10.1016/j.jcp.2014.04.022.
Google Scholar
[55]
L. Jofre, O. Lehmkuhl, J. Castro, A. Oliva, A 3-D Volume-of-Fluid advection method based on cell-vertex velocities for unstructured meshes, Computers & Fluids 94 (2014) 14–29. https://doi.org/10.1016/j.compfluid.2014.02.001.
Google Scholar
[56]
T. Marić, H. Marschall, D. Bothe, voFoam – A geometrical Volume of Fluid algorithm on arbitrary unstructured meshes with local dynamic adaptive mesh refinement using OpenFOAM, arXiv preprint (2013) arXiv:1305.3417.
Google Scholar
[57]
T. Marić, H. Marschall, D. Bothe, An enhanced un-split face-vertex flux-based VoF method, Journal of Computational Physics 371 (2018) 967–993. https://doi.org/10.1016/j.jcp.2018.03.048.
Google Scholar
[58]
C.B. Ivey, P. Moin, Conservative volume of fluid advection method on unstructured grids in three dimensions, In: Center for Turbulence Research Annual Research Briefs (2012) 179–192.
Google Scholar
[59]
C.B. Ivey, P. Moin, Conservative and bounded volume-of-fluid advection on unstructured grids, Journal of Computational Physics 350 (2017) 387–419. https://doi.org/10.1016/j.jcp.2017.08.054.
Google Scholar
[60]
J. Roenby, H. Bredmose, H. Jasak, A computational method for sharp interface advection, Royal Society Open Science 3 (2016) 160405. https://doi.org/10.1098/rsos.160405.
Google Scholar
[61]
J. López, P. Gómez, C. Zanzi, F. Faura, H. Hernández, Application of Non-Convex Analytic and Geometric Tools to a PLIC-VOF Method. In: ASME International Mechanical Engineering Congress and Exposition (2016) V007T09A005. https://doi.org/10.1115/IMECE2016-67409.
Google Scholar
[62]
J. López, J. Hernández, P. Gómez, F. Faura, Non-convex analytical and geometrical tools for volume truncation, initialization and conservation enforcement in VOF methods, Journal of Computational Physics 392 (2019) 666–693. https://doi.org/10.1016/j.jcp.2019.04.055.
Google Scholar
[63]
J. López, J. Hernández, P. Gómez, C. Zanzi, R. Zamora, VOFTools 5: An extension to non-convex geometries of calculation tools for volume of fluid methods, Computer Physics Communications (2020) 107277. https://doi.org/10.1016/j.cpc.2020.107277.
Google Scholar
[64]
D.L. Youngs, Time-dependent multi-material flow with large fluid distortion, In: Numerical Methods for Fluid Dynamics, Eds: K.W. Morton, M.J. Baines, Academic Press New York, 1982, pp. 273–285.
Google Scholar
[65]
R. Scardovelli, S. Zaleski, Interface reconstruction with least-square fit and split Eulerian–Lagrangian advection, International Journal for Numerical Methods in Fluids 41 (2003) 251–274. https://doi.org/10.1002/fld.431.
Google Scholar
[66]
R. Scardovelli, S. Zaleski, Analytical Relations Connecting Linear Interfaces and Volume Fractions in Rectangular Grids, Journal of Computational Physics 164 (2000) 228–237. https://doi.org/10.1006/jcph.2000.6567.
Google Scholar
[67]
D. Gueyffier, J. Li, A. Nadim, R. Scardovelli, S. Zaleski, Volume-of-fluid interface tracking with smoothed surface stress methods for three-dimensional flows, Journal of Computational Physics 152 (1999) 423–456. https://doi.org/10.1006/jcph.1998.6168.
Google Scholar
[68]
V. Dyadechko, M. Shashkov, Moment-of-fluid interface reconstruction, Los Alamos Report LA-UR-07-1537 (2007).
Google Scholar
[69]
F. Tampieri, Newell’s method for computing the plane equation of a polygon, In: Graphics Gems III (1992) 231–232. https://doi.org/10.1016/B978-0-08-050755-2.50052-X.
Google Scholar
[70]
J. López, J. Hernández, P. Gómez, F. Faura, A new volume conservation enforcement method for PLIC reconstruction in general convex grids, Journal of Computational Physics 316 (2016) 338–359. https://doi.org/10.1016/j.jcp.2016.04.018.
Google Scholar
[71]
C.W.S. Bruner, Geometric Properties of Arbitrary Polyhedra in Terms of Face Geometry, AIAA Journal 33 (1995) 1350–1350. https://doi.org/10.2514/3.12556.
Google Scholar
[72]
R.N. Goldman, Area of planar polygons and volume of polyhedra, In: Graphics Gems II (1991) 170–171. https://doi.org/10.1016/B978-0-08-050754-5.50043-8.
Google Scholar
[73]
B. Freireich, M. Kodam, C. Wassgren, An exact method for determining local solid fractions in discrete element method simulations, AIChE Journal 56 (2010) 3036–3048. https://doi.org/10.1002/aic.12223.
Google Scholar
[74]
J. López, C. Zanzi, P. Gómez, F. Faura, J. Hernández, A new volume of fluid method in three dimensions—Part II: Piecewise-planar interface reconstruction with cubic-Bézier fit, International Journal for Numerical Methods in Fluids 58 (2008) 923–944. https://doi.org/10.1002/fld.1775.
Google Scholar
[75]
P. Cifani, W.R. Michalek, G.J.M. Priems, J.G. Kuerten, C.W.M. van der Geld, B.J. Geurts, A comparison between the surface compression method and an interface reconstruction method for the VOF approach, Computers & Fluids 136 (2016) 421–435. https://doi.org/10.1016/j.compfluid.2016.06.026.
Google Scholar
[76]
A. Asuri Mukundan, T. Ménard, J.C. Brändle de Motta, A. Berlemont, A 3D Moment of Fluid method for simulating complex turbulent multiphase flows, Computers & Fluids 198 (2020) 104364. https://doi.org/10.1016/j.compfluid.2019.104364.
Google Scholar
[77]
C.B. Ivey, P. Moin, Accurate interface normal and curvature estimates on three-dimensional unstructured non-convex polyhedral meshes, Journal of Computational Physics 300 (2015) 365–386. https://doi.org/10.1016/j.jcp.2015.07.055.
Google Scholar
[78]
H.T. Ahn, M. Shashkov, Multi-material interface reconstruction on generalized polyhedral meshes, Journal of Computational Physics 226 (2007) 2096–2132. https://doi.org/10.1016/j.jcp.2007.06.033.
Google Scholar
[79]
G. Černe, S. Petelin, I. Tiselj, Numerical errors of the volume-of-fluid interface tracking algorithm, International Journal for Numerical Methods in Fluids 38 (2002) 329–350. https://doi.org/10.1002/fld.228.
Google Scholar
[80]
S.J. Mosso, B.K. Swartz, D.B. Kothe, R.C. Ferrell, A parallel, volume-tracking algorithm for unstructured meshes, In: Parallel Computational Fluid Dynamics 1996: Algorithms and Results Using Advanced Computers, 1997, pp. 368–375. https://doi.org/10.1016/B978-044482327-4/50113-3.
Google Scholar
1
This definition of the CFL number is different from the usual definition used in multi-dimensional algebraic advection schemes. However, the component-wise definition is more meaningful in the context of geometric VOF schemes, because it determines the number of layers of cells around the interfacial cells where the liquid volume fractions need to be updated.

Intel Fortran Compiler 2019

Customer Notification: Intel Fortran Compiler Update

이 알림은 향후 버전에서 컴파일 빌드 도구를 업데이트하고 있음을 알려 드리기 위한 것입니다.

솔버를 사용자 정의 (즉, 소스 코드 수정 및 재 컴파일)하지 않는 경웨는 별도의 조치가 필요하지 않습니다. 솔버를 사용자 정의(사용자가 프로그램 모듈에 사용자의 수식을 추가한 경우)하는 사용자는 새 버전이 출시 될 때 원활한 전환을 보장하기 위해 이 업데이트에 대한 알림에 대해 준비를 해야 합니다.

변경 사항은 다음과 같습니다.

FLOW-3D의 다음 주요 릴리스인 FLOW-3D v12.1 및 FLOW-3D CAST v5.1은 인텔 ® FORTRAN 컴파일러 버전 19.0.3.203 빌드 20190206 (Windows) 및 버전 19.0.3.199 빌드 20190206 (Linux)로 빌드됩니다.

Intel Fortran Compiler 2019
Intel Fortran Compiler 2019

솔버를 사용자 지정하는 Windows 사용자는 Microsoft Visual Studio 2017 Professional도 필요합니다.
현재 버전인 FLOW-3D v12.0 및 FLOW-3D CAST v5.0 및 후속 업데이트는 Intel® FORTRAN 버전 16.0.1 및 Microsoft Visual Studio 2010/2013 Professional을 사용하여 계속 빌드됩니다.
다시 알려드리지만,이 알림은 FLOW-3D 솔버용으로 제공된 소스 코드를 수정하여 재 컴파일(즉, 사용자 정의)하는 사용자에게만 적용됩니다.

솔버를 사용자 정의(커스텀 코드 추가한 경우)하지 않은 경우에는 조치가 필요하지 않습니다. 이 컴파일러 업데이트에 대한 질문이 있는 경우 support@flow3d.com으로 지원 팀에 문의하십시오.

EVGA 지포스 RTX 2060 KO 같은 현대적인 그래픽카드는 여러 디스플레이를 동시에 연결할 수 있다. ⓒ BRAD CHACOS/IDG

FLOW-3D POST, 그래픽 카드, 멀티모니터

좋은 하드웨어는 향상된 FLOW-3D POST 경험을 제공

FLOW Science, inc의 최첨단 POST Processor인 FLOW-3D POST를 최대한 활용하려면 좋은 하드웨어가 있어야 합니다. 이 블로그에서 소프트웨어 엔지니어링의 GUI 개발자/관리자인 Stephen Sanchez는 이러한 하드웨어 권장 사항에 따라 최적의 FLOW-3D POST 경험을 얻을 수 있는 방법에 대해 정보를 제공 합니다.

고품질 그래픽 하드웨어

최소 3GB의 VRAM 이 있는 그래픽 카드로 시작하는 것이 좋습니다 . 이것은 많은 볼륨 렌더링을 수행할 경우 특히 중요합니다. 볼륨 렌더링은 FLOW-3D POST 의 고급 기능으로 iso-surface가 아닌 유체 도메인 전체에서 변수의 세부 사항을 시각화합니다. 이 기능은 매우 통찰력 있지만 후 처리 중에 효과적으로 사용하려면 좋은 하드웨어가 필요합니다.

다음으로 Intel 통합 그래픽을 기본 그래픽 하드웨어로 사용해서는 안됩니다. 인텔 통합 그래픽은 전용 그래픽 하드웨어가 있는 랩톱에서도 대부분의 랩톱에서 일반적입니다(자세한 내용은 아래 참조). 

대부분의 FLOW-3D POST 기능은 이 구성에서 작동하지 않으므로 Intel 통합 그래픽을 지원하지 않습니다. 

FLOW-3D POST 는 NVIDIA 그래픽 카드 와 함께 사용할 때 가장 잘 수행됩니다. FLOW-3D POST 가 잘 작동하는 것으로 확인되었으므로 Maxwell 아키텍처 제품군 이상의 NVIDIA 그래픽 하드웨어를 적극 권장 합니다. 

NVIDIA Quadro 카드는 가장 안정적인 것으로 입증되었습니다. 고급 AMD 카드도 작동해야 하지만 NVIDIA 하드웨어 및 드라이버만큼 안정적이지 않다는 사실을 발견 했으므로 항상 AMD보다 NVIDIA를 권장합니다.

Nvidia 그래픽 카드

노트북의 듀얼 그래픽 카드 – 간단하지만 숨겨진 솔루션

이제 많은 노트북에 NVIDIA 그래픽 카드와 Intel 통합 그래픽 간에 전환 할 수 있는 기능이 있습니다. NVIDIA 카드로 FLOW-3D POST 가 실행되고 있는지 확인하는 것이 중요합니다 . NVIDIA 제어판을 통해 NVIDIA 카드로 노트북을 강제로 실행할 수 있습니다.

그래픽 카드를 Nvidia로 전환

비디오 드라이버 업데이트

비디오 드라이버가 업데이트 되었는지 확인하는 것이 좋습니다. FLOW-3D POST 에서 비디오 드라이버를 업데이트하여 쉽게 해결할 수 있는 아티팩트 및 디스플레이 문제에 대한 보고가 있었습니다 . 비디오 드라이버를 최신 상태로 유지하는 것은 이러한 문제를 방지하는 좋은 방법입니다.

RAM, RAM, RAM!

메모리가 충분하지 않으면 시뮬레이션 후 처리가 불가능할뿐만 아니라 메모리 요구 사항을 인식하는 것이 중요합니다. 최대 10 배의 성능 저하로 이어질 수 있습니다! FLOW-3D POST 에 필요한 RAM 양은 여러 요소, 특히 시뮬레이션 크기에 따라 다릅니다. 사용자에게 최대한의 유연성을 제공하기 위해 메시의 셀 수에 따라 다음과 같은 RAM 권장 사항이 있습니다.

  • 초대형 (2 억 개 이상의 셀) : 최소 128GB
  • 대용량 (6 천 ~ 1 억 5 천만 셀) : 64-128GB
  • 중간 (3 천만 ~ 6 천만 셀) : 32-64GB
  • 소형 (3,000 만 셀 이하) : 최소 32GB

FLOW-3D POST 는 메모리 집약적 일 수 있습니다. 실행할 시뮬레이션 크기에 대한 대략적인 아이디어가 있는 경우, 이 지침을 가능한 한 잘 따르는 것이 좋습니다. 즉, 유연성을 극대화하고 가장 원활한 FLOW-3D POST 경험을 보장하기 위해 문제 크기에 관계없이 가능한 한 많은 RAM을 확보하는 것이 좋습니다.


그래픽 카드를 업그레이드 교체 설치하는 방법

그래픽 카드를 업그레이드하는 것은 성능 향상을 위한 좋은 방법이다. 그래픽 카드 업그레이드를 통해 시각적으로 고사양을 요구하는 POST 작업을 쉽게 소화할 수 있는 컴퓨터로 진화할 수 있다. 

업그레이드를 위한 그래픽 카드 구매시 고려 사항, 기존 PC에 적합한가? 

원하는 그래픽 카드를 결정하는 것은 복잡하고 미묘한 문제다. AMD와 엔비디아는 200달러 미만에서부터 최대 1,500달러에 이르는 지포스(GeForce) RTX 3090에 이르기까지 거의 모든 예산에 대한 선택지를 제공하기 때문이다.

카드의 소음, 발열, 전력 소비 등과 같은 사항을 고려할 수 있겠지만, 일반적으로는 비용 대비 가장 큰 효과를 제공하는 그래픽 카드를 원한다.

컴퓨터가 새 그래픽 카드를 지원하는 적절한 하드웨어인지 확인한다. 

사용자가 겪는 가장 일반적인 문제는 부적절한 파워 서플라이(power supply)다. 충분한 전력을 공급할 수 없거나 사용 가능한 PCI-E 전원 커넥터가 충분하지 않을 수 있다. 필자의 경험상 파워 서플라이는 적어도 제조업체에서 권장하는 파워 서플라이의 요구 사항을 충족해야 한다. 예를 들어, 350W를 소비하는 지포스 GTX 3090을 구입했다면 8핀 전원 커넥터 한 쌍과 함께 엔비디아에서 제안한 최소 750W의 전력 공급 장치를 갖춰야 한다. 

현재 파워 서플라이가 얼마나 많은 전력을 제공하는지 알아보려면 PC 본체를 열고 모든 파워 서플라이에 기본 정보가 나열된 표준 식별 스티커를 확인하면 된다. 또한 사용 가능한 6핀 및 8핀 PCI-E 커넥터의 수를 확인할 수 있다. 

ⓒ Thomas Ryan 파워서플라이
ⓒ Thomas Ryan 파워서플라이

마지막으로 본체 내부에 새 그래픽 카드를 넣을 충분한 공간이 있는지 확인한다. 일부 고급 그래픽 카드는 길이가 상당히 길어 30Cm 이상일 수 있으며, 확장 슬롯이 2개 또는 3개가 될 수 있다. 해당 그래픽 카드의 실제 크기는 제조업체 웹사이트에서 찾을 수 있다. 

여기까지 해결했다면 이제 본격적으로 설치 작업에 착수한다. 


생각보다 간단한 그래픽 카드 설치 작업

그래픽 카드 설치에는 새 그래픽 카드, 컴퓨터, 그리고 십자 드라이버 3가지만 있으면 된다. 설치하기 전 PC를 끄고 전원 플러그를 뽑는다. 

기존 GPU를 제거해야 하는 경우가 아니면, 먼저 프로세서의 방열판에 가장 가까운 긴 PCI-E x16 슬롯을 찾아야 한다. 이 슬롯은 메인보드의 첫 번째 또는 두 번째 확장 슬롯이다. 

이 슬롯에 접근을 차단하는 느슨한 전선이 없는지 확인한다. 기존 그래픽 카드를 교체하는 경우, 연결된 케이블을 모두 분리하고, PC 본체 후면 내부에 고정 브래킷에서 나사를 제거한 다음, 카드를 제거한다. 대부분의 메인보드에는 그래픽 카드를 제자리에 고정하는 PCI-E 슬롯 끝에 작은 플라스틱 걸쇠(latch)가 있다. 이 걸쇠를 눌러 이전 그래픽 카드의 잠금을 해제하고 분리한다.

ⓒ Thomas Ryan PCI-E x16 슬롯에 설치
ⓒ Thomas Ryan PCI-E x16 슬롯에 설치

이제 새 그래픽 카드를 개방형 PCI-E x16 슬롯에 설치할 수 있다. 카드를 슬롯에 완전히 삽입한 다음, PCI-E 슬롯 끝에 있는 플라스틱 걸쇠를 눌러 제자리에 고정한다. 그런 다음 나사를 사용해 그래픽 카드의 금속 고정 브래킷을 PC 본체에 고정한다. 덮개 브래킷 또는 이전 그래픽 카드를 고정했던 나사를 재사용할 수 있다. 

ⓒ Thomas Ryan 그래픽 카드에는 추가 전원 커넥터 연결
ⓒ Thomas Ryan 그래픽 카드에는 추가 전원 커넥터 연결

대부분의 게임용 그래픽 카드에는 추가 전원 커넥터가 필요하다. 추가 전원이 필요한 경우, 해당 PCI-E 전원 케이블을 연결했는지 확인한다. 전원이 제대로 공급되지 않으면 그래픽 카드가 제대로 작동하지 않는다. 이 PCI-E 전원 케이블을 연결하지 않으면 PC 자체가 부팅되지 않을 수 있다.  

그래픽 카드를 고정하고 난 후, 전원을 켠 상태에서 본체 측면 패널을 제자리로 밀어넣고 디스플레이 케이블을 새 그래픽 카드에 연결해 작업을 완료한다. 이제 컴퓨터를 켠다. 

이제 그래픽 카드의 소프트웨어를 업그레이드할 단계가 왔다. 

새 그래픽 카드가 이전 카드와 동일한 브랜드일 경우에는 절차가 간단하다. 제조업체의 웹사이트로 이동해 운영체제에 맞는 최신 드라이버 패키지를 다운로드한다. 그래픽 드라이버는 일반적으로 약 500MB로, 상당히 크다. 인터넷 연결 속도에 따라 다운로드하는 데 시간이 걸릴 수도 있다. 드라이버를 설치하고 컴퓨터를 다시 시작하면 이제 새 그래픽 카드가 제공하는 부드럽고 매끄러운 프레임 속도를 즐길 수 있다.
  
그래픽 카드 제조업체가 바뀐 경우(인털에서 AMD로, 혹은 AMD에서 인텔로), 새 그래픽 카드용 드라이버를 설치하기 전에 이전 그래픽 드라이버를 제거하고 컴퓨터를 다시 시작해야 한다. 이전 드라이버를 제거하지 않으면 새 드라이버와 충돌할 수 있다. 

editor@itworld.co.kr 기사 일부 발췌 인용

그래픽 카드 GPU 온도 확인하는 방법

그래픽 카드 온도 확인은 아주 쉽다. 윈도우에서 바로 온도를 확인할 수 있는 내장 도구도 추가됐다. 또한, 무료 GPU 모니터링 도구가 많이 있고 그중 대다수가 온도를 측정해준다. 조금 더 자세히 알아보자.

ⓒ MARK HACHMAN / IDG 그래픽카드 온도 확인
ⓒ MARK HACHMAN / IDG 그래픽카드 온도 확인

마이크로소프트가 윈도우 10 2020년 5월 업데이트에서 GPU 온도 모니터링 툴을 작업 관리자에 추가했다. 무려 24년이나 걸렸다.

Ctrl+Shift+Esc를 열어 작업 관리자 대화창을 열거나 Ctrl+Alt+Delete에서 ‘작업 관리자’를 선택하거나 윈도우 시작 메뉴 아이콘을 오른쪽 클릭해서 ‘작업 관리자’를 선택한다. 여기에서 ‘성능’ 탭으로 들어가면 왼쪽에 GPU를 확인할 수 있을 것이다. 윈도우 10 2020년 5월 업데이트 혹은 그 이후 버전의 윈도우가 설치되어 있을 때만 사용할 수 있는 기능이다.

하지만 이 기능은 매우 단순하다. 시간 흐름에 따른 온도 변화를 추적하지 않고, 현재의 온도만을 보여준다. 그리고 업무를 하거나 오버클럭 조정 중에 작업 관리자를 여는 것도 귀찮을 수 있다. 마침내 윈도우에 GPU 온도를 확인할 수 있는 기능이 들어간 것은 환영하지만, 뒤이어 설명할 서드파티 도구가 훨씬 더 나은 GPU 온도 확인 옵션을 제공한다.

AMD 라데온 그래픽 카드 사용자가 라데온 세팅(Radeon Setting) 앱을 최신 버전으로 유지하고 있다면 방법은 쉽다. 2017년 AMD는 시각 설정을 변경할 수 있는 라데온 오버레이(Radeon Overlay)를 출시했다. 여기에도 GPU 온도와 다른 중요한 정보를 확인할 수 있는 성능 모니터 기능이 있다.

프로그램을 활성화하려면 Alt+R 키를 눌러 라데온 오버레이를 불러온다. 성능 모니터링 섹션에서 원하는 탭을 선택한다. Ctrl+Shift + 0을 눌러서 성능 모니터링 도구 설정을 단독으로 불러올 수 있다.

라데온 세팅 앱에서 오버클럭 도구인 와트맨(Wattman)으로 이동해 GPU 온도를 확인할 수 있다. 윈도우 바탕 화면을 우클릭하고, 라데온 설정을 선택한 후 게이밍(Gaming) > 글로벌 세팅(Global Setting) > 글로벌 와트맨(Global Wattman) 항목으로 이동한다. 도구를 사용해 지나친 오버클럭으로 그래픽 카드를 날려버리지 않겠다고 서약한 후에는 와트맨에 액세스하고 GPU 온도, 그리고 그래프 형태로 된 핵심적 통계 수치를 볼 수 있다. 여기까지가 전부다.

라데온 사용자가 아닌 사람도 많을 것이다. 스팀의 하드웨어 설문 조사는 전체 응답자 PC 중 75%가 엔비디아 지포스 그래픽 카드를 탑재했다는 결과를 발표했다. 그리고 지포스 익스피리언스 소프트웨어는 GPU 온도 확인 기능을 제공하지 않아서 서드파티 소프트웨어의 손을 빌려야 한다.

그래픽 카드 제조 업체는 보통 GPU 오버 클럭을 위한 특수한 소프트웨어를 제공한다. 이 도구에는 라데온 오버레이처럼 가장 중요한 측정을 실행할 때 OSD(On-Screen Display)를 지속하는 옵션 등이 있다. 여러 종류 중에서 가장 추천하는 것은 다재다능함을 갖춘 MSI의 애프터버너(Afterburner) 도구다. 이 제품은 오랫동안 인기를 얻었는데 엔비디아 지포스, AMD 라데온 그래픽 카드 두 제품 모두에서 잘 작동하고, 반길 만한 다른 기능도 더했다.

IDG HWInfo는 언제나 누구에게나 적합한 모니터링 프로그램
IDG HWInfo는 언제나 누구에게나 적합한 모니터링 프로그램

GPU 온도에 전혀 관심이 없다면? 그렇다면 시스템의 온도 센서를 보여주는 모니터링 소프트웨어를 설치하면 편리할 것이다. HWInfo는 언제나 누구에게나 적합한 모니터링 프로그램으로, PC의 모든 부품의 가상 스냅샷을 보여준다. 스피드팬(SpeedFan) 과 오픈 하드웨어 모니터(Open Hardware Monitor)도 신뢰할 만한 서드파티 앱이다.

‘착한’ GPU 온도는 몇 도?

이제 그래픽 카드를 모니터링하는 소프트웨어를 갖췄다. 하지만 화면을 채우는 숫자는 맥락이 없이는 아무것도 아니다. 그래픽 카드 온도는 어디까지 괜찮은 것일까?

쉬운 대답은 없다. 제품마다 다르다. 이럴 때는 구글이 친구가 된다. 대다수 칩은 섭씨 90도 중반에도 작동하고, 게이밍 노트북에서도 90도까지 온도가 올라가는 경우가 흔히 있다. 그러나 일반 데스크톱 PC 온도가 90도 이상으로 올라간다면 구조 신호나 다름없다. 공기 흐름이 원활한 GPU 1대 시스템에서는 80도 이상 올라가면 위험하다. 팬이 여러 개 달린 커스텀 그래픽 카드는 무거운 워크로드 하에서도 60~70도가 적당하고, 수냉쿨러가 달린 GPU라면 온도가 더 낮아야 할 것이다.

그래픽 카드가 최근 5년 안에 생산된 제품이고 90도 이상으로 뜨거워진다면, 또는 최근 몇 주간 온도가 급격히 상승했다면 다음의 냉각 방법을 고려해보자.


그래픽 카드 온도 낮추는 법

그래픽 카드 온도가 높아졌을 때 하드웨어 업그레이드에 돈을 들이지 않고 개선하지 않기란 어렵다. 그러나 돈을 쏟아붓기 전에 정말 그래야 하는지 필요성을 점검해 보자. 다시 한번 강조하지만 그래픽 카드는 뜨거운 온도를 버틸 수 있도록 설계되어 있다. PC가 무거운 게임이나 영상 편집 중에 강제 종료되는 경우가 아니라면 아마도 걱정할 필요가 없을 것이다.

우선, 시스템의 케이블을 깨끗하게 정리해 GPU 주변의 공기가 원활하게 순환되는지 확인하라. 케이블이 깔끔하게 정리됐다면 케이스에 팬을 추가하는 것도 고려한다. 모든 PC는 최적의 성능을 위해 공기를 빨아들이고 내보내는 팬이 여럿 달려 있는데, POST PC라면 팬은 더 많아야 한다. 저렴한 팬은 10달러부터 구입할 수 있고, RGB 조명이 붙은 화려한 제품은 조금 더 가격이 높다.

마지막으로, GPU와 히트싱크의 써멀 페이스트가 오래되어 말라 있다면 효율이 떨어질 수 있다. 특히 오래된 그래픽 카드라면 더더욱 그렇다. 그리고 아주 드문 경우지만 품질이 좋지 않은 써멀 페이스트가 발라져서 출시되는 경우도 있다. 다른 방법이 모두 효과가 없다면 써멀 페이스트를 다시 바르는 것을 시도해보자. 그러나 과정이 매우 어려울 수 있고 카드마다 조금씩 다르고, 잘못 손댈 경우 사용자 보증 기한의 보호를 받을 수 없게 된다. 

온도를 확실하게 낮추려면 수랭 쿨러를 위한 쿨링 시스템을 고려한다. 대다수 사용자에게는 지나친 모험이지만 대부분 수냉쿨러는 발열과 노이즈 감소 효과가 확실하고 공기 냉각에 있어 병목 현상도 없다.


“업무 효율 향상의 기본” 멀티 모니터 구축 가이드

듀얼 모니터를 사용하면 업무 생산성이 높아진다는 연구 결과가 있지만, 모니터가 많을수록 생산성이 높아지는지 여부에 대해서는 아직 이렇다 할 근거는 없다. 그러나 업무 생산성을 생각하지 않더라도 모니터를 여러 대(3대~6대까지) 사용하는 것은 멋진 일이며, 많은 화면을 봐야 하는 엔지니어는 정말 필요할지도 모른다.

모니터를 세로로 세워두면 긴 문서를 볼 때 스크롤을 적게 해도 된다는 장점이 있다. 멀티 디스플레이 환경을 구축하기 위해 고려해야 할 모든 것들을 살펴보겠다.

멀티 모니터 구축 가이드(www.itworld.co.kr)
멀티 모니터 구축 가이드(www.itworld.co.kr)

1단계 : 그래픽 카드 확인하기

보조 모니터를 구입하기 전에 컴퓨터가 물리적으로 이 모든 모니터들을 감당할 수 있을지 점검해 봐야 한다. 가장 쉬운 방법은 PC의 뒷면을 보고, 그래픽 포트(DVI, HDMI, 디스플레이포트, VGA 등)가 몇 개나 있는지 확인하는 것이다.

별도의 그래픽 카드가 없다면 포트를 2개밖에 발견하지 못할 것이다. 그래픽이 통합된 대부분의 마더보드는 모니터 2개 밖에 설치하지 못한다. 별도의 그래픽 카드가 있다면, 마더보드의 포트를 제외하고 최소 3개의 포트를 발견할 수 있을 것이다.

팁 : 마더보드와 별도 그래픽 카드의 포트를 모두 이용해서 멀티 모니터를 설치할 수도 있지만, 이 경우 성능 저하와 모니터끼리의 속도 차이가 발생할 것이다. 그래도 이렇게 하고 싶다면, PC의 BIOS에서 Configuration > Video > Integrated graphics 로 진입한 다음, ‘always enable’로 설정한다.

그러나 별도의 그래픽 카드에 3개 이상의 포트가 있다고 해서 이것을 모두 동시에 사용할 수 있다는 의미는 아니다. 예를 들어서 구형 엔비디아 카드는 포트가 2개 이상이어도 하나의 카드에 모니터를 2개 이상 연결할 수 없다. 자신의 그래픽 카드가 멀티 모니터를 지원하는지 판단하는 가장 좋은 방법은 그래픽 카드 모델명을 찾아서 원하는 모니터 개수와 함께 검색하는 것이다. 예를 들어, ‘엔비디아 GTX 1660 모니터 4대’라고 검색하면 된다.

EVGA 지포스 RTX 2060 KO 같은 현대적인 그래픽카드는 여러 디스플레이를 동시에 연결할 수 있다. ⓒ BRAD CHACOS/IDG
EVGA 지포스 RTX 2060 KO 같은 현대적인 그래픽카드는 여러 디스플레이를 동시에 연결할 수 있다. ⓒ BRAD CHACOS/IDG

그래픽 카드가 원하는 만큼 충분히 모니터를 지원할 수 있으면 좋지만, 그렇지 않다면 추가 그래픽 카드를 구입해야 한다. 그래픽 카드를 추가로 구입하기 전 타워 안에 충분한 공간(PCI 슬롯)이 있는지, 전원 공급은 충분한지 확인해야 한다.

멀티 모니터용으로만 그래픽 카드를 구입한다면 최신 그래픽 카드 중에서도 저렴한 옵션을 선택하는 것이 좋다. 

아니면 멀티 스트리밍이 지원되는 디스플레이포트를 탑재한 신형 모니터를 사용하는 방법도 있다. 그래픽 카드의 디스플레이포트 1.2에 연결하고, 디스플레이포트 케이블을 사용해 다음 모니터로 연결하는 것이다. 모니터의 크기나 해상도가 같지 않아도 된다. 뷰소닉(ViewSonic)의 VP2468이 이런 제품 중 하나다. 아마존에서 약 210달러에 판매되는 이 24인치 모니터는 디스플레이포트 아웃 외에도 프리미엄 IPS 스크린, 아주 얇은 베젤 등 멀티 모니터 설정에 이상적인 특징을 제공한다.

2단계 : 모니터 선택하기 

그래픽 카드에 대해서 파악했다면 이제 추가 모니터를 구입할 차례다. 사용자에 따라서 기존에 사용하고 있는 모니터, 책상 크기, 추가 모니터 용도 등에 따라서 완벽한 모니터가 달라질 것이다.

필자의 경우, 이미 24인치 모니터 2대를 가지고 있었기 때문에 중앙에 설치할 더 큰 모니터가 필요해서 27인치 모니터를 선택했다. 게임을 하지 않기 때문에 모니터 크기 차이는 상관없었다. 하지만 사용자에 따라서 멀티 모니터로 POST를 하거나 동영상을 보기 위해서는 이러한 구성보다 같은 모니터를 연결하는 것이 더 좋을 것이다.

모니터를 구입하기 전에 PC와 모니터의 포트 호환성을 설펴야 한다. DVI-HDMI 혹은 디스플레이포트-DVI 등 전환해주는 케이블을 이용할 수도 있지만 다소 귀찮다. 그러나 PC나 모니터에 VGA 포트가 있다면, 교체를 권한다. VGA는 아날로그 커넥터이기 때문에 선명도가 떨어진다.

3단계 : PC설정

모니터를 구입하고 나면 PC에 연결하고 PC의 전원을 켠다. 이것으로 모니터 설치가 끝났다. 하지만 완전히 끝난 것은 아니다.

윈도우가 멀티 모니터 환경에서 잘 동작하게 만들어야 하는데, 윈도우 7이나 윈도우 8 사용자라면 바탕화면에서 오른쪽 클릭하고 ‘화면 해상도’를 선택한다. 윈도우 10 사용자라면 ‘디스플레이 설정’을 클릭한다. 그러면 디스플레이를 정렬할 수 있는 창이 나타난다.

ⓒ ITWorld 디스플레이 설정
ⓒ ITWorld 디스플레이 설정

여기서 모니터들이 모두 탐지되는지 확인할 수 있다. ‘식별’을 클릭하면 각 디스플레이에 큰 숫자가 나타난다. 주 모니터(작업 표시줄과 시작 버튼이 나타나는 모니터)로 사용할 모니터에 1번이 나타나야 하는데, 원하는 것을 선택한 다음 아래 여러 디스플레이 설정에서 ‘이 디스플레이를 주 모니터로 만들기’를 클릭한다. 그 다음 ‘다중 디스플레이’ 드롭다운 메뉴에서 복제할 것인지 확장할 것인지를 선택하면 되는데, 대부분의 경우 ‘디스플레이 확장’이 적합하다.

GPU 제어판에서도 다중 모니터를 설정할 수 있다. 바탕화면에서 오른쪽 클릭을 하고 엔비디아, AMD, 인텔 등 그래픽 제조사의 제어판 메뉴를 열어 윈도우와 유사한 방식으로 디스플레이를 설정할 수 있다.

멀티 디스플레이를 구축할 경우에는 같은 모델을 이용하는 것이 해상도나 선명도, 색보정 등의 문제가 발생하지 않아 ‘끊김 없는’ 경험을 할 수 있다.

FLOW-3D 수치해석용 컴퓨터 선택 가이드 (update)

Hardware Selection for FLOW-3D Products – FLOW-3D

2021-04-14 최신 CPU 부분 업데이트 / ㈜에스티아이씨앤디 솔루션사업부

In this blog, Flow Science’s IT Manager Matthew Taylor breaks down the different hardware components and suggests some ideal configurations for getting the most out of your FLOW-3D products.

개요

본 자료는 Flow Science의 IT 매니저 Matthew Taylor가 작성한 자료를 기반으로 STI C&D에서 일부 자료를 보완한 자료입니다. 본 자료를 통해 FLOW-3D 사용자는 최상의 해석용 컴퓨터를 선택할 때 도움을 받을 수 있을 것으로 기대합니다.

수치해석을 하는 엔지니어들은 사용하는 컴퓨터의 성능에 무척 민감합니다. 그 이유는 수치해석을 하기 위해 여러 준비단계와 분석 시간들이 필요하지만 당연히 압도적으로 시간을 소모하는 것이 계산 시간이기 때문일 것입니다.

따라서 수치해석용 컴퓨터의 선정을 위해서 단위 시간당 시스템이 처리하는 작업의 수나 처리량, 응답시간, 평균 대기 시간 등의 요소를 복합적으로 검토하여 결정하게 됩니다.

또한 수치해석에 적합한 성능을 가진 컴퓨터를 선별하는 방법으로 CPU 계산 처리속도인 Flops/sec 성능도 중요하지만 수치해석을 수행할 때 방대한 계산 결과를 디스크에 저장하고, 해석결과를 분석할 때는 그래픽 성능도 크게 좌우하기 때문에 SSD 디스크와 그래픽카드에도 관심을 가져야 합니다.

FLOW SCIENCE, INC. 에서는 일반적인 FLOW-3D를 지원하는 최소 컴퓨터 사양과 O/S 플랫폼 가이드를 제시하지만, 도입 담당자의 경우, 최상의 조건에서 해석 업무를 수행해야 하기 때문에 가능하면 최고의 성능을 제공하는 해석용 장비 도입이 필요합니다. 이 자료는 2021 현재 FLOW-3D 제품을 효과적으로 사용하기 위한 하드웨어 선택에 대해 사전에 검토되어야 할 내용들에 대해 자세히 설명합니다. 그리고 실행 중인 시뮬레이션 유형에 따라 다양한 구성에 대한 몇 가지 아이디어를 제공합니다.

CPU 최신 뉴스

2021년 4월 15일 기준 (https://www.itworld.co.kr/print/190283 기사 원문 발췌)

ⓒ Rob Schultz/IDG
ⓒ Rob Schultz/IDG
  • 현재 라이젠 5000 제품군과 인텔 11세대 코어 CPU가 그 어느 때보다 뛰어난 성능과 코어를 제공한다. 
    하이엔드 프로세서를 구입하고자 한다면, 라이젠 9 5900X가 최고의 선택지다. 인텔의 새로운 8코어 코어 i9-11900K 대표 제품과 동등한 수준의 성능을 제공하지만, 라이젠 칩의 12코어 24스레드 덕분에 훨씬 더 높은 생산성 성능을 제공한다. 데스크탑에서 최고 성능을 원한다면 750달러로 가격이 치솟은 라이젠 9 5950X는 무려 16코어 덕분에 훨씬 더 많은 성능을 제공한다.
    워크스테이션에서 최고 사양은 AMD Ryzen™ Threadripper™ PRO 3995WX 로 CPU 코어 수는 64개이고 스레드 수는 128코어로 거의 슈퍼컴퓨터 수준이다. 가격 조회 사이트인 다나와에서 현재 일자(2021년 4월 15일) 기준으로 검색해 보면 CPU 가격만 700만원대인 매우 고가의 CPU인 것을 알 수 있다.
AMD 3995wx
  • 인텔의 코어 i9-11900K 가격은 550달러이므로, AMD 라이젠 9 5900K와 가격이 동일하지만, 로켓 레이크의 출시 초기에는 약 615달러에 판매되고 있다. 전력 소모가 심하고 AMD 칩보다 속도가 그리 빠르지 않다. 또한 코어 i9-11900K는 8개의 코어 및 16개 스레드만 제공되므로 생산성 작업에서도 크게 뒤쳐진다. 실제로 코어 i9-11900K는 소매 가격이 450달러인 8코어 라이젠 7 5800X와 더 비슷한 성능을 보인다.  
  • CPU는 최근 수개월 동안 그래픽 카드와 함께 부족 현상을 겪고 있어 가용성이 많이 떨어지고 있다. 특히 AMD 라이젠 프로세서의 가격이 인상돼 사용자는 현명하게 구매할 필요가 있다. 
  • 인텔의 최신 칩인 11세대 로켓 레이크(Rocket Lake) 코어 프로세서는 여전히 오래된 14nm 제조 공정을 기반으로 제작됐지만, 아키텍처 자체는 인텔의 최신 10nm 아이스 레이크(Ice Lake) 코어로 만들어졌다. 코어 i9-11900K에서 볼 수 있듯이 이는 흥미롭고, 복합적인 결과를 도출한 필사적인 아이디어다. 
  • 하지만 앞으로 더 밝은 미래가 있다. 인텔의 새로운 CEO 팻 겔싱어는 최근 다른 기업을 위한 x86 칩을 구축하고 수년간 14nm에서 허덕이던 인텔의 ‘틱톡(tick-tock)’ 아키텍처를 되살리는 등 인텔의 장기적인 기술 계획을 발표했다. 
  • 성능을 향상시키는 PCIe 리사이저블 BAR(Resizable BAR) 기능은 AMD의 스마트 엑세스 메모리(Smart Access Memory)와 유사한 형태로 등장한 후에 널리 사용 가능해졌다. AMD가 라이젠 5000에 이 기능을 도입한 이후, 인텔의 최신 로켓 레이크 칩으로 확산됐다. BIOS 업데이트는 양 제조업체의 구형 프로세서 및 메인보드에 이 기능을 추가하고 있다.     

CPU의 선택

CPU는 전반적인 성능에 큰 영향을 미치며, 대부분의 경우 컴퓨터의 가장 중요한 구성 요소입니다. 그러나 데스크탑 프로세서를 구입할 때가 되면 Intel 과 AMD의 모델 번호와 사양을 이해하는 것이 어려워 보일 것입니다.
그리고, CPU 성능을 평가하는 방법에 의해 가장 좋은 CPU를 고른다고 해도 보드와, 메모리, 주변 Chip 등 여러가지 조건에 의해 성능이 달라질 수 있기 때문에 성능평가 결과를 기준으로 시스템을 구입할 경우, 단일 CPU나 부품으로 순위가 정해진 자료보다는 시스템 전체를 대상으로 평가한 순위표를 보고 선정하는 지혜가 필요합니다.

PassMark – CPU Mark High End CPUs

2021년 4월 14일 기준

PassMark - CPU Mark Updated 14th of April 2021
PassMark – CPU Mark Updated (14th of April 2021)

<출처> https://www.cpubenchmark.net/high_end_cpus.html

PassMark – CPU Mark Single Thread Performance

2021년 4월 14일 기준

수치해석을 수행하는 CPU의 경우 예산에 따라 Core가 많지 않은 CPU를 구매해야 하는 경우도 있을 수 있습니다. 보통 Core가 많다고 해석 속도가 선형으로 증가하지는 않으며, 해석 케이스에 따라 적정 Core수가 있습니다. 이 경우 예산에 맞는 성능 대비 최상의 코어 수가 있을 수 있기 때문에 Single thread Performance 도 매우 중요합니다. 아래 성능 도표를 참조하여 예산에 맞는 최적 CPU를 찾는데 도움을 받을 수 있습니다.

출처 : https://www.cpubenchmark.net/singleThread.html

PassMark - CPU Mark Single Thread Performance (Updated 14th of April 2021)
PassMark – CPU Mark Single Thread Performance (Updated 14th of April 2021)

CPU 성능 분석 방법

부동소수점 계산을 하는 수치해석과 밀접한 Computer의 연산 성능 벤치마크 방법은 대표적으로 널리 사용되는 아래와 같은 방법이 있습니다.

FLOW-3D의 CFD 솔버 성능은 CPU의 부동 소수점 성능에 전적으로 좌우되기 때문에 계산 집약적인 프로그램입니다. FlowSight 또한 CPU에 크게 의존합니다. 현재 출시된 사용 가능한 모든 CPU를 벤치마킹할 수는 없지만 상대적인 성능을 합리적으로 비교할 수는 있습니다.

특히, 수치해석 분야에서 주어진 CPU에 대해 FLOW-3D 성능을 추정하거나 여러 CPU 옵션 간의 성능을 비교하기 위한 최상의 옵션은 Standard Performance Evaluation Corporation의 SPEC CPU2017 벤치마크(현재까지 개발된 가장 최신 평가기준임)이며, 특히 SPECspeed 2017 Floating Point 결과가 CFD Solver 성능을 매우 잘 예측합니다.

이는 유료 벤치마크이므로 제공된 결과는 모든 CPU 테스트 결과를 제공하지 않습니다. 보통 제조사가 ASUS, Dell, Lenovo, HP, Huawei 정도의 제품에 대해 RAM이 많은 멀티 소켓 Intel Xeon 기계와 같은 값비싼 구성으로 된 장비 결과들을 제공합니다.

CPU 비교를 위한 또 다른 옵션은 Passmark Software의 CPU 벤치마크입니다. PerformanceTest 제품군은 유료 소프트웨어이지만 무료 평가판을 사용할 수 있습니다. 대부분의 CPU는 저렴한 옵션을 포함하여 나열됩니다. 부동 소수점 성능은 전체 벤치마크의 한 측면에 불과하지만 다양한 워크로드에서 전반적인 성능을 제대로 테스트합니다.

예산을 결정하고 해당 예산에 해당하는 CPU를 선택한 후에는 벤치마크를 사용하여 가격에 가장 적합한 성능을 결정할 수 있습니다.

<참고>

SPEC의 벤치 마크https://www.spec.org/benchmarks.html#cpu )

SPEC CPU 2017 (현재까지 가장 최근에 개발된 CPU 성능측정 기준)

다른 컴퓨터 시스템에서 컴퓨팅 계산에 대한 집약적인 워크로드를 비교하는데 사용할 수 있는 성능 측정을 제공하도록 설계된 SPEC CPU 2017에는 SPECspeed 2017 정수, SPECspeed 2017 부동 소수점, SPECrate 2017 정수 및 SPECrate 2017 부동 소수점의 4 가지 제품군으로 구성된 43 개의 벤치 마크가 포함되어 있습니다. SPEC CPU 2017에는 에너지 소비 측정을 위한 선택적 메트릭도 포함되어 있습니다.

<SPEC CPU 벤치마크 보고서>

벤치마크 결과보고서는 제조사별, 모델별로 테스트한 결과를 아래 사이트에 가면 볼 수 있습니다.

https://www.spec.org/cgi-bin/osgresults

<보고서 샘플>

  • SPEC CPU 2017

Designed to provide performance measurements that can be used to compare compute-intensive workloads on different computer systems, SPEC CPU 2017 contains 43 benchmarks organized into four suites: SPECspeed 2017 Integer, SPECspeed 2017 Floating Point, SPECrate 2017 Integer, and SPECrate 2017 Floating Point. SPEC CPU 2017 also includes an optional metric for measuring energy consumption.

클럭 대 코어

일반적으로 클럭 속도가 높은 칩은 CPU 코어를 더 적게 포함합니다. FLOW-3D는 병렬화가 잘되어 있지만, 디스크 쓰기와 같이 일부 작업은 기본적으로 단일 스레드 방식으로 수행됩니다. 따라서 데이터 출력이 빈번하거나 큰 시뮬레이션은 종종 더 많은 코어가 아닌, 더 높은 클럭 속도를 활용합니다. 마찬가지로 코어 및 소켓의 다중 스레딩은 오버헤드를 발생시키므로 작은 문제의 해석일 경우 사용되는 코어 수를 제한하면 성능이 향상될 수 있습니다.

CPU 아키텍처

CPU 아키텍처는 중요합니다. 최신 CPU는 일반적으로 사이클당 더 많은 기능을 제공합니다. 즉, 현재 세대의 CPU는 일반적으로 동일한 클럭 속도에서 이전 CPU보다 성능이 우수합니다. 또한 전력 효율이 높아져 와트당 성능이 향상될 수 있습니다. Flow Science에는 구형 멀티 소켓 12, 16, 24 코어 Xeon보다 성능이 뛰어난 최근 세대 10~12 Core i9 CPU 시스템을 보유하고 있습니다.

오버클럭

해석용 장비에서는 CPU를 오버클럭 하지 않는 것이 좋습니다. 하드웨어를 다년간의 투자라고 생각한다면, 오버클럭화는 발열을 증가시켜 수명을 단축시킵니다. CPU에 따라 안정성도 저하될 수 있습니다. CPU를 오버클럭 할 때는 세심한 열 관리가 권장됩니다.

하이퍼스레딩

<이미지출처:https://gameabout.com/krum3/4586040>

하이퍼스레딩은 물리적으로 1개의 CPU를 가상으로 2개의 CPU처럼 작동하게 하는 기술로 파이프라인의 단계수가 많고 각 단계의 길이가 짧을때 유리합니다. 다만 수치해석 처럼 모든 코어의 CPU를 100% 사용중인 장시간 수행 시뮬레이션은 일반적으로 Hyper Threading이 비활성화 된 상태에서 더 잘 수행됩니다. FLOW-3D는 100% CPU 사용률이 일반적이므로 새 하드웨어를 구성할 때 Hyper Threading을 비활성화하는 것이 좋습니다. 설정은 시스템의 BIOS 설정에서 수행합니다.

몇 가지 워크로드의 경우에는 Hyper Threading을 사용하여 약간 더 나은 성능을 보이는 경우가 있습니다. 따라서, 최상의 런타임을 위해서는 두 가지 구성중에서 어느 구성이 더 적합한지 시뮬레이션 유형을 테스트하는 것이 좋습니다.

스케일링

여러 코어를 사용할 때 성능은 선형적이지 않습니다. 예를 들어 12 코어 CPU에서 24 코어 CPU로 업그레이드해도 시뮬레이션 런타임이 절반으로 줄어들지 않습니다. 시뮬레이션 유형에 따라 16~32개 이상의 CPU 코어를 선택할 때는 FLOW-3D 및 FLOW-3D CAST의 HPC 버전을 사용하거나 FLOW-3D CLOUD로 이동하는 것을 고려하여야 합니다.

AMD Ryzen 또는 Epyc CPU

AMD는 일부 CPU로 벤치마크 차트를 석권하고 있으며 그 가격은 매우 경쟁력이 있습니다. FLOW SCIENCE, INC. 에서는 소수의 AMD CPU로 FLOW-3D를 테스트했습니다. 현재 Epyc CPU는 이상적이지 않고 Ryzen은 성능이 상당히 우수합니다. 발열은 여전히 신중하게 다뤄져야 할 문제입니다. 현재 32 코어 옵션에 영향을 주는 Windows 버그가 초기 버전에서 성능을 크게 저하시키는 것으로 알려져 있습니다. Bug Fix가 되었는지 업데이트 하여 확인하고, 해결되지 않은 경우 이러한 CPU에는 Linux를 권장됩니다.

<관련 기사>

https://www.techspot.com/news/78122-report-software-fix-can-double-threadripper-2990wx-performance.html

Graphics 고려 사항

FLOW-3D는 OpenGL 드라이버가 만족스럽게 수행되는 최신 그래픽 카드가 필요합니다. 최소한 OpenGL 3.0을 지원하는 것이 좋습니다. FlowSight는 DirectX 11 이상을 지원하는 그래픽 카드에서 가장 잘 작동합니다. 권장 옵션은 엔비디아의 쿼드로 K 시리즈와 AMD의 파이어 프로 W 시리즈입니다.

특히 엔비디아 쿼드로(NVIDIA Quadro)는 엔비디아가 개발한 전문가 용도(워크스테이션)의 그래픽 카드입니다. 일반적으로 지포스 그래픽 카드가 게이밍에 초점이 맞춰져 있지만, 쿼드로는 다양한 산업 분야의 전문가가 필요로 하는 영역에 광범위한 용도로 사용되고 있습니다. 주로 산업계의 그래픽 디자인 분야, 영상 콘텐츠 제작 분야, 엔지니어링 설계 분야, 과학 분야, 의료 분석 분야 등의 전문가 작업용으로 사용되고 있습니다. 따라서 일반적인 소비자를 대상으로 하는 지포스 그래픽 카드와는 다르계 산업계에 포커스 되어 있으며 가격이 매우 비싸서 도입시 예산을 고려해야 합니다.

유의할 점은 엔비디아의 GTX 게이밍 하드웨어는 볼륨 렌더링의 속도가 느리거나 오동작 등 몇 가지 제한 사항이 있습니다. 일반적으로 노트북에 내장된 통합 그래픽 카드보다는 개별 그래픽 카드를 강력하게 추천합니다. 최소한 그래픽 메모리는 512MB 이상을 권장합니다.

PassMark – G3D Mark High End Videocards

출처 : https://www.videocardbenchmark.net/high_end_gpus.html

원격데스크탑 사용시 고려 사항

Flow Science는 nVidia 드라이버 버전이 341.05 이상인 nVidia Quadro K, M 또는 P 시리즈 그래픽 하드웨어를 권장합니다. 이 카드와 드라이버 조합을 사용하면 원격 데스크톱 연결이 완전한 3D 가속 기능을 갖춘 기본 하드웨어에서 자동으로 실행됩니다.

원격 데스크톱 세션에 연결할 때 nVidia Quadro 그래픽 카드가 설치되어 있지 않으면 Windows는 소프트웨어 렌더링을 사용합니다. 이는 FLOW-3D 및 FlowSight 모두 성능에 부정적인 영향을 미칩니다. FLOW-3D 가 소프트웨어 렌더링을 사용하고 있는지 확인하려면 FLOW-3D 도움말 메뉴에서 정보를 선택하십시오. GDI Generic을 소프트웨어 렌더링으로 사용하는 경우 GL_RENDERER 항목에 표시됩니다.

하드웨어 렌더링을 활성화하는 몇 가지 옵션이 있습니다. 쉬운 방법 중 하나는 실제 콘솔에서 FLOW-3D를 시작한 다음 원격 데스크톱 세션을 연결하는 것입니다. Nice Software DCV 와 같은 일부 VNC 소프트웨어는 기본적으로 하드웨어 렌더링을 사용합니다.

RAM 고려 사항

프로세서 코어당 최소 4GB의 RAM은 FLOW-3D의 좋은 출발입니다. FlowSight POST Processor를 사용하여 후처리 작업을 할 경우 상당한 양의 RAM을 사용하는 것이 좋습니다.

현재 주력제품인 DDR4보다 2배 빠른 DDR5가 곧 출시된다는 소식도 있습니다.

일반적으로 FLOW-3D를 이용하여 해석을 할 경우 격자(Mesh)수에 따라 소요되는 적정 메모리 크기는 아래와 같습니다.페이지 보기

  • 초대형 (2억개 이상의 셀) : 최소 128GB
  • 대형 (60 ~ 1억 5천만 셀) : 64 ~ 128GB
  • 중간 (30-60백만 셀) : 32-64GB
  • 작음 (3 천만 셀 이하) : 최소 32GB

HDD 고려 사항

수치해석은 해석결과 파일의 데이터 양이 매우 크기 때문에 읽고 쓰는데, 속도면에서 매우 빠른 SSD를 적용하면 성능면에서 큰 도움이 됩니다. 다만 SSD 가격이 비싸서 가성비 측면을 고려하여 적정수준에서 결정이 필요합니다.

CPU와 저장장치 간 데이터가 오고 가는 통로가 그림과 같이 3가지 방식이 있습니다. 이를 인터페이스라 부르며 SSD는 흔히 PCI-Express 와 SATA 통로를 이용합니다.

흔히 말하는 NVMe는 PCI-Express3.0 지원 SSD의 경우 SSD에 최적화된 NVMe (NonVolatile Memory Express) 전송 프로토콜을 사용합니다. 주의할 점은 MVMe중에서 SATA3 방식도 있기 때문에 잘 구별하여 구입하시기 바랍니다.

그리고 SSD를 선택할 경우에도 SSD 종류 중에서 PCI Express 타입은 매우 빠르고 가격이 고가였지만 최근에는 많이 저렴해졌습니다. 따라서 예산 범위내에서 NVMe SSD등 가장 효과적인 선택을 하는 것이 좋습니다.
( 참고 : 해석용 컴퓨터 SSD 고르기 참조 )

기존의 물리적인 하드 디스크의 경우, 디스크에 기록된 데이터를 읽기 위해서는 데이터를 읽어내는 헤드(바늘)가 물리적으로 데이터가 기록된 위치까지 이동해야 하므로 이동에 일정한 시간이 소요됩니다. (이러한 시간을 지연시간, 혹은 레이턴시 등으로 부름) 따라서 하드 디스크의 경우 데이터를 읽기 위한 요청이 주어진 뒤에 데이터를 실제로 읽기까지 일정한 시간이 소요되는데, 이 시간을 일정한 한계(약 10ms)이하로 줄이는 것이 불가능에 가까우며, 데이터가 플래터에 실제 기록된 위치에 따라서 이러한 데이터에의 접근시간 역시 차이가 나게 됩니다.

하지만 HDD의 최대 강점은 가격대비 용량입니다. 현재 상용화되어 판매하는 대용량 HDD는 12TB ~ 15TB가 공급되고 있으며, 이는 데이터 저장이나 백업용으로 가장 좋은 선택이 됩니다.
결론적으로 데이터를 직접 읽고 쓰는 드라이브는 SSD를 사용하고 보관하는 용도의 드라이브는 기존의 HDD를 사용하는 방법이 효과적인 선택이 될 수 있습니다.

PassMark – Disk Rating High End Drives

출처 : https://www.harddrivebenchmark.net/high_end_drives.html

상기 벤치마크 테스트는 테스트 조건에 따라 그 성능 곡선이 달라질 수 있기 때문에 조건을 확인할 필요가 있습니다. 예를 들어 Windows7, windows8, windows10 모두에서 테스트한 결과를 평균한 점수와 자신이 사용할 컴퓨터 O/S에서 테스트한 결과는 다를 수 있습니다. 상기 결과에 대한 테스트 환경에 대한 내용은 아래 사이트를 참고하시기 바랍니다.

참고 : 테스트 환경

페이지 보기

유압 헤드 계산에서는 유선이 평행하다고 가정

FLOW-3D Output variables(출력 변수)

Output variables(출력 변수)

FLOW-3D에서 주어진 시뮬레이션의 정확한 출력은 어떤 물리적 모델, 출력 위젯에 정의된 추가 출력 및 특정 구성 요소별 출력에 따라 달라집니다. 이 문서는 FLOW-3D의 출력에 대해 좀 더 복잡한 출력 변수 중 일부를 참조하는 역할을 합니다.

FLOW-3D Additional output
FLOW-3D Additional output

Distance Traveled by Fluid(유체로 이동 한 거리)

때로는 유체 입자가 이동한 거리가 중요한 경우도 있습니다. FLOW-3D에서 사용자는 모델 설정 ‣ 출력 위젯에서 유체가 이동한 거리에 대한 출력을 요청할 수 있습니다. 이 기능은 유체가 흐름 영역(경계 또는 질량 소스를 통해)에 들어간 시간 또는 유체가 도메인을 통해 이동한 거리를 계산합니다. 이 기능은 모든 시뮬레이션에도 사용할 수 있으며, 특별한 모델을 사용할 필요가 없으며, 흐름에도 영향을 미치지 않습니다. 이 모델을 사용하려면 출력 위젯으로 이동하고 추가 출력 섹션에서 “Distance traveled by fluid” 옆의 체크상자를 선택하십시오.

 노트

추가 출력 섹션은 출력 위젯의 모든 탭에서 사용할 수 있습니다.

유체 도착 시간

유체 도착 시간을 아는 것은 종종 유용합니다. 예를 들어 주조 시뮬레이션에서 주입 시간을 결정하는 데 사용할 수 있습니다. 제어 볼륨은 충전 프로세스 동안 여러 번 채워지고 비워지기 때문에 계산 셀이 채워지는 처음과 마지막 시간 모두 기록되고, 후 처리를 위해 저장될 수 있습니다. 이 작업은 출력 위젯과 추가 출력 섹션 내에서 유체 도착 시간 확인란을 선택하여 수행됩니다.

 노트

이 출력 옵션은 1 유체 자유 표면 흐름에만 사용할 수 있습니다.

유체 체류 시간

때로는 유체가 계산 영역 내에서 보내는 시간인 체류시간을 아는 것이 유용합니다. 이는 출력 ‣ Output ‣ Additional Output ‣ Fluid residence time 확인란을 선택하여 수행합니다. 여기서 S로 지정된 이 변수에 대한 전송 방정식은 단위 소스 항과 함께 Solve됩니다.

유체 체류 시간(Fluid residence time)
유체 체류 시간(Fluid residence time)

여기에서 t는 시간이며 u는 유체 속도입니다.

S의 단위는 시간이다. 계산 도메인에 들어가는 모든 유체에 대한 S의 초기값은 0입니다.

의 값은 항상 second order체계를 가진 데이터로부터 근사치를 구합니다.

이 출력 옵션은 1 유체 및 2 유체 유량 모두에 사용할 수 있습니다.

 노트

경계 조건 또는 소스에서 도메인으로 유입되는 유체가 이미 도메인에 있는 유체와 혼합될 때 체류가 감소하는 것처럼 보일 수 있습니다.

Wall Contact Time

벽면 접촉 시간 출력은 (1)개별 유체 요소가 특정 구성 요소와 접촉하는 시간 및 (2)특정 구성 요소가 유체와 접촉하는 시간을 추적합니다. 이 모델은 액체 금속이 모래 오염물과 접촉했을 때 오염과 상관 관계가 있는 proxy 변수를 제공하기 위한 것입니다. 이 출력은 최종 주조물에서 오염된 유체가 어디에 있는지 확인하는 데 사용될 수 있습니다. 접촉 시간 모델의 또 다른 해석은, 예를 들어, 용해를 통해 다소 일정한 비율로 화학물질을 방출하는 물에 잠긴 물체에 의한 강의 물의 오염입니다.

모델은 Model Setup ‣ Output ‣ Wall contact time 박스를 확인하여 활성화됩니다. 또한 Model Setup ‣ Output ‣ Geometry Data section의 각 구성요소에 대해 해당 구성요소를 계산에 포함하기 위해 반드시 설정해야 하는 Contact time flag가 있습니다.

 추가 정보

Wall Contact Time with Fluid and Component Properties: Contact Time with Fluid for more information on the input variables를 참조하십시오.

 노트

이 모델은 실제 구성 요소, 즉 고체, 다공성 매체, 코어 가스 및 충전 퇴적물 구성 요소로 제한됩니다. 접촉 시간은 유체 # 1과 관련해서만 계산됩니다.

2. 형상 데이터
2. 형상 데이터

Component wetted are

Fluid 1과 접촉하는 구성 요소의 표면 영역은 관심 구성 요소에 대한 Model Setup ‣ Output ‣ Geometry Data ‣ Wetted area 옵션을 활성화하여 History Data로 출력 될 수 있습니다.

구성 요소의 힘과 토크

Forces

Model Setup ‣ Output ‣ Geometry Data ‣ Forces 옵션을 활성화하면 부품에 대한 압력, 전단력, 탄성 및 벽 접착력을 History Data에 출력할 수 있습니다.

압력을 가지지 않은 셀(즉, 도메인 외부에 있거나 다른 구성 요소 안에 있는 셀)이 구성 요소 주변의 각 셀에 대한 압력 영역 제품을 합산하는 동안 어떻게 처리되는지를 제어하는 압력 계산에 대한 몇 가지 추가 옵션이 있습니다. 기본 동작은 이러한 셀에서 사용자 정의 기준 압력을 사용하는 것입니다. 지정되지 않은 경우 기준 압력은 초기 무효 압력인 PVOID로 기본 설정됩니다. 또는, 코드는 Reference pressure is code calculated 옵션을 선택하여 구성요소의 노출된 표면에 대한 평균 압력을 사용할 수 있습니다.

마지막으로, 일반 이동 물체의 경우, 규정된/제약을 받는 대로 물체를 이동시키는 힘을 나타내는 잔류 힘의 추가 출력이 있습니다.

Torques

Model Setup ‣ Output ‣ Force 옵션이 활성화되면 구성 요소의 토크가 계산되고 History Data에 출력됩니다. 토크는 힘-모멘트에 대한 기준점 X, 힘-모멘트에 대한 기준점 Y, 정지 구성 요소에 대한 힘-모멘트 입력에 대한 기준점 Z에 의해 지정된 지점에 대해 보고됩니다. 참조점의 기본 위치는 원점입니다.

General Moving Objects에는 몇 가지 추가 참고 사항이 있습니다. 첫째, 토크는 (1) 6-DOF 동작의 질량 위치 중심 또는 (2)고정축 및 고정점 회전의 회전 축/점에 대해 보고됩니다. 힘에서 행해지는 것과 마찬가지로, 규정된/제한된 바와 같이 물체를 이동시키는 토크를 나타내는 잔류 토크의 출력도 있습니다.

 노트

힘 및 토크 출력은 각 지오메트리 구성 요소의 일반 히스토리 데이터에 기록됩니다. 출력은 개별 힘/토크 기여 (예: 압력, 전단, 탄성, 벽 접착) 및 개별 기여도의 합으로 계산된 총 결합력/토크로 제공됩니다.

Buoyancy center and metacentric height (부력 중심 및 메타 중심 높이)

일반 이동 객체의 부력과 안정성에 대한 정보는 각 구성 요소에 대해 모델 설정 Setup 출력 ‣ 기하학적 데이터 ‣ 부력 중심 및 도량형 높이 옵션을 활성화하여 History Data에서 출력할 수 있습니다. 이렇게 하면 구성 요소의 중심 위치와 중심 높이가 출력됩니다.

  1. Advanced

FLOW-3D Advanced Output Option
FLOW-3D Advanced Output Option

Fluid vorticity & Q-criterion(유체 와동 및 Q 기준)

와동구성 요소뿐만 아니라 와동 구조를 위한 Q-criterion을 계산하고 내보내려면 Model Setup ‣ Output ‣ Advanced 탭에서 해당 확인란을 클릭하여 유체 와동 & Q-criterion을 활성화하십시오.

여기에서:

:  소용돌이 벡터의 다른 구성 요소

 Q-criterion은 속도 구배 텐서의 2차 불변성을 갖는 연결된 유체 영역으로 소용돌이를 정의합니다. 이는 전단 변형률과 와류 크기 사이의 국부적 균형을 나타내며, 와류 크기가 변형률의 크기보다 큰 영역으로 와류를 정의합니다.

Hydraulic Data and Total Hydraulic Head 3D

Hydraulic Data

깊이 기준 유압 데이터를 요청하려면 출력 ‣ 고급으로 이동한 후 유압 데이터 옆의 확인란을 선택하십시오(심층 평균 값과 중력을 -Z 방향으로 가정).

이 옵션은 FLOW-3D가 유압 시뮬레이션에 유용할 수 있는 추가 깊이 평균 데이터를 출력하도록 합니다.

  • Flow depth
  • Maximum flow depth
  • Free surface elevation
  • Velocity
  • Offset velocity
  • Froude number
  • Specific hydraulic head
  • Total hydraulic head

이 수량 각각에 대해 하나의 값 이 메쉬의 모든 (x, y) 위치에서 계산되고 수직 열의 모든 셀에 저장됩니다 (이 수량이 깊이 평균이기 때문에 z 방향으로 데이터의 변화가 없습니다). 변수는 정확도를 보장하기 위해주기마다 계산됩니다. 모든 경우에,  깊이 평균 속도, z- 방향  의 중력 가속도, 유체 깊이, 및 컬럼 내 유체의 최소 z- 좌표입니다.

  • 자유 표면 고도는 수직 기둥의 맨 위 유체 요소에 있는 자유 표면의 z-좌표로 계산됩니다.
  • The Froude number 은   

식으로 계산됩니다.

  • 유체 깊이는 깊이 평균 메쉬 열의 모든 유체의 합으로 계산됩니다.

특정 유압 헤드 

및 총 유압 헤드

변수는 다음에서 계산됩니다.  

 노트

  • 깊이 기준 유압 출력 옵션은 예리한 인터페이스가 있고 중력이 음의 z 방향으로 향할 때에만 유체 1에 유효합니다.
  • 유압 헤드 계산은 스트림 라인이 평행하다고 가정한다는 점을 유념해야 합니다. 예를 들어 플럭스 표면이 재순환 흐름 영역에 배치되는 경우 이 문제가 발생할 수 있습니다. 이 경우, 유량 표면에서 보고된 유량 평균 유압 헤드는 헤드의 계산에서 흐름 방향이 무시되기 때문에 예상보다 클 수 있습니다.

Total Hydraulic Head 3D(총 유압 헤드 3D)

또한 총 유압 헤드 3D 옵션을 확인하여 국부적(3D) 속도 필드, 플럭스 표면에서의 유압 에너지(배플 참조) 및 플럭스 기반 유압 헤드를 사용하여 유체 1의 총 헤드를 계산할 수 있다. 3D 계산은 국부 압력을 사용하여 수행되며(즉, 압력이 유체 깊이와 관련이 있다고 가정하지 않음) 원통 좌표와 호환됩니다.

 노트

  • 유압 헤드 계산은 스트림 라인이 평행하다고 가정한다는 점을 유념해야 한다. 예를 들어 플럭스 표면이 재순환 흐름 영역에 배치되는 경우 문제가 발생할 수 있습니다. 이 경우, 플럭스 표면에서 보고된 유량 평균 유압 헤드는 헤드의 계산 시 흐름 방향이 무시되기 때문에 예상보다 클 수 있습니다.
  • 3D 유압 헤드 계산은 입력 파일에 중력이 정의되지 않은 경우 중력 벡터의 크기를 1로 가정합니다.

Flux-averaged hydraulic head

특정 위치 (즉, 배플)의 플럭스 평균 유압 헤드는 다음과 같이 계산됩니다.

Flux-averaged hydraulic head
Flux-averaged hydraulic head

유압 헤드 계산에서는 유선이 평행하다고 가정합니다. 예를 들어 플럭스 표면이 재순환 흐름 영역에 배치된 경우 (예: 아래에 표시된 것과 같이) 문제가 될 수 있습니다.

유압 헤드 계산에서는 유선이 평행하다고 가정




유압 헤드 계산에서는 유선이 평행하다고 가정

이 경우 플럭스 표면에 보고된 플럭스 평균 유압 헤드는 헤드 계산 시 흐름 방향이 무시되므로 예상보다 클 수 있습니다.

FLOW-3D에는 History Probes, Flux surface, Sampling Volumes의 세 가지 주요 측정 장치가 있습니다. 이러한 장치를 시뮬레이션에 추가하는 방법은 모델 설정 섹션에 설명되어 있습니다(측정 장치 참조). 이들의 출력은 기록 데이터 편집 시간 간격으로 flsgrf 파일의 일반 기록 데이터 카탈로그에 저장됩니다. 이러한 결과는 Analyze ‣ Probe 탭에서 Probe Plots을 생성하여 액세스할 수 있습니다.

히스토리 프로브 출력

히스토리 프로브를 생성하는 단계는 모델 설정 섹션에 설명되어 있습니다(기록 프로브 참조). 시뮬레이션에 사용된 물리 모델에 따라 각각의 History Probe에서 서로 다른 출력을 사용할 수 있습니다. 프로브를 FSI/TSE로 지정하면 유한 요소 메시 안에 들어가야 하는 위치에서 응력/스트레인 데이터만 제공한다. 유체 프로브가 솔리드 형상 구성 요소에 의해 차단된 영역 내에 위치하는 경우, 기하학적 구조와 관련된 수량(예: 벽 온도)만 계산된다. 일반적으로 프로브 좌표에 의해 정의된 위치에서 이러한 양을 계산하려면 보간이 필요하다.

플럭스 표면 출력

플럭스 표면은 이를 통과하는 수량의 흐름을 측정하는데 사용되는 특별한 물체입니다. 플럭스 표면을 만드는 단계는 모델 설정 섹션에 설명되어 있습니다(플럭스 표면 참조). 각 플럭스 표면에 대해 계산된 수량은 다음과 같습니다.

  • Volume flow rate for fluid #1
  • Volume flow rate for fluid #2 (for two-fluid problems only)
  • Combined volume flow rate (for two-fluid problems only)
  • Total mass flow rate
  • Flux surface area wetted by fluid #1
  • Flux-averaged hydraulic head when 3D Hydraulic Head is requested from additional output options
  • Hydraulic energy flow when hydraulic data output is requested
  • Total number of particles of each defined species in each particle class crossing flux surface when the particle model is active
  • Flow rate for all active and passive scalars this includes scalar quantities associated with active physical models (eg. suspended sediment, air entrainment, ect.)

 노트

  • 유속과 입자수의 기호는 유동 표면을 설명하는 함수의 기호에 의해 정의된 대로 흐름이나 입자가 플럭스 표면의 음에서 양으로 교차할 때 양의 부호가 됩니다.
  • 플럭스 표면은 각 표면의 유량과 입자 수가 정확하도록 그들 사이에 적어도 두 개의 메쉬 셀이 있어야 합니다.
  • 유압 데이터 및 총 유압 헤드 3D 옵션을 사용할 때는 유압 헤드 계산이 스트림 라인이 평행하다고 가정한다는 점을 유념해야 한다. 예를 들어 플럭스 표면이 재순환 흐름 영역에 배치되는 경우 이 문제가 발생할 수 있습니다. 이 경우, 유량 표면에서 보고된 유량 평균 유압 헤드는 헤드의 계산에서 흐름 방향이 무시되기 때문에 예상보다 클 수 있습니다.

샘플링 볼륨 출력

샘플링 볼륨은 해당 범위 내에서 볼륨을 측정하는 3 차원 데이터 수집 영역입니다. 샘플링 볼륨을 만드는 단계는 모델 설정 섹션에 설명되어 있습니다(샘플링 볼륨 참조). 각 샘플링 볼륨의 계산 수량은 다음과 같습니다.

  • 시료채취량 내에서 #1 유체 총량
  • 시료채취량 내 #1 유체질량 중심
  • 샘플링 용적 가장자리에 위치한 솔리드 표면을 포함하여 샘플링 용적 내의 모든 벽 경계에 작용하는 좌표계의 원점에 상대적인 유압력 및 모멘트.
  • 샘플링 용적 내 총 스칼라 종량: 이것은 부피 적분으로 계산되므로 스칼라 양이 질량 농도를 나타내면 샘플링 용적 내의 총 질량이 계산된다. 거주 시간과 같은 일부 종의 경우, 평균 값이 대신 계산됩니다.
  • 샘플링 볼륨 내의 입자 수: 각 샘플링 볼륨 내에 있는 각 입자 등급의 정의된 각 종별 입자 수(입자 모델이 활성화된 경우)
  • 운동 에너지, 난류 에너지, 난류 소실율 및 와류에 대한 질량 평균
  • 표본 체적의 6개 경계 각각에서 열 유속: 유체 대류, 유체 및 고체 성분의 전도 및 유체/구성 요소 열 전달이 포함됩니다. 각 플럭스의 기호는 좌표 방향에 의해 결정되는데, 예를 들어, 양방향의 열 플럭스도 양수입니다. 출력에서 확장 또는 최대 디버그 수준을 선택하지 않는 한 이러한 디버그 수준은 fsplt에 자동으로 표시되지 않습니다.

FLOW-3D 및TruVOF는 미국 및 기타 국가에서 등록 상표입니다.

삼성 870 EVO SATA

수치해석에 유용한 SSD (메모리디스크) 가이드

본 자료는 ITWORLD 기사에서 2021년 1월과 20일 자료와 그 이전 자료에서 발췌 인용된 자료입니다. (출처 : www.itworld.co.kr)

수치해석을 하는 경우 계산과정에서 생성되는 결과 파일 사이즈는 매우 크기 때문에, 빠른 디스크 속도는 사용자의 총 해석시간을 줄이는데 큰 도움이 됩니다.

수치해석에서 SSD가 필요한가?

수치해석 업무를 담당하는 사용자에게 SSD가 필요한가? 한마디로 말하면 수치해석을 하는 모든 사람은 보유하고 있는 수치해석 장비의 디스크를 SSD로 업그레이드하는 것이 좋다. 가장 빠른 기계식 하드 드라이브도 SSD 속도에는 미치지 못한다.

기존 노트북, 또는 데스크톱의 하드 드라이브를 SSD로 교체하면 완전히 새로운 시스템처럼 느낄 수 있다. 수치해석을 하는 사용자는 SSD를 구입하는 것은 컴퓨터를 업그레이드하는데 가장 적합한 옵션이다.

SSD는 기계식 하드 드라이브보다 기가바이트 당 비용이 더 많이 들기 때문에 초 고용량으로 제공되지 않는 경우가 많다. 속도와 저장 공간이 필요한 경우, 128GB 나 256GB의 SSD를 구입해 부팅 드라이브로 사용하고, 기존 하드 드라이브를 PC의 보조 저장 장치로 사용하면 최선의 선택이 된다.

하드 드라이브는 가격 대비 용량 측면에서 여전히 큰 이점을 제공하며, 자주 사용되지 않는 데이터를 저장하는 용도로 적합하다. 그러나 운영체제, 프로그램, 자주 사용하는 데이터에는 보유하고 있는 시스템이 지원한다면 NVMe SSD, 지원하지 않는다면 SATA SSD를 사용하는 것이 좋다.

아래 그래프를 보면 SSD를 왜 사용해야 하는지 명확해진다.

SSD Speed compare
SSD Speed compare

SATA SSD vs. NVMe SSD

시장에 SATA SSD와 NVMe SSD가 아직 공존하는 데는 이유가 있다. 메모리 기반 SSD의 잠재력을 감안할 때 결국 새로운 버스와 프로토콜이 필요할 수밖에 없으리란 점은 초기부터 명확했다. 그러나 초창기 SSD는 비교적 속도가 느렸으므로 기존 SATA 스토리지 인프라를 사용하는 편이 훨씬 더 편리했다.

SATA 버스는 버전 3.3에 이르러 16Gbps까지 발전했지만 거의 모든 상용 제품은 여전히 6Gbps에 머물러 있다(오버헤드를 더해 대략 550MBps). 버전 3.3이라 해도 현재 SSD 기술, 특히 RAID 구성으로 낼 수 있는 속도에 비하면 한참 느리다.

그 다음으로 등장한 방법은 역시 기존 기술이지만 대역폭이 훨씬 더 높은 버스 기술인 PCI 익스프레스, 즉 PCIe 활용이다. PCIe는 그래픽 및 기타 애드온 카드를 위한 기본 데이터 전송 계층이다. 3.x 세대 PCIe는 복수의 레인(대부분의 PC에서 최대 16개)을 제공하며, 각 레인은 1GBps(985MBps)에 가까운 속도로 작동한다.

PCIe는 썬더볼트 인터페이스의 기반이기도 하다. 썬더볼트는 게임용 외장 그래픽 카드, 그리고 내장 NVMe와 거의 대등한 속도를 내는 외장형 NVMe 스토리지에서 진가를 발휘하기 시작했다. 많은 사용자들이 이제 느끼고 있지만, 인텔이 썬더볼트를 버리지 않은 것은 현명한 판단이었다.

물론 PCIe 스토리지는 NVMe보다 몇 년 전에 나왔다. 그러나 이전 솔루션은 SATA, SCSI, AHCI와 같은 하드 드라이브가 스토리지 기술의 정점이었던 시절에 개발된 오래된 데이터 전송 프로토콜에 발목을 잡혔다. NVMe는 저지연 명령과 다수의 큐(최대 6만 4,000개)를 제공함으로써 스토리지의 발목을 잡았던 제약을 없앤다. 지속적인 원을 그리며 데이터가 기록되는 하드 드라이브와 달리 SSD에서는 마치 산탄처럼 데이터가 흩어져 저장되므로 특히 후자, 즉 다수의 큐가 큰 효과를 발휘한다.

SSD 선택 시 유의해서 봐야할 것

물론 저장 용량과 가격이 중요하다. 또한 긴 보증기간은 조기 데이터 사망에 대한 우려를 완화시킬 수 있다. 대부분의 SSD 제조업체는 3년 보증을 제공하며 일부 더 좋은 모델은 5년을 보증한다. 그러나 이전 세대의 SSD와는 달리, 몇 년 전에 혹독한 내구성 테스트로 입증한 것처럼 최신 SSD는 일반 소비자가 어지간히 사용해서는 마모되지 않는다.

가장 유의해야 할 것은 SSD를 PC에 연결하는 데 사용되는 기술이다.

  • SATA: 연결 유형과 전송 프로토콜을 나타내며, 대부분의 2.5인치 및 3.5인치 하드 드라이브와 SSD를 PC에 연결한다. SATA III 속도는 약 600MBps에 달할 수 있으며, 대부분의 현대 드라이브는 최대 속도를 제공한다.
  • PCIe: 이 인터페이스는 컴퓨터의 4개의 PCIe 레인을 활용해 SATA 속도를 훨씬 능가해 거의 4GBps를 제공한다(PCIe 3세대). 이런 파괴적인 속도는 강력한 NVMe 드라이브와 잘 어울린다. 메인보드의 PCIe 레인과 M.2 슬롯 모두 PCIe 인터페이스를 지원하도록 유선으로 연결할 수 있으며, “검정” M.2 드라이브를 PCIe 레인에 슬롯화할 수 있는 어댑터를 구입할 수 있다.
  • NVMe: 비휘발성 메모리 익스프레스(Non-Volatile Memory Express) 기술은 PCIe의 풍부한 대역폭을 활용해 SATA 기반 드라이브를 비교조차 못할 정도로 매우 빠른 SSD를 만든다. NVMe에 대해 더 자세히 알고 싶다면 여기를 클릭하라.
  • M.2: 설명이 쉽지 않다. 많은 사람이 M.2 드라이브가 모두 NVMe 기술과 PCIe 속도를 사용한다고 생각하지만 사실이 아니다. M.2는 단순히 폼 팩터에 불과하다. 물론 대부분의 M.2 SSD는 NVMe를 사용하지만 일부는 여전히 SATA를 사용한다. 많은 최신 울트라북이 저장을 위해 M.2를 사용한다.
  • U.2 및 mSATA: mSATA 및 U.2 SSD에서도 문제가 발생할 수 있지만, 이 형식을 지원하는 메인보드와 제품 가용성은 드물다. M.2가 대중화되기 전에 일부 구형 울트라북에 mSATA가 포함되어 있으며, 필요할 경우 드라이브를 사용할 수 있다.  

물론 속도도 중요하지만, 대부분의 최신 SSD는 SATA III 인터페이스를 지원한다. 그러나 전부 다 그런 것은 아니다.

구입전 사용자가 알아야 할 NVMe SSD

NVMe 드라이브는 구입하기 전에 어떤 특징을 갖고 있는지 알고 있어야 한다. 표준 SATA SSD는 이미 PC 부팅 시간과 로딩 시간을 대폭 단축하고 훨씬 저렴하다. NVMe 드라이브는 특히 대량으로 데이터를 정기적으로 전송하는 경우, 삼성 960 프로와 같은 M.2 폼 팩터나 또는 PCIe 드라이브가 가장 많은 효과를 누릴 수 있다. 그렇지 않으면 NVMe 드라이브는 가격만 비쌀뿐 가치도 없다.  

ⓒ Brad Chacos

NVMe SSD를 구입하기로 결정한 경우, PC에서 SSD를 처리할 수 있는지 확인해야 한다. 이는 비교적 새로운 기술이므로, 지난 몇 년 내에 제작한 메인보드만이 M.2 연결이 가능하다. 스카이레이크 시대의 AMD 라이젠과 주류 인텔 칩을 고려하라. PCIe 어댑터에 탑재된 NVMe SSD는 M.2 채택이 확산되기 전인 초기에 널리 사용됐지만 지금은 매우 드물다. NVMe SSD를 구입하기 전에 실제로 NVMe를 사용할 수 있는지 확인하고 최대한 활용하기 위해서는 4개의 PCIe 레인이 필요하다는 점에 유의해야 한다. 

NVMe 드라이브를 최대한 활용하려면 운영체제를 실행해야 하기 때문에 드라이브를 인식하고 부팅할 수 있는 시스템이 있어야 한다. 지난 1~2년 전에 구입한 PC는 NVMe 드라이브에서 부팅하는데 아무런 문제가 없지만, 좀 더 오래된 메인보드는 지원하지 않을 수 있다. 구글에서 자신의 메인보드를 검색하고 NVMe 부팅을 지원하는지 확인하라. 보드의 BIOS 업데이트를 설치해야 할 수도 있다. 하드웨어가 NVMe SSD에서 부팅할 수 없는 경우에도 보조 드라이브로 사용할 수 있어야 한다.  

아래 itworld에 기고된 최신 SSD에 대한 기사를 인용 제공합니다.

리뷰 | 삼성 870 EVO SATA, 원하는 속도와 합리적인 가격 ‘다 갖췄다’

일자 : 2021-01-20, 출처 : https://www.itworld.co.kr/print/179874

삼성은 SSD 시장에 진출한 이래로 줄곧 이 시장의 선두를 지키고 있으며, 870 EVO는 그 전통을 이어갔다. 870 EVO는 본지가 테스트한 제품 가운데 가장 빠른 SATA SSD이며, 최대 4TB 용량과 속도를 감안할 때 매우 저렴하다. 

ⓒ Samsung


다양한 사양과 적당한 가격, 그리고 5년 보증 

삼성 870 EVO는 삼성 자체 TLC(Triple-Level Cell / 3비트) V낸드(V-NAND)를 사용하는 2.5인치 SATA 6Gbps SSD다. 삼성은 일반적으로 실제 컨트롤러 기술이나 레이어 수에 관해서는 밝히지 않지만, 용량으로 봤을 때, 92 또는 96 레이어를 갖춘 삼성이 자체 설계한 컨트롤러일 가능성이 높다.

삼성은 이 드라이브를 250GB/50달러, 500GB/80달러, 1TB/140달러, 2TB/270달러, 4TB/520달러 버전으로 제공한다. 250GB 용량마다 512MB의 기본 DRAM 캐시가 있으며, 드라이브는 150TBW(쓰기 가능한 용량) 또는 5년 서비스를 보장한다. 150TBW가 먼저 도래하면 5년 보증이 무효화된다는 의미다. 대부분의 사용자는 이렇게 많은 데이터를 작성하지 못하므로 사실상 5년 보증이라고 생각하면 된다. 

ⓒ Samsung

870 EVO는 삼성의 터보라이트(TurboWrite) 가변 보조 캐시 알고리즘을 사용한다. 메인 낸드는 전압 레벨당 단일 비트만 기록해 SLC로 처리된다. 따라서 드라이브의 최대 용량에 근접할 때까지 최고의 쓰기 성능을 유지할 수 있다. 다만 SSD 성능 저하의 경험을 겪지 않으려면, 저장 용량의 75%를 넘지 않는 것이 좋다. 


테스트한 SATA SSD 제품 가운데 최고  

삼성 870 EVO는 지금까지 테스트한 전체 SATA SSD 가운데 가장 빠른 것으로 검증됐다. 특히 작은 파일에서 뛰어난 성능을 발휘했다. 그렇다고 훨씬 빠른 NVMe 기술에서의 성능과 비교하는 것은 아니다. 6Gbps SATA 자체가 제한적인 기술이다. 테스트 수치는 모든 최상위 SATA 드라이브에서 매우 유사하다. 하지만 870 EVO는 많은 작업에서 1~2초 정도 줄일 수 있으며, 장기적으로 보면 성능의 차이로 나타날 것이다. 

이번 테스트에서는 2019년형 씨게이트 아이언울프(Seagate IronWolf) 110와 비교했는데, 아이언울프 110은 모든 단계에서 870 EVO를 따라잡을 수 있는 몇 안 되는 제품이기 때문이다. 그러나 훨씬 더 비싸고 기업용으로 설계된 제품이다. 

ⓒ IDG

(그림)에서 볼 수 있듯이 지속적인 쓰기 또는 읽기 성능과 관련해 경쟁업체 간에는 거의 차이가 없다. 그러나 설계 능력과 구성요소는 랜덤/작은 파일 성능에 차이를 만들 수 있으며, 실제로 다음 (그림)과 같은 수치를 기록했다. 

크리스탈디스크마크(CrystalDiskMark) 6의 지속적인 처리량 테스트와 마찬가지로 48GB 전송에서 드라이브 간의 차이는 미미했다. 870 EVO는 여전히 12초(약 2%) 차이로 승리를 차지했다. 

ⓒ IDG

다음 (그림)에서 870 EVO가 870 QVO보다 약간 비싼 이유를 확인할 수 있었다. QVO는 보조 낸드 캐시가 부족할 때, 150Mbps로 속도가 느려진다. 870 QVO는 870 EVO처럼 낸드를 보조 캐시로 동적으로 할당하지 않는다.  

ⓒ IDG

450GB 쓰기는 1TB와 4TB 모델 모두에서 수행했으며, 예상 변동 범위 내에서 5초 차이가 난다. 이는 터보라이트가 더 큰 용량에서 제 역할을 수행하고 있음을 의미한다. 500GB 모델은 870 QVO의 QLC와 달리 TLC 기반 EVO에서는 속도가 느려질 수 있다. 


870 EVO, 가격대 최고 제품 

삼성 870 EVO는 동급 최고의 성능을 자랑하며, 모든 사용 시나리오에서 최고의 성능을 자랑한다. 대용량 파일을 작성하지 않는다면 더 저렴한 870 QVO를 선택할 수 있다. 다만 필요하다고 생각하는 용량보다 훨씬 더 많은 용량을 선택해야 한다. 비용이 문제가 되지 않을 경우, 870 EVO는 완벽한 드라이브이며, 미래형 드라이브로 권장할 수 있다. editor@itworld.co.kr

ITWORLD : 6월 업데이트 | 2020년 최고의 SSD 선택 가이드

스토리지 PCWorld SSD(Solid-State Drive)로 전환하는 것은 PC에 가장 적합한 업그레이드다. SSD을 통해 PC는 부팅 시간이 짧아지고, 프로그램 및 게임 로드 속도가 빨라지는 등, 일반적으로 컴퓨터 속도가 빨라진다. 



그러나 모든 SSD가 동일한 것은 아니다. 최고의 SSD는 저렴한 가격으로 견고한 성능을 제공한다. 가격이 문제가 되지 않을 경우, 엄청난 속도의 빠른 읽기 및 쓰기 속도를 제공한다. 

많은 SSD가 2.5인치 폼 팩터로 제공되며 기존 하드 드라이브에서 사용하는 것과 동일한 SATA 포트를 통해 PC와 통신한다. 그러나 최첨단 NVMe(Non-Volatile Memory Express) 드라이브는 메인보드의 M.2에 직접 연결하는 작은 스틱 형태의 SSD다. PCIe 어댑터에 장착되는 이 드라이브는 구입하기 전에 메인보드에 슬롯이 있는지 확인해야 한다. 그래픽 카드나 사운드 카드처럼 메인보드에 꽂을 수 있는 SSD와 미래형 3D 크로스포인트(3D XPoint) 드라이브 등이 등장함에 따라 완벽한 SSD를 선택하는 것은 예전처럼 간단하지 않다. 

그래서 이 가이드가 필요하다. 본지는 사용자 상황에 적합한 SSD를 찾기 위해 수많은 SSD를 테스트했다. 본지가 선정한 최고 인기 제품과, SSD 선택 시 무엇을 봐야 하는지 알아보도록 하자. 


최신 SSD 소식 

  • 지난해 가을, AMD의 라이젠(Ryzen) 3000 CPU가 최첨단 PCIe 4.0 스토리지 지원을 받아 출시됐지만, 그 지원은 고가의 X570 메인보드에만 국한됐다. 이제 곧, B550 메인보드는 동일한 기능을 일반인에게도 제공할 것이며, 오래된 라이젠 칩과도 호환될 것이다. 6월 16일에 발표할 것이다.   
  • X박스 시리즈 X의 초고속 스토리지 기술의 중추인 다이렉트스토리지(DirectStorage)가 윈도우에 등장한다. 마이크로소프트는 다이렉트스토리지 자체에 대해 자세히 다루지 않았지만, X박스 시리즈 X의 ‘벨로시티 스토리지(Velocity Storage)’는 정말 인상적이다. 


대부분 사용자를 위한 최고의 SSD 

SK 하이닉스 골드(SK Hynix Gold) S31 SATA SSD 

ⓒ SK Hynix

실제 시장에서 등장한 SK 하이닉스의 첫 번째 SSD는 본지가 테스트한 것 가운데 가장 빠른 SATA 드라이브임을 입증했다. 사실 SK 하이닉스는 세계에서 가장 큰 반도체 공급업체 가운데 하나로, 모든 기술을 갖고 있다. 골드 S31 가격은 적당하며 아주 좋은 드라이브다.  

삼성의 주력인 EVO SSD 제품군은 2014년 이래로 줄곧 본지의 권장 목록에서 1위를 차지했으며, 현재 삼성 860 EVO는 여전히 속도, 가격, 호환성 및 5년 보증 및 뛰어난 마법사 관리 소프트웨어의 안정성 등 조화를 원하는 사람들에게 좋은 옵션이다. 하지만 최근 새롭게 출시되는 신제품에 의해 왕좌에서 내려왔는데, 이 신인은 사실 전혀 새로운 존재는 아니었다.   

대부분의 사람은 SK 하이닉스 골드 S31을 구입하는 것이 좋다. 본지가 테스트한 가장 빠른 SATA SSD 가운데 하나일뿐만 아니라 가격도 적절하다. 

250GB 드라이브의 경우 46달러, 500GB 드라이브의 경우 64달러, 대규모 1TB 드라이브의 경우 125달러인 골드 S31은 삼성의 제품군(500GB 90달러, 1TB 모델 140달러)보다 훨씬 저렴하다. 골드 S31은 실제 48GB 복사 테스트에서 지속적인 읽기와 쓰기 작업을 위해 테스트한 드라이브 가운데 가장 빠른 드라이브임을 증명했다. 

SK 하이닉스는 정확히 제품 이름이 아니기 때문에 브랜드 자체에 대해 조금 딴지를 걸 수도 있다. 그럼에도 불구하고 SK 하이닉스는 지구상에서 가장 큰 반도체 제조업체 가운데 하나다. SK 하이닉스는 시작부터 NAND 및 컨트롤러 기술을 개발해왔으며, 수많은 대형 컴퓨터 업체의 SSD 제조업체였지만 판매선상에는 자리하지 못했다. 이제 그 선상에 섰고, 결과는 훌륭했다. 

좀 더 큰 저장 용량을 원하는 사용자라면 비싸긴 하지만 삼성 860 EVO가 1TB, 2TB, 4TB 모델을 제공하고 있다. SK 하이닉스도 골드 S31 1TB 버전을 약 110달러에 제공했지만 현재는 사용할 수 없다(이 제품은 미국에서만 출시됐으며 국내에서는 해외 직구로만 구입할 수 있다. 편집자 주). 

 
가성비 최고의 SSD 

애드링크(AddLink) S22 QLC SATA 2.5인치 SSD

ⓒ Addlink 

애드링크 S22 QLC는 장시간 쓰기 작업 중에도 속도가 느려지지 않는다. 또한 SSD 치고는 매우 싸다. 몇 가지 문제가 있음에도 불구하고 본지는 이 제품을 가성비 최고의 SSD로 선정했다. 

기존의 MLC(Multi-Level Cell) 및 TLC (Triple-Level Cell) SSD 가격이 급락하면서 제조업체는 SSD 가격을 더욱 낮추는 새로운 형태의 QLC(Quick-Level Cell) 드라이브를 출시했다. 이 새로운 기술을 통해 SSD 제조업체는 하드 드라이브와 같은 용량의 SSD를 출시함과 동시에 매우 빠른 SSD 속도에 근접하게 됐다. 

여전히 최고인 삼성 860 QVO를 포함한 QLC 드라이브의 1세대는 수십 기가바이트의 데이터를 한번에 전송하면, 쓰기 속도가 하드드라이브 수준으로 떨어졌다. 하지만 애드링크 S22 QLC SSD는 그렇지 않다. 기존 TLC SSD가 QLC 드라이브에 비해 속도 우위를 유지하지만 애드링크 S22의 경우, 이런 한계를 벗어난 데다가 가격은 512GB 63달러, 1TB 104달러에 불과하다. SK하이닉스 S31 또한 이제 거의 같은 속도라는 점은 주목할 필요가 있다. 

대량의 데이터를 한번에 이동할 계획이 없고, 더 많은 공간이 필요하다면, 삼성 860 QVO는 여전히 훌륭한 옵션이다. 실제로 애드링크의 SSD보다 조금 더 빠르다. 그러나 아마존에서 1TB는 128달러, 2TB는 250달러, 5TB는 480달러로 더 비싸다. 더 낮은 용량은 판매되지 않는다. 

그러나 더 빠르고 새로운 NVMe M.2 드라이브를 지원하는 새로운 메인 보드가 있다면 무엇을 선택해야 할까? 


최고의 NVMe SSD 

WD 블루 SN550 NVMe M.2 SSD 

ⓒ WD

100달러짜리 1TB 드라이브는 마음에 들기 쉽다. 특히 블루 SN550은 SN500보다 눈에 띄게 향상되어 거의 모든 사람에게 만족을 준다. 약간의 빈약한 SLC 캐시가 약점이긴 하지만 250GB 용량은 950MBps 쓰기 속도를 갖고 있다는 점이다. 본지는 1TB 버전을 클럭킹해 1.75GBps를 기록한 바 있다. 

성능이 가장 중요한 경우, 삼성 970 프로 또는 시게이트 파이어쿠다(Seagate FireCuda) 510이 가장 빠른 NVMe SSD이긴 하지만, 대부분의 사람은 웨스턴디지털 블루 SN550 NVMe SSD를 구입하는 것이 좋다.  

WD SSD는 NVMe 드라이브 가운데 가장 화려하지도, 앞서 언급한 대안만큼 빠르지도 않다. 하지만 비용이 훨씬 저렴하다. WD 블루 SN550은 보급형 가격(250GB 55달러, 500GB 70달러, 1TB 110달러)에도 불구하고 다른 할인된 NVMe 드라이브와는 성능에서는 조금의 차이가 있다. 신뢰성이 뛰어나고 잘 알려진 유명 브랜드의 제품으로 평균 5년 이상의 보증 기간을 제공한다. 

조금 더 뛰어난 성능을 원한다면, 애드링크 S70 NVMe SSD가 또 다른 훌륭한 옵션이다. 본지는 WD 드라이브보다 성능을 약간 선호하지만, 애드링크 SSD는 가격 인상 이후, 약 15달러가 더 비싸졌으며, WD 블루 SN550의 성능은 일상적인 컴퓨터 사용자에게 충분하다고 판단했다. 애드링크는 WD만큼 잘 알려져 있진 않지만 해당 제품에 대해 5년 보증을 제공한다. 


가장 빠른 SSD 

인텔 옵테인(Intel Optane) SSD 905P 

ⓒ Intel

인텔 SSD 905P는 본지가 테스트한 가장 빠른 NVMe 드라이브 가운데 하나였으며, 가장 비싼 드라이브이기도 하다. 그러나 내구성이 매우 우수하다는 평가를 받고 있다. 많은 양의 데이터를 작성하는 경우, 구입할만한 가치가 있다.  

성능이 가장 중요하고 가격을 생각하지 않는다면, 인텔의 옵테인 SSD 905P는 구매할 수 있는 최고의 SSD다. 이 드라이브는 다른 SSD와 같은 기존 NAND 기술을 사용하지 않고 마이크론과 인텔이 개발한 미래형 3D 크로스포인트(3D Xpoint) 기술을 기반으로 만들어졌다. 

하지만 실질적인 측면에서 옵테인 SSD 900P는 스토리지 벤치마크를 완벽하게 통과해 NAND SSD가 제공하는 약 200TBW에 비해 엄청나게 많은 8,750TBW을 자랑한다. 만약 이것이 사실이라면, 이 초고속 드라이브는 기본적으로 압도적이며, 엄청나게 좋아보인다. 

그러나 최고의 성능이 누리는 권리에 대한 대가를 지불해야 한다. 인텔 옵테인 SSD 905P는 280GB 390달러, 480GB의 경우 599달러, 1.5TB의 경우 1,130달러이며, U.2 및 PCIe 카드 형태로 제공되는 등 몇 가지 추가 옵션이 있다. 

또한 NVMe SSD보다 훨씬 비싸다. 이런 특성으로 인해 인텔 SSD는 대량의 데이터를 정기적으로 이동하는 곳에는 가장 효과적이다. 또한 옵테인 SSD 900P는 실제로 NVMe 프로토콜을 사용해 PC와 통신하기 때문에 몇 가지 추가 기준을 충족시켜야 부팅이 가능하다.    

이 제품보다 한 단계 떨어진 인텔 옵테인 SSD 900P는 905P의 미디어처 버전과 유사하지만 더 낮은 용량과 가격에서도 기존 SSD를 능가한다(280GB 버전 390달러, 480GB 모델 599달러로 대부분의 NVMe 드라이브보다 훨씬 비싸다). 

AMD의 뛰어난 라이젠 3000 시리즈 프로세서가 최첨단 기술을 지원함에 따라 초고속 PCIe 4.0 SSD가 출시되기 시작했다. 이에는 고급 AMD X570 메인보드가 필요하다. 초기 평가를 통해 실제 환경에서 대용량 파일을 이동할 때 실질적인 이점만 얻을 수 있다는 것을 알 수 있지만, 여기서 언급된 기존 PCIe 4.0 SSD보다 훨씬 빠른 속도를 약속한다. 

커세어(Corsair), 기가바이트(Gigabyte), 세이브런트(Sabrent)는 사용 가능한 첫 번째 PCIe 4.0 SSD를 출시했으며, 1TB 모델과 비슷한 성능을 약 200달러에 제공했다. 그러나 본지는 아직 이 제품들에 대해 테스트하지 않았다. 

editor@itworld.co.kr

FLOW-3D 수치해석 프로그램 Supported Platforms 보기

업무에 적합한 올바른 CFD 소프트웨어 선택 방법

업무에 적합한 올바른 CFD 소프트웨어 선택 방법

많은 제품들이 모두 자신의 소프트웨어가 가장 적합하다고 말하기 떄문에, 사람들은 자신의 업무에 적합한 CFD 소프트웨어 선택에 어려움을 겪습니다. 그 이유는 유체 흐름 및 열 전달 분석을 위한 소프트웨어 패키지는 다양한 형태로 제공됩니다. 이러한 패키지는 물리적 근사치와 수치적 솔루션 기법이 크게 다르기 때문에 적합한 패키지를 선택하는 것이 어렵습니다.

아래 내용에서 올바른 CFD 소프트웨어를 선택할 때 고려해야 할 중요한 항목을 설명합니다.

Spillway’s tailrace over natural rock

1. 메싱 및 지오메트리

유한 요소 또는 “바디 맞춤 좌표”를 사용하는 솔루션 방법은 유동 영역의 기하학적 구조를 준수하는 해석용 그리드를 생성해야합니다. 정확한 수치 근사를 위해 허용 가능한 요소 크기와 모양으로 이러한 그리드를 생성하는 것은 쉽지 않은 작업입니다. 복잡한 경우 이러한 유형의 그리드 생성에는 며칠 또는 몇주의 노력이 소요될 수 있습니다. 일부 프로그램은 직사각형 그리드 요소만 사용하여 이러한 생성 문제를 제거하려고 시도하지만 흐름 및 열 전달 특성을 변경하는 “계단현상” 경계 문제를 해결해야 합니다. FLOW-3D는 FAVOR ™ (분수 면적 / 체적) 방법을 사용하여 기하학적 특성이 매끄럽게 포함된 생성하기 쉬운 직사각형 그리드를 사용하여 두 문제를 모두 해결합니다. 간단하고 강력한 솔리드 모델러가 FLOW-3D와 함께 패키지로 제공되거나 사용자가 CAD 프로그램에서 기하학적 데이터를 가져올 수 있습니다.

2. 운동량 방정식과 대략적인 흐름 모델

유체 운동량의 정확한 처리는 여러 가지 이유로 중요합니다. 첫째, 복잡한 지오메트리를 통해 유체가 어떻게 흐를지 예측할 수 있는 유일한 방법입니다. 둘째, 유체에 의해 가해지는 동적 힘 (즉, 압력)은 모멘텀을고려하여야만 계산할 수 있습니다. 마지막으로, 열 에너지의 대류 이동을 계산하려면 개별 유체 입자가 다른 유체 입자 및 제한 경계와 관련하여 어떻게 움직이는지를 정확하게 파악할 수 있어야 합니다.

이것은 운동량의 정확한 처리를 의미합니다. 모멘텀의 보존을 대략적으로만 하는 단순화된 흐름 모델은 실제적인 유체 구성과 온도 분포를 예측하는데 사용할 수 없기 때문에 FLOW-3D에서는 사용되지 않습니다.

3. 액체-고체 열 전달 영역

액체와 고체 (예 : 금속-금형) 사이의 열 전달에는 계면 영역의 정확한 추정이 필요합니다. 계단 경계는 이 영역을 과대 평가합니다. 예를 들어, 실린더의 표면적은 27 %의 비율로 과대 평가됩니다. FLOW-3D 전 처리기의 각 제어 볼륨에 대해 FAVOR ™ 방법에 의해 정확한 계면 영역이 자동으로 계산됩니다.

4. 액체-고체 열 전달에 대한 볼륨 효과 제어

제어 볼륨의 크기는 액체 / 고체 인터페이스를 포함하는 제어 볼륨에서도 열이 흐르기 때문에 액체와 고체 사이에서 교환되는 열의 속도와 양에 영향을 미칠 수 있습니다. FLOW-3D에서는 액체-고체 인터페이스에서 열 전달 속도를 계산할 때 체적 크기와 전도도가 고려됩니다.

5. 암시성(Implicitness)과 정확성

비선형 및 결합 방정식에 대한 암시적 방법에는 각 반복에서 under-relaxation 특성이 있는 반복 솔루션 방법이 필요합니다. 이 동작은 일부 상황에서 심각한 오류 (또는 매우 느린 수렴)를 일으킬 수 있습니다 (예 : 큰 종횡비로 제어 볼륨을 사용하거나 실제로 중요하지 않은 효과를 예상하여 암시성이 사용되는 경우).

FLOW-3D에서는 계산 노력FLOW-3D에서는 계산 작업이 덜 필요하기 때문에 가능한 경우 언제나 명시적 수치 방법을 사용하며, 수치 안정성 요구 사항은 정확도 요구 사항과 동일합니다. Implicit vs. Explicit Numerical Methods 문서에서 자세히 알아보세요.

6. 대류 전송을 위한 암시적 수치 방법 (Implicit Numerical Methods)

임의적으로 큰 시간 단계 크기를 계산에 사용할 수 있는 암시적 수치 기법은 CPU 시간을 줄이는데 널리 사용되는 방법입니다. 불행히도 이러한 방법은 대류 해석에 정확하지 않습니다. 암시적 방법은 근사 방정식에 확산 효과를 도입하여 시간 단계 독립성을 얻습니다. 물리적 확산(예 : 열전도)에 수치적 확산을 추가하는 것은 확산 속도만 수정하기 때문에 심각한 문제를 일으키지 않을 수 있습니다. 그러나 대류 과정에 수치 확산을 추가하면 모델링되는 물리적 현상의 특성이 완전히 바뀝니다. FLOW-3D에서 시간 단계는 프로그램에 의해 자동으로 제어되어 정확한 시간 근사치를 보장합니다.

7. 이완 및 수렴 매개 변수 (Relaxation and Convergence Parameters)

암시적 근사를 사용하는 수치 방법은 하나 이상의 수렴 및 이완 매개 변수를 선택해야합니다. 이러한 매개 변수를 잘못 선택하면 발산 또는 수렴 속도가 느려질 수 있습니다. FLOW-3D에서는 하나의 수렴 및 하나의 이완 매개 변수만 사용되며, 두 매개 변수는 프로그램에 의해 동적으로 선택됩니다. 사용자는 수치해석 솔버를 제어하는 ​​매개 변수를 설정할 필요가 없습니다.

8. 자유 표면 추적

액체-가스 인터페이스 (즉, 자유 표면)를 모델링하는 데 사용되는 두 가지 방법이 있습니다. 그 중 하나는 액체 및 가스 영역의 흐름을 계산하고 계면을 유체 밀도의 급격한 변화로 처리하는 것입니다. 일반적으로 밀도 불연속성은 고차 수치 근사를 사용하여 모델링됩니다.

불행히도, 이 치료는 몇몇 그리드 셀에 걸쳐 인터페이스가 매끄럽게 진행되도록 해주며, 그러한 인터페이스에 일반적으로 존재하는 접선 유속의 급격한 변화는 설명하지 않습니다. 또한 이 기법은 가스가 계산 영역으로 유입되는 액체로 대체될 경우 탈출 포트 또는 가스의 싱크로도 보완해야 합니다. 또한 이러한 방법은 일반적으로 유체의 비압축성을 만족시키기 위해 더 많은 노력을 기울여야 합니다.  가스 영역은 거의 균일한 압력 조정을 통해 솔루션 수렴 속도를 늦추는 경향이 있기 때문에 이러한 현상이 발생합니다.

FLOW-3D에서는 다른 기술인 VOF (Volume-of-Fluid) 방법이 사용됩니다. 이것은 인터페이스가 단계 불연속으로 긴밀하게 유지되는 진정한 3 차원 인터페이스 추적 체계입니다. 또한 선택적 표면 장력을 포함하여 수직 및 접선 응력 경계 조건이 인터페이스에 적용됩니다. 가스 영역은 사용자가 모델에 포함되도록 요청하지 않는 한 계산되지 않습니다.

고성능 컴퓨터(HPC)에 대한 이해

본 자료는 수치해석을 업무로 수행하는 엔지니어들의 고성능 컴퓨터에 대한 이해를 돕기 위해 https://www.amd.com/ko/technologies/hpc-explained 를 인용한 자료입니다.
본 자료의 모든 저작권은 https://www.amd.com에 있습니다.

고성능 컴퓨팅 안내

신약 개발에 걸리는 기간이 수년에서 수일로 단축된다고 상상해 보십시오. 고성능 컴퓨팅(HPC)은 시뮬레이션, 모델 및 분석을 통해 이러한 유형은 물론 기타 첨단 과학 문제를 해결할 수 있습니다. 이러한 시스템은 세계의 여러 주요 문제에 대한 해결책을 제공하여 “4차 산업혁명”으로 가는 길을 제시합니다.1 HPC 시스템은 이미 다음과 같은 용도로 사용되고 있습니다.

  • 여러 유형의 암과 기타 질병 퇴치를 위한 신약 화합물 개발 및 시험2
  • 방탄복과 같은 신소재 개발을 위한 분자 역학 시뮬레이션3
  • 영향을 받는 지역사회가 더 효과적으로 대비하도록 돕기 위한 중요한 기상 변화 예측4

슈퍼컴퓨터는 최첨단 HPC 시스템을 대표합니다. 슈퍼컴퓨터의 고유한 역량은 기능의 발전에 따라 시간이 지나면서 변화하는 표준에 좌우됩니다. 단일 슈퍼컴퓨팅 클러스터에는 수만 개의 프로세서가 포함될 수 있으며 세계 최고 성능의 최고가 시스템의 가격은 1억 달러 이상에 달합니다.5

HPC의 작동 방식

HPC에서 정보를 처리하는 두 가지 주요 방법:

직렬 처리를 중앙 처리 장치(CPU)에서 수행합니다. 일반적으로 각 CPU 코어에서 한 번에 한 작업만 처리합니다. CPU는 운영체제 및 기본적인 애플리케이션(예: 워드 프로세싱, 사무 생산성)과 같은 기능에 있어 필수적입니다.serial processing chart

병렬 처리를 여러 CPU 또는 그래픽 처리 장치(GPU)를 통해 수행할 수 있습니다. 원래는 전용 그래픽 용으로 개발된 GPU는 데이터 매트릭스(예: 화면 픽셀)에 대해 동시에 여러 산술 연산을 수행할 수 있습니다. GPU는 수많은 데이터 계층에서 동시에 작업할 수 있기 때문에 동영상에서 객체를 인식하는 것과 같은 머신 러닝(ML) 애플리케이션 작업에서 병렬 처리를 수행하는 데 적합합니다.parallel processing chart

슈퍼컴퓨팅의 잠재력을 극대화하기 위해서는 다양한 시스템 아키텍처가 필요합니다. 대부분의 HPC 시스템은 초고대역폭 상호 연결을 통해 여러 프로세서 및 메모리 모듈을 취합하여 병렬 처리를 지원합니다. 일부 HPC 시스템은 CPU와 GPU를 결합하는 데 이를 이기종 컴퓨팅이라고 합니다.

컴퓨터의 컴퓨팅 성능은 “FLOPS”(초당 부동 소수점 연산)라는 단위로 측정됩니다. 2019년 초반 현재 최고 수준의 슈퍼 컴퓨터는 143.5페타FLOPS(143 × 1015)를 처리할 수 있습니다. 페타스케일라고 하는 이러한 수준의 슈퍼컴퓨터는 천조 이상의 FLOPS를 수행합니다. 그에 비해, 하이엔드 게이밍 데스크탑은 속도가 1/1,000배 미만으로 약 200기가FLOPS(1 × 109)를 처리하는 데 그칩니다. 프로세싱과 처리 성능 모두에서 슈퍼컴퓨팅 혁신이 이루어지면 머지않아 엑사스케일 수준의 슈퍼컴퓨팅으로 발전하여 페타스케일보다 약 1,000배 빠른 속도가 실현될 것입니다. 이는 엑사스케일 슈퍼컴퓨터가 초당 1018(또는 10억 x 10억)의 연산을 수행할 수 있음을 의미합니다.evolution processing power

“FLOPS”는 이론적 처리 속도를 나타냅니다 – 프로세서에 지속적으로 데이터를 전송하는 데 필요한 속도를 파악합니다. 그러므로, 데이터 처리율이 반드시 시스템 디자인에 반영되어야 합니다. 프로세싱 노드 간 상호 연결과 함께 시스템 메모리가 데이터의 프로세서 도달 속도에 영향을 줍니다.supercomputer representative power

차세대 슈퍼컴퓨터가 구현하는 1 exaFLOP의 처리 성능은 5,000,000대에 달하는 데스크탑 컴퓨터의 성능에 필적합니다.*

*각 데스크탑의 처리 성능을 200기가FLOPS로 가정

스마트한 용어

  • 고성능 컴퓨팅 (HPC): 단일 컴퓨터(예: 1개의 CPU + 8개의 GPU)부터 세계적 수준의 슈퍼컴퓨터를 아우르는 폭넓은 범위의 강력한 컴퓨팅 시스템
  • 슈퍼컴퓨터: 진화하는 성능 표준에 기반한 최고 수준의 HPC
  • 이기종 컴퓨팅: 직렬(CPU) 및 병렬(GPU) 처리 기능을 최적화하는 HPC 아키텍처
  • 메모리: 데이터에 신속하게 액세스하기 위해 HPC 시스템에서 데이터가 저장되는 위치
  • 인터커넥트: 프로세싱 노드 간 통신을 지원하는 시스템 계층, 여러 수준의 상호 연결이 슈퍼컴퓨터 내에 존재
  • 페타스케일: 초당 1,000조(1015)의 계산을 수행하기 위해 설계된 슈퍼컴퓨터
  • 엑사스케일: 초당 100경(1018)의 계산을 수행하기 위해 설계된 슈퍼컴퓨터

새로운 이용 사례

기술 수준이 향상되면서, HPC는 더욱 폭넓은 기능으로 확장되었습니다. 오늘날 처리 능력과 메모리가 그 어느 때보다 향상되어 보다 복잡한 문제를 해결할 수 있게 되었습니다.

  • 머신 러닝: 인공지능(AI), 머신 러닝(ML)의 하위집합으로서 수행 지침을 수동적으로 받아들이는 대신 스스로 학습할 수 있는 시스템을 말합니다. HPC 시스템은 사진에서 흑색 종을 감지하는 암 연구와 같이 방대한 양의 데이터를 분석하는 높은 수준의 ML에 사용할 수 있습니다.6
  • 빅 데이터 분석: 학술, 과학, 금융, 비즈니스, 의료, 사이버 보안 및 정부 애플리케이션 부문의 연구 및 문제 해결을 보완하기 위해 대량의 데이터 세트를 신속하게 비교하고 상관 관계를 분석합니다. 이 작업에는 대규모 처리 및 컴퓨팅 기능이 필요합니다. 매년 50페타바이트의 임무 데이터가 생성되는 NASA에서는 슈퍼컴퓨팅을 활용해 관측을 분석하고 방대한 정보를 바탕으로 시뮬레이션을 실행합니다.7
  • 고급 모델링 및 시뮬레이션: 기업은 초기 단계에서 물리적 구축을 수행하지 않고도, 고급 모델링 및 시뮬레이션을 통해 혁신적인 제품을 더 빨리 출시하고 시간, 재료 및 인건비를 절약할 수 있습니다. HPC 모델링 및 시뮬레이션은 신약 개발 및 시험, 자동차 및 항공 우주 설계, 기후 예측/기상 관측, 에너지 애플리케이션 부문에서 활용됩니다.8

AMD가 엑사스케일에 대한 드라이브를 실현하는 방식

미국에너지국(DOE)/버클리 연구소(Berkeley Lab), 로렌스 리버모어 국립 연구소(U.S. Lawrence Livermore National Laboratory), 슈투트가르트 대학(University of Stuttgart) 및 CSC(핀란드 IT 과학 센터)의 최신 시스템과 같은 세계 최고 성능의 슈퍼컴퓨터가 바로 AMD 기술에 기반합니다.9

가까운 미래에 엑사스케일 수준의 최적의 슈퍼컴퓨터 설계를 실현하기 위해서는 더욱 강력한 처리 성능 및 프로세싱 기능(CPU 및 GPU 모두에서)이 필요합니다. 고성능 컴퓨팅과 그래픽 기술 부문 모두에서 업계 리더인 AMD는 HPC 시스템을 최적화하는 데 있어 몇 가지 고유한 이점을 제시합니다. 미국에너지국(DOE)에서 추진하는 엑사스케일 컴퓨팅 프로젝트의 일환으로, AMD는 미국 최초로 엑사스케일 수준의 슈퍼컴퓨터를 개발하기 위한 기술을 발전시키기 위해 미국 정부와 파트너십을 맺었습니다.10 이 작업에는 CPU 및 GPU 마이크로아키텍처, 메모리 시스템, 구성 요소 통합 및 고속 인터커넥트에 중점을 둔 연구가 포함되었습니다.

exascale desktop icon데스크탑

지역 전력망에 대한 하나의 동적 시나리오를 실시간으로 시뮬레이션합니다.

petascale iconn페타스케일

국가 전력망에 대한 수만 개의 동적 시나리오를 실시간으로 시뮬레이션합니다.

exascale  icon엑사스케일

전 세계 전력망에 대한 수백만 개의 동적 시나리오를 생성 및 수요에 관한 정의되지 않은 변수를 적용해 실시간으로 시뮬레이션합니다.

미래로 나아가는 힘과 자유

엑사스케일 컴퓨팅은 맞춤형 의료, 탄소 포집, 천체 물리학, 시장 경제학 및 바이오 연료 분야의 발전에 기여할 잠재성이 있습니다. 전문가들이 날씨를 더 정확히 예측하고, 더 복잡한 수학적 문제를 해결하며, 우주의 더 먼 곳까지 탐험하고, 에너지 절감형 전력망을 구축하는 데 도움이 될 것입니다.11 차세대 슈퍼컴퓨팅을 위한 공동의 노력과 이러한 시스템이 사회에 기여할 수 있는 긍정적인 영향을 바탕으로, AMD는 미래의 컴퓨팅 시스템의 성능, 에너지 효율성, 신뢰성 및 프로그래밍의 향상을 위한 연구와 자원에 주력하고 있습니다.

자세히 알아보기: https://www.amd.com/hpc

Intel CPU i9

해석용 컴퓨터 CPU에 대한 이해 및 선택 방법

자료출처 : 본 기사는 PCWorld Australia의 내용과 www.itworld.co.kr의 기사를 기반으로 일부 가필하여 게재한 내용입니다.

인텔 코어 CPU 에 대한 이해

인텔 코어 CPU에 대한 자료를 찾아보면 쿼드(Quad) 코어, 하이퍼-스레딩(Hyper-Threading), 터보-부스팅(Turbo-Boosting), 캐시(Cache) 크기 같은 용어를 많이 볼 수 있다.
인텔 코어 i3, i5, i7, i9는 각각 어떻게 다를까?
칩셋에는 세대가 있는데, 세대의 의미와 차이는 무엇일까?
하이퍼-스레딩은 무엇이고 클럭 속도는 어느 정도가 적합할까?

새 프로세서를 구입하기 전에 먼저 현재 사용하고 있는 인텔 CPU를 이해해보자.
지금 내 PC 성능이 어느 정도인지 알기 위해서이다.
가장 빠른 방법은 제어판 > 시스템 및 보안 항목에서 시스템을 선택하는 것이다.

여기에서 현재 PC에 설치된 CPU, RAM, 운영체제 정보를 확인할 수 있다.
프로세서 아래에 현재 설치된 인텔 CPU가 무엇인지, 인텔 코어 i7-4790, 인텔 코어 i7-8500U 같은 모델명을 확인할 수 있을 것이다. 또 Ghz가 단위인 CPU 클럭 속도를 알 수 있다. 나중에 이와 관련해 더 자세히 설명을 하겠다.

일단 CPU부터 알아보자.
CPU 모델명에는 숫자가 많아 어려워 보이지만, 이 숫자가 무슨 의미인지 이해하는 것은 어려운 일이 아니다.

모델명의 앞 부분인 “인텔 코어”는 인텔이 만든 코어 시리즈 프로세스 중 하나라는 의미다. 코어는 인텔에서 가장 크고, 인기있는 제품군이다. 따라서 많은 인텔 제품 데스크톱과 노트북 컴퓨터에서 인텔 코어라는 표기를 발견할 수 있다.

참고 : 인텔은 셀룰론(Celeron), 펜티엄(Pentium), 제온(Xeon) 등 다양한 프로세스 제품군을 판매하고 있지만, 이 기사는 인텔 코어 프로세스에 초점을 맞춘다.

그 다음 “i7”은 CPU 내부 마이크로 아키텍처 디자인의 종류이다.
자동차가 클래스와 엔진 종류로 나눠지는 것과 비슷하다. 이들 ‘엔진’이 하는 일은 동일하다. 그러나 차량 브랜드에 따라 일을 하는 방법이 다르다.
인텔의 경우 코어 브랜드 CPU의 클래스인 i3, i5, i7이 각각 사양이 다르다. 여기서 사양이란 코어의 수, 클럭 속도, 캐시 크기, 터보 부스트 2.0과 하이퍼스레딩 같은 고급 기능 지원 여부를 말한다.
코어 i5와 i7 데스크톱 프로세서는 통상 쿼드 코어(코어가 4개)이고, 로우엔드(저가) 코어 i3 데스크톱 프로세스는 듀얼 코어(코어가 2개)다.

이제 SKU와 세대에 대해 알아보자. 앞서 예로 들은 “4790”으로 설명하겠다.
첫 번째 숫자인 “4”는 CPU의 세대이고, “790”는 일종의 일련번호, 또는 ID 번호이다. 즉 인텔 코어 i7이 4세대 CPU라는 이야기이다.

그런데 ‘접미사’가 붙는 경우가 있다. 위에서 예로 든 모델에는 접미사가 없지만 “Intel Core i7-8650U” 같이 끝에 접미사가 붙은 모델이 있다. 여기에서 “U”는 “Ultra Low Power(초저전력)”를 의미한다.
인텔은 모델명에 다양한 접미사를 사용하는데 세대에 따라 의미가 바뀌는 경우가 있다. 따라서 현재 사용하고 있는 CPU 모델을 정확히 해석하려면 링크된 인텔의 ‘접미사 목록’ 페이지를 참고하자.

CPU의 세대는 중요할까?

꽤 중요하다. 간단히 말해, 그리고 일반적으로 세대가 높을 수록, 즉 새로울 수록 더 좋다. 하지만 세대별로 개선된 정도는 각기 다르다.

인텔에 따르면, 최신 8세대 인텔 코어 프로세스는 7세대보다 최대 40%까지 성능이 향상됐다. 물론 비교 대상에 따라 성능 향상치가 크게 다르다. SKU가 세대별로 다를 수 있기 때문이다. 예를 들어, 인텔 코어 i7-8850U는 있지만 인텔 코어 i7-7850U는 없다.

세대가 높을 수록 최신 프로세서라는 것이 기본 원칙이다. 더 발전한 기술과 설계의 이점을 누릴 수 있다는 의미이며, PC 성능도 따라서 향상될 것이다.

코어가 많을 수록 좋을까?
간단히 대답하면, 일반적으로 코어 수가 적은 것보다 많은 것이 좋다. 코어가 1개인 프로세서는 한 번에 스레드 1개만 처리할 수 있다. 그리고 코어가 2개인 프로세서는 2개를, 코어가 4개인 쿼드 코어 프로세서는 4개를 처리할 수 있다.

그렇다면 스레드(Thread)는 무엇일까? 아주 간단히 설명하면, 스레드는 특정 프로그램에서 나와 프로세서를 통과하는 연속된 데이터 데이터 흐름을 말한다. PC의 모든 것은 프로세서를 통과하는 스레드로 귀결된다.

즉, 논리적으로 코어가 많을 수록 한 번에 처리할 수 있는 스레드가 많다. PC가 더 빠르고 효율적으로 데이터를 처리하고 명령을 실행할 수 있다는 이야기이다. 그러나 새 CPU를 조사하면서 코어 수에만 초점을 맞추면 자칫 코어 수만큼 중요한 수치인 클럭 속도를 무시할 위험이 있다.

CPU의 각 코어에는 Ghz가 단위인 클럭 속도가 있다. 클럭 속도는 CPU 실행 속도다. 클럭 속도가 빠를 수록, CPU가 한 번에 처리 및 실행할 수 있는 명령이 많다.

클럭 속도는 통상 높을 수록 더 좋다. 그러나 발열과 관련된 제약 때문에 프로세서의 코어 수가 많을 수록 클럭 속도가 낮은 경향이 있다. 이런 이유로 코어 수가 많은 PC가 최고의 성능을 발휘하지 못하는 경우도 있다.
그렇다면 가장 알맞은 클럭 속도는 어느 정도일까?


클럭 속도는 PC로 하려는 일에 따라 달라진다. 일부 애플리케이션은 싱글스레드로 실행된다. 반면, 여러 스레드를 활용하도록 만들어진 애플리케이션도 있다. 비디오 렌더링이나 일부 게임 환경이 여기에 해당된다. 이 경우, 코어 수가 많은 프로세서가 클럭 속도가 높지만 코어가 하나인 프로세스보다 성능이 훨씬 더 높다.
수치해석의 경우는 계산량이 많은 큰 해석의 경우 멀티코어가 훨씬 유리하다.

웹 브라우징 같은 일상적인 작업에서는 클럭 속도가 높은 i5 프로세서가 i7보다 가격 대비 성능이 훨씬 더 높다는 의미이다. 즉, 코어 수가 많은 프로세서보다 클럭 속도는 높고 코어 수가 적은 프로세서를 구입하는 것이 훨씬 경제적인 대안이 될 수도 있다.

하이퍼-스레딩이란?

앞서 언급했듯, 일반적으로 프로세서 코어 하나가 한 번에 하나의 스레드만 처리할 수 있다. 즉, CPU가 듀얼 코어라면 동시에 처리할 수 있는 스레드가 2개다. 그러나 인텔은 하이퍼-스레딩이라는 기술을 개발해 도입했다. 가상으로 운영체제가 인식하는 코어를 2배 증가시키는 방법으로 하나의 코어가 동시에 여러 스레드를 처리할 수 있는 기술이다.

즉 i5의 물리적 코어 수는 4개이지만, 여러 스레드를 지원하는 애플리케이션을 실행시키면 하이퍼-스레딩이 코어 수를 가상으로 2배 늘려서 성능을 크게 향상하는 방법이다.

터보 부스트(Turbo Boost)란?

인텔의 터보 부스트는 프로세서가 필요한 경우 동적으로 클럭 속도를 높이는 기능이다. 터부 부스트로 높을 수 있는 최대 클럭 속도는 활성 코어의 수, 추정되는 전류 및 전력 소모량, 프로세서 온도에 따라 달라진다.

알기 쉽게 설명하면, 인텔 터보 부스트 기술은 사용자의 프로세서 사용 현황을 모니터링, 프로세서가 ‘열 설계 전력’의 최대치에 얼마나 가까이 도달했는지 판단한 후 적절한 수준으로 클럭 속도를 높인다. 기본적으로 가장 적절하고 우수한 클럭 속도와 코어 수를 제공한다.

현재 터보 부스트 테크놀로지 2.0 버전이 사용되고 있으며, 여러 다양한 7세대 및 8세대 인텔 코어 i7과 i5 CPU에서 이를 지원한다.

i3, i5, i7, i9 프로세서 중 하나를 선택하기 전에 클럭 속도, 코어 수와 함께 기억해야 할 한 가지가 또 있다.

캐시 크기

CPU가 동일한 데이터를 계속 사용하는 경우, CPU는 이 데이터를 프로세서의 일부분인 캐시라는 곳에 저장된다. 캐시는 RAM과 비슷하다. 그러나 메인보드가 아닌 CPU에 구축되어 있어 훨씬 더 빠르다.
캐시 크기가 크면 더 빨리 더 많은 데이터에 액세스 할 수 있다. 클럭 속도 및 코어 수와 다르게, 캐시 크기는 무조건 클 수록 더 좋다. 메모리가 많을 수록 CPU 성능이 향상된다.

7세대 코어 i3 및 코어 i5 프로세서 U 및 Y 시리즈 캐시 크기는 3MB, 4MB이다. 코어 i7의 캐시 크기는 4MB이다. 현재 8세대 프로세서의 캐시 메모리는 6MB, 8MB, 9MB, 12MB이다.

코어 i3, i5, i7, i9의 차이점은 무엇일까?
일반적으로 코어 i7은 코어 i5, 코어 i5는 코어 i3보다 나은 프로세서이다. 코어 i7의 코어 수는 7개가 아니다. 코어 i3 역시 코어 수가 3개가 아니다. 코어 수나 클럭 속도가 아닌 상대적인 연산력의 차이를 알려주는 수치다.

2017년 출시된 코어 i9 시리즈는 고가의 고성능 프로세서이다. 최상급인 코어 i9-7980X의 코어 수와 클럭 속도는 18개와 2.6GHz, 한 번에 처리할 수 있는 스레드는 32개이다. 가장 저렴한 코어 i9-7900X의 경우 각각 10코어, 3.3GHz(기본 클럭 속도), 20 스레드이다.

수치해석 측면에서 구입해야 할 컴퓨터를 고려한다면 CPU 성능은 현재 최신코어인 i7과 i9을 구입하는 것이 원하는 성능을 정확히 제공하는 CPU를 선택하는 방법이지만 예산과 성능이라는 선택의 문제가 존재한다.

editor@itworld.co.kr


AMD CPU 에 대한 이해

썸네일
썸네일

AMD CPU 이름 규칙 및 코드명, 종류, 세대, 소켓 알아보기

AMD 1600, AMD 2400G, Athlon 240GE, AMD 3990X 등 AMD에 다양한 종류의, 다양한 모델명을 가진 cpu들이 있습니다. AMD cpu, apu의 종류와 세대, 소켓에 대해서 알아보도록 하며 이 글에서는 2017년 3월 3일 이후 나온 ‘라이젠’ 시리즈의 cpu, apu에 대해서만 다루도록 하겠습니다.

AMD 라이젠 시리즈는 현재 3세대까지 출시되었으며, 크게 일반 cpu, 하이엔드 cpu(스레드리퍼), 일반 APU, 모바일 APU으로 나뉩니다. 또한 소켓은 현재까지 나온 cpu 중 하이엔드 cpu를 제외한 cpu는 모두 am4소켓입니다.

AMD CPU 이름 규칙

이름 규칙
이름 규칙

AMD 라이젠 시리즈는 ‘AMD 라이젠 7 1700X’를 예로 들면, 앞의 ‘AMD’는 회사 이름을 나타내며

뒤에 ‘라이젠 7’은 성능을 나타냅니다.
‘라이젠 3’은 메인스트림,
‘라이젠 5’는 고성능,
‘라이젠 7’은 최고 성능입니다.

그리고 뒤에 ‘1’은 세대를 나타냅니다.
‘1700’은 Zen 1세대이며,
‘AMD 라이젠 5 2400G’와 같이 APU는 기존 세대에 비해 조금 개선되긴 했지만, 다음 세대 정도까지에 개선은 아니라서 세대는 같지만, ‘400G’앞에 붙는 숫자는 1이 더해져서 나옵니다.

그리고 두번째 자리 ‘7’은 성능을 나타냅니다.
‘2,3’은 메인스트림,
‘4,5,6’은 고성능,
‘7,8’은 최고 성능입니다.

그리고 세네번째 자리는 세세한 기능의, 세세한 성능의 변화 정도로 생각하시면 됩니다.

출처: https://minikupa.com/52 [미니쿠파]

Particle Model(입자모델)

Lagrangian particle model(라그랑지안 입자 모델)

라그랑지안 입자 모델(Lagrangian particle model)은 서브 그리드(Sub-grid) 모델로 계산 셀보다 작은 속성과 크기가 다른 구형(Spherical) 입자의 움직임을 추적할 수 있는 계산 모델입니다.

해석 사례

  • Aeration tank modelling(산기 탱크 모델링)
  • Bubble diffuser system(버블디퓨저 시스템)
  • Drug delivery etc.

Particle options

  • Marker particles – Massless
  • Mass particles – Solid spheres
  • Fluid particles – Droplets of fluid
  • Gas particles – Bubbles of gas

가정 및 한계(Assumptions & Limitations)

  • 입자크기(Particle size) << 격자크기(Mesh size)
  • 입자간의 상호작용을 고려하지 않습니다.
  • 입자 갯수에 제한

Marker Particles(마커 입자)

마커 입자(Marker particles)는 흐름(Flow)에 영향을 미치지 않고 주변 유체의 속도에 따라 움직이지 않는 질량이 없는 상태의 입자입니다. 그러므로, 유체 분자의 시각화로 간주될 수 있습니다.

계산영역에 마커 입자(Marker particles)를 적용함으로써, 개별 유체 분자가 따르는 경로(Paths)를 시각화할 수 있습니다.

Mass Particles(질량 입자)

질량 입자(Mass particles)는 특정 직경과 밀도를 가진 고체 구체(Spheres)로 고려됩니다. 따라서, 질량 입자(Mass particles)는 계산 영역에서 현탁된 고체(Suspended solids)의 운동을 모델링하기 위해 사용됩니다.

Fluid particles(유체 입자)

유체 입자(Fluid particles)는 유체#1의 액적(Droplets of Fluid#1)으로 생각할 수 있습니다. 유체 입자(Fluid particles)는 유체 스프레이(Fluid sprays), 적층 제조(additive manufacturing), 용접(Welding) 등과 같은 계산 셀보다 작은 모델링 유체 부피를 포함하는 수많은 시뮬레이션에 사용될 수 있습니다.

Gas particles(가스 입자)

가스 입자(Gas particles)는 가스의 구형(Spherical) 버블과 유체, 공극(Void) 및 고체 물체와의 상호 작용을 시뮬레이션하는데 사용됩니다.

2019년 소개된 강력한 PC 하드웨어 소개

고성능 컴퓨팅(HPC)

고성능 컴퓨팅(HPC)은 과학, 공학 또는 거대한 비지니스 요구 사항들을 해결하기 위해, 우리가 흔히 사용하는 일반적인 데스크탑 컴퓨터나 워크스테이션보다 훨씬 더 높은 성능을 발휘하도록 컴퓨팅 파워를 결합하여 고성능을 발휘하도록 하는 것을 의미합니다.
시뮬레이션이나 분석과 같은 HPC  워크로드는 계산 속도, 메모리 사용 및 데이터 관리가 매우 중요합니다.
클러스터나 슈퍼컴퓨터라고도 불리는 일반적인 HPC 시스템은 고속의 네트워크에 연결된 다수의 서버를 이용한 확장을 통해, 여러 애플리케이션들을 병렬 실행하도록 설계됩니다.
HPC 시스템에는 관련 소프트웨어, 도구, 구성요소, 스토리지 및 서비스가 포함된 경우가 많습니다.

고성능 컴퓨팅은 일반적으로

  • 100Gbps의 초고속 네트워킹
  • 확장 가능한 고성능 스토리지
  • 고성능 컴퓨팅 소프트웨어 스텍 (최근에는 거의 Linux가 대세로 자리 잡음)
  • 에너지 효율성
  • GPU 가속지원

등이 핵심 성능지표로 고려되어 개발됩니다.
이러한 컴퓨터는 매우 고가이고 특별한 관리환경과 전문가들이 필요하여, 일반인들은 쉽게 접하기가 어렵습니다.
그러나 최근에는 시스템 구성은 전문가들이 하고, 시스템 사용은 일반 엔지니어들이 사용할 수 있도록 UI나 시스템 사용환경이 많이 편리해져서 대기업이나 국책 연구기관의 연구원들이 쉽게 사용할 수 있는 기반이 많이 갖추어져 있습니다.

이러한 HPC와는 스케일 규모면에서는 차이가 많지만, 최근에는 단일 컴퓨터에서도 많은 core로 구성된, 수퍼컴에 가까운 단일 컴퓨팅 고성능 PC가 판매되고 있습니다.
따라서 본 기사에서는 고성능 PC 하드웨어를 통해 수치해석을 수행할 수 있는 전세계의 최신 컴퓨터 기술을 소개하는 PC 기반 하드웨어 기사를 소개합니다.
본 기사는 itworld 에서 작성된 자료입니다.

AMD 라이젠 3000 리뷰 | 인텔의 시대를 끝내러 왔다

2019.07.09
업데이트 기사에서는 성능 테스트 결과 중 3D 뷰포트와 시너지 시네스코어(Cinescore) 성능 결과를 더했다. 또한, 게임 외적인 이유로 데이터에 나타나지 않았던 파 크라이(Far Cry) 5와 데우스 엑스: 맨카인드 유나이티드(Deus Ex: Mankind United)에서의 구형 라이젠 칩 게이밍 벤치마크 차트도 추가했다.

AMD의 12코어 라이젠 9 3900X CPU 리뷰를 한마디로 요약한 문장은 이렇지 않을까?“와, 이 CPU 진짜 빠르다.”

그러나 결론만 보기는 아쉽다. 라이젠 9 3900X는 1GHz를 처음으로 넘어섰던 AMD의 오리지널 K7 애슬론 시리즈 CPU, 데스크톱 PC의 64비트 시대를 열었던 애슬론 64 CPU만큼이나 중요한, 시장을 바꾸는 CPU가 될 물건이기 때문이다.

라이젠 9 3900X가 앞으로 저런 제품이 세운 위대함을 달성하기 어려울 것이라고 생각할지 모른다. 이전 세대의 무시무시한 게이밍 성능 지표를 모두 넘어서는 정도는 아니다. 그러나 발매 직후의 혼란이 가라앉으면 AMD 라이젠 3000 시리즈는 단숨에 가장 인기 있는 CPU가 될 것이다.

라이젠 3000 시리즈는 어찌됐든 7나노 공정으로 생산된 최초의 사용자 x86 칩이다. 인텔의 현재 데스크톱 칩은 모두 아직도 14나노 공정으로 제작된다. 올해 말쯤 되어야 10나노 공정으로의 이전이 시작될 것이다. AMD가 7나노 공정에 먼저 도달한 것을 부러워하면서 말이다.

기술적인 우위를 바탕으로 AMD는 라이젠 3000을 위해 재설계된 2세대 젠 코어를 발표했다. 이전 라이젠 2000 시리즈에 비해 부동 소수점 성능이 2배 증가했고, 클럭당 명령어 처리 횟수가 15% 향상되었다.

AMD는 명령 프리-패치를 개선했고, 명령 캐시를 한층 강화했고, 마이크로-op 캐시를 2배로 늘렸다고 말했다. AMD는 부동 소수점 성능을 2배로 늘린 것에 더해 이제 AVX-256까지 도입했다(256비트 고급 벡터 확장). 인텔 코어는 AVX-512이다. 오늘날 AVX는 주로 동영상 인코딩 분야에 영향을 주지만, 다른 분야에서도 진가를 발휘한다.

AMD는 기본적으로 라이젠 3000 칩에서 L3 캐시를 2배 늘리고, 이것을 게임 캐시라고 부르면서 애플과 비슷한 마케팅을 펼치고 있다. 라이젠 9 3900X에서 70MB를 차지하는 이 캐시는 라이젠 3000 시리즈의 메모리 지연성을 크게 줄인다. 또 CPU의 게이밍 성능을 극적으로 향상한다. 그래서 게임 캐시라고 부르면서 일반 사용자의 이해를 돕고 있다.  게임 캐시는 애플리케이션 성능 개선에도 유용하지만, 앱 캐시라고 불렀을 때 기뻐할 사람은 아무도 없을 테니까.

라이젠 3000 시리즈에는 7나노 CCD가 2개 들어간다. ⓒAMD

코어와 함께 칩셋 설계도 크게 손을 보았다. 처음의 젠 기반 라이젠은 메모리 및 PCIe 컨트롤러가 인피니티 패브릭으로 결합된 2개의 14 나노 CCD를 특징으로 했다. 젠 2에 기반한 라이젠 3000은 메모리 컨트롤러와 PCIe 4.0 컨트롤러를 별개의 IO 다이로 분리한다. 7나노 연산 코어와 달리 IO 다이는 12나노 공정으로 제작된다. 이는 CPU의 전체 원가 절감에 기여한다. 7나노 공정 웨이퍼가 훨씬 가치 있는데, AMD의 팹 협력사인 TSMC가 IO 다를 제작에 사용하지 않아도 되기 때문이다.

여기서 중요한 질문은 GPU가 제한 요소가 아닌 상황에서, 오랫동안 라이젠 성능의 발목을 잡았던 게이밍 문제가 마침내 해소되었느냐는 것이다. 차이는 이제 매우 근소해졌다. 심지어 엔비디아의 무자비하게 빠른 RTX 2080 Ti를 구동하더라도 거의 99% 문제가 없을 것이다.

PCIe4.0?!

그렇다. PCIe4.0이다. PCIe의 차세대 버전 PCIe4.0은 기본적으로 클럭 속도와 스루풋을 PCIe3.0보다 2배로 늘린다. AMD가 PCIe4.0으로 이동한 것도 또 한가지 유리한 점이다. 인텔은 CPU에서 PCIe3.0 속도로 정체되어 있고, 마찬가지로 엔비디아도 PCIe3.0 기반 GPU만을 보유한 상황이다.

현재 PCIe 4.0 실제 성능은 SSD를 제외하고 손쉽게 구현하기 어려울 것이다. 그러나 새 표준은 PC에서 더 많은 경로와 더 많은 포트를 지원한다. PCIe4.0 SSD의 혜택을 원한다면 AMD의 라이젠 3000과 새 X570 칩셋이 유일한 수단이다.

PCIe의 설명 자료는 여기서 소개한다(all about PCIe 4.0). 개발 초기 단계인 PCIe5.0과 PCIe6.0이 동시에 존재해 혼란을 준다면, 초기 사양이 실제 하드웨어로 구현되기까지는 시간이 걸린다는 점을 기억하기 바란다. 기본적으로 PCIe 4.0가 현재의 유일한 해법이고, AMD는 이 성과를 자랑할만하다.

가격

아직 가격이 남았다. 인텔의 플래그십 제품인 8코어의 코어 i9-9900K는 488달러인 반면, 더 빠르지는 않더라도 최소한 같다고 주장하는 AMD의 12코어는 499달러에 RGB 쿨러를 더했다.

AMD 라이젠 3000 제품군은 가격으로 인텔 제품을 압박한다. ⓒAMD

쓰레드당 가격은 AMD가 인텔보다 우세하다. 각종 CPU의 쓰레드당 가격 차트를 보면 라이젠 9 3900X는 쓰레드당 21달러이고, 코어 i9-9900K는 31달러로 게임이 되지 않는 지경이다.

ⓒAMD

그러나 쓰레드당 가격, 환상적인 7나노 공정도 성능이 뒷받침되지 않는다면 가치가 없다. 그럼 이제부터 라이젠 9 3900X가 얼마나 빠른지 살펴보자.

테스트 방법

이번 리뷰에는 대표적 CPU 3개를 선택했다. AMD의 2세대 라이젠 7 2700X가 테스트의 기준으로 활용된다. 두 번째는 최고의 경쟁자인 488달러의 인텔의 코어 i9-9900K이다. 마지막은 AMD의 499달러짜리 라이젠 9 3900K이다.

CPU는 나란히 테스트되었다. 라이젠 7 2700X는 MSI X470 게이밍 M7 AC에, 코어 i9-9900K는 아수스 막스무스 XI 히어로에, 라이젠 9 3900X는 MSI X5700 가드라이크에 각각 탑재했다.

그래픽의 경우 초반 CPU와 게임 테스트는 파운더스 에디션 지포스 GTX 1080를 사용하였다. 추가적 게임 테스트에서는 파운더스 에디션 지포스 RTX2080 Ti 카드를 이용하였다.

세 PC 모두 최신 UEFI/BIOS와 드라이버를 이용하고, 윈도우 10 프로페셔널 1903을 새로 설치하였다. 윈도우 버전은 특히 중요하다. AMD가 이제 버전 1903에 스케줄 최적화가 포함되어 라이젠 3000에서 더 효율적으로 쓰레드를 전송할 수 있다고 말했기 때문이다.

기억할 점은 AMD의 CPU는 CPU 코어의 작은 집단과 빠른 속도를 갖도록 구축되지만 CPU 코어 집단 사이의 액세스 속도는 더 느리다는 것이다. 구 버전 윈도우에서 스케줄러는 클러스터 내의 한 집단으로 한 쓰레드를 전송한다. 윈도우는 멀티 다이 설계를 감안하여 설계되지 않았기 때문에 두 번째 쓰레드를 다른 CPU 코어 클러스터로 전송할 것이고 이는 성능을 낮추는 원인이 된다.

단순히 두 쓰레드를 같은 CPU 코어 클러스터로 전송하는 경우가 아니면, 두 코어 클러스터 사이의 교차를 처리해야 하기 때문에 속도가 느려지는 것이다. 이제 이 문제가 해소되었다. 윈도우 1903은 가능한 경우 동일한 CPU 코어 클러스터로 쓰레드를 전송할 것이다. AMD의 주장에 따르면 윈도우의 변화를 통해 최대 15%의 성능 향상을 가져올 수 있다. 다만, 모든 애플리케이션에서 적용되는 것은 아니므로 애플리케이션마다 차이가 있을 것이라고 전했다.

ⓒAMD

세 빌드에서 모두 듀얼 채널 모드의 DDR4를 동일하게 이용했지만, 한 가지 차이를 두었다. 코어i9-9900K와 라이젠 7 2700X는 16GB DDR4/3200 CL 14를 이용했고, 라이젠 9 3900K는 16GB DDR4/3600 CL 15를 이용했다. 라이젠 9를 최적의 메모리 클럭인 3,600MHz로 테스트하고 싶었기 때문이다. 3,200 MHz에서도 역시 테스트할 예정이다. 시간적 제약으로 인해 먼저 DDR4/3600 성능만 제시하고, 시간이 허락하면 DDR4/3200 테스트 결과를 추가로 업데이트할 예정이다. 그러나 AMD가 PCWorld에 밝힌 바에 따르면 DDR4/3200CL14는 DDR4/3600CL15에 비해 성능에서 큰 차이가 없다고 한다.

여기서 다른 변수는 저장 공간이다. 라이젠 7과 코어 i9은 초고속 MLC 기반의 삼성 960 프로 512GB SSD을 사용해 PCIe3의 3세대 속도로 테스트되었다. 라이젠 9 3900X는 PCIe4.0을 지원하는 최초의 CPU이자 플랫폼이다. PCIe4.0은 새 플랫폼의 핵심 기능이므로 CPU의 PCI 레인으로 직접 연결된 2TB의 커세어 MP600 PCIe 4.0 SSD를 이용하였다. 이번에 PCWorld가 실행한 테스트에서 스토리지는 CPU 성능에 영향을 주지 않을 것이다.

커세어 MP600 ⓒAMD

MCE인가, 아닌가?

코어 i9-9900K 리뷰와 마찬가지로 이번에도 ‘다중 코어 강화(Multi-Core Enhancement, MCE)’ 기능을 이용할 것인지를 놓고 의견이 엇갈렸다. MCE는 메인보드 지원 기능으로, 인텔 ‘K’ CPU를 더 높은 클럭 속도로 실행한다. 하지만, 전력 소비도 더 크고 열도 더 많이 발생한다. MCE는 기술적으로 인텔의 표준 규격을 넘긴 ‘오버클럭’으로 간주된다.

그렇다면 이 기능을 끄면 되지 않느냐고 생각할 수 있을 것이다. 그런데 문제는 거의 모든 중급 이상의 인텔 메인보드는 즉시 사용할 수 있도록 MCE가 자동으로 설정되어 있다는 점이다. 이 기능을 끈 상태로 새 CPU를 테스트한 결과는 대부분의 사용자가 경험하게 될 코어 i9-9900K의 진정한 속도와는 거리가 멀 것이다.

켠 상태로 두는 것은 더 난감하다. 왜냐하면 메인보드 업체마다 이 설정을 조금씩 다르게 구현하기 때문이다. MCE가 켜진 상태에서 성능을 정확히 측정할 수 있는 쉬운 방법은 없다.

결국 인텔 CPU에 대해 MCE를 끈 채로 테스트를 했고, AMD의 유사한 정밀 부스트 오버드라이브(Precision Boost Overdrive) 역시 끈 상태로 테스트했다. 다른 기사에서 이 부분을 한층 깊이 있게 다룰 것이다. 그러나 현재까지는 MCE를 끈 채 인텔 CPU를 실행하는 것은 PBO를 끈 채 AMD CPU를 실행하는 것보다 인텔 CPU에 훨씬 불리하다는 점은 유의해야 한다.

그렇다면 이제부터 차트의 세계로 나가도록 하자.

라이젠 9 3900x 3D 모델링 성능

12코어 CPU가 8코어를 쉽게 압도할 것이라는 점은 그다지 놀랍지 않다. ⓒIDG
라이젠 9 3900X의 싱글 쓰레드 성능이 인상적이다. ⓒIDG
시네벤치 R20으로 옮겨가면 라이젠 9 3900X의 싱글 쓰레드 성능이 더 돋보인다. ⓒIDG
라이젠 9 3900X가 인텔 코어 i9를 멀티 쓰레드 성능에서 압도하는 것은 어쩌면 당연하다. ⓒIDG
코로나 모델러 테스트 결과도 8코어보다 12코어 성능이 더 높게 나왔다. ⓒIDG
비슷한 결과다. V레이 넥스트 테스트에서도 다른 모델링 앱과 별반 다르지 않은 결과를 냈다. ⓒIDG
ⓒIDG
놀랍지도 않다. 라이젠 9가 코어 i9을 가지고 노는 수준이다. ⓒIDG
5GHz 클럭이라는 강점을 지닌 코어 i9가 라이젠 9를 싱글 쓰레드로 설정된 POV레이 테스트에서 근소하게 앞섰다. ⓒIDG
H.265 코덱을 활용한 4K 인코딩 작업에서도 라이젠 9 3900X가 월등했다. ⓒ

라이젠 9 3900X 인코딩 성능

라이젠 9 3900X는 H.265 코덱을 사용한 4K 인코딩에서 코어i9를 간단히 앞질렀다. ⓒIDG
시너지 시네스코어 10.4 테스트에서도 라이젠 9의 성능이 코어 i9 칩을 상당히 앞섰다. ⓒIDG
프리미어 CC 2019 작업에서는 코어 i9가 더 우세하다. ⓒIDG
프리미어 HEVC 인코더 프로젝트에서도 코어 i9가 우세했지만 차이는 조금 줄어들었다. ⓒIDG

포토샵 성능 테스트

포토샵 성능에서는 라이젠 9 2900X가 근소하게 앞섰다. ⓒIDG

압축 테스트

압축 테스트 결과. 라이젠 9 3900X와 라이젠 7 2700X의 성능 차가 크다. ⓒIDG
WinRAR결과는 좋게도 나쁘게도 해석할 수 있다. 라이젠 7 2700X 결과에서 보듯, WinRAR는 전통적으로 인텔 CPU와 상성이 좋았는데, 라이젠 9 3900X가 코어 i9와 크게 차이나지 않는 수준의 결과를 냈다. ⓒIDG
7ZIP 압축 테스트에서의 싱글 쓰레드 성능은 코어 i9가 조금 더 앞섰다. ⓒIDG
멀티쓰레드 성능은 라이젠 9가 압도적이었다. ⓒIDG
압축 풀기 테스트는 전통적으로 성능 확인의 정수이자 CPU가 브랜치 오예측을 얼마나 잘 감당하는지와 관련이 있었다.  ⓒIDG​​​​​
7Zip 압축 풀기 테스트에서는 3개 제품이 모두 엇비슷한 성능을 나타냈다. 가장 우수한 것은 코어 i9였다. ⓒIDG

라이젠 9 3900X의 게이밍 성능 테스트

섀도우 오브 툼 레이더는 1,920×1,080 해상도에서 플레이했는데도 GPU에 의한 병목 현상이 나타났다. ⓒIDG
최신 게임을 플레이할 때는 두 제품 모두 빠른 GPU가 필요하다. ⓒIDG
조금 더 오래된 라이즈 오브 더 툼레이더로 옮겨 가면 역시 구형인 지포스 GTX 1080 FE가 병목 현상임을 알 수 있다. ⓒIDG
라이젠 9 3900X가 코어 i9를 앞서지는 못했지만, 차이는 아주 근소하다. ⓒIDG
ⓒIDG
파 크라이 5는 코어 i9가 라이젠 시리즈를 앞선 성능을 보인 게임 중 하나다. ⓒIDG
데우스 엑스 맨카인드 디바이디드 결과. 라이젠 7과 라이젠 9의 차이에서 게임 성능 개선 폭을 짐작할 수 있다.  ⓒIDG
레인보우 식스 시지 결과 ⓒIDG
CPU 포커스드 테스트 결과는 전적으로 CPU 테스트나 다름 없다. 지포스 GTX 1080과 RTX 2080Ti에서의 프레임 차이가 거의 없었기 때문이다.  ⓒIDG

결론

1쓰레드에서 24 쓰레드까지의 시네벤치 테스트로 리뷰를 마치고 싶다. 시네벤치 R20은 3D 모델링 벤치마크로서 게이밍 성능이나 여타 애플리케이션 성능을 예측하지 않는다. 그러나 수많은 게임과 애플리케이션이 현대 CPU의 쓰레드를 모두 활용하는 혜택을 누릴 수는 없다. 그런 면에서 시네벤치 R20이 가치가 있다. CPU를 1개 쓰레드에서 시작해 끝까지 로딩 했을 때의 성능을 살펴볼 수 있기 때문이다.

아래의 차트에서 AMD는 통상적으로 차트 우측에서 두드러진다. 거의 언제나 인텔 칩에 비해 코어 수에서 우세하기 때문이다.

반면 인텔은 통상적으로 우측에서는 패배하지만, 좌측에서는 승리한다. 인텔 칩은 AMD 칩에 비해 클럭 속도와 IPC가 우세하기 때문이다. 인텔의 코어 칩이 강점을 지닌 부분은 기본적으로 여기뿐이다. 대다수 애플리케이션과 게임은 차트의 좌측에 있는 성능에 의존한다. 라이젠 9 3900K와 코어 i9-9900K 사이의 차트를 보면 그 강점은 이제 사라졌다.

시네벤치 r20을 1쓰레드에서 24쓰레드까지 돌리자, 전 구간에서 라이젠 9 3900x의 진정한 강점이 드러났다. ⓒIDG

동일 데이터를 다른 관점으로 보기 위해 성능 우세 정도를 비율로 보여주는 차트를 만들었다. 차트에서 알 수 있듯이 12코어는 8코어를 간단히 압도한다.

이번에도 인텔의 코어 i9에 있어 가장 나쁜 소식은 차트의 좌측에 있다. 여기서도 인텔의 우위가 사라졌다. 두 CPU는 6쓰레드까지 거의 대등하고 이후부터 라이젠 9가 앞서기 시작한다.

라이젠 9는 8쓰레드 이후부터 코어 수로 인텔 코어 i9를 제압했다. ⓒIDG

쓰레드 수가 적은 경우를 봐도 라이젠 9 3900K는 언제나 코어 i9 9900K만큼이나 빠르다. 이는 기본적으로 이제 코어 i9을 사야 할 이유가 거의 없음을 의미한다. 남은 이유도 분명 존재하지만, 고급 CPU를 구입하려는 사용자 10명 중 9명은 라이젠 9 3900X를 선택할 것이 틀림없다. editor@itworld.co.kr


컴퓨텍스 2018에서 소개된 강력한 PC 하드웨어 소개

본 기사는 PCWorld 및 itworld에서 부분 발췌된 내용입니다.

컴퓨텍스 2018에서는 게이밍이 뜨겁다.
PC의 핵심 칩들이 크게 발전하면서 성능을 크게 높였다.

스레드리퍼(Threadripper) 2 인텔의 발표 직후, AMD는 32코어 64스레드 플래그십인 스레드리퍼 2를 소개하면서 코어 전쟁에 불을 붙였다. 새 24코어 CPU도 출시되며 새 칩들은 2세대 라이젠(Ryzen)과 같은 기본 기술에 기초하여 개발되었다. 또한 AMD는 쿨러 마스터와 협력하여 32코어의 온도를 관리할 수 있는 거대한 공냉식 쿨러인 레이스 리퍼(Wraith Ripper)를 제작했다.

AMD를 전격 채용한 에이서 헬리오스(Acer Helios) 500 컴퓨텍스에서 AMD의 기술이 예상치 못한 곳에서 공개되었다. AMD를 전격 채용한 이 모델에는 6코어 12스레드 라이젠 7 2700 데스크톱 프로세서뿐만이 아니라 라데온 베가(Radeon Vega) 56 그래픽이 탑재되어 있으며, 외장 베가 GPU가 탑재된 노트북은 이번이 처음이다. 에이서는 이 노트북에 144Hz 프리싱크 디스플레이를 매치하여 베가의 성능을 최대한 발휘할 수 있도록 했다.

MSI 노트북(치터(Cheater) 모드 적용) MSI는 컴퓨텍스에서 모든 가격 대의 노트북을 선보였다. MSI가 엔비디아 GTX 1050 그래픽을 내장한 프레스티지(Prestige) PS42가 있다. 매우 인상적일 것이며 기록을 달성할 수 있을지 기대된다. 보급형의 경우 MSI GF63은 999달러란 저렴한 가격에 6코어 8세대 인텔 코어 CPU와 GTX 1050이 내장되어 있다.

독특한 에이수스 노트북 에이수스는 컴퓨텍스에서 프로젝트 프리코그 외에도 혁신적인 하드웨어를 선보였다. 또한 기본적으로 트랙패드(Trackpad)를 상황에 따라 PC용 보조 화면으로 변신시키는 “스크린패드(ScreenPad)” 기술이 포함된 젠북 프로(ZenBook Pro) 15의 새로운 버전을 공개했다.

2017년 수치해석 분야에 기대되는 최신 컴퓨터 소식

수치해석을 하는 많은 분들은 대부분 시간과의 전쟁을 치루고 있습니다.
좀 더 빨리, 좀 더 상세한 결과를 얻어야 하기 때문에, 많은 분들이 예산이 허락하는 한 성능 좋은 컴퓨터를 확보하는 것이 최대의 목표가 되고 있습니다.

한 동안 AMD가 인텔의 경쟁자로 존재하면서 두 회사는 선의의 성능 경쟁을 치열하게 전개해 왔는데, AMD가 서서히 경쟁력을 잃고 있다가 최근에 젠 CPU를 통해 다시 경쟁에 불을 지피고 있습니다.
여기에 두 회사의 최신 주력 CPU 의 내용을 기사에서 인용하여 소개합니다.


인텔, 18코어 36스레드 갖춘 코어 i9 칩 발표 “AMD 쓰레드리퍼와 전면전” (기사 출처 : itworld)

인텔이 코어 i9을 무기로 본격적인 AMD와의 전쟁에 돌입했다. 인텔은 30일 대만 컴퓨텍스에서 하이엔드 PC시장에서 AMD의 16코어 32스레드 스레드리퍼(Threadripper)와 경쟁할 18코어 36스레드의 ‘몬스터 마이크로프로세서’를 발표했다.

이 프로세서에는 코어 i9 익스트림 에디션 i9-7980XE라는 이름이 붙었다. 첫 번째 테라플롭(Teraflop) 데스크톱 PC프로세스로 아주 고가이다. 올해 말 출하되는 프로세서의 가격은 1,999달러이다. 한 단계 낮은 코어 i9 제품군 제품들은 가격이 조금 더 저렴하다. 10코어, 12코어, 14코어, 16코어로 구성된 코어 i9 X 시리즈 가격은 999~1,699달러 사이다. 모두 스카이레이크 기반 프로세스이며, 기존 브로드웰-E보다 높은 성능을 제공한다. 인텔에 따르면, 싱글스레드 앱은 15%, 멀티스레드는 10% 빠르다.

인텔은 ‘베이진 폴스(Basin Falls)”라는 코드 네임을 가진 코어 i9 X 시리즈가 너무 비싼 사람들을 위해 3종의 새로운 코어 i7 X 시리즈 칩(339~599달러)과 1종의 쿼드 코어 코어 i5(242달러)도 공개했다. 인텔은 몇 주 이내에 신제품 칩을 출하할 예정이라고 설명했다.

대부분의 코어 i9칩에 터보 부스트 맥스 기술 업데이트(Updated Turbo Boost Max Technology) 3.0이 탑재될 예정이다. 터보 부스트 맥스는 칩이 최고의 코어 2개를 파악하고, 필요할 때 가변적으로 속도를 높여 오버클러킹을 하는 기능이다. 옵테인 메모리도 지원한다. 인텔은 130개 이상의 옵테인 지원 메인보드가 출시될 예정이라고 설명했다.

신제품 165W, 140W, 112W 칩은 역시 새로운 소켓인 R4에 맞춰 설계되어 있다. 2,066핀 LGA 소켓과 호환되는 인텔 칩셋은 X299가 유일하다.

다시 한번, 인텔과 AMD가 제대로 한 판 붙을 전망이다. 둘 중 누가 승리할지 지켜보는 사용자들의 관심도 뜨겁다. 인텔은 코어 i9을 발표하면서 하이엔드 시장에 공격적으로 접근했다. AMD도 스레드리퍼의 10코어, 12코어, 14코어 버전과 가격을 공개할 수밖에 없는 실정이다. 인텔이 먼저 패를 공개했다. 게임은 이제부터가 시작이다.

인텔의 새 코어 i9 칩은 모든 PC관련 제품이 전시되는 종합 전시회로 발전한 컴퓨텍스에서 가장 중요한 발표 중 하나로 꼽혔다. 기대되는 소식은 아직 많이 남아있다. 홍보 담당자에 따르면, 인텔 경영진이 차세대 10nm 칩인 캐논 레이크에 대해 발표할 예정이라고 한다. 기존 케이비 레이크 칩보다 30% 높은 성능을 자랑하는 제품이다.

또, HTC 바이브 VR 헤드셋을 WiGig 기술을 이용해 무선 연결하는 기술에 대해 더 자세한 정보가 발표될 계획이다. 인텔과 HTC는 지난 1월 CES에서 파트너십 체결을 발표했다. 인텔은 또 8월부터 컴퓨트 카드(Compute Card)를 출시한다고 발표할 계획이다.

코어 i9의 속도와 피드
클록 속도가 4GHz를 넘으면서, 제조업체들이 직면한 도전 과제는 추가된 코어를 모두 사용하는 방법을 찾는 것이었다. 앞서 링크된 기사에서 설명했듯, 하나의 프로세스 코어만 집중적으로 사용하는 게임들이 여전히 많다. 인텔은 게임 플레이는 물론, 게임에 이용하지 않는 다른 코어로 트위치나 유튜브 스트리밍을 인코딩하고, 더 나아가 백그라운드에서 음악도 재생할 수 있는 새로운 세대의 ‘스트리머(Streamer)’로 눈길을 돌렸다. 인텔은 이런 동시다발 작업에 ‘메가태스킹’이라는 명칭을 붙였다. 이 회사는 이를 갈수록 증가하는 코어 수에 맞게 ‘수요’를 유지하는 아주 좋은 방법으로 판단하고 있다.

이와 관련, X시리즈 마케팅 매니저인 토니 베라는 “게이머가 콘텐츠 창작자로 변모하는 추세”라고 강조했다.

제품 가격은 자연스럽게 최고 2,000달러로 아주 비싸고, 경제력이 있거나 기업의 후원을 받는 사용자만 최신 코어 i9 제품들을 구입할 수 있을 전망이다. 다음은 제품 별 가격과 코어, 스레드 수를 정리한 내용이다.

Core i9-7980XE: 18코어/ 36스레드, 1,999달러
Core i9-7960X: 16코어/ 32스레드, 1,699달러
Core i9-7940X: 14코어/ 28스레드, 1,399달러
Core i9-7920X: 12코어/ 24스레드, 1,199달러
Core i9-7900X (3.3GHz): 10코어/ 20스레드, 999달러

인텔은 또 한정된 예산에 제약 받는 사용자를 대상으로 3종의 새로운 코어 i7 X 시리즈 칩을 판매할 계획이다.

Core i7 7820X (3.6GHZ), 8코어/ 16스레드, 599달러
Core i7-7800X (3.5GHz), 6코어/ 12스레드, 389달러
Core i7-7740X (4.3GHz), 4코어/ 8스레드, 339달러
케이비 레이크 코어에 맞춰 설계된 i7-7740X를 제외한 모든 칩이 인텔의 ‘스카이레이크-X’에 기반을 두고 있다.

새 칩에서 가장 큰 관심을 끄는 기능은 터보 부스트 맥스 기술 업데이트 3.0이다. 고든 마 웅이 인텔 브로드웰-E 리뷰에서 설명한 것처럼, 터보 부스트 맥스 기술 3.0은 (칩에 따라 차이가 있지만) 최고의 코어를 식별한다. 그리고 CPU 집약적 싱글 스레드 애플리케이션을 이 코어로 연결해 전체 성능을 향상한다.
또, 최고의 코어 2개를 식별하고, 가장 CPU 집약적인 스레드에 할당한다. 더 많은 코어를 더 효과적으로 활용하는 게임과 애플리케이션에 도움을 주는 기능이다. 그러나 이 새로운 기능을 탑재하지 않은 칩도 있다. 새 6코어, 2종의 4코어 X시리즈 칩이 여기에 포함된다.

다음은 속도와 피드를 요약 설명한 표다.

오버클럭이 포인트
인텔은 새 X시리즈에 공냉 쿨러를 추천하지 않는다. 인텔은 165W와 140W의 새 칩이 방출할 열을 효과적으로 냉각시킬 수 있는 TS13X 쿨러를 판매할 예정이다.

TS13X는 PG(Propylene Glycol)을 이용, 열을 73.84-CFM 팬으로 보낸다. 이 팬의 소음은 21~35dBA이고, 회전 속도는 800~2,200rpm이다. 별도 판매될 TS13X의 가격은 85~100달러 사이이다.

인텔은 또 XTU(Extreme Tuning Utility)를 이용, 코어 당 오버클러킹과 전압 조절을 계속 지원할 계획이다. AVX 512 비율 오프셋, 메모리 전압 조절, PEG/DMI 오버클러킹 등 새 기능이 포함되어 있다.
또 ‘성능 튜닝 보증 서비스(Performance tuning protection plan)’를 제공할 계획이다. 이는 오버클로킹 사용자를 위한 일종의 ‘보험’이다. 칩이 고장 날 경우, 1회 교체를 해주는 보증 서비스이며, 두 번째부터는 유료로 진행된다.

데이터 전송 성능을 향상한 새 X299 칩셋
테라플롭급 연산력을 갖춘 PC의 경우, 다른 부품과의 데이터 전송 성능이 아주 중요하다. x299 칩셋은 최신 DMI 3.0을 도입해 SATA 3.0포트와 USB 포트 연결 대역폭을 2배로 증가시킨다. X299 칩셋에는 최대 8개의 SATA 3.0포트, 10개의 USB 3.0 포트가 장착되어 있다. 기존 X99 칩셋의 USB 3.0포트 수는 최대 6개였다.

브로드웰-E X99 칩셋은 8개의 PCIe 레인을 지원했었다. 그러나 X299은 최대 24개의 PCIe 3.0 레인을 지원한다. 고속 PCIe NVM3 드라이브 등 추가 PCIe를 CPU와 연결된 PCI3에 직접 연결할 수 있다. 코어가 10개 이상인 CPU의 경우, 최대 44개의 PCIe 3.0 레인을 이용할 수 있다.

X299는 속도가 빨라진 DDR4-2066을 지원한다. 그러나 어느 정도 RAM 용량을 지원하는지 확실하지 않다. 인텔은 캐시 계층(Cache Hierarchy)을 조정했다. 이를 통해 개별 프로세서 근처에 더 많은 캐시를 배치하는 방법보다 캐시 크기를 더 많이 줄일 수 있다. 인텔은 새로운 캐시의 ‘히트(Hit)’ 레이트가 더 높다고 설명한다. 칩 크기를 줄였지만 캐시 성능을 유지할 수 있었다는 의미이다.

이번 신제품 소식은 코어 i9, 코어 i7 X 시리즈 사용자 모두 크게 기뻐할 기능 및 성능 향상이다. 메인보드와 PC 제조사도 하이엔드 시장에서 수익을 증대하기 위해 코어 i9 제품들을 출시할 것으로 예상된다. 이번 주 컴퓨텍스에서 전해질 더 많은 소식에 사용자들의 관심이 쏠리고 있다. editor@itworld.co.kr


2018년 인텔 6코어 코어 i9 CPU 발표

본 기사는 itworld.co.kr 기사를 인용하였습니다.

아래 기사를 보면 이젠 해석용 컴퓨터도 고성능 노트북으로 가능하게 되어 가는 것 같습니다. ItWorld의 기사를 게재합니다.

인텔의 새로운 6코어 모바일 코어 i9 칩은 가장 빠른 노트북 CPU로, 새로운 코어 i9-8950HK의 기본 클럭 속도는 2.9GHz이며 여기에 “열 속도 가속(Thermal Velocity Boost)”이라는 신기술을 사용해 최대 4.8GHz까지 올라간다. 새로운 언락 8세대 코어 i9를 최상위 제품으로, 그 아래에 5개의 신형 코어 i5와 코어 i7 고성능 모바일 H 시리즈 칩, 그리고 저전력 시스템을 위한 4개의 U 시리즈 코어 칩이 포진한다. 모두 14나노 커피레이크 칩이다. 인텔은 새로운 데스크톱 코어 프로세서 제품군과 노트북 PC 내의 하드 드라이브 성능을 강화하는 옵테인 메모리 내장을 나타내기 위한 브랜드 로고(코어 i7+)도 새로 발표했다.

인텔에 따르면 코어 i9는 7세대 코어 프로세서에 비해 게임 프레임 재생률 기준 최대 41% 더 우수하며, 게임 플레이 스트리밍 및 녹화 성능은 32% 더 빠르다. 인텔은 새로운 코어 i9는 언락 상태로 제공되므로 게임 PC 제조 업계에서 5GHz 시스템도 출시하게 될 것이라고 밝혔다. 옵테인 메모리가 포함되면 성능 향상 폭은 더욱 커진다. 다만 인텔이 성능 비교에 사용한 7세대 시스템에는 SSD가 아닌 느린 기계식 하드 드라이브가 탑재돼 있어 SSD에서의 성능 향상이 어느 정도인지는 정확히 알 수 없다.

인텔 프리미엄 및 게이밍 노트북 부문 총괄 책임자인 프레드릭 햄버거는 “코어 i9는 인텔이 지금까지 발표한 가장 빠른 게이밍 프로세서”라며, “데스크톱에 거의 근접한 성능을 노트북에서 얻을 수 있다”고 강조했다.

새로운 모바일 코어 칩은 인텔이 스펙터 및 멜트다운 취약점을 수정하기 위해 패치한 소프트웨어 완화책을 지원한다(이후 나올 하드웨어 재설계는 적용되지 않는다). 인텔 측은 제시된 성능 수치가 이러한 완화책으로 인한 성능 감소를 반영한 것이라고 밝혔다.

인텔이 출시하는 모든 모바일 프로세스가 그렇듯이, 중요한 점은 가격이다. 인텔은 보통 모바일 칩 가격을 공개하지 않으며, 이번에도 마찬가지다. 다만 새로운 제품군 중에서 코어 i9 칩의 경우 게임 노트북 중에서도 상위 기종에만 들어갈 것으로 보인다. 그 외의 다른 칩은 훨씬 더 폭넓게 보급될 전망이다.

인텔 코어 H 시리즈 CPU

인텔은 현재 폭발적으로 성장 중인 PC 게임 시장을 노골적으로 정조준하고 있다. 햄버거는 인텔 코어 칩을 내장한 일반 판매용 게임 노트북이 전년 대비 45% 성장했다고 말했다.

인텔의 새로운 45W H 시리즈에는 각각 2종의 새로운 코어 i7과 코어 i5 칩 및 신형 제온이 포함된다. 사실 모바일 코어 i9 칩은 제온 E-2186과 상당히 흡사해 보인다. 클럭 속도, 코어 수, 열 설계 전력 등이 동일하다. 그러나 코어 i9의 클럭 속도는 완전히 언락된 상태로 제공된다. 코어 i9의 가격이 너무 부담스럽다면, 동일한 6개의 코어와 12개 쓰레드를 탑재한 새로운 코어 i7-8850H이 있다.

새로 출시되는 칩은 모두 인텔이 노트북을 대상으로 밀고 있는 옵테인 메모리를 지원하며, 기업용 시스템을 위한 vPro 기술이 옵션으로 제공된다.
인텔의 라데온 RX 베가(“케이비레이크-G”) 칩은 울트라북 수준에서 1080p 성능을 제공하도록 설계됐지만, 신형 8세대 코어 i9 칩은 햄버거의 표현대로라면 “머슬북(Musclebook)”에 맞게 설계돼 노트북에서 얻을 수 있는 절대적인 최고의 성능을 제공한다. 햄버거는 “이 칩으로 만족할 수 없다면 어떤 칩으로도 만족하지 못할 것”이라고 덧붙였다.

Intel

인텔은 이번에 처음으로 이른바 “열 속도 가속” 기능을 포함했다. 이 기능은 클럭 속도를 정상보다 더 높여준다. 평상시 코어 i9-8950HK에서 터보 부스트가 활성화된 후 최대 클럭 속도는 4.6GHz다. 그러나 햄버거는 칩의 온도가 충분히 낮은 상태에서 최대 속도로 작동 중이라면, 클럭 속도가 한층 더 올라간다면서 단일 코어를 200MHz 더 높여 4.8GHz로 작동하거나 모든 코어를 약 100MHz 높여 작동하게 된다고 설명했다.

다만 햄버거는 열 속도 가속 기술이 “자동적인 기능이 아닌 기회에 따라 작동하는 기능”이며, 인텔은 시스템 온도 섭씨 50도 이하에서 이 기능이 작동하도록 설계했다고 거듭 강조했다. 햄버거는 “OEM 파트너와 함께 전력 성능을 최적화하고 열 특성을 조정해 성능을 더 끌어올리기 위해 많은 시간을 투자했다”면서 “지금의 추세는 가장 얇게 만들기 위해 성능을 희생하는 게 아니라, 더 오래 지속되는 더 얇은 규격에 더 효율적인 성능을 집어넣는 것”이라고 말했다.

인텔 코어 U 시리즈 CPU

성능은 좀 낮아도 배터리가 오래 가는 제품을 찾는 사용자를 위해 인텔은 새로운 U 시리즈 칩 4종도 함께 출시했다. 28W TDP 저전력 8세대 코어 칩은 모두 4코어 8스레드 구성이 적용되며 모바일 구성의 옵테인 메모리 기술을 지원한다.

Intel

모든 칩은 인텔이 선보인 새로운 300 시리즈 칩셋인 H370, H310, Q370, B360에 연결된다. 또한 인텔 대변인에 따르면 모든 칩은 향상된 오디오 및 I/O, 기가비트 처리량을 갖춘 통합 인텔 802.11ac 와이파이, 10Gbit/s 통합 2세대 USB 3.1 I/O 등 플랫폼 수준에서 더 많은 기능을 제공한다.

게이밍 노트북 판매가 “폭증”하고 시장 성장에 보조를 맞춰 유통업체들도 매장 진열대에서 이런 제품의 비중을 계속 늘리고 있다. 인텔도 투자를 지속할 계획이다. 게이밍 노트북에서 코어 수를 늘리고 5GHz 벽을 돌파하게 되면 인텔은 성능의 한계를 확실히 더 높이게 될 것이다.  editor@itworld.co.kr

원문보기:
http://www.itworld.co.kr/news/108803#csidx218d62dae70faefa8f8cdc4efd8ea92 


AMD 마이크로아키텍처 (기사 출처 : itworld)

AMD 라이젠 3월 2일 출시…코어 i7보다 가격도 성능도 “우세”

Mark Hachman | PCWorld

“40% 성능 향상”이라는 말은 보수적인 자체 평가였다. AMD는 첫 번째 라이젠 프로세서 3가지를 오는 3월 2일 출시할 계획이라고 밝혔다. 인텔 코어 제품군을 능가하는 성능으로 기대를 받고 있는 라이젠 프로세서는 가격도 절반 가까이 저렴하다.

22일 열린 라이젠 출시 행사에서 발표에 나선 AMD 임원들은 인텔 코어 i7을 공략하기 위한 세 가지 데스크톱용 CPU를 공개했다. 신형 라이젠 CPU는 여러 곳의 주요 메인보드 업체와 전문가용 맞춤형 PC 업체가 지원한다. 특히 AMD는 신형 라이젠 프로세서가 더 적은 비용으로 더 높은 성능을 제공한다는 점을 강조했다. 최고 성능 제품인 라이젠 7 1800X는 인텔의 1,000달러짜리 코어 i7-6900K의 절반에도 못 미치는 가격이지만, 성능은 더 뛰어나다.

인텔과 마찬가지로 AMD의 라이젠 프로세서 역시 역시 3가지 제품군으로 구성되어 있는데, 고급형 라이젠 7, 중급형 라이젠 5, 가장 저렴한 보급형 라이젠 3이 그것이다. AMD는 고성능 라이젠 7부터 먼저 출시하는데, 1800X(499달러), 1700X(399달러), 1700(329달러)의 세 가지 모델이다. 라이젠 5와 라이젠 3은 올해 하반기에 출시할 예정인데, 구체적인 출시 일정은 밝히지 않았다.

이번 행사 직전까지 공개되지 않은 라이젠 관련 정보는 가격과 정확한 출시일이었다. 애널리스트들은 AMD가 그간의 실책을 모두 개선한 것 같다고 평가했으며, 인텔은 자칫 기반이 되는 PC용 마이크로프로세서 시장의 점유율을 잃을 수 있는 위험에 처했다. 물론 인텔도 대응책은 있다. 가격 인하도 그중 하나일 가능성이 있고, 더 많은 코어를 가진 신제품이나 옵테인 기술을 적극 내세우는 것도 방법이 될 수 있다.

인텔이 지난 1월 케이비 레이크 칩 40가지를 대대적으로 출시한 것과는 달리 AMD는 서두르지 않고 있다. 이번에 출시된 라이젠 7 칩의 세부 사양을 살펴보자.

Mark Hachman

라이젠 7 1800X. 95와트 8코어 16쓰레드 프로세서로, 기본 클럭 속도는 3.6GHz, 부스트 모드에서는 4GHz로 동작한다. 499달러 1800X의 대응 제품은 8코어 인텔 코어 i7-6900K로 무려 1,089달러짜리이다. AMD에 따르면, 1800X는 시네벤치 상에서 단일 쓰레드 점수가 162로 동점을 기록했다. 하지만 코어를 모두 구동하자 1,601점으로 6900K보다 9% 높은 점수를 기록했다.

라이젠 7 1700X. 95와트 8코어 16쓰레드 프로세서로, 기본 클럭 속도는 3.4GHz, 부스트 모드에서는 3.8GHz로 동작한다. AMD에 따르면, 399달러 1700X는 시네벤치 멀티코어 벤치마크 테스트에서 1,537점을 기록해 6900K보다 4% 높은 성능을 보였다.

라이젠 7 1700. 655와트 8코어 16쓰레드 프로세서로, 기본 클럭 속도는 3GHz, 부스트 모드에서는 3.7GHz로 동작한다. AMD에 따르면, 1700은 시네벤치 멀티코어 테스트에서 1,410점으로 339달러짜리 코어 i7 7700K보다 46% 더 높은 성능을 기록했다. 핸드브레이크 비디오 인코딩 테스트에서는 1700은 61.8초를, 7700K는 71.8초를 기록했다.

Mark Hachman

AMD에 따르면 라이젠 7 1700은 신형 레이스 스파이어(Wraith Spire) 쿨러를 기본 쿨러로 제공해 소음이 32데시벨에 불과하다.

라이젠의 눈에 띄는 성능 향상에는 설계팀의 역할이 컸다. AMD는 자사의 목표 중 하나가 젠 아키텍처의 클럭당 명령어 처리수(IPC, instructions per clock)를 40% 늘리는 것이라고 밝힌 바 있다. 그리고 실제로 AMD는 IPC를 52% 향상했다. CEO 리사 수는 “단지 목표를 맞춘 것이 아니라 크게 초과 달성했다”라고 강조했다. editor@itworld.co.kr

원문보기:
http://www.itworld.co.kr/news/103594#csidx36e903474b838daa0638fbf87957a25


CFD 업무에 종사하는 사람들은 빠른 컴퓨터는 갖고 싶은 품목1위가 아닐까 싶습니다.
최근에는 소위 슈퍼컴퓨터라 불릴만한 성능을 가진 데스크탑 CPU 의 발전이 놀라운데, 이번에 AMD에서 발표한 CPU도 놀라울 정도의 가벽 대비 성능을 자랑하는 CPU를 발표하였습니다.
저렴한 비용으로 책상위의 슈퍼컴을 장만할 수 있는 기회가 오고 있는 것 같습니다.
아래 ITWOLD에서 2018.08.07에 게재한 기사를 인용 소개합니다.

AMD 32코어 쓰레드리퍼, 코어수와 가격으로 인텔에 정면 승부

Gordon Mah Ung | PCWorld
자료출처 : 본 기사는 ITWORLD의 기사를 인용게재한 내용입니다. (원문보기)
AMD가 2세대 라이젠 쓰레드리퍼(Ryzen Threadrippers, 또는 쓰레드리퍼 2)를 공식 발표했다. 코어수도 놀랍지만 가격이 인텔을 정조준하고 있다.

2세대 라이젠 쓰레드리퍼 2990WX는 32코어 64쓰레드로, 권장 가격은 1,799달러(뉴에그나 아마존 예약 주문 가격)이다. 물론 엄청난 가격이지만, 인텔의 최상위 제품과 비교하면 상당히 저렴하다. 지난 해 출시된 인텔의 코어 i9-7980XE는 18코어 제품이지만 가격은 2,000달러이다.

쓰레드당 가격으로 따지면, 인텔의 코어 i9-7980XE는 약 55달러인데 반해 쓰레드리퍼 2는 약 28달러에 불과하다.

IDG
마치 대형 할인판매점과 같다. 쓰레드가 많을수록, 쓰레드당 가격은 떨어진다.

32코어 2990WX는 주력 제품이며, AMD는 다음과 같은 다양한 쓰레드리퍼 제품을 발표했다.

– 2세대 라이젠 쓰레드리퍼 2920X, 12코어 24쓰레드, 기본 클럭속도 3.5GHz, 부스트 클럭속도 4.3GHz, 가격 649달러.
– 2세대 라이젠 쓰레드리퍼 2950X, 16코어 32쓰레드, 기본 클럭속도 3.5GHz, 부스트 클럭속도 4.4GHz, 가격 899달러.
– 2세대 라이젠 쓰레드리퍼 2970WX, 24코어 48쓰레드, 기본 클럭속도 3.0GHz, 부스트 클럭속도 4.2GHz, 가격 1,299달러.
– 2세대 라이젠 쓰레드리퍼 2990WX, 32코어 64쓰레드, 기본 클럭속도 3.0GHz, 부스트 클럭속도 4.2GHz, 가격 1,799달러.

32코어 쓰레드리퍼 2990WX는 현재 예약 주문이 가능하며, 정식 출하일은 8월 13일로 예상된다. 16코어 2950X의 출시일은 8월 31일이며, 나머지 24코어, 12코어 제품은 10월에 출시된다.

2세대 쓰레드리퍼는 모두 AMD가 올해 초 2세대 라이젠 칩과 함께 내놓은 향상된 12나노 젠+ 아키텍처를 기반으로 한다. 또한 모든 CPU는 기존 X399 메인보드와 호환되며, 구형 CPU 없이도 BIOS 업데이트를 지원한다.

신형 CPU는 1세대 제품과 비교해 확연한 성능 향상을 제공하며, 동급 인텔 제품과의 비교를 불허한다. AMD는 32코어 쓰레드리퍼 2990WX가 시네벤치 R15를 기준으로 인텔의 18코어 코어 i9-7980XE보다 50% 더 빠르다고 밝혔다. POV-Ray 같은 다른 멀티쓰레드 기반 테스트에서도 47% 앞섰다.

모델명에 추가된 W
사실 AMD가 일부 2세대 쓰레드리퍼의 모델명에 W를 추가한 것도 이 때문이다. AMD는 많은 애플리케이션과 게임이 쓰레드나 코어수보다는 더 높은 클럭속도를 선호한다며, W가 없는 두 모델은 바로 이런 사용자를 위한 것이라고 설명했다.

24코어와 32코어 제품의 모델명에 WX를 붙인 것은 이들 CPU가 창작자나 혁신가를 정조준하고 있음을 나타내기 위한 것이다. 즉 W가 추가된 모델은 픽셀이나 프레임, 그리고 광선을 극한까지 추구하는 사람들을 위한 것으로, 이들은 가능한 많은 코어와 쓰레드를 필요로 한다.

주요 이정표
일반 소비자용 CPU에 32코어를 도입하면서 CPU 전쟁은 새로운 전기를 맞이한다. 불과 2년 전, 인텔은 10코어 코어 i7-6950X를 무려 1,723달러에 출시했는데, 지금은 32코어 CPU가 1,799달러에 나왔다.

IDG
날로 치열해지는 코어 전쟁

조만간 나올 인텔의 대응 기대
물론 인텔이 한가로이 앉아 레모네이드나 홀짝거리는 것은 아니지만, 경쟁은 치열하다. AMD가 지난 컴퓨텍스에서 32코어 괴물을 공개하기 하루 전날, 인텔은 28코어에 클럭속도 5GHz짜리 괴물을 소개했다. 이 제품은 올해말 출시될 것으로 예상된다.

인텔의 문제는 이 CPU의 시연을 솔직하게 보여주지 않은 것이다. 인텔 임원은 28코어 CPU가 5GHz로 동작한다고 밝혔지만, 이를 위해 산업용 수랭 시스템을 사용했는지를 밝히지 않았다. 나중에 인텔은 시연이란 것이 언제나 그렇듯이 오버클러킹 시연처럼 가능성을 확인하기 위한 것이라고 설명했다.

이런 논란과 관계없이 AMD 쓰레드리퍼 2990WX는 몇 개월 먼저 출시된 상태이다. 더구나 인텔이 28코어 CPU를 어떤가격에 판매해야 AMD의 신작과 경쟁할 수 있을지도 의문이다. 기업 사용자와의 형평성이 걸림돌이 되는데, 현재 28코어 제온 플래티넘 8176의 가격은 8,719달러이다.

기존 워크스테이션 고객을 걱정할 필요가 없는 AMD는 다시 한 번 가격 파괴 전략을 펼치고있다. 이런 식으로 AMD는 인텔과 코어와 가격으로 정면 대결하기를 원하지만, 인텔은 이런 직접 대결을 최대한 피하고자 한다.  editor@itworld.co.kr

수치해석 담당자가 궁금한 현재 살 수 있는 최강 성능의 PC 하드웨어

수치해석 업무를 담당하는 엔지니어들은 항상 시간에 쫒기며 산다고 해도 과언은 아니다. 새로운 강력한 컴퓨터를 갖는 것이 항상 소원이 되가는 수치해석 엔지니어에게 유용한 정보를 제공합니다.
아래에 한국 ITWORLD에서 PCWorld의 기사를 번역 게시한 기사를 소개합니다.

현재 살 수 있는 최강 성능의 PC 하드웨어

PCWorld
PC의 장점 가운데 하나는 뛰어난 유연성이다. 다양한 형태와 크기, 제조업체 및 모델을 갖춘 수많은 하드웨어가 있기 때문에 구매자가 아무리 돈이 많더라도 혼선이 생기게 마련이다. 이번 기사에서 AMD의 괴물 같은 스레드리퍼(Threadripper) 칩에서부터 지포스 RTX 2080 Ti에 이르기까지 오늘날 구입할 수 있는 최고 성능의 PC 구성 요소를 소개한다.

Credit: Gordon Mah Ung/IDG

CPU
PC의 핵심은 프로세서다. AMD의 32코어, 64 스레드 라이젠 스레드리퍼 2990WX만큼 강력한 CPU는 없다(아마존 1,750달러). 다만 비즈니스 및 데이터센터 장비는 일반 소비자용보다 더 강력하다.

이 CPU는 인텔 18코어 대표작인 코어 i9-7980XE(아마존 2,000달러)보다 거의 2배 많은 코어와 쓰레드를 갖고 있음에도 200달러 이상 싸다. 인텔의 코어는 개별적으로는 더 빠르지만, 2990WX의 엄청난 코어 수를 제대로 활용할 수 있다면 그 어떤 것도 비교할 수 없다.

최상의 PC 게임 성능을 원한다면 코어 i7-8700K(아마존 350달러)가 가장 적합한 프로세스로, 6코어, 12쓰레드는 3.7GHz와 4.7GHz 사이에서 동작하면서 인텔의 18코어보다 훨씬 더 높은 성능이다.

바로 지금 사용할 수 있는 것을 구매한다면, 첫번째 코어 i7-8086K(이 칩은 창립 40주년을 기념해 만들어졌다)은 싱글 쓰레드 애플리케이션에서 5GHz로 출시된 최초의 인텔 칩이다. 또한 수동으로 오버클럭된 경우, 모든 코어에서 5GHz를 기록하는 것이 확실하다. 그러나 표준 성능은 훨씬 저렴한 8700K와 유사하다. 이 칩은 5만 개만 만들어졌다. 뉴에그, 아마존, 베스트바이에서 425달러에 판매하고 있다.

Credit: Gordon Mah Ung

메인보드
프로세서를 골랐다면 메인보드 유형을 알 수 있다. 스레드리퍼 칩은 AMD의 X399 메인보드와 호환된다. 본지는 MSI MEG X399 크리에이션(Creation)(뉴에그 499달러)으로, 스레드리퍼 2990WX를 검토했다. 이 메인보드는 연결성이 좋으며 스틱 형태의 SSD를 냉각할 M.2 프로저 히트싱크, 견고한 전력 공급 시스템을 자랑한다.

여기에서는 간략하게 정리하고 AMD X399 메인보드에 대한 자세한 내용은 여기에서 확인하라.

Credit: MSI

메모리
인텔의 X99 플랫폼은 64GB RAM 한계를 넘어섰으며 DDR4는 이전보다 더 빠른 메모리를 지원한다. 128GB 키트까지 보장하는 3,200MHz 커세어 도미네이터 플레티넘(Corsair Dominator Platinum) 메모리(아마존 1,750달러), 세계에서 가장 큰 RAM 디스크를 만든 이유는 무엇일까. 적절한 속도를 느끼고 싶다면 벤전스(Vengeance) LPX DDR4의 16GB 키트(아마존 430달러)가 적합하다.

이렇게 많은 RAM을 가진 PC를 가질 적절한 이유가 없다는 점에서 이 가격은 단점이 될 수 있다. 용량이 더 작은 키트나 다른 공급업체의 제품을 선택하더라도 DDR3가 아닌 DDR4 메모리여야 한다. X299 메인보드는 최첨단이다.

Credit: Gordon Mah Ung

그래픽 카드
지금 당장 가장 강력한 그래픽 카드를 구입해야 한다면, 대부분의 게임 사용자는 지포스 GTX 1080Ti 또는 EVGA GTX Ti SC2(아마존 670달러)와 같은 맞춤형 오버클럭킹 버전을 선택할 것이다. 이 제품은 GTX 1080보다 25~35% 더 빠르며 4K 해상도로 60fps를 기록할 수 있는 최초의 저렴한 일반 소비자용 그래픽 카드로, 이미 많은 게임에서 적절하게 호환을 이뤘다.

그러나 조금 시간적 여유가 있다면 지금 이를 살 필요는 없다. 엔비디아는 이미 차세대 지포스 RTX 2080 Ti의 예약 구매 신청을 받고 있다. 이는 전작을 날려버릴 준비가 됐다. 2080 Ti 제품의 리뷰는 아직 나오지 않았지만 9월 20일이면 출시된다. 가능한 한 본지의 리뷰를 읽어 검토하고 사전 예약을 해도 늦지 않다.

Credit: Brad Chacos/IDG

모니터
그래픽카드에 큰 돈을 쓸 계획이라면, 하이엔드 디스플레이도 원할 것이다. 하이엔드 디스플레이의 경우, 기본적으로 G싱크(G-Sync) HDR 디스플레이라는 걸출한 제품이 있다.

에이서 프레데터(Acer Predator) X27, 에이수스(Asus) ROG 스위프트(Swift) PG27UQ(뉴에그 각각 2,000달러) 또한 최대 144Hz로, 고급스러운 27인치 4K 패널이다. 말 그대로 이 패널들은 384개 백라이트 영역과 함께 최대 1,000니트의 밝기로 HDR(High-Dynamic Range) 영상을 지원한다. 비-HDR 콘텐츠 또한 아름답게 보인다. 이 모니터는 어도비RGB(AdobeRGB) 색역의 99%를 차지하고 지싱크는 게임 플레이를 부드럽게 해준다.

Credit: Martyn Williams/IDG

주 스토리지
스토리지는 다양한 옵션을 제공한다. 4TB 삼성 860 EVO(아마존 1,400달러)와 WD 골드(아마존 500달러)는 각각 소비자용 SSD와 HDD 시장에서 최고의 성능을 자랑하는데, 본지의 리뷰에서 최고 점수를 받았다.

삼성의 SSD는 분명히 빠르지만 많은 비용이 든다. WD 골드의 7,200rpm 플래터는 기계식 하드드라이브에서 놀라운 엑세스 속도를 제공한다. 이 제품은 같은 가격 제품대에서는 찾아볼 수 없는 엔터프라이즈급 기능으로 자랑한다.

Credit: Western Digital

급속 스토리지
저장 용량과 상관없이 순수하게 속도가 주요 목표라면 좋은 제품이 있다. 약간의 공간에 대한 대가로, 사용자는 M.2 PCI-e NVMe SSD의 엄청난 전송 속도를 즐길 수 있다. 4TB 삼성 960 프로(뉴에그 1,50달러)는 크리스탈디스크마크(CrystalDiskMark) 리뷰에서 읽기 속도가 3.5GBps를 훨씬 웃도는 가장 빠른 드라이브 가운데 하나다.

이 제품을 부팅 드라이브로 삼으면 지연에 대해 걱정할 필요가 없다. 시간 절약을 위해 아주 많은 비용을 투자하는 것이 부담스럽다면 1TB WD 블랙 3D NVMe(아마존 450달러)를 대신 사용하자.

또한 인텔의 혁신적인 옵테인 900P SSD(뉴에그 600달러)는 삼성이 독차지하는 시장에 타격을 가하고 작은 파일을 많이 읽을 때 엄청난 성능을 자랑하지만 280GB 및 480GB 용량으로만 제공한다.

다른 제품을 찾고자 한다면 본지의 “나에게 맞는” SSD 선택 가이드 2018에서 최고의 SSD를 찾을 수 있을 것이다.

Credit: Samsung

사운드카드
PC의 다른 부분에 엄청난 비용을 지불했다면 최고 수준의 오디오에도 투자할 수 있을 것이다. 크리에이티브 테크놀로지의 사운드블라스트(Sound Blaster)X AE-5(아마존 150달러)는 32비트, 384KHz ESS ES9016K2M SABRE32 Ultra DAC 칩셋을 사용한다. 가격은 기본적으로 고가의 전문 사운드 장치에서 볼 수 있는 DAC 수준이다.

이 제품은 최초의 프리미엄 일반 소비자용 사운드카드로, 5.1 아날로그 서라운드 사운드, 600 옴 헤드셋까지 구동할 수 있는 듀얼 앰프 Xamp, RGB 조명 등을 제공한다.

Credit: Gordon Mah Ung/IDG

전원공급장치
현재 인텔 프로세서와 엔비디아 그래픽카드의 놀라운 전력 효율성으로 인해 대부분의 단일 GPU 시스템은 아마도 600W 이상의 전원공급장치를 필요로 하지 않을 것이다.
그러나 이번 기사는 최상의 제품에 관한 것이기에 최고 전원공급장치를 소개한다. 여러 개의 그래픽 카드를 사용하거나 미래 확장을 위해 공간을 확보하길 원한다면, 이 제품을 사용해도 좋다.

커세어(Corsair) AX1500i(아마존 450달러)는 본질적으로 전력 공급에 있어 모범적이다. 요즘 코인 채굴작업으로 인해 수요가 많아 종종 재고가 없을 수 있다. 이 모듈식 커세어 AX1500i PSU는 최첨단 디지털 제어시스템 덕분에 모든 면에서 완벽한 등급을 자랑한다. 최근 커세어는 한단계 진보한 AX1600i(뉴에그 500달러)도 발표했다.

이번 기사에서 설명한 바와 같이 유사한 장비를 설치하고 하나 또는 2개의 그래픽 카드를 사용할 경우, 좀더 낮은 전원 공급장치를 구입할 수 있다.

editor@itworld.co.kr

CFD 업무에 종사하는 사람들에게 희소식인 최신 컴퓨터 CPU 소식

CFD 업무에 종사하는 사람들은 빠른 컴퓨터는 갖고 싶은 품목1위가 아닐까 싶습니다.
최근에는 소위 슈퍼컴퓨터라 불릴만한 성능을 가진 데스크탑 CPU 의 발전이 놀라운데, 이번에 AMD에서 발표한 CPU도 놀라울 정도의 가벽 대비 성능을 자랑하는 CPU를 발표하였습니다.
저렴한 비용으로 책상위의 슈퍼컴을 장만할 수 있는 기회가 오고 있는 것 같습니다.
아레에 ITWOLD에서 게재한 기사를 인용 소개합니다.

AMD 32코어 쓰레드리퍼, 코어수와 가격으로 인텔에 정면 승부

Gordon Mah Ung | PCWorld
자료출처 : 본 기사는 ITWORLD의 기사를 인용게재한 내용입니다. (http://www.itworld.co.kr/insight/110307)
AMD가 2세대 라이젠 쓰레드리퍼(Ryzen Threadrippers, 또는 쓰레드리퍼 2)를 공식 발표했다. 코어수도 놀랍지만 가격이 인텔을 정조준하고 있다.

2세대 라이젠 쓰레드리퍼 2990WX는 32코어 64쓰레드로, 권장 가격은 1,799달러(뉴에그나 아마존 예약 주문 가격)이다. 물론 엄청난 가격이지만, 인텔의 최상위 제품과 비교하면 상당히 저렴하다. 지난 해 출시된 인텔의 코어 i9-7980XE는 18코어 제품이지만 가격은 2,000달러이다.

쓰레드당 가격으로 따지면, 인텔의 코어 i9-7980XE는 약 55달러인데 반해 쓰레드리퍼 2는 약 28달러에 불과하다.

IDG
마치 대형 할인판매점과 같다. 쓰레드가 많을수록, 쓰레드당 가격은 떨어진다.

32코어 2990WX는 주력 제품이며, AMD는 다음과 같은 다양한 쓰레드리퍼 제품을 발표했다.

– 2세대 라이젠 쓰레드리퍼 2920X, 12코어 24쓰레드, 기본 클럭속도 3.5GHz, 부스트 클럭속도 4.3GHz, 가격 649달러.
– 2세대 라이젠 쓰레드리퍼 2950X, 16코어 32쓰레드, 기본 클럭속도 3.5GHz, 부스트 클럭속도 4.4GHz, 가격 899달러.
– 2세대 라이젠 쓰레드리퍼 2970WX, 24코어 48쓰레드, 기본 클럭속도 3.0GHz, 부스트 클럭속도 4.2GHz, 가격 1,299달러.
– 2세대 라이젠 쓰레드리퍼 2990WX, 32코어 64쓰레드, 기본 클럭속도 3.0GHz, 부스트 클럭속도 4.2GHz, 가격 1,799달러.

32코어 쓰레드리퍼 2990WX는 현재 예약 주문이 가능하며, 정식 출하일은 8월 13일로 예상된다. 16코어 2950X의 출시일은 8월 31일이며, 나머지 24코어, 12코어 제품은 10월에 출시된다.

2세대 쓰레드리퍼는 모두 AMD가 올해 초 2세대 라이젠 칩과 함께 내놓은 향상된 12나노 젠+ 아키텍처를 기반으로 한다. 또한 모든 CPU는 기존 X399 메인보드와 호환되며, 구형 CPU 없이도 BIOS 업데이트를 지원한다.

신형 CPU는 1세대 제품과 비교해 확연한 성능 향상을 제공하며, 동급 인텔 제품과의 비교를 불허한다. AMD는 32코어 쓰레드리퍼 2990WX가 시네벤치 R15를 기준으로 인텔의 18코어 코어 i9-7980XE보다 50% 더 빠르다고 밝혔다. POV-Ray 같은 다른 멀티쓰레드 기반 테스트에서도 47% 앞섰다.

모델명에 추가된 W
사실 AMD가 일부 2세대 쓰레드리퍼의 모델명에 W를 추가한 것도 이 때문이다. AMD는 많은 애플리케이션과 게임이 쓰레드나 코어수보다는 더 높은 클럭속도를 선호한다며, W가 없는 두 모델은 바로 이런 사용자를 위한 것이라고 설명했다.

24코어와 32코어 제품의 모델명에 WX를 붙인 것은 이들 CPU가 창작자나 혁신가를 정조준하고 있음을 나타내기 위한 것이다. 즉 W가 추가된 모델은 픽셀이나 프레임, 그리고 광선을 극한까지 추구하는 사람들을 위한 것으로, 이들은 가능한 많은 코어와 쓰레드를 필요로 한다.

주요 이정표
일반 소비자용 CPU에 32코어를 도입하면서 CPU 전쟁은 새로운 전기를 맞이한다. 불과 2년 전, 인텔은 10코어 코어 i7-6950X를 무려 1,723달러에 출시했는데, 지금은 32코어 CPU가 1,799달러에 나왔다.

IDG
날로 치열해지는 코어 전쟁

조만간 나올 인텔의 대응 기대
물론 인텔이 한가로이 앉아 레모네이드나 홀짝거리는 것은 아니지만, 경쟁은 치열하다. AMD가 지난 컴퓨텍스에서 32코어 괴물을 공개하기 하루 전날, 인텔은 28코어에 클럭속도 5GHz짜리 괴물을 소개했다. 이 제품은 올해말 출시될 것으로 예상된다.

인텔의 문제는 이 CPU의 시연을 솔직하게 보여주지 않은 것이다. 인텔 임원은 28코어 CPU가 5GHz로 동작한다고 밝혔지만, 이를 위해 산업용 수랭 시스템을 사용했는지를 밝히지 않았다. 나중에 인텔은 시연이란 것이 언제나 그렇듯이 오버클러킹 시연처럼 가능성을 확인하기 위한 것이라고 설명했다.

이런 논란과 관계없이 AMD 쓰레드리퍼 2990WX는 몇 개월 먼저 출시된 상태이다. 더구나 인텔이 28코어 CPU를 어떤가격에 판매해야 AMD의 신작과 경쟁할 수 있을지도 의문이다. 기업 사용자와의 형평성이 걸림돌이 되는데, 현재 28코어 제온 플래티넘 8176의 가격은 8,719달러이다.

기존 워크스테이션 고객을 걱정할 필요가 없는 AMD는 다시 한 번 가격 파괴 전략을 펼치고 있다. 이런 식으로 AMD는 인텔과 코어와 가격으로 정면 대결하기를 원하지만, 인텔은 이런 직접 대결을 최대한 피하고자 한다.  editor@itworld.co.kr

FLOW-3D 해석용 컴퓨터 안내 – 2018년 2분기 업데이트

FLOW-3D 수치해석용 컴퓨터 선택 가이드

수치해석을 하는 엔지니어들은 사용하는 컴퓨터의 성능에 무척 민감합니다. 그 이유는 수치해석을 하기 위해 여러 준비단계와 분석 시간들이 필요하지만 당연히 압도적으로 시간을 소모하는 것이 계산 시간이기 때문일 것입니다.

따라서 수치해석용 컴퓨터의 선정을 위해서 단위 시간당 시스템이 처리하는 작업의 수나 처리량, 응답시간, 평균 대기 시간 등의 요소를 복합적으로 검토하여 결정하게 됩니다.

또한 수치해석에 적합한 성능을 가진 컴퓨터를 선별하는 방법으로 CPU 계산 처리속도인 Flops/sec 성능도 중요하지만 수치해석을 수행할 때 방대한 계산 결과를 디스크에 저장하고, 해석결과를 분석할 때는 그래픽 성능도 크게 좌우하기 때문에 SSD 디스크와 그래픽카드에도 관심을 가져야 합니다.

현재 고성능컴퓨터는 장기적인 전망으로 보는 Quantum Computing, DNA-based Computing, Optical Computing 등의 미래의 컴퓨팅 기술과 단기적인 고성능 컴퓨터 기술인  Symmetric -Multi Processing 기술과 MPP(Massively Pallel Processing)기술이 일반화되고 있습니다. (아래 그림 참조)

일반적으로 슈퍼컴퓨터로 불리는 고성능 HPC는 규모가 큰 운영관리시설과 전문인력이 필요하고 매우 고가이기 때문에, 실제 업무를 수행하는 대부분의 기업이나 기관에서는 단일 SMP 컴퓨터를 많이 사용하고 있습니다.

FLOW-3D에 적합한 일반적인 최소 권장사양은 아래 사양을 참고하시면 됩니다.

다만, 가능하면 최신 CPU의 고성능, 저전력 등 최신기술이 반영된 제품을 선택하는 것은 언제나 투자비와 연관되어 있기 때문에 항상 고민의 대상인 것은 틀림없는것 같습니다.

1) Processors

– FLOW-3D는  x86-64 (Intel/AMD) 프로세스를 지원합니다.

CPU는 전반적인 성능에 큰 영향을 미치며, 대부분의 경우 컴퓨터의 가장 중요한 구성 요소입니다. 그러나 데스크탑 프로세서를 구입할 때가되면 인텔과 AMD의 모델 번호와 사양이 어려워 보일 것입니다.
그리고, CPU 성능을 평가하는 방법에 의해 가장 좋은 CPU를 고른다고 해도 보드와, 메모리, 주변 Chip 등 여러가지 조건에 의해 성능이 달라질 수 있기 때문에 성능평가 결과를 기준으로 시스템을 구입할 경우, 단일 CPU나 부품으로 순위가 정해진 자료보다는 시스템 전체를 대상으로 평가한 순위표를 보고 선정하는 지혜가 필요합니다.

부동소숫점 계산을 하는 수치해석과 밀접한 Computer의 연산 성능 벤치마크 방법은 대표적으로 널리 사용되는 아래와 같은 방법이 있습니다.

2) Operating Systems
  • 64-bit Windows 7, Windows 8, Windows 8.1, Windows 10, Windows Server 2008, and Windows Server 2012
  • 64-bit Red Hat Enterprise Linux 6, Red Hat Enterprise Linux 7 and SUSE 11*

Windows 및 Linux에 대한 시뮬레이션 시간은 대등합니다. 사용자가 사용하기 편리한 운영 체제를 선택하면 됩니다.

3) Graphics Support
FLOW-3D는 OpenGL 드라이버가 만족스럽게 수행되는 최신 그래픽 카드가 필요합니다. 최소한 OpenGL 3.0을 지원하는 것이 좋습니다. FlowSight는 DirectX 11 이상을 지원하는 그래픽 카드에서 가장 잘 작동합니다. 권장 옵션은 엔비디아의 쿼드로 K 시리즈와 AMD의 파이어 프로 W 시리즈입니다. 엔비디아의 GTX 게이밍 하드웨어는 볼륨 렌더링의 속도가 느리거나 오동작 등 몇 가지 제한 사항이 있습니다. 일반적으로 노트북에 내장된 통합 그래픽 카드보다는 개별 그래픽 카드를 강력하게 추천합니다. 최소한 그래픽 메모리는 512MB 이상을 권장합니다.
4) Memory and Processor Speed

프로세서 코어 당 최소 2GB의 RAM을 권장합니다. 예를 들어, 두 개의 6 코어 CPU가 있을 경우 워크스테이션의 메모리는 최소 24 GB가 있어야합니다. 필요한 RAM의 양은 해석 대상 문제에 매우 의존적입니다. 큰 도메인 또는 복잡한 형상에서 좋은 해상도를 원하는 시뮬레이션은 필요한 최소한 RAM보다 훨씬 더 많은 RAM이 필요합니다. 메모리 속도는 시뮬레이션 시간에 영향을 적게 받지만 통상적으로 1333MHz 또는 1600 MHz이면 충분합니다.

5) HDD

수치해석은 해석결과 데이터 양이 매우 크기 때문에 읽고 쓰는데 속도면에서 매우 빠른 SSD를 적용하면 성능면에서 큰 도움이 됩니다. 다만 SSD 가격이 비싸서 가성비 측면을 고려하여 적정수준에서 결정이 필요합니다.
그리고 SSD를 선택할 경우에도 SSD 종류 중에서 PCI Express 타입은 매우 빠르지만 가격 또한 매우 고가이므로 예산 범위내에서 선택을 고민해야 합니다.

기존의 물리적인 하드 디스크의 경우, 디스크에 기록된 데이터를 읽기 위해서는 데이터를 읽어내는 헤드(바늘)가 물리적으로 데이터가 기록된 위치까지 이동해야 하므로 이동에 일정한 시간이 소요됩니다. (이러한 시간을 지연시간, 혹은 레이턴시 등으로 부름) 따라서 하드 디스크의 경우 데이터를 읽기 위한 요청이 주어진 뒤에 데이터를 실제로 읽기 까지 일정한 시간이 소요되는데, 이 시간을 일정한 한계(약 10ms)이하로 줄이는 것이 불가능에 가까우며, 데이터가 플래터에 실제 기록된 위치에 따라서 이러한 데이터에의 접근시간 역시 차이가 나게 됩니다.

하지만 HDD의 최대 강점은 가격대비 용량입니다. 현재 상용화되어 판매하는 대용량 HDD는 12TB ~ 15TB가 공급되고 있으며, 이는 데이터 저장이나 백업용으로 가장 좋은 선택이 됩니다.
결론적으로 데이터를 직접 읽고 쓰는 드라이브는 SSD를 사용하고 보관하는 용도의 드라이브는 기존의 HDD를 사용하는 방법이 효과적인 선택이 될 수 있습니다.

컴퓨텍스 2018에서 소개된 강력한 PC 하드웨어 소개

고성능 컴퓨팅(HPC)

고성능 컴퓨팅(HPC)는 과학, 공학 또는 거대한 비지니스 요구 사항들을 해결하기 위해 일반적인 데스크탑 컴퓨터나 워크스테이션보다 훨씬 더 높은 성능을 발휘하도록 컴퓨팅 파워를 결합하는 것을 의미합니다.
시뮬레이션이나 분석과 같은 HPC 워크로드는 계산, 메모리 사용 및 데이터 관리가 매우 중요합니다.
클러스터나 슈퍼컴퓨터라고도 불리는 일반적인 HPC 시스템은 고속의 네트워크에 연결된 다수의 서버를 이용한 확장을 통해 여러 애플리케이션들을 병렬 실행하도록 설계됩니다.
HPC 시스템에는 관련 소프트웨어, 도구, 구성요소, 스토리지 및 서비스가 포함된 경우가 많습니다.

고성능 컴퓨팅은 일반적으로

– 100Gbps의 초고속 네트워킹
– 확장 가능한 고성능 스토리지
– 고성능 컴퓨팅 소프트웨어 스텍 (최근에는 거의 Linux가 대세로 자리 잡음)
– 에너지 효율성
– GPU 가속지원

등이 핵심 성능지표로 개발됩니다.

HPC와는 스케일 규모면에서는 차이가 많지만 단일 컴퓨팅 기반에서 뛰어난 성능을 발휘하는 고성능 PC 하드웨어를 중심으로  전세계의 최신 컴퓨터 기술을 소개하는 컴퓨덱스에서 발표된 2018년  PC 기반 하드웨어 소개의 일부 기사를 소개합니다.

컴퓨텍스 2018에서 소개된 강력한 PC 하드웨어 소개

본 기사는 PCWorld 및 itworld에서 부분 발췌된 내용입니다.

컴퓨텍스 2018에서는 게이밍이 뜨겁다.
PC의 핵심 칩들이 크게 발전하면서 성능을 크게 높였다.

스레드리퍼(Threadripper) 2 인텔의 발표 직후, AMD는 32코어 64스레드 플래그십인 스레드리퍼 2를 소개하면서 코어 전쟁에 불을 붙였다. 새 24코어 CPU도 출시되며 새 칩들은 2세대 라이젠(Ryzen)과 같은 기본 기술에 기초하여 개발되었다. 또한 AMD는 쿨러 마스터와 협력하여 32코어의 온도를 관리할 수 있는 거대한 공냉식 쿨러인 레이스 리퍼(Wraith Ripper)를 제작했다.

AMD를 전격 채용한 에이서 헬리오스(Acer Helios) 500 컴퓨텍스에서 AMD의 기술이 예상치 못한 곳에서 공개되었다. AMD를 전격 채용한 이 모델에는 6코어 12스레드 라이젠 7 2700 데스크톱 프로세서뿐만이 아니라 라데온 베가(Radeon Vega) 56 그래픽이 탑재되어 있으며, 외장 베가 GPU가 탑재된 노트북은 이번이 처음이다. 에이서는 이 노트북에 144Hz 프리싱크 디스플레이를 매치하여 베가의 성능을 최대한 발휘할 수 있도록 했다.

MSI 노트북(치터(Cheater) 모드 적용) MSI는 컴퓨텍스에서 모든 가격 대의 노트북을 선보였다. MSI가 엔비디아 GTX 1050 그래픽을 내장한 프레스티지(Prestige) PS42가 있다. 매우 인상적일 것이며 기록을 달성할 수 있을지 기대된다. 보급형의 경우 MSI GF63은 999달러란 저렴한 가격에 6코어 8세대 인텔 코어 CPU와 GTX 1050이 내장되어 있다.

독특한 에이수스 노트북 에이수스는 컴퓨텍스에서 프로젝트 프리코그 외에도 혁신적인 하드웨어를 선보였다. 또한 기본적으로 트랙패드(Trackpad)를 상황에 따라 PC용 보조 화면으로 변신시키는 “스크린패드(ScreenPad)” 기술이 포함된 젠북 프로(ZenBook Pro) 15의 새로운 버전을 공개했다.

 

2017년 수치해석 분야에 기대되는 최신 컴퓨터 소식

수치해석을 하는 많은 분들은 대부분 시간과의 전쟁을 치루고 있습니다.
좀 더 빨리, 좀 더 상세한 결과를 얻어야 하기 때문에, 많은 분들이 예산이 허락하는 한 성능 좋은 컴퓨터를 확보하는 것이 최대의 목표가 되고 있습니다.

한 동안 AMD가 인텔의 경쟁자로 존재하면서 두 회사는 선의의 성능 경쟁을 치열하게 전개해 왔는데, AMD가 서서히 경쟁력을 잃고 있다가 최근에 젠 CPU를 통해 다시 경쟁에 불을 지피고 있습니다.
여기에 두 회사의 최신 주력 CPU 의 내용을 기사에서 인용하여 소개합니다.


인텔, 18코어 36스레드 갖춘 코어 i9 칩 발표 “AMD 쓰레드리퍼와 전면전” (기사 출처 : itworld)

인텔이 코어 i9을 무기로 본격적인 AMD와의 전쟁에 돌입했다. 인텔은 30일 대만 컴퓨텍스에서 하이엔드 PC시장에서 AMD의 16코어 32스레드 스레드리퍼(Threadripper)와 경쟁할 18코어 36스레드의 ‘몬스터 마이크로프로세서’를 발표했다.

이 프로세서에는 코어 i9 익스트림 에디션 i9-7980XE라는 이름이 붙었다. 첫 번째 테라플롭(Teraflop) 데스크톱 PC프로세스로 아주 고가이다. 올해 말 출하되는 프로세서의 가격은 1,999달러이다. 한 단계 낮은 코어 i9 제품군 제품들은 가격이 조금 더 저렴하다. 10코어, 12코어, 14코어, 16코어로 구성된 코어 i9 X 시리즈 가격은 999~1,699달러 사이다. 모두 스카이레이크 기반 프로세스이며, 기존 브로드웰-E보다 높은 성능을 제공한다. 인텔에 따르면, 싱글스레드 앱은 15%, 멀티스레드는 10% 빠르다.

인텔은 ‘베이진 폴스(Basin Falls)”라는 코드 네임을 가진 코어 i9 X 시리즈가 너무 비싼 사람들을 위해 3종의 새로운 코어 i7 X 시리즈 칩(339~599달러)과 1종의 쿼드 코어 코어 i5(242달러)도 공개했다. 인텔은 몇 주 이내에 신제품 칩을 출하할 예정이라고 설명했다.

대부분의 코어 i9칩에 터보 부스트 맥스 기술 업데이트(Updated Turbo Boost Max Technology) 3.0이 탑재될 예정이다. 터보 부스트 맥스는 칩이 최고의 코어 2개를 파악하고, 필요할 때 가변적으로 속도를 높여 오버클러킹을 하는 기능이다. 옵테인 메모리도 지원한다. 인텔은 130개 이상의 옵테인 지원 메인보드가 출시될 예정이라고 설명했다.

신제품 165W, 140W, 112W 칩은 역시 새로운 소켓인 R4에 맞춰 설계되어 있다. 2,066핀 LGA 소켓과 호환되는 인텔 칩셋은 X299가 유일하다.

다시 한번, 인텔과 AMD가 제대로 한 판 붙을 전망이다. 둘 중 누가 승리할지 지켜보는 사용자들의 관심도 뜨겁다. 인텔은 코어 i9을 발표하면서 하이엔드 시장에 공격적으로 접근했다. AMD도 스레드리퍼의 10코어, 12코어, 14코어 버전과 가격을 공개할 수밖에 없는 실정이다. 인텔이 먼저 패를 공개했다. 게임은 이제부터가 시작이다.

인텔의 새 코어 i9 칩은 모든 PC관련 제품이 전시되는 종합 전시회로 발전한 컴퓨텍스에서 가장 중요한 발표 중 하나로 꼽혔다. 기대되는 소식은 아직 많이 남아있다. 홍보 담당자에 따르면, 인텔 경영진이 차세대 10nm 칩인 캐논 레이크에 대해 발표할 예정이라고 한다. 기존 케이비 레이크 칩보다 30% 높은 성능을 자랑하는 제품이다.

또, HTC 바이브 VR 헤드셋을 WiGig 기술을 이용해 무선 연결하는 기술에 대해 더 자세한 정보가 발표될 계획이다. 인텔과 HTC는 지난 1월 CES에서 파트너십 체결을 발표했다. 인텔은 또 8월부터 컴퓨트 카드(Compute Card)를 출시한다고 발표할 계획이다.

코어 i9의 속도와 피드
클록 속도가 4GHz를 넘으면서, 제조업체들이 직면한 도전 과제는 추가된 코어를 모두 사용하는 방법을 찾는 것이었다. 앞서 링크된 기사에서 설명했듯, 하나의 프로세스 코어만 집중적으로 사용하는 게임들이 여전히 많다. 인텔은 게임 플레이는 물론, 게임에 이용하지 않는 다른 코어로 트위치나 유튜브 스트리밍을 인코딩하고, 더 나아가 백그라운드에서 음악도 재생할 수 있는 새로운 세대의 ‘스트리머(Streamer)’로 눈길을 돌렸다. 인텔은 이런 동시다발 작업에 ‘메가태스킹’이라는 명칭을 붙였다. 이 회사는 이를 갈수록 증가하는 코어 수에 맞게 ‘수요’를 유지하는 아주 좋은 방법으로 판단하고 있다.

이와 관련, X시리즈 마케팅 매니저인 토니 베라는 “게이머가 콘텐츠 창작자로 변모하는 추세”라고 강조했다.

제품 가격은 자연스럽게 최고 2,000달러로 아주 비싸고, 경제력이 있거나 기업의 후원을 받는 사용자만 최신 코어 i9 제품들을 구입할 수 있을 전망이다. 다음은 제품 별 가격과 코어, 스레드 수를 정리한 내용이다.

Core i9-7980XE: 18코어/ 36스레드, 1,999달러
Core i9-7960X: 16코어/ 32스레드, 1,699달러
Core i9-7940X: 14코어/ 28스레드, 1,399달러
Core i9-7920X: 12코어/ 24스레드, 1,199달러
Core i9-7900X (3.3GHz): 10코어/ 20스레드, 999달러

인텔은 또 한정된 예산에 제약 받는 사용자를 대상으로 3종의 새로운 코어 i7 X 시리즈 칩을 판매할 계획이다.

Core i7 7820X (3.6GHZ), 8코어/ 16스레드, 599달러
Core i7-7800X (3.5GHz), 6코어/ 12스레드, 389달러
Core i7-7740X (4.3GHz), 4코어/ 8스레드, 339달러
케이비 레이크 코어에 맞춰 설계된 i7-7740X를 제외한 모든 칩이 인텔의 ‘스카이레이크-X’에 기반을 두고 있다.

새 칩에서 가장 큰 관심을 끄는 기능은 터보 부스트 맥스 기술 업데이트 3.0이다. 고든 마 웅이 인텔 브로드웰-E 리뷰에서 설명한 것처럼, 터보 부스트 맥스 기술 3.0은 (칩에 따라 차이가 있지만) 최고의 코어를 식별한다. 그리고 CPU 집약적 싱글 스레드 애플리케이션을 이 코어로 연결해 전체 성능을 향상한다.
또, 최고의 코어 2개를 식별하고, 가장 CPU 집약적인 스레드에 할당한다. 더 많은 코어를 더 효과적으로 활용하는 게임과 애플리케이션에 도움을 주는 기능이다. 그러나 이 새로운 기능을 탑재하지 않은 칩도 있다. 새 6코어, 2종의 4코어 X시리즈 칩이 여기에 포함된다.

다음은 속도와 피드를 요약 설명한 표다.

오버클럭이 포인트
인텔은 새 X시리즈에 공냉 쿨러를 추천하지 않는다. 인텔은 165W와 140W의 새 칩이 방출할 열을 효과적으로 냉각시킬 수 있는 TS13X 쿨러를 판매할 예정이다.

TS13X는 PG(Propylene Glycol)을 이용, 열을 73.84-CFM 팬으로 보낸다. 이 팬의 소음은 21~35dBA이고, 회전 속도는 800~2,200rpm이다. 별도 판매될 TS13X의 가격은 85~100달러 사이이다.

인텔은 또 XTU(Extreme Tuning Utility)를 이용, 코어 당 오버클러킹과 전압 조절을 계속 지원할 계획이다. AVX 512 비율 오프셋, 메모리 전압 조절, PEG/DMI 오버클러킹 등 새 기능이 포함되어 있다.
또 ‘성능 튜닝 보증 서비스(Performance tuning protection plan)’를 제공할 계획이다. 이는 오버클로킹 사용자를 위한 일종의 ‘보험’이다. 칩이 고장 날 경우, 1회 교체를 해주는 보증 서비스이며, 두 번째부터는 유료로 진행된다.

데이터 전송 성능을 향상한 새 X299 칩셋
테라플롭급 연산력을 갖춘 PC의 경우, 다른 부품과의 데이터 전송 성능이 아주 중요하다. x299 칩셋은 최신 DMI 3.0을 도입해 SATA 3.0포트와 USB 포트 연결 대역폭을 2배로 증가시킨다. X299 칩셋에는 최대 8개의 SATA 3.0포트, 10개의 USB 3.0 포트가 장착되어 있다. 기존 X99 칩셋의 USB 3.0포트 수는 최대 6개였다.

브로드웰-E X99 칩셋은 8개의 PCIe 레인을 지원했었다. 그러나 X299은 최대 24개의 PCIe 3.0 레인을 지원한다. 고속 PCIe NVM3 드라이브 등 추가 PCIe를 CPU와 연결된 PCI3에 직접 연결할 수 있다. 코어가 10개 이상인 CPU의 경우, 최대 44개의 PCIe 3.0 레인을 이용할 수 있다.

X299는 속도가 빨라진 DDR4-2066을 지원한다. 그러나 어느 정도 RAM 용량을 지원하는지 확실하지 않다. 인텔은 캐시 계층(Cache Hierarchy)을 조정했다. 이를 통해 개별 프로세서 근처에 더 많은 캐시를 배치하는 방법보다 캐시 크기를 더 많이 줄일 수 있다. 인텔은 새로운 캐시의 ‘히트(Hit)’ 레이트가 더 높다고 설명한다. 칩 크기를 줄였지만 캐시 성능을 유지할 수 있었다는 의미이다.

이번 신제품 소식은 코어 i9, 코어 i7 X 시리즈 사용자 모두 크게 기뻐할 기능 및 성능 향상이다. 메인보드와 PC 제조사도 하이엔드 시장에서 수익을 증대하기 위해 코어 i9 제품들을 출시할 것으로 예상된다. 이번 주 컴퓨텍스에서 전해질 더 많은 소식에 사용자들의 관심이 쏠리고 있다. editor@itworld.co.kr


AMD 마이크로아키텍처 (기사 출처 : itworld)

AMD 라이젠 3월 2일 출시…코어 i7보다 가격도 성능도 “우세”

Mark Hachman | PCWorld

“40% 성능 향상”이라는 말은 보수적인 자체 평가였다. AMD는 첫 번째 라이젠 프로세서 3가지를 오는 3월 2일 출시할 계획이라고 밝혔다. 인텔 코어 제품군을 능가하는 성능으로 기대를 받고 있는 라이젠 프로세서는 가격도 절반 가까이 저렴하다.

22일 열린 라이젠 출시 행사에서 발표에 나선 AMD 임원들은 인텔 코어 i7을 공략하기 위한 세 가지 데스크톱용 CPU를 공개했다. 신형 라이젠 CPU는 여러 곳의 주요 메인보드 업체와 전문가용 맞춤형 PC 업체가 지원한다. 특히 AMD는 신형 라이젠 프로세서가 더 적은 비용으로 더 높은 성능을 제공한다는 점을 강조했다. 최고 성능 제품인 라이젠 7 1800X는 인텔의 1,000달러짜리 코어 i7-6900K의 절반에도 못 미치는 가격이지만, 성능은 더 뛰어나다.

인텔과 마찬가지로 AMD의 라이젠 프로세서 역시 역시 3가지 제품군으로 구성되어 있는데, 고급형 라이젠 7, 중급형 라이젠 5, 가장 저렴한 보급형 라이젠 3이 그것이다. AMD는 고성능 라이젠 7부터 먼저 출시하는데, 1800X(499달러), 1700X(399달러), 1700(329달러)의 세 가지 모델이다. 라이젠 5와 라이젠 3은 올해 하반기에 출시할 예정인데, 구체적인 출시 일정은 밝히지 않았다.

이번 행사 직전까지 공개되지 않은 라이젠 관련 정보는 가격과 정확한 출시일이었다. 애널리스트들은 AMD가 그간의 실책을 모두 개선한 것 같다고 평가했으며, 인텔은 자칫 기반이 되는 PC용 마이크로프로세서 시장의 점유율을 잃을 수 있는 위험에 처했다. 물론 인텔도 대응책은 있다. 가격 인하도 그중 하나일 가능성이 있고, 더 많은 코어를 가진 신제품이나 옵테인 기술을 적극 내세우는 것도 방법이 될 수 있다.

인텔이 지난 1월 케이비 레이크 칩 40가지를 대대적으로 출시한 것과는 달리 AMD는 서두르지 않고 있다. 이번에 출시된 라이젠 7 칩의 세부 사양을 살펴보자.

Mark Hachman

라이젠 7 1800X. 95와트 8코어 16쓰레드 프로세서로, 기본 클럭 속도는 3.6GHz, 부스트 모드에서는 4GHz로 동작한다. 499달러 1800X의 대응 제품은 8코어 인텔 코어 i7-6900K로 무려 1,089달러짜리이다. AMD에 따르면, 1800X는 시네벤치 상에서 단일 쓰레드 점수가 162로 동점을 기록했다. 하지만 코어를 모두 구동하자 1,601점으로 6900K보다 9% 높은 점수를 기록했다.

라이젠 7 1700X. 95와트 8코어 16쓰레드 프로세서로, 기본 클럭 속도는 3.4GHz, 부스트 모드에서는 3.8GHz로 동작한다. AMD에 따르면, 399달러 1700X는 시네벤치 멀티코어 벤치마크 테스트에서 1,537점을 기록해 6900K보다 4% 높은 성능을 보였다.

라이젠 7 1700. 655와트 8코어 16쓰레드 프로세서로, 기본 클럭 속도는 3GHz, 부스트 모드에서는 3.7GHz로 동작한다. AMD에 따르면, 1700은 시네벤치 멀티코어 테스트에서 1,410점으로 339달러짜리 코어 i7 7700K보다 46% 더 높은 성능을 기록했다. 핸드브레이크 비디오 인코딩 테스트에서는 1700은 61.8초를, 7700K는 71.8초를 기록했다.

Mark Hachman

AMD에 따르면 라이젠 7 1700은 신형 레이스 스파이어(Wraith Spire) 쿨러를 기본 쿨러로 제공해 소음이 32데시벨에 불과하다.

라이젠의 눈에 띄는 성능 향상에는 설계팀의 역할이 컸다. AMD는 자사의 목표 중 하나가 젠 아키텍처의 클럭당 명령어 처리수(IPC, instructions per clock)를 40% 늘리는 것이라고 밝힌 바 있다. 그리고 실제로 AMD는 IPC를 52% 향상했다. CEO 리사 수는 “단지 목표를 맞춘 것이 아니라 크게 초과 달성했다”라고 강조했다. editor@itworld.co.kr

 

원문보기:
http://www.itworld.co.kr/news/103594#csidx36e903474b838daa0638fbf87957a25

Intel CPU i9

인텔 6코어 코어 i9 CPU 발표

인텔 6코어 코어 i9 CPU 발표

2018-04-04
본 기사는 itworld.co.kr 기사를 인용하였습니다.

아래 기사를 보면 이젠 해석용 컴퓨터도 고성능 노트북으로 가능하게 되어 가는 것 같습니다. ItWorld의 기사를 게재합니다.

인텔의 새로운 6코어 모바일 코어 i9 칩은 가장 빠른 노트북 CPU로, 새로운 코어 i9-8950HK의 기본 클럭 속도는 2.9GHz이며 여기에 “열 속도 가속(Thermal Velocity Boost)”이라는 신기술을 사용해 최대 4.8GHz까지 올라간다. 새로운 언락 8세대 코어 i9를 최상위 제품으로, 그 아래에 5개의 신형 코어 i5와 코어 i7 고성능 모바일 H 시리즈 칩, 그리고 저전력 시스템을 위한 4개의 U 시리즈 코어 칩이 포진한다. 모두 14나노 커피레이크 칩이다. 인텔은 새로운 데스크톱 코어 프로세서 제품군과 노트북 PC 내의 하드 드라이브 성능을 강화하는 옵테인 메모리 내장을 나타내기 위한 브랜드 로고(코어 i7+)도 새로 발표했다.

인텔에 따르면 코어 i9는 7세대 코어 프로세서에 비해 게임 프레임 재생률 기준 최대 41% 더 우수하며, 게임 플레이 스트리밍 및 녹화 성능은 32% 더 빠르다. 인텔은 새로운 코어 i9는 언락 상태로 제공되므로 게임 PC 제조 업계에서 5GHz 시스템도 출시하게 될 것이라고 밝혔다. 옵테인 메모리가 포함되면 성능 향상 폭은 더욱 커진다. 다만 인텔이 성능 비교에 사용한 7세대 시스템에는 SSD가 아닌 느린 기계식 하드 드라이브가 탑재돼 있어 SSD에서의 성능 향상이 어느 정도인지는 정확히 알 수 없다.

인텔 프리미엄 및 게이밍 노트북 부문 총괄 책임자인 프레드릭 햄버거는 “코어 i9는 인텔이 지금까지 발표한 가장 빠른 게이밍 프로세서”라며, “데스크톱에 거의 근접한 성능을 노트북에서 얻을 수 있다”고 강조했다.

새로운 모바일 코어 칩은 인텔이 스펙터 및 멜트다운 취약점을 수정하기 위해 패치한 소프트웨어 완화책을 지원한다(이후 나올 하드웨어 재설계는 적용되지 않는다). 인텔 측은 제시된 성능 수치가 이러한 완화책으로 인한 성능 감소를 반영한 것이라고 밝혔다.

인텔이 출시하는 모든 모바일 프로세스가 그렇듯이, 중요한 점은 가격이다. 인텔은 보통 모바일 칩 가격을 공개하지 않으며, 이번에도 마찬가지다. 다만 새로운 제품군 중에서 코어 i9 칩의 경우 게임 노트북 중에서도 상위 기종에만 들어갈 것으로 보인다. 그 외의 다른 칩은 훨씬 더 폭넓게 보급될 전망이다.

인텔 코어 H 시리즈 CPU

인텔은 현재 폭발적으로 성장 중인 PC 게임 시장을 노골적으로 정조준하고 있다. 햄버거는 인텔 코어 칩을 내장한 일반 판매용 게임 노트북이 전년 대비 45% 성장했다고 말했다.

인텔의 새로운 45W H 시리즈에는 각각 2종의 새로운 코어 i7과 코어 i5 칩 및 신형 제온이 포함된다. 사실 모바일 코어 i9 칩은 제온 E-2186과 상당히 흡사해 보인다. 클럭 속도, 코어 수, 열 설계 전력 등이 동일하다. 그러나 코어 i9의 클럭 속도는 완전히 언락된 상태로 제공된다. 코어 i9의 가격이 너무 부담스럽다면, 동일한 6개의 코어와 12개 쓰레드를 탑재한 새로운 코어 i7-8850H이 있다.

새로 출시되는 칩은 모두 인텔이 노트북을 대상으로 밀고 있는 옵테인 메모리를 지원하며, 기업용 시스템을 위한 vPro 기술이 옵션으로 제공된다.
인텔의 라데온 RX 베가(“케이비레이크-G”) 칩은 울트라북 수준에서 1080p 성능을 제공하도록 설계됐지만, 신형 8세대 코어 i9 칩은 햄버거의 표현대로라면 “머슬북(Musclebook)”에 맞게 설계돼 노트북에서 얻을 수 있는 절대적인 최고의 성능을 제공한다. 햄버거는 “이 칩으로 만족할 수 없다면 어떤 칩으로도 만족하지 못할 것”이라고 덧붙였다.

Intel

인텔은 이번에 처음으로 이른바 “열 속도 가속” 기능을 포함했다. 이 기능은 클럭 속도를 정상보다 더 높여준다. 평상시 코어 i9-8950HK에서 터보 부스트가 활성화된 후 최대 클럭 속도는 4.6GHz다. 그러나 햄버거는 칩의 온도가 충분히 낮은 상태에서 최대 속도로 작동 중이라면, 클럭 속도가 한층 더 올라간다면서 단일 코어를 200MHz 더 높여 4.8GHz로 작동하거나 모든 코어를 약 100MHz 높여 작동하게 된다고 설명했다.

다만 햄버거는 열 속도 가속 기술이 “자동적인 기능이 아닌 기회에 따라 작동하는 기능”이며, 인텔은 시스템 온도 섭씨 50도 이하에서 이 기능이 작동하도록 설계했다고 거듭 강조했다. 햄버거는 “OEM 파트너와 함께 전력 성능을 최적화하고 열 특성을 조정해 성능을 더 끌어올리기 위해 많은 시간을 투자했다”면서 “지금의 추세는 가장 얇게 만들기 위해 성능을 희생하는 게 아니라, 더 오래 지속되는 더 얇은 규격에 더 효율적인 성능을 집어넣는 것”이라고 말했다.

인텔 코어 U 시리즈 CPU

성능은 좀 낮아도 배터리가 오래 가는 제품을 찾는 사용자를 위해 인텔은 새로운 U 시리즈 칩 4종도 함께 출시했다. 28W TDP 저전력 8세대 코어 칩은 모두 4코어 8스레드 구성이 적용되며 모바일 구성의 옵테인 메모리 기술을 지원한다.

Intel

모든 칩은 인텔이 선보인 새로운 300 시리즈 칩셋인 H370, H310, Q370, B360에 연결된다. 또한 인텔 대변인에 따르면 모든 칩은 향상된 오디오 및 I/O, 기가비트 처리량을 갖춘 통합 인텔 802.11ac 와이파이, 10Gbit/s 통합 2세대 USB 3.1 I/O 등 플랫폼 수준에서 더 많은 기능을 제공한다.

게이밍 노트북 판매가 “폭증”하고 시장 성장에 보조를 맞춰 유통업체들도 매장 진열대에서 이런 제품의 비중을 계속 늘리고 있다. 인텔도 투자를 지속할 계획이다. 게이밍 노트북에서 코어 수를 늘리고 5GHz 벽을 돌파하게 되면 인텔은 성능의 한계를 확실히 더 높이게 될 것이다.  editor@itworld.co.kr

원문보기:
http://www.itworld.co.kr/news/108803#csidx218d62dae70faefa8f8cdc4efd8ea92

수치해석용 컴퓨터의 성능분석 방법 및 권장사양

1. 개요

수치해석을 하는 엔지니어들은 사용하는 컴퓨터의 성능에 무척 민감합니다. 그 이유는 수치해석을 하기 위해 여러 준비단계와 분석 시간들이 필요하지만 당연히 압도적으로 시간을 소모하는 것이 계산 시간이기 때문일 것입니다.

따라서 컴퓨터의 성능 평가를 하기 위해서 기본적으로 검토해야 하는 사항을 살펴보도록 하겠습니다.

1-1시스템 성능의 정의

컴퓨터 시스템의 성능이란 단위 시간당 시스템이 처리하는 작업의 수에 의해 결정되거나 처리량, 응답시간, 평균 대기 시간 등의 요소가 복합적으로 상호작용하여 결정되는 것으로 시스템 총 생산성을 결정하는 요인입니다.

1-2시스템 성능 평가의 정의

  • 시스템(HW+SW)의 성능을 측정하거나 그 성능을 향상시킬 수 있는 방법을 조사하는 작업
  • 작업부하모델(Workload model)로 수행능력을 측정하여 시스템의 성능을 객관적이고 종합적으로 판단하는 것

1-3 목적

  • 선정(Selection) : 컴퓨터 시스템 구매나 선정시 이용.
  • 개선(Improvement) : 시스템 성능 향상이나 운용비용 절감
  • 설계(Design) : 제조, 개발업체들이 제품설계에 활용

2. 벤치마크

비교대상이 되는 여러 컴퓨터에 표준 벤치마크 프로그램을 수행시켜 속도를 비교 검사하여 성능을 측정하는 방법을 의미합니다.

2-1 벤치마크의 종류

SPEC ( Standard Performance Evaluation Corporation ) : 각 분야별 주요 환경을 통해 정수, 부동소수 또는 다수의 CPU에 대한 성능 측정방법

LADDIS : NFS 업체의 비공식 기구로 NFS의 업무 부하 증가에 따른 서버 응답 속도를 측정하는 방법

FLOPS (floating-point operations per second) : 플롭스는 초당 수행할 수 있는 실수 연산(부동소수점)의 횟수를 의미하는 컴퓨터 성능 단위로 1메가 플롭스라면 1초에 백만번의 실수을 처리할 수 있다는 것을 의미함. 플롭스 단위는 일반적으로 컴퓨터의 실수연산(FPU) 성능을 나타낼 때 주로 이용하고 있습니다.

LINPACK(linear programming package) : Single User FORTRAN Benchmark TEST로 공학 및 과학계산을 위한 선형 방정식을 풀고, 정수 및 부동소수점 계산을 수행하여 Cache Performance 측정. 프로그램 크기가 최근에 적용되는 캐시기억장치 크기보다 작아 실제 수행능력을 평가하는데 부족함이 있어서 최근에는 사용자가 실제 사용하는 응용프로그램 환경에서의 수행속도를 측정하기 위해 SPEC,AIM,코너스톤(Khornerstone) 등이 사용되고 있습니다.

Dhrystone : 정수계산 및 레코드와 포인터 조작 등을 위한 연산을 행하고 I/O 작업, 운영체제 호출(Operating system calling) 및 실수 연산은 하지 않음. 원시 프로그램을 시험하고자하는 컴퓨터에서 컴파일 한 후 실행시키므로 하드웨어 개선없이 단지 시험하고자하는 루틴에 해당하는 컴파일러 부분만을 개선하여도 빠른 결과를 얻을 수 있으므로 신뢰도가 떨어집니다.

Whetstone : 주로 부동소수점 처리 성능(Flops)을 평가하는 표준적인 벤치마크(benchmark) 프로그램의 하나로 부동소수점 처리성능을 평가하는 최초의 프로그램으로 정수처리능력을 평가하는 드라이스톤 벤치 프로그램처럼 컴파일러에 의존하여 신뢰도가 떨어집니다.

TPC ( Transaction Processing Performance Council) : OLTP 시스템의 처리성능 평가 기준의 표준 규격을 제정하기 위하여 결성된 비영리단체(1988)에서 제정했습니다.

2-2 전세계 슈퍼컴 현황

전세계에서 가장 빠른 슈퍼컴퓨터(HPC)의 현황은 https://www.top500.org 에서 1년에 2회 발표합니다. 현재까지 발표된 컴퓨터의 순위는 아래와 같습니다. 슈퍼컴은 대용량 데이터처리 또는 수치해석 처럼 대용량 과학기술 계산에 특화되어 있기 때문에 LINPACK 벤치마크 기준을 이용하여 Flops/s 성능을 기준으로 정하고 있습니다.

Top500_2016

3. 내가 사용하는 컴퓨터의 성능 알아보기

3-1 방대한 순위 데이터베이스를 가지고 있는 “퍼포먼스테스트” 프로그램

이 프로그램은 시스템의 PC를 구성하는 각 주요 하드웨어에 부하를 가한 후 이를 토대로 성능을 수치화한 데이터를 사용자로부터 수집하여 데이터베이스를 가지고 있어서 자신의 컴퓨터가 어느정도 수준의 컴퓨터인지 쉽게 알 수 있습니다. 프로그램은 30일간 무료로 사용해볼 수 있는데 성능테스트는 늘 하는 것이 아니고 한번만 해보면 되기 때문에 사용기간은 충분합니다. 다음 사이트 (http://www.passmark.com/) 에서 다운로드 받을 수 있습니다.

이 외에도 게임에 특화된 ‘3D마크(3DMark)” 프로그램이나 하드디스크 성능 분석에 특화된 “HD튠 프로(HD Tune Pro)”나 “크리스탈디스크마크(CrystalDiskMark)” 등이 있습니다.

PerformanceTest8_00PerformanceTest8_01PerformanceTest8_02PerformanceTest8_03PerformanceTest8_04

위 그림은 필자의 일반적인 업무용 노트북 컴퓨터를 대상으로 테스트한 결과로 초록색 Bar는 필자의 컴퓨터 성능을 의미합니다. 일반 사무 업무용으로 꽤 쓸만한 LG i5 gram 노트북으로  계산성능이 고사양이 아니어서 비교 순위는 좀 낮은편에 속한 것을 알 수 있습니다.

그래픽 성능의 경우 내장 그래픽을 사용하는 일반 업무용 노트북의 특성상 최하위에 속한 것을 알 수 있습니다. 그래픽카드의 경우 수치해석 결과를 분석하는 POST 업무는 꽤 많은 시간이 소요되는데, 일반적으로 내장 그래픽을 사용하는 컴퓨터의 경우 속도가 늦거나 프로그램 실행이 안되거나 화면의 일부 색상이나 형상등이 보이지 않는 여러가지 문제들이 발생합니다.

따라서 수치해석 결과분석을 하는 컴퓨터는 반드시 메인보드에 내장된 그래픽칩셉이 아닌 성능좋은 별도의 그래픽카드를 사용하는것을 권장합니다.
계산결과를 읽거나 저장하는 필자의 디스크 성능은 SSD가 기본 장착되어 있어서, 그나마  상위권에 속해 위안을 받았습니다.

3-2 계산용 컴퓨터의 선택

위에서 잠깐 살펴본 것처럼 컴퓨터의 성능이 어느정도 되는지 분석할 수 있는 여러가지 벤치마크 기준과 테스트 프로그램 들이 있습니다.
벤치마크 기준을 통해 수치해석에 적합한 성능을 가진 컴퓨터를 선별하는 Flops/sec 성능도 중요하지만, 방대한 계산 결과를 디스크에 읽고 쓰는 I/O 성능과, 해석결과를 분석할 때 절대적으로 필요한 그래픽 성능은 매우 중요하므로 메모리 디스크인 SSD 디스크와 고성능 그래픽카드에도 관심을 가져야 합니다.