본문 바로가기

Multimedia

NVIDIA vs AMD 워크스테이션 그래픽카드

NVIDIA와 AMD의 워크스테이션 그래픽카드를 가지고 CGchannel.com에서 한 벤치마크입니다. 

여기서는 2010년에 출시됐던 AMD 파이어프로 V3800/V4800/V5800/V7800/V8800, NVIDIA 쿼드로 FX 3800/5800에 추가로 AMD 파이어프로 V5900/V7900, 쿼드로 2000/4000/5000/6000을 추가해 테스트했습니다. 이걸로 현재 시장에서 출시중인 중~고급형 워크스테이션 그래픽카드는 다 포진한 셈입니다.

모든 제품들은 현재 모든 워크스테이션과 통용 계산 API를 지원합니다. 쉐이더 모델 5, OpenGL 4, 다이렉트 X 11, OpenCL 1을 지원합니다. NVIDIA는 CUDA도 지원하지요. 여기에 쿼드로 FX3800/FX5800과 파이어프로 V8750은 쉐이더 모델 4, OpenGL 3, 다이렉트 X 10까지만 지원합니다.

먼저 보급형 2개입니다. AMD 파이어프로 V3800, 4800, NVIDIA는 쿼드로 400/600입니다. 하지만 여기서는 이런 보급형은 뺐습니다.

1.jpg

NVIDIA 쿼드로 2000, AMD 파이어프로 V5800/V5900.

 

메인스트림 4개입니다. NVIDIA 쿼드로 2000은 작년에 출시된 신제품이며 1GB GDDR5 128비트 메모리로 최대 대역폭 41.6GB/s, CUDA 코어 192개에 클럭 625MHz입니다. 영상 출력은 듀얼링크 DVI 1개와 디스플레이포트 2개에 전력 사용량은 62W입니다. AMD는 파이어프로 V5900을 넣었습니다. 메모리 스펙이 V5800보다 배로 늘어나면서 2GB GDDR5 256비트 메모리가 됐습니다. 대역폭은 64GB/s, 512개 코어에 클럭은 600MHz, 출력은 듀얼링크 DVI 1개에 디스플레이포트 2개, 전력 사용량 75W. 그리고 제작년의 메인스트림 제품이었던 파이어프로 V5800과 쿼드로 FX3800도 테스트에 넣었습니다.

2.jpg

AMD 파이어프로 V7800/8800, NVIDIA 쿼드로 4000/5000/FX5800

 

고급형은 총 5개입니다. NVIDIA는 2개의 신제품-쿼드로 4000/5000이 있네요. 쿼드로 4000은 256비트 2GB GDDR5 메모리로 89.6Gb/s의 대역폭에 CUDA 코어 256개는 클럭 475MHz입니다. 출력 포트는 듀얼링크 DVI와 디스플레이포트 2개고 전력 사용량은 142W. 쿼드로 5000은 320비트 2.5GB GDDR5 메모리로 대역폭 120GB/s입니다. CUDA 코어 352개에 클럭은 513MHz. 출력 포트는 역시 듀얼링크 DVI 포트 1개와 디스플레이포트 2개, 전력 사용량 152W. AMD는 파이어프로 V7900을 넣었습니다. 256비트 2GB GDDDR5 메모리에 160GB/s의 대역폭, 1280개 스트림 프로세서는 클럭 725MHz, 디스플레이포트 4개에 전력 사용량 150W. 구형 제품인 파이어프로 V7800, V8800, 쿼드로 FX 5800도 넣었습니다.

3.jpg 

NVIDIA 쿼드로 6000/FX5800

 

최고급형은 NVIDIA의 쿼드로 FX5800/6000을 넣었습니다. 쿼드로 6000은 작년에 막 나온 것으로 384비트 6GB GDDR5 메모리, 대역폭 144GB/s. CUDA 코어는 448개고 클럭은 574Mhz. 듀얼링크 DVI 1개와 디스플레이포트 2개, 전력 사용량 204W. AMD의 플래그쉽은 파이어프로 V9800이 있지만 물건이 없는 관계로 테스트에선 제외.

4.jpg

그래서 테스트에 참가한 제품들의 스펙은 다음과 같습니다.

 

5.jpg

테스트 전에, 주요 특징부터 먼저 짚고 갑시다. 디스플레이포트는 현재 워크스테이션에서 빠르게 보급되는 포트입니다. 크기가 작고 신호 안정성이 뛰어나며 더 높은 해상도를 지원하기 때문입니다. 하지만 디스플레이포트를 지원하는 모니터를 구비하기보다는 디스플레이 to DVI 젠더를 쓰는 경우가 많습니다. 그러나 디스플레이포트를 싱글링크 DVI로 바꿔주는 젠더는 그리 비싸지 않지만, 30인치 정도의 고해상도에서는 듀얼링크 DVI 젠더를 써야 합니다. 이럴려면 액티브 젠더를 써야 하는데 가격이 비싼건 둘째치고 USB 포트를 써서 전원을 끌어워야 하는등 복잡한 점이 많습니다. 하지만 디스플레이포트는 30비트 컬러나 아이피니티 등을 제대로 지원한다는 장점이 있습니다.

 

6.jpg

아이피니티는 매우 강력한 기능의 멀티 디스플레이 기술입니다. 파이어프로 V4800, V5800, V5900, V7800은 1개의 듀얼링크 DVI와 2개의 디스플레이포트로 3개의 2560x1600 해상도 디스플레이와 연결할 수 있으며, V7900, V8800은 4개, V9800;은 6개까지 연결할 수 있습니다. 이걸 3x2로 배열하면 7680x3200의 해상도가 나오는 것이지요. 만약 여러 대의 모니터를 연결한다면 NVIDIA의 지포스는 2대의 모니터까지만 연결할 수 있는데다가 별도의 파워를 필요로 하는 등 매우 복잡합니다. 일단 모니터 수를 늘리는데 맛을 들리면 더 이상 모니터 수를 줄이긴 싫지요.

7.jpg

 

8.jpg

 

워크스테이션 그래픽카드는 강력한 연산 성능과 대용량 메모리를 가지고 있습니다. 그래서 이를 레이 트레이싱 등의 통용 계산에 활용하면 좋은 효과를 낼 수 있지요. 현재 GPU를 사용한 통용 계산 API 중에는 CUDA와 OpenCL이 대표적입니다. OpenCL은 개방 표준으로 NVIDIA와 AMD가 이를 모두 지원하며 CUDA는 아직까진 NVIDIA만 지원합니다.

NVIDIA는 GPU 통용 계산을 처음으로 연구 개발하면서 하드웨어를 제조하는 회사입니다. 2006년에는 최초의 통합 쉐이더 유닛을 사용한 GPU, G80을 출시하면서 지포스 8800 GTX란 이름을 붙었습니다. 이 기술을 선도하는 기업은 대량의 어플리케이션을 CUDA가 지원하게 만들었지만 OpenCL은 지원하지 않습니다. 개발자들 입장에서는 OpenCL의 지원이 많아질수록 좋은데요. 아무래도 통일된 표준 API가 여러 부분에서 장점이 있는건 당연하겠지요.

렌더링 작업에서 많은 어플리케이션이 GPU를 써서 가속을 합니다. 이건 CUDA 기반이건 OpenCL 기반이건 마찬가지입니다. CUDA 기반 어플리케이션은 Mental images'iray, Arion, Refractive Software의 Octane Render가 있고. OpenCL을 지원하는 Glare Technologies’ Indigo Renderer, Chaos Group’s V-Ray RT, Art And Animation Studio의 FurryBall 렌더러가 있습니다. GPU 가속의 오픈 소스 소프트웨어는 LuxRender, cebas's finalRender 4등이 지원하면서 OpenCL에서도 잘 돌아갈 것으로 보입니다. 현재 무료 소프트웨어 중에는 StudioGPU의 MachStudio Pro가 CUDA와 다이렉트 X에서의 OpenCL을 지원합니다.

9.jpg

 

테스트 환경은 HP Z800 워크스테이션입니다. 32나노 2웨이 제온 프로세서가 3.33GHz로 작동합니다. 윈도우즈 7 64비트, 18GB DDR3 메모리, 시게이트 SAS 포트 15000rpm 하드디스크입니다. 여기에 2대의 30인치 모니터를 연결해 총 5120x1600의 해상도를 구성했습니다.

10.jpg

이번 테스트에서 쓴 소프트웨어는 Autodesk 3DS MAX 2012, Maya 2012, Softimage 2012, Mudbox 2012, NewTek's LightWave 10가 있고 Luxology's Modo 501, Maxon's Cinema 4D, Maxon's Cinebench, The Foundry's Mari,mental images'iray, Art And Animation Studio’s FurryBall renderer, StudioGPU’s Mach Studio Pro를 추가했습니다.

 

먼저 오토데스크의 마야 2012입니다. 3D 모델링과 애니메이션 렌더링 등에 주로 쓰이며, OpenGL에 최적화된 프로그램입니다.

11.jpg

12.jpg

13.jpg

테스트 결과를 보면 파이어프로의 성능이 괜찮게 나온 편이었습니다. 쿼드로 6000만 빼고 파이어프로 시리즈가 좋은 성능을 보였습니다. 특히 V5900, V7900의 드라이버는 마야에 최적화되 좋은 성능을 보여줍니다. 3종 테스트에서 평균 프레임을 순서대로 정렬하면 다음과 같습니다.

쿼드로 6000
파이어프로 V7900
파이어프로 V5900
파이어프로 V8800
파이어프로 V7800
쿼드로 5000
파이어프로 V5800
파이어프로 V4800
쿼드로 4000
쿼드로 FX 5800
쿼드로 2000
쿼드로 FX 3800
파이어프로 V3800

 

다음은 3DS 맥스 2012입니다. 역시 오토데스크의 제품으로 모델링, 애니메이션, 렌더링을 지원하는데, 이 버전은 Nitrous, 다이렉트 X, OpenGL을 모두 지원하는 것이 특징입니다. 여기서는 Nitrous 모드로 테스트했습니다.

14.jpg

15.jpg

16.jpg

17.jpg

3DS 맥스에서는 쿼드로의 성능이 전반적으로 높게 나왔습니다.

 

 

다음은 오토데스크의 마지막 프로그램인 소프트이미지 2012입니다. 마야와 마찬가지로 OpenGL을 지원하지만, 다른 프로그램보다는 속도가 빠르며 퀄리티 손실 문제도 없습니다.

18.jpg

성능대로 배열하면 이렇습니다.

파이어프로 V8800
파이어프로 V5900
파이어프로 V7800
파이어프로 V5800
파이어프로 V4800
쿼드로 6000
쿼드로 5000
쿼드로 4000
쿼드로 FX 5800
쿼드로 2000
쿼드로 FX 3800
파이어프로 V3800

 

다음은 머드박스 2012입니다. 마야나 소프트이미지와 비슷한 종류의 프로그램이며 OpenGL을 지원합니다. 하지만 다른 어플리케이션과 다르게 머드박스는 무수히 많은 수의 폴리곤을 만들 수 있습니다. 보통 장면에 8백만개나 그 이상의 폴리곤을 쓸 수 있으니까요. 다른 프로그램들은 2~5백만개 정도입니다. 따라서 이런 프로그램은 고용량 메모리에 크게 민감하게 됩니다.

그럼 여기서 Z브러시를 쓰지 않은 이유를 설명해야 되겠는데 그 이유는 간단합니다. 머드박스는 그래픽카드에 크게 의존하지만 Z브러시는 CPU에 의존하기 때문에 그래픽카드의 성능에 받는 영향이 작기 때문입니다.

여기서는 처리 시간과 처리 속도를 가지고 비교해 봤습니다.

19.jpg

512MB와 1GB 메모리는 3천만개 이상의 폴리곤을 소화하기 어려워 보입니다.

 

다음은 라이트웨이브 10입니다. 유명한 3D 프로그램으로 영상 편집에서 널리 쓰이고 있습니다. OpenGL API 가속 프로그램입니다.

20.jpg

성능에 따라 정렬하면 이렇습니다.

파이어프로 V7900
파이어프로 V5900
쿼드로 6000
파이어프로 V8800, V7800 (tied)
쿼드로 5000, 파이어프로 V5800 (tied)
쿼드로 2000
쿼드로 4000, FX 5800, 파이어프로 V4800 (tied)
쿼드로 FX 3800
파이어프로 V3800

 

다음은 Mari 1.3v2입니다. 새로 나온 3D 텍스처 렌더링 프로그램으로 Maxon's BodyPaint 3D와 비슷합니다. 원래는 Weta에서 만들었으나 지금은 The Foundry에 인수됐습니다. 대량의 폴리곤을 써서 3D 모델을 그려내며 높은 해상도의 텍스처를 채워 넣는데 최고 32768x32768까지 지원하며 수백만개의 폴리곤을 쓴 텍스처 모델링을 만들 수 있습니다.

쿼드로 6000/5000 정도면 쓸만한 성능이 나옵니다. 이 프로그램은 1GB를 최저 메모리로 요구하기 때문에 1.5GB 메모리의 그래픽카드에서는 고해상도 텍스처를 충분한 속도로 처리할 수 있을 것입니다.

Mari는 NVIDIA 전용 소프트웨어이기 때문에 쿼드로만 가지고 테스트했습니다.

21.jpg

쿼드로 2000은 지원도 안하네요. 메모리가 부족하거든요.

 

다음은 모델링을 가지고 여러 프로그램과 모드에서 테스트한 결과입니다. 여기서 사용한 모델은 760만개의 폴리곤으로 이루어졌으며, 사용한 모드는 다음과 같습니다.

3ds Max: Nitrous viewport, realistic shading mode
MAYA: Viewport 2.0, shaded and textured with ambient occlusion enabled
Softimage: shaded and textured mode
modo: Advanced OpenGL, shaded mode
Cinema 4D: Enhanced OpenGL, shaded mode
LightWave: shaded and textured mode

22.jpg

모드와 처리 방식에 따라서 성능도 달라집니다. 하지만 그래픽카드 사이의 성능을 비교하는 용도로는 쓸 수 있을 것입니다.

 

시네벤치 R11.5는 CPU 성능 테스트에 많이 쓰지만 여기서는 OpenGL의 결과를 비교했습니다.

23.jpg

테스트 결과는 NVIDIA가 대체적으로 앞서고 있습니다.

쿼드로 5000
쿼드로 6000
파이어프로 V7900
쿼드로 4000
파이어프로 V8800
파이어프로 V7800
쿼드로 FX 5800
파이어프로 V5800
파이어프로 V4800
쿼드로 FX 3800
파이어프로 V5900
쿼드로 2000
파이어프로 V3800

 

마지막으로 렌더링 테스트입니다. 아직은 지원 테스트가 그리 많지 않지만 GPGPU 계산이 갈수록 늘어나고 있으니까요.

먼저 iray입니다. 3DS 맥스의 렌더링 기반으로 아직까진 CUDA만 지원합니다. 그래서 AMD 그래픽카드는 CPU에서 연산하게 됩니다.

24.jpg

여기서 제일 저렴한 쿼드로조차도 2웨이 6코어 CPU보다 더 빠른 성능이 나옵니다. 쿼드로 6000은 CPU의 1/3 정도 시간으로 작업을 끝냈지요. 12코어 3.33GHz CPU 정도면 현재 최상급인데 말입니다.

 

다음은 Furry Ball 테스트입니다. OpenCL 테스트로 마야의 애드온입니다.

25.jpg

이 테스트에서 성능에 제일 큰 영향을 주는건 메모리 용량입니다. 쿼드로의 성능은 좋은 편이며 파이어프로 V3800은 테스트를 완주하지 못했습니다.

 

마하스튜디오 프로는 컴퓨터 그래픽스에서 새로 등장한 소프트웨어입니다. 후처리에 GPU 연산을 쓴다는 점이 특징으로, OpenCL, CUDA, 다이렉트 컴퓨트를 쓰지 않고 다이렉트 X 기반으로 작동합니다.

26.jpg

그럼 이제 결론을 낼 때가 됐네요.

 

27.jpg

 

쿼드로 6000이 제일 좋은 성능을 내는 것은 확실합니다. 강력한 성능과 대용량 메모리로 확고한 위치를 차지하고 있지만 4000달러에요.

전체적으로 보면 쿼드로 시리즈는 매우 좋은 성능을 보여주고 있습니다. 이전 세대인 쿼드로 FX보다 확실히 성능이 늘었으며, 3DS MAX, Mudbox, Modo, Cinema 4D에서 뚜렷히 높은 성능이 나와줍니다. 쿼드로 6000을 살 돈이 없다면 쿼드로 5000이나 4000도 괜찮을 것입니다.

앞으로 쿼드로가 멀티 디스플레이의 지원을 강화한다면 훨씬 나아질 것입니다.

 

29.jpg

 

AMD 파이어프로도 괜찮습니다. Maya, Softimage, LightWave에서 좋은 성능을 내주고 있습니다. 비록 쿼드로 6000처럼 강력한 성능은 아니지만 파이어프로 V7800의 가성비는 뛰어납니다. 만약 부하가 그렇게 커지 않으면서도 고급 제품을 원한다면 파이어프로 V7900도 괜찮을 것입니다. 가격은 쿼드로 4000 수준이지만 쿼드로 4000, 5000 이상의 성능을 내주며 일부 테스트에서는 쿼드로 6000 급의 성능이 나옵니다.

AMD와 NVIDIA는 모두 강력한 워크스테이션 그래픽카드를 가지고 있습니다. 어플리케이션 지원이 중요한 요소가 될 텐데, NVIDIA의 지원이 AMD보다 비싸지만 가격이 더 비쌉니다. AMD는 가격이 싸지만 CUDA는 못쓰고 OpenCL만 골라야 합니다.