Как настроить смартфоны и ПК. Информационный портал
  • Главная
  • Железо
  • Выводы по синтетическим тестам. Игровые тесты: S.T.A.L.K.E.R.: Call of Pripyat

Выводы по синтетическим тестам. Игровые тесты: S.T.A.L.K.E.R.: Call of Pripyat

Сегодня в нашем обзоре видеокарта Radeon HD 6950 от ASUS. Представляя собой версию с Cypress Pro, ядро ASUS HD 6950 использует 22 SIMD вычислителя, 1408 потоковых процессора, 32 ROP-элементов и 88 текстурных юнитов. Карта работает с мощным модулем 2 ГБ GDDR5 памяти. Тактовая частота ядра видеокарты составляет 810 МГц, и это устройство считается разогнанным. ASUS HD 6950 имеет хороший дополнительный потенциал для разгона, особенно учитывая функцию Voltage Tweak.

ASUS HD 6950 поставляется в коробке почти точно такой же, как ASUS EAH6850 и ASUS GTX 570. Прекрасная упаковка - на передней стороне изображен готовый к битве черный рыцарь, что внушает ощущение мощности спрятанного в коробке устройства. Здесь же, на лицевой стороне, можно увидеть небольшое количество информации о HD 6950, например об объеме памяти GDDR5 и ремарку о том, что перед вами разогнанная видеокарта. На обратной стороне расположены некоторые дополнительные сведения и подробная схема способов подключения мониторов.

Внутри коробки обнаруживается еще одна — из картона, с золотистым логотипом ASUS. Эта внутренняя коробка разделена на две секции. В правой секции сложены все поставляющиеся с картой аксессуары. Во второй секции расположена сама ASUS HD 6950, обернутая в антистатическую оболочку. Она проложена мягким черным пенистым материалом.

Что касается аксессуаров, то здесь все обычно — ASUS вложила в коробку CD с драйверами, руководство пользователя, 6-пиновый соединительный шнур Molex и кабель шины CrossFire.

Считаю важным отметить, что при открытии коробки с видеокартой ощущаешь, насколько бережно и тщательно ASUS подходит к упаковке продуктов. Что касается карты. Внутренности ASUS HD 6950 заключены в защитный корпус красно-черных цветов. В левом нижнем углу корпуса расположен логотип фирмы-производителя. Сам корпус изготовлен по всем требованиями к обеспечению охлаждения. Вообще, HD 6950 выглядит целостно и впечатляюще.




ASUS HD 6950 использует следующие возможности соединений: два двойных порта DVI, порт HDMI 1.4a и пара портов mini DisplayPort 1.2. Используя порты mini DisplayPort 1.2, Вы сможете подключить до 6 мониторов к одной карте.

Если Вы практикуете работу с несколькими видеокартами в одной системе, тогда с HD 6950 Вам повезло - эту карту можно соединить с четырьмя другими. Как и с другими 69XX видеокартами, помните, что на соединителе CrossFire есть переключатели BIOS, которые позволят выбрать между штатным BIOS и настраиваемым. Подключение питания к этой карте проще, чем на многих других high-end картах - все, что Вам нужно — два 6-пиновых соединителя и подводимое питание на уровне 550Вт.

Снять верхнюю крышку оказалось просто, как и кулер. Система охлаждения ASUS HD 6950 спроектирована, установлена и закреплена, в принципе, по стандартным для такого дизайна карты правилам.


Со снятым кулером можно тщательно рассмотреть ядро ASUS HD 6950 — Cayman Pro. Этот мощный кристалл создан по технологии 40 нм и содержит 2.64 миллиарда транзисторов. В нем используются 22 SIMD-элемента, 1408 потоковых процессора, 88 текстурных юнита и 32 ROP-элемента. Как уже упоминалось, ASUS прибавил 10 МГц к штатной частоте ядра, в итоге этот показатель составил 810 МГц. ASUS HD 6950 c 2 ГБ памяти GDDR5, работающих с Cayman Pro произведены Hynix. ASUS оставила в этих модулях исходную частоту – 1250 МГц.



Перейдем к оценке производительности видеокарты.

Спецификация
Графический движок AMD Radeon HD 6950
Стандарт шины PCI Express 2.1
Видео память ASUS HD 6950 GDDR5 2 ГБ
Тактовая частота движка 810 МГц
Тактовая частота памяти 5000 МГц (1250 МГц GDDR5)
RAMDAC 400 МГц
Интерфейс памяти 256-бит
Разрешение макс. разрешение D-Sub: 2048×1536;
макс. разрешение DVI: 2560×1600
Интерфейсы DVI Output х1 (DVI-I), x1 (DVI-D);
HDMI Output x1;
Display Port x2 (Mini DP);
Поддержка HDCP
Программное обеспечение утилиты и драйверы ASUS
Размеры 28.8×12.7 см

Особенности

Эксклюзивные инновации ASUS :

  • Разогнанная! : Видеокарта разогнана в процессе производства до частоты 810 МГц, что на 10МГц больше штатного показателя ядра. Это обеспечит большую частоту кадров в играх.
  • Полностью алюминиевая оболочка : Алюминиевое покрытие позволяет гораздо эффективнее рассеивать теплоту с поверхности, при этом охладить карту становится проще!
  • Voltage Tweak : Полный контроль и максимальные возможности при разгоне с новой функцией ASUS Voltage Tweak (совместно с SmartDoctor) – ускорение, производительность, удовольствие на 50% больше!
  • ASUS Smart Doctor : Интеллектуальная система мониторинга коэффициента разгона с интуитивно понятной панелью управления.
  • ASUS Gamer OSD : Разгон в реальном времени, тестирование производительности и запись видеороликов в любой PC игре!
  • Превосходная технология интеллектуального представления видео : оптимизирует цветопередачу согласно различным сценариям развлечений по пяти моделям — стандартной, игровой, пейзаж, ночное видение и театральной.

Особенности GPU:

  • Оснащен AMD Radeon HD 6950
  • Технология AMD HD3D : Оптимизация стереоскопического игрового 3D изображения и картинок при просмотре фильмов.
  • Технология AMD CrossFireX : Позволяет получить до 1.8X прироста графической мощности при использовании двух карт.
  • Технология AMD Eyefinity : Активизирует мощность ядер графического процессора для ускорения решения самых ресурсоемких задач.
  • Поддержка Microsoft DirectX 11 : Обеспечивает новый уровень реалистичности компьютерным играм и помогает аппаратному обеспечению воплощать всю свою производительность.
  • Поддержка Microsoft Windows 7 : Позволяет пользователям шире использовать возможности своего компьютера.

Тестирование

Тестирование ASUS HD 6950 будет заключаться в запуске синтетических бенчмарок и игр, и сравнении показателей производительности между видеокартами. Показатели будут сведены в диаграммы.

Система для теста :

  • Процессор : Intel Core I7 920 200×18 3.6 ГГц
  • Охлаждение : Noctua NH-U12P SE 1366
  • Материнская плата : ASUS P6T Deluxe OC Palm Edition
  • Память : Mushkin 996805 Redline PC312800 6-8-6-24 1600 МГц
  • Видеокарта : Palit GTX 570 Sonic Platinum Edition
  • Блок питания : Mushkin 1000 Ватт Joule Modular
  • Жесткий диск : 1 x Seagate 1 ТБ SATA
  • Оптический привод : LG DVD-RW
  • Операционная система : Windows 7 Professional 64-bit
  • Корпус : Cooler Master HAF 932

Сравниваемые видеокарты:

  • NVIDIA GTS 450
  • ASUS ENGTX465
  • NVIDIA GTX 480
  • Galaxy GTX 470 GC
  • BFG GTS 250 1GB OC
  • Sapphire HD 5970 2GB
  • Sapphire HD 5870
  • Sapphire HD 5850 Toxic 2 ГБ
  • XFX HD 6850
  • XFX HD 6870
  • NVIDIA GTX 580

Разгон видеокарты:

  • ASUS HD 6950 965/1505 МГц

Используя ASUS Smart Doctor или приложение для оверклокинга Afterburner, с одинаковым успехом можно достаточно серьезно повысить скорость. В итоге, настраивая значение подаваемого напряжения, мы смогли достичь тактовой частоты 965 МГц на ядре и 1505 МГц на GDDR5 памяти. Стабильность работы и температурный режим при дальнейшем повышении частот сильно зависит от запускаемого приложения. Но и 965 МГц — это 20% прирост. Напряжение на ядре в процессе разгона было поднято с 1100 мВ до 1250 мВ. Единственным отрицательным моментом стало значительное повышение шума из-за увеличения количества оборотов нагнетающего вентилятора охладительной системы, но что такое шум, когда битва идет за скорость?

Игровой тест: Aliens vs. Predator

Aliens vs. Predator – научно-фантастический шутер от первого лица. Игра построена на движке Rebellion’s Asura, который поддерживает Dynamic Lighting, Shader Model 3.0, систему Soft Particle и Physics. Для тестирования этой игры был использован встроенный бенчмарк-инструмент Aliens vs. Все функции DirectX 11 были включены.

Настройки :

  • 16xAF
  • SSAO = Вкл
  • Качество текстур = Очень высокое
  • Аппаратная тесселяция = Вкл
  • Усовершенствованное сэмплирование теней = Вкл


В случае штатных параметров, производительность ASUS HD 6950 очень близка к GTX 570. В разогнанном варианте мы получили небольшой прирост показателей и оказались на уровне GTX 480.

Игровой тест: Metro 2033

Частично — шутер от первого лица, частично — хоррор, игра Metro 2033 основана на одноименном романе российского писателя Дмитрия Глуховского. Игра работает на движке 4A Engine, поддерживает DirectX 11, NVIDIA PhysX и NVIDIA 3D Vision.

Настройки :

  • DirectX 11
  • 16xAF
  • Глобальные настройки = Высокие
  • Physx = Выкл




ASUS HD 6950 снова оказалась близка GTX 480 в своей штатной версии. Увеличение тактовой частоты после оверклокинга подтянуло показатели к GTX 570.

Игровой тест Call of Duty: Modern Warfare 2

Call of Duty: Modern Warfare 2 это очередная игра серии Call of Duty, шутер от первого лица. Движок игры — IW 4.0, отличный подопытный для тестирования производительности видеокарты. В процессе тестирования мы будем замерять FPS с помощью Fraps в ходе обычной игры.

Настройки :

  • Все игровые настройки на максимуме
  • 16xAF



ASUS HD 6950 показала производительность на каждом из разрешений немного ниже HD6970. Разгон приблизил ее к HD6970, однако не позволил особо сократить разрыв.

Тест: Unigine Heaven Benchmark 2.0

Unigine Heaven Benchmark 2.0 — это программа тестирования графических процессоров с использованием DirectX 11 GPU на движке Unigine. Что ставит Heaven Benchmark особняком – это возможность использования аппаратной тесселяции в трех режимах - умеренном, нормальном и экстремальном. При этом тесселяция требует от видеокарты поддержки DirectX 11 и Windows Vista/7, а Heaven Benchmark также поддерживает DirectX 9, DirectX 10 и OpenGL. Визуально тест представлен как изображение прекрасных плавающих островов, на которых расположены крохотные деревеньки с тщательно прорисованной архитектурой.

Настройки :

  • 16xAF
  • Шейдеры = Высоко
  • Тесселяция = Нормально
  • Измерения = FPS


В штатном режиме, ASUS HD 6950 всего на один или два кадра в секунду отставала от GTX 570. При повышении разрешения, карта вполне могла превзойти соперника. В разогнанном состоянии показатели производительности были близки к HD6970.

Тест: 3DMark 11

3DMark 11 это очередной релиз Futuremark в серии 3DMark после Vantage. 3DMark 11 создан исключительно под DirectX 11, так что поддержка видеокартой Windows Vista или 7 обязательна для прохождения этого теста.

Новая версия бенчмарка тестируется при помощи нескольких новых демок, которые включают также аудиопотоки. При этом для каждой из карт были использованы три набора предустановок.

Настройки :

  • Настройки тестов по умолчанию
  • Начальный тест: 1024 x 600
  • Тест производительности: 1280 x 720
  • Экстремальный тест: 1920 x 1080







ASUS HD 6950 держалась позади карт NVIDIA до тех пор, пока мы не перешли на высшие разрешения, на которых она стала держаться ближе к GTX 570. Разогнанная карта показала огромный прирост производительности, что позволило ей держаться на одном уровне с GTX 480.

Тест: 3DMark Vantage

Включая в себя все новейшие игровые тесты, этот бенчмарк предназначен для систем на базе Vista. В тестовых программах есть четыре уровня предустановок, специфичных для каждого из разрешений. «Начальный» работает на 1024 x 768, а «Экстремальный» на 1920 x 1200. Для нашего тестирования были использованы именно эти пресеты.

Настройки :

  • Настройки : по умолчанию для каждого из пресетов
  • Начальный : 1024 x 768
  • Производительный : 1280 x 1024
  • Высокий : 1680 x 1050
  • Экстремальный : 1920 x 1200



ASUS HD 6950 продолжила демонстрировать производительность на уровне GTX 480. Разогнанная версия также работала как GTX 480, за исключением высоких разрешений.

Температурный тест

В ходе темпеартурного теста была обеспечена 100% загрузка видеокарты с помощью MSI Kombuster, при этом утилита MSI Afterburner была использована для регистрации температуры. Также для оценки стабильности тест запускался в разрешении 1920 x 1200 с использованием 8xAA. Для обеспечения выхода на максимальные пороги по температуре, тест длился 15 минут. Для штатной карты регулирование частоты вращения вентилятора охлаждения оставалось в ведении системы управления BIOS, а для разогнанной карты мощность его устанавливалась на 100%. Тест в режиме ожидания длилася 20 минут при таких же условиях работы охлаждения.

Настройки :

  • Мониторинг через MSI Afterburner
  • Длительность теста в режиме ожидания — 20 мин
  • Температура измерялась в градусах Цельсия

ASUS HD 6950 показала средние значения температуры. В случае разогнанной карты наблюдался небольшой нагрев, но его нельзя назвать серьезным.

Тест энергопотребления

Энергопотребление систем будет измерено в режиме бездействия и в режиме нагрузки при подаче пикового напряжения. Для загрузки GPU на 15 минут используем MSI Kombuster. Результат в режиме ожидания фиксируется после 15 минут бездействия системы.

Настройки

  • Тест на стабильность работы GPU — MSI Kombuster
  • Разрешение 1920 x 1200
  • Длительность теста под нагрузкой — 15 мин
  • Длительность теста в режиме ожидания — 15 мин
  • Измерения в Ваттах

Мы видим откровенно низкое энергопотребление как у штатной, так и у разогнанной ASUS HD 6950. В случае теста в режиме ожидания, разогнанная карта показывает немного повышенное потребление, но этот прирост не особо значителен.

ASUS HD 6950: отзывы

Исходя из всего увиденного, оборудованная Cayman Pro видеокарта ASUS HD 6950 показала производительность на том уровне, что и ожидалось. В исходном исполнении карта не смогла превзойти GTX 480. В разогнанном варианте она была весьма близка к GTX 580. Потенциал карты при разгоне оказался весьма существенным, 20% прироста тактовой частоты – отличный результат. Утилита ASUS Smart Doctor очень хороша для управления разгоном и имеет понятный интерфейс.

Температура работы в ходе тестов была показана довольно низкая, это значит, что система охлаждения по принципу паровой камеры делает свое дело. Температура при разгоне повышалась, и выведенный на максимальную мощность вентилятор производил много шума — это известная проблема штатного охлаждения на продуктах AMD. В целом хороший отзыв в том, что, при цене $289, вы получаете очень мощную видекарту с возможностью подключения до 6 мониторов. В качестве отзыва, еще нужно сказать, что это ASUS HD 6950 – очень хорошее предложение за свои деньги.

Плюсы :

  • Соотношение цена/качество
  • Eyefinity
  • Хорошее охлаждение
  • Потенциал для разгона
  • Smart Doctor

Минусы :

  • Очень громкий вентилятор

Просмотры: (5670)

Отправить

Класснуть

Линкануть

ВведениеНельзя сказать, что выпуск компанией Nvidia нового решения среднего класса на базе ядра GF114 стал потрясением основ и ниспровержением устоев в нише производительных графических карт стоимостью около 250 долларов, однако с появлением на рынке GeForce GTX 560 Ti графическое подразделение AMD попало в неудобное положение. Способный соперничать с новинкой «зелёных» Radeon HD 6950 стоил 299 долларов, а Radeon HD 6870 при сопоставимой цене GeForce GTX 560 Ti явно проигрывал. К чести компании, та не растерялась и ответила на выпад Nvidia сразу двумя грамотными маневрами: снижением цены Radeon HD 6870 с 239 до 219 долларов и выпуском более дешёвой версии Radeon HD 6950 стоимостью 259 долларов. Последней будет посвящён сегодняшний обзор, поэтому немного углубимся в детали.

Объём видеопамяти на борту игровых видеокарт линейно рос по мере прогресса в сфере потребительского 3D. Довольно долгое время вопрос «а надо ли больше мегабайт?» был одним из самых регулярно задаваемых. Сначала речь шла о необходимости 128 МБ по сравнению с массовыми 64 МБ, затем серийные карты стали оснащаться 256 МБ видеопамяти, но речь стала заходить о 512 МБ, и наконец, большинство игровых карт стало комплектоваться 1 ГБ локальной памяти, после чего процесс практически остановился. И немудрено - 1 ГБ видеопамяти при грамотном использовании достаточно в 99 % случаев и сценариев использования, особенно с учётом того, что всё большее количество игровых проектов являются мультиплатформенными, а значит, предъявляющими менее серьёзные требования к этому параметру. Конечно, старшие модели Nvidia GeForce GTX 500 несут на борту больше, однако, это обусловлено конфигурацией их контроллеров памяти, образующей 320- или 384-битные внешние шины доступа.

Тем менее ясна причина, по которой AMD при выпуске нового семейства Radeon HD 6900 оснастила обоих его представителей, Radeon HD 6970 и Radeon HD 6950, 2 ГБ видеопамяти, что лишь удорожило стоимость конечных продуктов и сделало младшую модель куда менее конкурентоспособной, чем та могла бы быть. К счастью, компания быстро осознала свою ошибку, и новая модель Radeon HD 6950 стоимостью 259 долларов получила 1 ГБ видеопамяти, сохранив все остальные характеристики более дорогого собрата.

В наши руки попала одна из таких карт, выпущенная компанией PowerColor, так что теперь только остаётся убедиться в том, что 2 ГБ видеопамяти на борту современной игровой видеокарты достаточно высокого класса являются излишеством. В окончательном прояснении этого вопроса нам поможет PowerColor HD6950 1GB .

PowerColor HD6950 1GB: конструкция и технические характеристики

Производитель явно питает слабость к вертикальным коробкам, поскольку HD6950 1GB поставляется практически в такой же упаковке, как и ранее описанный HD6870 PCS+ . Изменился лишь рисунок на лицевой стороне.

Мотивы рисунка явно навеяны вселенной Warhammer 40K, что понравится не всем, но, как мы уже неоднократно повторяли, это сугубо дело вкуса. Скажем лишь, что в данном случае о какой-то оригинальности говорить явно не приходится. Полезной информации на упаковке также немного - указана лишь модель видеоадаптера, а также тип и объём установленной на его борту видеопамяти.

Внутренности коробки представляют собой обычный картонный поддон, так что о серьёзных защитных свойствах речи не идёт. Помимо видеоадаптера в антистатическом пакете, тут можно найти следующий набор сопутствующих принадлежностей:



Переходник DVI → D-Sub
Переходник Mini DisplayPort → DisplayPort
Руководство по установке
CD с драйверами и утилитами

Комплектация ничуть не менее спартанская, нежели в случае с HD6870 PCS+; отсутствует даже соединительный мостик CrossFire. Однако, это лишь положительным образом отражается на доступности продукта, которая для очень многих любителей современных игр является весьма важным фактором, наряду с производительностью.

Парадоксально, но PowerColor HD6950 1GB использует не эталонный дизайн печатной платы, разработанный AMD для Radeon HD 6950, а незначительно переработанный дизайн Radeon HD 6870. Такой подход со стороны PowerColor можно назвать, как минимум, оригинальным. Практически этот же дизайн мы видели в конструкции HD6870 PCS+:




Отличия, конечно, есть, но их мешает рассмотреть система охлаждения, поэтому мы не преминули её демонтировать, отвернув четыре подпружиненных винта:


Выяснилось, что отличий, на самом деле, весьма немного: несколько другая разводка «земли» в хвостовой части платы и изменения в левом верхнем углу, вызванные необходимостью установки второго разъёма CrossFire и переключателя BIOS. Есть и другие, но очевидно, что разработчики PowerColor постарались максимально использовать уже имеющиеся в их распоряжении наработки.


Четырёхфазный стабилизатор питания графического ядра использует контроллер CHiL Semiconductor CHL8214 , а вот в подсистеме питания памяти установлен неизвестный контроллер производства uPI Semiconductor со странной маркировкой uP1509P. Общая компоновка силовой части не изменилась, она по-прежнему построена по схеме «4+2», а внешнее питание подключается к плате посредством двух шестиконтактных разъёмов PCIe 1.0.


В качестве микросхем памяти используются хорошо знакомые нам и нашим читателям чипы GDDR5 H5GQ1H24AFR ёмкостью 1 Гбит (32Мх32) производства Hynix Semiconductor. Суффикс T2C указывает на номинальную частоту 1250 (5000) МГц, на которой память и работает, обеспечивая пропускную способность всей подсистемы на уровне 160 ГБ/сек. Вряд ли можно ожидать от неё серьёзных достижений по части разгона, но от нехватки пропускной способности PowerColor HD6950 1GB и без того страдать не будет.




Графический процессор был произведён на 49 неделе прошлого, 2010 года. Разумеется, речь идёт об усечённой версии Cayman, в котором активно лишь 1408 ALU из 1536 физически имеющихся на кристалле GPU. Таким образом, активно 352 универсальных процессора VLIW4 из 384. Подсистема обработки текстур усечена с 96 до 88 текстурных процессоров, а вот растровая подсистема не пострадала: на неё жёстко завязана конфигурация контроллеров памяти, поэтому активны все 32 блока RBE.

Тактовая частота ядра в энергосберегающем режиме составляет 250 МГц, а в режиме полной нагрузки - 800 МГц, что полностью соответствует официальным спецификациям AMD на Radeon HD 6950. Напряжение питания ядра может составлять одно из трёх значений: 0,898 В, 1,0 В или 1,063 В, в зависимости от режима работы. В верхней левой части платы имеется переключатель BIOS, с помощью которого можно переключиться между защищённой заводской прошивкой и свободной, допускающей перепрошивку пользователем.



Крепёжная планка PowerColor HD6950 1GB демонстрирует стандартную конфигурацию коммутационных разъёмов. Она несёт на себе пару портов DVI-I, порт HDMI и пару разъёмов Mini DisplayPort. Разумеется, все пять разъёмов можно использовать одновременно, а с использованием коммутатора, поддерживающего стандарт DP 1.2 - и довести количество одновременно работающих дисплеев до шести. Пара разъёмов CrossFire позволяет построить мощную систему CrossFireX, состоящую из четырёх карт. С появлением на рынке Radeon HD 6990 такая возможность не очень актуальна, но всё же она присутствует.

Как было отмечено в обзоре PowerColor HD6870 PCS+, установленная на этой карте система охлаждения оказалась крайне неудачной или дефектной. В случае с HD6950 1GB мы видим похожую конструкцию:



Площадь радиатора существенно больше, но тепловых трубок по-прежнему две. Однако, обдувается радиатор уже двумя 92-мм вентиляторами. Если бы не результаты предыдущих испытаний аналогичной конструкции, можно было бы сказать, что система охлаждения PowerColor HD6950 1GB выглядит многообещающе. Но с учётом полученных ранее данных мы считаем разумным проявить дополнительную осторожность в оценках. Впрочем, следующая глава расставит всё по местам.

Энергопотребление, тепловой режим, шумность и разгон

Описываемая модель Radeon HD 6950, оснащённая 1 ГБ локальной видеопамяти, встречается в нашей практике впервые, поэтому было решено потратить немного времени на выяснение вопроса об уровне энергопотребления данного решения. Для этого оно было установлено на измерительный стенд со следующей конфигурацией:

Процессор Intel Core 2 Quad Q6600 (3 ГГц, 1333 МГц FSB x 9, LGA775)
Системная плата DFI LANParty UT ICFX3200-T2R/G (ATI CrossFire Xpress 3200)
Память PC2-1066 (2x2 ГБ, 1066 МГц)
Блок питания Enermax Liberty ELT620AWT (Номинальная мощность 620 Вт)
Microsoft Windows 7 Ultimate 64-bit
CyberLink PowerDVD 9 Ultra/«Serenity» BD (1080p VC-1, 20 Мбит/c)
Crysis Warhead
OCCT Perestroika 3.1.0

Данная платформа оснащена специальным измерительным модулем, описанным в обзоре «Энергопотребление компьютеров: так сколько нужно ватт? ». Его использование позволяет получить наиболее полные данные об электрических характеристиках современных графических карт в различных режимах. Как обычно, для создания нагрузки на видеоадаптер в различных режимах были использованы следующие тесты:

CyberLink PowerDVD 9: FullScreen, аппаратное ускорение включено
Crysis Warhead: 1600x1200, FSAA 4x, DirectX 10/Enthusiast, карта «frost»
OCCT Perestroika GPU: 1600x1200, FullScreen, Shader Complexity 8

Для каждого режима, за исключением симуляции предельной нагрузки в OCCT, замеры проводились в течение 60 секунд; во избежание выхода карты из строя вследствие перегрузки цепей питания, для теста OCCT: GPU время тестирования было ограничено 10 секундами. В результате проделанных измерений были получены следующие результаты:


















Будем кратки: ничего нового замеры уровня энергопотребления PowerColor HD6950 1GB не открыли. В режиме 2D и декодирования HD-видео карта потребляет чуть больше эталонного Radeon HD 6950 2GB, а в режиме 3D - напротив, чуть меньше. 161 Вт - уровень GeForce GTX 560 Ti, так что описываемое изделие вполне конкурентоспособно в своём классе по части энергопотребления.

Отметим, что при декодировании видео высокого разрешения цифры демонстрируют пиковый уровень энергопотребления, что хорошо видно из вышеприведённой диаграммы. Средний показатель в этом режиме составляет примерно 40 Вт. Второй, ближний к краю печатной платы разъём питания, обозначенный в таблице, как «12V 6-pin», нагружается заметно сильнее первого, но серьёзного превышения рекомендуемых для данного типа разъёмов 75 Ватт нет даже в OCCT.

Вернёмся к более животрепещущему вопросу, а именно, к тепловым и шумовым характеристикам. При комнатной температуре в пределах 25 градусов Цельсия нам удалось получить следующие результаты:



Показатели, на первый взгляд, не выдающиеся, и даже не слишком отличающиеся от показателей PowerColor HD6870 PCS+, однако, во-первых, HD6950 1GB имеет существенно более высокий уровень тепловыделения, а во-вторых, на фоне показателей эталонной модели Radeon HD 6950 2GB система охлаждения PowerColor HD6950 1GB смотрится весьма и весьма неплохо! Но, как мы помним, у PowerColor HD6870 PCS+ достаточно высокая эффективность охлаждения сопровождалась чудовищным уровнем шума. Повторится ли это в случае с PowerColor HD6950 1GB?


Это, как ни странно, зависит от положения переключателя BIOS. В случае, если задействована защищённая заводская прошивка, уровень шума находится в разумных пределах; во всяком случае, при фоновом уровне шума в помещении на уровне 38 дБА, показатели PowerColor HD6950 1GB ничуть не хуже показателей эталонного Radeon HD 6950 2GB. По крайней мере, это справедливо для режима 3D. А вот переключение в положение «для энтузиастов» мгновенно приводит к существенному повышению скорости вращения вентиляторов и соответствующему росту уровня шума. По всей видимости, это своеобразная защита от пользовательских экспериментов с разгоном и повышением напряжения питания GPU. От настоящих экстремалов она, конечно, не спасёт, однако, идея перестраховки в целом не выглядит лишней, благо, настоящие оверклокеры, как правило, не заботятся об акустическом комфорте. Разумеется, все результаты тестов, включая температурные, были получены в режиме «b1», означающем защищённую прошивку.

Результаты разгона PowerColor HD6950 1GB оказались достаточно скромными. После ряда попыток удалось добиться стабильной работы карты на следующих частотах:


Как видите, всего 860 МГц по частоте графического ядра вряд ли можно назвать серьёзным разгоном. Память порадовала несколько больше, достигнув внушительных 5400 МГц эквивалентной частоты GDDR5. В итоге, после некоторых колебаний, было решено протестировать PowerColor HD6950 1GB не только при заводских частотах, но и в режиме разгона.

Конфигурация тестовых платформ и методология тестирования

Тестирование PowerColor HD6950 1GB в реальных игровых приложениях было проведено на универсальной тестовой платформе со следующей конфигурацией:

Процессор Intel Core i7-975 Extreme Edition (3,33 ГГц, 6,4 GT/s QPI)
Кулер Scythe SCKTN-3000 «Katana 3»
Системная плата Gigabyte GA-EX58-Extreme (Intel X58)
Память Corsair XMS3-12800C9 (3x2 ГБ, 1333 МГц, 9-9-9-24, 2Т)
Жесткий диск Samsung Spinpoint F3 (1 ТБ/32 МБ, SATA II)
Блок питания Ultra X4 850W Modular (Номинальная мощность 850 Вт)
Монитор Dell 3007WFP (30”, максимальное разрешение 2560x1600@60 Гц)
Microsoft Windows 7 Ultimate 64-bit

Использовались следующие версии драйверов ATI Catalyst и Nvidia GeForce:

ATI Catalyst 11.4 «Mjölnir I» preview для ATI Radeon HD
Nvidia GeForce 266.66 WHQL для Nvidia GeForce GTX 560 Ti
Nvidia GeForce 266.58 WHQL для Nvidia GeForce GTX 570

Сами драйверы были настроены следующим образом:

ATI Catalyst:

Anti-Aliasing: Use application settings/4x/Standard Filter
Morphological filtering: Off
Tesselation: Use application settings
Texture Filtering Quality: High Quality
Enable Surface Format Optimization: Off
Wait for vertical refresh: Always Off
Anti-Aliasing Mode: Adaptive Multi-sample AA

Nvidia GeForce:

Texture filtering - Quality: High quality
Vertical sync: Force off
Antialiasing - Transparency: Multisampling
CUDA - GPUs: All
Set PhysX configuration: Auto-select
Ambient Occlusion: Off
Остальные настройки: по умолчанию

В состав тестового пакета вошли следующие игры и приложения:

Трехмерные шутеры с видом от первого лица:

Aliens vs. Predator (1.0.0.0, Benchmark)
Battlefield: Bad Company 2 (1.0.5, Fraps)
Call of Duty: Black Ops (1.04, Fraps)
Crysis Warhead (1.1.1.711, Benchmark)
Metro 2033 (Ranger Pack, 1.02, Benchmark)
S.T.A.L.K.E.R.: Call of Pripyat (1.6.02, Fraps)


Трехмерные шутеры с видом от третьего лица:

Just Cause 2 (1.0.0.1, Benchmark/Fraps)
Lost Planet 2 (1.1, Benchmark/Fraps)


RPG:

Dragon Age II (1.01, Fraps)
Mass Effect 2 (1.01, Fraps)


Симуляторы:

F1 2010 (1.01, Fraps)


Стратегические игры:

StarCraft II: Wings of Liberty (1.3, Fraps)
Total War: Shogun 2 (1.1, Fraps)


Полусинтетические и синтетические тесты:

Futuremark 3DMark Vantage (1.1)
Futuremark 3DMark 11 (1.0.1)
Unigine Heaven Benchmark (2.5)
Tom Clancy"s H.A.W.X. 2 Benchmark (1.04, Benchmark/Fraps)

Каждая из входящих в набор тестового программного обеспечения игр была настроена таким образом, чтобы обеспечивать максимально возможный уровень детализации. В приложениях, поддерживающих тесселяцию, эта возможность была задействована.

Принципиальный отказ от ручной модификации каких-либо конфигурационных файлов означает, что для настройки использовались исключительно средства, доступные в самой игре любому непосвящённому пользователю. Тестирование проводилось в разрешениях 1600х900, 1920х1080 и 2560х1600. За исключением отдельно оговоренных случаев, стандартную анизотропную фильтрацию 16х дополняло сглаживание MSAA 4x. Активация сглаживания осуществлялась либо средствами самой игры, либо, при их отсутствии, форсировалась с помощью соответствующих настроек драйверов ATI Catalyst и Nvidia GeForce.

Помимо PowerColor HD6950 1GB, в тестировании приняли участие следующие графические карты:

ATI Radeon HD 6950 2GB
ATI Radeon HD 6870
Nvidia GeForce GTX 570
Nvidia GeForce GTX 560 Ti

Для получения данных о производительности использовались встроенные в игру средства тестирования с обязательным применением оригинальных тестовых роликов, а также, по возможности, фиксацией данных о минимальной производительности. В отдельных случаях для получения информации о минимальной производительности дополнительно применялась тестовая утилита Fraps 3.3.2. В случае отсутствия вышеупомянутых средств применялась эта же утилита в ручном режиме с трёхкратным тестовым проходом, фиксацией минимальных значений и последующим усреднением финального результата.

Игровые тесты: Aliens vs. Predator


Как мы и ожидали, от урезания вдвое объёма локальной видеопамяти Radeon HD 6950 ничуть не пострадал, если не считать упавшей цены, что, конечно, трудно отнести к потерям, особенно с точки зрения покупателя. Карта PowerColor чувствует себя весьма уверенно как в обычном режиме, так и с дополнительным разгоном, причём, в последнем случае, HD6950 1GB может поспорить и с более дорогим GeForce GTX 570. Недоступным остаётся лишь режим 2560х1600, требующий решений более высокого класса.

Игровые тесты: Battlefield: Bad Company 2


Разницы между двумя моделями Radeon HD 6950 нет никакой, что не может не радовать. Похоже, на сегодня индустрия настольной трёхмерной графики достигла момента, когда наращивать объём видеопамяти не будет смысла ещё довольно долго. В этой игре GeForce GTX 560 Ti лидирует, но не настолько, чтобы однозначно предпочесть эту карту Radeon HD 6950, тем более, что разгон позволяет выжать из последнего ещё немного производительности.

Игровые тесты: Call of Duty: Black Ops


Игра абсолютно нетребовательна к достаточно современным графическим картам, однако, видно, что среди всех участников теста GeForce GTX 560 Ti демонстрирует наихудшую минимальную производительность, в то время, как у обеих версий Radeon HD 6950 с ней дела обстоят превосходно даже в режимах Ultra HD. Соответственно, нет никакой нужды прибегать к разгону.

Игровые тесты: Crysis Warhead


Пока это единственный тест, где нам удалось обнаружить хоть какую-то разницу в производительности двух моделей Radeon HD 6950, пусть весьма несущественную и только в разрешении 2560х1600, где сравнение уже теряет смысл из-за низкой производительности. Продукт PowerColor выглядит явно выгоднее GeForce GTX 560 Ti, поскольку, в отличие от того, обеспечивает вполне приемлемые показатели в режиме Full HD как с разгоном, так и без него. Примерно такую же производительность можно получить и на GeForce GTX 570, однако, обойдётся это вам заметно дороже.

Игровые тесты: Metro 2033



Интересно, что разгон Radeon HD 6950 не даёт никакого заметного эффекта в этой игре, но по общему уровню производительности этот видеоадаптер уступает только GeForce GTX 570. Единственное разрешение, в котором разница заметна - 1600х900, так что переплачивать нет причин. Однако не следует забывать про серьёзные флуктуации минимальной скорости при включенной тесселяции.

Игровые тесты: S.T.A.L.K.E.R.: Call of Pripyat

Игра тестируется с включенной тесселяцией.


Эффект от разгона невелик и его можно не принимать во внимание, тем более, что производительности Radeon HD 6950 и так достаточно для полноценной игры в разрешении 1920х1080. Наряду с GeForce GTX 560 Ti, версия Radeon HD 6950 с 1 ГБ видеопамяти заслуженно является одной из лучших массовых игровых карт достаточно высокого класса.

Игровые тесты: Just Cause 2


Как и прежде, никакого смысла в покупке Radeon HD 6950 2GB нет. Модель, оснащённая вдвое меньшим объёмом локальной видеопамяти, работает ничуть не хуже во всём диапазоне разрешений. Особого смысла в разгоне также найдено не было, хотя в разрешении 1600х900 его применение позволило герою нашего обзора догнать GeForce GTX 570.

Игровые тесты: Lost Planet 2


Уже доказано, что Lost Planet 2 откровенно предпочитает архитектуру Nvidia Fermi, так что решениям AMD в этой игре делать практически нечего. Даже достаточно мощный Radeon HD 6950 можно использовать лишь в разрешении 1600х900, причём, для исправления ситуации потребуется явно более существенный разгон, нежели тот, которого нам удалось добиться в случае с PowerColor HD6950 1GB.

Игровые тесты: Dragon Age II


Новая RPG, выпущенная Bioware, недаром использовалась в рекламе Radeon HD 6990. У Crysis Warhead появился действительно серьёзный противник по части аппетитов к ресурсам графической подсистемы. Интересно, что ситуация здесь выглядит с точностью до наоборот в сравнении с Lost Planet 2 - решения Nvidia явно в загоне, а бал правят карты на базе AMD Cayman. При максимальных настройках детализации герой нашего обзора позволяет вполне комфортно играть в разрешении 1600х900, что при недюжинных аппетитах данной игры само по себе является весомым достижением, особенно если взглянуть на плачевные показатели GeForce GTX 570. Как и в других играх, за исключением всё того же Crysis Warhead, разница в объёме видеопамяти двух моделей Radeon HD 6950 не даёт никакого эффекта.

Игровые тесты: Mass Effect 2

В этом тесте полноэкранное сглаживание форсируется с использованием методики, описанной в обзоре Contemporary Graphics Accelerators in Mass Effect 2.


В данном случае разгон PowerColor HD6950 1GB позволяет догнать GeForce GTX 560 Ti в разрешении 1600х900 и перегнать в более высоких разрешениях, но и без этой меры производительность исследуемого продукта достаточно высока во всех режимах, включая Ultra HD. Наряду с GeForce GTX 560 Ti описываемый видеоадаптер, вне всякого сомнения, является отличным выбором для Mass Effect 2.

Игровые тесты: F1 2010


Ничуть не хуже проявляет себя продукт PowerColor и в симуляторе гонок Формулы 1; во всяком случае, он обеспечивает заметно более высокий уровень средней и минимальной производительности, нежели GeForce GTX 560 Ti, лишь немногим уступая заметно более дорогому GeForce GTX 570.

Игровые тесты: StarCraft II: Wings of Liberty


Обзор близится к концу, но пока StarCraft II можно назвать единственной игрой, где разгон PowerColor HD6950 1GB приносит хоть какую-то пользу, а именно, несколько увеличивает производительность в разрешении 2560х1600. Поскольку прирост невелик, от реальности этой пользы можно спорить, но нельзя не отметить, что возможности исследуемого продукта обеспечивают достаточно высокий уровень комфорта даже в этом разрешении. В целом, Radeon HD 6950 1GB выглядит лишь немногим хуже GeForce GTX 570.

Игровые тесты: Total War: Shogun 2

Особенности движка этой игры заставляют делать выбор между использованием FSAA и полного набора спецэффектов. Мы сделали выбор в пользу последних.


По какой-то причине минимальная производительность GeForce GTX 560 Ti находится ниже всякой критики при средних показателях, сопоставимых с показателями Radeon HD 6950 1GB, что определяет предпочтительный выбор для потенциального покупателя, не желающего раскошеливаться сразу на GeForce GTX 570. Сразу следует отметить, что ни один из участников тестирования не смог добиться приемлемых показателей в разрешении 2560х1600.

Полусинтетические и синтетические тесты: Futuremark 3DMark Vantage

Чтобы минимизировать влияние центрального процессора, при тестировании в 3DMark Vantage применяется профиль «Extreme», использующий разрешение 1920х1200, FSAA 4x и анизотропную фильтрацию. Для полноты картины производительности, результаты отдельных тестов снимаются во всем диапазоне разрешений.



Результаты достаточно закономерны: производительность двух моделей Radeon HD 6950 если и отличается, то минимально, а разгон карты PowerColor достаточно скромен, чтобы принести весомые дивиденды. В итоге GeForce GTX 570 остаётся почивать на лаврах, ну а неразогнанные GeForce GTX 560 Ti и Radeon HD 6870 плетутся в хвосте.




Всё вышесказанное справедливо и для отдельных тестов, разве что во втором тесте отставание GeForce GTX 560 Ti от Radeon HD 6950 не столь существенно, как в первом, а в разрешении 2560х1600 уже можно говорить о паритете между этими двумя картами.

Полусинтетические и синтетические тесты: Futuremark 3DMark 11

В новом тестовом пакете Futuremark мы также применяем профиль «Extreme», однако, в отличие от 3DMark Vantage, в 3DMark 11 он использует разрешение 1920х1080.



Производительность двух Radeon HD 6950, один из которых несёт на борту 1 ГБ видеопамяти, а другой - вдвое больше, абсолютно одинаковая. Разницу в десяток-полтора очков легко можно списать на случайные флуктуации. Однако, в отличие от 3DMark Vantage, в 3DMark 11 с помощью разгона можно поднять результат исследуемой карты почти до уровня GeForce GTX 570.

Полусинтетические и синтетические тесты: Tom Clancy"s H.A.W.X. 2 Preview Benchmark

Данный тест активно использует тесселляцию для отрисовки поверхности земли. Количество полигонов в кадре может достигать полутора миллионов.


В отличие от Radeon HD 6800, серия Radeon HD 6900 летает явно выше, но всё же не столь высоко, как решения Nvidia Fermi, располагающие намного более внушительными мощностями по обработке геометрии и выполнению тесселяции. Впрочем, показатели достаточно оптимистичные даже в разрешении 2560х1600. Разгон прибавляет к уже имеющемуся результату совсем немного.

Полусинтетические и синтетические тесты: Unigine Heaven benchmark

В тесте используется режим тесселяции «normal».


Несмотря на сравнительно скромный движок тесселяции в сравнении с решениями на базе Nvidia Fermi, Radeon HD 6950 демонстрирует весьма неплохой результат, лишь немногим уступающий результату GeForce GTX 570. К тому же, в разрешениях от 1920х1080 и выше в новой версии Unigine Heaven GeForce GTX 560 Ti резко теряет в минимальной производительности, что играет на руку данному решению AMD.

PowerColor HD6950 1GB: достоинства и недостатки

Достоинства:

Высокий уровень производительности в своём классе
Широкий выбор режимов FSAA
Лучшее в индустрии качество анизотропной фильтрации
Поддержка вывода на шесть мониторов
Полноценная аппаратная поддержка декодирования HD-видео, включая DivX и 3D
Качественный постпроцессинг и масштабирование HD-видео
Интегрированное звуковое ядро с поддержкой звуковых форматов HD
Поддержка вывода звука через HDMI
Поддержка HDMI 1.4a
Поддержка DisplayPort 1.2
Высокая эффективность охлаждения
Невысокий уровень шума

Недостатки:

Скромный разгонный потенциал
Меньший, по сравнению с конкурирующими решениями, выбор приложений GPGPU

Заключение

Как и ожидалось, никакого видимого эффекта сокращение объёма видеопамяти у Radeon HD 6950 не оказало. Лишь в разрешении 2560х1600 в Crysis Warhead и StarCraft II обнаружилось крайне несущественное падение производительности, не превышающее 9 и 6 %, соответственно. В остальных случаях если отставание и наблюдалось, то оно не достигло даже 5 %. Иными словами, можно говорить о полном паритете Radeon HD 6950 1GB и Radeon HD 6950 2GB.

В связи с этим, встаёт вопрос - какова же сфера применения второй, более дорогой модели? Однозначно на этот вопросы мы ответить не можем, но ясно одно - это явно не игровая сфера, поскольку в 2011 году в подавляющем большинстве игр вполне достаточно 1 ГБ локальной видеопамяти, и данная цифра уже давно успела утвердиться в качестве своеобразного стандарта. Может быть, в каких-то приложениях, производящих массивные вычисления на GPU, 2 ГБ локальной памяти и могут быть востребованными, но для таких целей существуют специализированные решения, оснащённые ещё большими объёмами памяти, и, соответственно, лучше подходящие для таких задач.

Очевидно, что на рынке игровых графических карт Radeon HD 6950 2GB не выжить: при стоимости 299 долларов сверху его пожимает более быстрый GeForce GTX 570, а снизу - менее дорогой GeForce GTX 560 Ti. А вот Radeon HD 6950 1GB весьма удачно вписывается в нишу между двумя вышеупомянутыми решениями Nvidia, будучи ощутимо дешевле первого и существенно быстрее второго. Подтверждением могут служить сводные диаграммы производительности:






В первую очередь, Radeon HD 6950 1GB может похвастаться тем, что опережает GeForce GTX 560 Ti на 8-30 % в среднем, в зависимости от разрешения, а в отдельных тестах превосходство может быть и двухкратным. Последнее, правда, говорит не в пользу AMD, а, скорее, о том, что какая-то игра предпочитает определённую графическую архитектуру. Отставание от GeForce GTX 570 невелико; в среднем, оно составляет 3-10 %, в зависимости от разрешения, но в отдельных тестах может достигать и 40 %, так что предпочтительный выбор конкретного игрока, как и прежде, зависит от предпочитаемого им набора игр. Что касается разгона, то, как и ожидалось, столь скромный прирост по тактовым частотам GPU и памяти принёс соответствующий прирост производительности - от 2 до 14 %, в зависимости от игры и разрешения.

Относительно конкретной модели Radeon HD 6950 1 ГБ, рассмотренной в данном обзоре, PowerColor HD6950 1GB, мы смело можем сказать, что свою цену она отрабатывает сполна. Эта видеокарта не демонстрирует экстраординарных талантов в области разгона и не может похвастаться богатой комплектацией. Всё, что она делает - это обеспечивает вышеописанный уровень производительности в современных играх, демонстрируя при этом неплохие тепловые и акустические характеристики. Иными словами, PowerColor HD6950 1GB является хорошей «рабочей лошадкой», отлично справляющейся со своими обязанностями. Она не блещет выдающимися достоинствами, но лишена и видимых недостатков, а значит, мы вполне можем рекомендовать её тому, кто ищет производительную игровую карту с разумной стоимостью.

Другие материалы по данной теме


Обзор ускорителя GeForce GTX 550 Ti и видеокарты MSI N550GTX-Ti Cyclone OС
Справочные таблицы по видеорешениям ATI, AMD и NVIDIA
MSI R6870 Hawk против PowerColor HD6870 PCS+: обзор двух моделей Radeon HD 6870

AMD Radeon HD 6950/6970:

описание видеокарт и результаты синтетических тестов

Есть смысл еще раз напомнить, что карты требуют дополнительного питания, причем 6950 — двумя 6-контактными разъемами. А 6970 — 8-контактным и 6-контактным. Надеемся, что партнеры AMD будут вкладывать в комплект соответствующие переходники-разветвители питания.

О системе охлаждения.

AMD Radeon HD 6950/6970 2048 МБ 256-битной GDDR5, PCI-E

Стоит заметить, что CO очень схожа по принципу с той, что мы видели на GTX 580/570, и она также базируется на испарительной камере, которая заключена в медном узком отсеке, соприкасающемся с GPU. Над этой камерой выстроена конструкция из ребер охлаждения, через которые проходит воздух, гонимый цилиндрическим вентилятором на конце всего устройства. Правда, в отличие от GTX 580, в данном случае вся конструкция выполнена из меди, включая ребра радиатора, поэтому СО получилась весьма тяжелой.

Мы уже писали, что такое решение — более эффективно, нежели традиционно использовавшееся ранее на тепловых трубках. Внутри испарительной камеры особая жидкость, которая моментально передает тепло от нижней пластины к верхней.

Особо стоит также отметить, что СО настроена на незначительные реагирования при нагреве, чтобы обеспечить почти бесшумную работу. Поэтому нагрев ядра может даже превышать то, что мы видели в случае с 5870.

Мы провели исследование температурного режима с помощью утилиты MSI Afterburner (автор А. Николайчук AKA Unwinder) и получили следующие результаты:

AMD Radeon HD 6970 2048 МБ 256-битной GDDR5, PCI-E

AMD Radeon HD 6950 2048 МБ 256-битной GDDR5, PCI-E

Результаты исследования показали, что, несмотря на все вышесказанное, СО реально эффективна, и даже при частоте вращения 40% от максимума нагрев равен 92 градуса у 6970, а у 6950 — 84. Это после 6-часового постоянного тестирования под нагрузкой в 3D. Да, кому-то 92 градуса покажутся чрезмерно высокими, однако для акселераторов уровня Hi-End это приемлемо.

Максимальное энергопотребление карт под нагрузкой — 250—260 Вт для 6970 и чуть выше 205 Вт для 6950. Мы специально не приводим всяких графиков потребления, чтобы не усложнять прочтение материала. Читателей ведь всегда интересует — сколько оно потребляет в максимуме, чтобы подобрать нужный БП, а детали уже мало кому интересны.

Комплектация. Учитывая, что референс-образцы никогда не имеют комплектации, мы этот вопрос опустим.

Установка и драйверы

Конфигурация тестового стенда:

  • Компьютер на базе CPU Intel Core i7-975 (Socket 1366)
    • процессор Intel Core i7-975 (3340 МГц);
    • системная плата Asus P6T Deluxe на чипсете Intel X58;
    • оперативная память 6 ГБ DDR3 SDRAM Corsair 1600 МГц;
    • жесткий диск WD Caviar SE WD1600JD 160 ГБ SATA;
    • блок питания Tagan TG900-BZ 900 Вт.
  • операционная система Windows 7 64-битная; DirectX 11;
  • монитор Dell 3007WFP (30″);
  • драйверы ATI версии Catalyst 10.11; Nvidia версии 263.09 / 260.99.

VSync отключен.

Синтетические тесты

Используемые нами пакеты синтетических тестов можно скачать здесь:

  • D3D RightMark Beta 4 (1050) с описанием на сайте 3d.rightmark.org .
  • D3D RightMark Pixel Shading 2 и D3D RightMark Pixel Shading 3 — тесты пиксельных шейдеров версий 2.0 и 3.0, ссылка .
  • RightMark3D 2.0 с кратким описанием: под Vista без SP1 , под Vista c SP1 .

За неимением собственных синтетических тестов DirectX 11 мы ещё раз воспользовались примерами из пакетов SDK Microsoft и AMD и демонстрационной программой Nvidia. Во-первых, это HDRToneMappingCS11.exe и NBodyGravityCS11.exe из комплекта DirectX SDK (February 2010) .

Также мы взяли приложения обоих производителей: Nvidia и AMD. Из ATI Radeon SDK были взяты примеры DetailTessellation11 и PNTriangles11 (они также есть и в DirectX SDK). Дополнительно использовалась демонстрационная программа компании Nvidia — Realistic Water Terrain , также известная как Island11 (автор — Тимофей Чеблоков, очень известный специалист в 3D-графике).

Синтетические тесты проводились на следующих видеокартах:

  • Radeon HD 6970 HD 6970 )
  • Radeon HD 6950 со стандартными параметрами (далее HD 6950 )
  • Radeon HD 6870 со стандартными параметрами (далее HD 6870 )
  • Radeon HD 5870 со стандартными параметрами (далее HD 5870 )
  • Geforce GTX 580 со стандартными параметрами (далее GTX 580 )
  • Geforce GTX 570 со стандартными параметрами (далее GTX 570 )

Для сравнения результатов новых моделей видеокарт серии Radeon HD 6900 были выбраны эти модели, потому что Radeon HD 5870 — предыдущее одночиповое решение компании для топового ценового диапазона, сильнейшее до выхода новых моделей; Radeon HD 6870 — текущее решение компании AMD, стоящее на ступеньку ниже топовых и основанное на недавно вышедшем видеочипе Barts.

А именно эти решения Nvidia были взяты потому, что Geforce GTX 580 — быстрейшая одночиповая модель компании, основанная на свежем GPU. Хотя она не является конкурентом представленных видеокарт по цене, её результаты интересны как некая максимальная для решений Nvidia планка. Ну а GTX 570 взята как прямой конкурент для старшей модели новой серии — HD 6970.

Direct3D 9: тесты Pixel Filling

В этом тесте определяется пиковая производительность выборки текстур (texel rate) в режиме FFP для разного числа текстур, накладываемых на один пиксель:

В данном тесте фильтрации 32-битных (8 бит на цвет) текстур большинство видеокарт показывают цифры, далёкие от теоретически возможных. Вот и результаты нашей текстурной синтетики в случае видеоплат серии HD 6900 не дотягивают до пиковых значений. Далее мы рассмотрим скорость текстурирования ещё раз, в тесте из пакета 3DMark Vantage, где получаются более реалистичные цифры.

А тут получается, что HD 6970 выбирает лишь 67 текселей за один такт из 32-битных текстур при билинейной фильтрации, что почти на треть ниже теоретической цифры в 96 отфильтрованных текселей. Для HD 6950 эти цифры соответствуют 62 текселям из 88 теоретических, то есть эффективность младшей модели получилась чуть выше, и это связано с небольшой разницей по пропускной способности видеопамяти, также влияющей на результаты.

Неудивительно, что все карты AMD показывают такую высокую производительность и значительно опережают своих соперников из стана компании Nvidia. У них ведь и теоретические показатели скорости текстурирования весьма высоки. А вот даже топовая GTX 580 имеет лишь 64 TMU и сильно уступает моделям на Cayman, имеющим 88—96 TMU, да ещё и работающих на более высоких частотах.

Весьма любопытной получилась разница между HD 6950 и HD 5870 в разных условиях. Если в случаях с большим количеством текстур, где больше всего сказывается именно количество TMU и их частота, они идут наравне, то при меньшем количестве текстур на пиксель вперёд выходит модель HD 5870. Причём разницу нельзя списать только на ПСП, и вероятно тут сказываются и различные оптимизации в драйверах.

Рассмотрим эти же результаты в тесте филлрейта:

Эти цифры показывают скорость заполнения, и в них мы видим всё то же самое, разве что с учетом количества записанных в буфер кадра пикселей. Максимальный результат остаётся за новыми топовыми решениями семейства Radeon HD 6900, имеющими просто огромное количество TMU и более эффективными в нашем синтетическом тесте. Удивительно, но в случаях с 0—4 накладываемыми текстурами младшая из рассматриваемых сегодня видеокарт почему-то сильно уступает предыдущему топовому решению AMD, хотя в сложных условиях практически не отстаёт от него.

Direct3D 9: тесты Pixel Shaders

Первая группа пиксельных шейдеров, которую мы рассматриваем, очень проста для современных видеочипов, она включает в себя различные версии пиксельных программ сравнительно низкой сложности: 1.1, 1.4 и 2.0, встречающихся в старых играх.

Тесты очень просты для современных GPU и сильно упираются в производительность текстурирования. Поэтому они показывают далеко не все возможности современных видеочипов, но всё же интересны для оценки баланса между текстурными выборками и математическими вычислениями. В данном случае особых отличий между HD 5870 и HD 6950 нет, результаты этих моделей сопоставимы. Хотя один тест выделился — пиксельный шейдер освещения тремя источниками по Фонгу явно зависит от математической производительности GPU, и поэтому уровня HD 5870 в нём достигла только старшая модель — HD 6970.

Производительность в других тестах ограничена по большей части скоростью текстурных модулей и филлрейтом, но с учётом эффективности блоков и кэширования данных. Новые модели серии Radeon HD 6900 несколько быстрее предшествующих: HD 6970 быстрее HD 5870, а HD 6950 быстрее HD 6870 (из другого ценового диапазона). И почти все они опережают обе топовые модели Geforce — даже GTX 580 в этих тестах показывает результат лишь на уровне HD 6870, и в этом явно виноват недостаток скорости текстурирования.

Посмотрим на результаты более сложных пиксельных программ промежуточных версий:

И в этот раз получилось примерно то же самое, снова GTX 580 конкурирует скорее с HD 6870, чем с реальными топовыми моделями AMD. Тест Cook-Torrance более интенсивен вычислительно, и разница в нём примерно соответствует разнице в количестве ALU и их частоте. Именно поэтому данный тест лучше подходит для архитектуры AMD, чипы которой имеют большее количество математических блоков.

И тут нашлись два интересных момента. Во-первых, HD 5870 обгоняет даже HD 6970, что сложно объяснить одними лишь теоретическими характеристиками. Разница по пиковой математической производительности между этими моделями почти отсутствует, но есть и архитектурные отличия. Похоже, что именно разная эффективность исполнения этого шейдера на тех самых VLIW5- и VLIW4-процессорах и привела к такой разнице не в пользу нового чипа Cayman. Поэтому и HD 6950 в этом тесте выступила лишь на уровне HD 6870, а также GTX 580.

Во втором, сильно зависящем от скорости текстурирования тесте процедурной визуализации воды «Water» используется зависимая выборка из текстур больших уровней вложенности, и видеокарты в нём располагаются по скорости текстурирования, с поправкой на разную эффективность использования TMU.

Вот в этом тесте у новых решений всё прекрасно, HD 6950 обеспечивает результат на уровне HD 5870, а HD 6970 лидирует с хорошим отрывом, почти соответствующим 25-процентной разнице в теоретической скорости текстурирования. Понятно, что видеокартам производства Nvidia здесь ловить нечего, и они показывают результат на уровне заметно более дешёвой модели конкурента.

Direct3D 9: тесты пиксельных шейдеров Pixel Shaders 2.0

Эти тесты пиксельных шейдеров DirectX 9 сложнее предыдущих, они близки к тому, что мы сейчас видим в мультиплатформенных играх, и делятся на две категории. Начнем с более простых шейдеров версии 2.0:

  • Parallax Mapping — знакомый по большинству современных игр метод наложения текстур, подробно описанный в статье .
  • Frozen Glass — сложная процедурная текстура замороженного стекла с управляемыми параметрами.

Существует два варианта этих шейдеров: с ориентацией на математические вычисления и с предпочтением выборки значений из текстур. Рассмотрим математически интенсивные варианты, более перспективные с точки зрения будущих приложений:

Это универсальные тесты, зависящие и от скорости блоков ALU, и от скорости текстурирования, в них важен общий баланс чипа. Производительность новых видеокарт AMD в тесте «Frozen Glass» весьма хороша, HD 6970 снова оказалась заметно быстрее, чем HD 5870, а HD 6950 почти догнала её. Увы для Nvidia, но из-за слабого текстурирования решения компании AMD снова оказались заметно быстрее.

Вот во втором тесте «Parallax Mapping» решения Nvidia чувствуют себя уже немногим лучше, и HD 6870 с HD 6950 близки к результатам карты GTX 580 из другого рыночного сегмента, стоящей дороже. Интересно, что HD 5870 снова оказалась быстрее, чем HD 6970. Это подтверждает нашу теорию о том, что скорость в тесте ограничена математической производительностью и что тест чуть хуже подходит новой архитектуре компании AMD.

Есть ещё одно вероятное объяснение — синтетические тесты зачастую очень сильно грузят GPU параллельными расчётами и энергопотребление новых моделей в синтетике вполне может выходить за рамки выставленного ограничения. Следовательно, может снижаться и тактовая частота, а вместе с ней и результаты оказываются ниже, чем ожидалось. Впрочем, это предположение нужно проверять. Рассмотрим эти же тесты в модификации с предпочтением выборок из текстур математическим вычислениям:

Для решений Nvidia ситуация стала заметно печальнее, так как со скоростью текстурирования у последних чипов AMD, в отличие от конкурентов, всё очень хорошо, поэтому они лишь наращивают своё и без того неоспоримое преимущество. Даже самый-самый GTX 580 уступает тому же HD 6870 в обоих тестах с упором на текстурирование. Ну а наши новые герои из семейства HD 6900 оказались быстрейшими, HD 6950 даже выиграл у HD 5870, пусть и сущие копейки. А HD 6970 снова стал лидером, что вполне объяснимо теоретически, если посмотреть на производительность блоков TMU.

Всё это были устаревшие задачи, в основном с упором в текстурирование, а реже в филлрейт. Далее мы рассмотрим результаты ещё двух тестов пиксельных шейдеров — но уже версии 3.0, самых сложных из наших тестов пиксельных шейдеров для Direct3D 9 API. Они наиболее показательны с точки зрения современных игр на ПК, среди которых много мультиплатформенных. Тесты отличаются тем, что сильно нагружают и ALU, и текстурные модули, обе шейдерные программы сложны и длинны, и включают большое количество ветвлений:

  • Steep Parallax Mapping — значительно более «тяжелая» разновидность техники parallax mapping, также описанная в статье Современная терминология 3D-графики .
  • Fur — процедурный шейдер, визуализирующий мех.

В наших самых сложных DX9-тестах видеокарты производства Nvidia всегда выступают сильнее решений AMD, в противоположность всем предыдущим испытаниям. Такое положение связано с тем, что эти тесты не ограничены производительностью текстурных выборок, а зависят скорее от эффективности исполнения кода пиксельных шейдеров.

В тестах сложных пиксельных шейдеров версии 3.0 новые топовые видеокарты AMD всё же не смогли догнать конкурентов, хотя и заметно приблизились к ним. Скорость в обоих тестах PS 3.0 слабо зависит от ПСП и текстурирования, зато код отличается сложностью, с чем очень неплохо справляется новая архитектура Nvidia и… новая архитектура AMD. Пожалуй, это первый тест, где мы видим заметную положительную разницу между предыдущей и новейшей архитектурами компании AMD.

И последняя справляется с задачей явно лучше. Хотя даже HD 6970 с трудом конкурирует с GTX 570, но ведь о таком раньше мы вообще не помышляли. Решения Nvidia всегда были неоспоримыми лидерами в этой паре тестовых задач, и традиционно показывали результат намного сильнее. А видеокарты на новом графическом чипе Cayman смогли к ним приблизиться вплотную.

Direct3D 10: тесты пиксельных шейдеров PS 4.0 (текстурирование, циклы)

Во вторую версию RightMark3D вошли два знакомых теста PS 3.0 под Direct3D 9, которые были переписаны под DirectX 10, а также ещё два новых теста. В первую пару добавились возможности включения самозатенения и шейдерного суперсэмплинга, что дополнительно увеличивает нагрузку на видеочипы.

Данные тесты измеряют производительность выполнения пиксельных шейдеров с циклами при большом количестве текстурных выборок (в самом тяжелом режиме до нескольких сотен выборок на пиксель) и сравнительно небольшой загрузке ALU. Иными словами, в них измеряется скорость текстурных выборок и эффективность ветвлений в пиксельном шейдере.

Первым тестом пиксельных шейдеров будет Fur. При самых низких настройках в нём используется от 15 до 30 текстурных выборок из карты высот и две выборки из основной текстуры. Режим Effect detail — «High» увеличивает количество выборок до 40—80, включение «шейдерного» суперсэмплинга — до 60—120 выборок, а режим «High» совместно с SSAA отличается максимальной «тяжестью» — от 160 до 320 выборок из карты высот.

Проверим сначала режимы без включенного суперсэмплинга, они относительно просты, и соотношение результатов в режимах «Low» и «High» должно быть примерно одинаковым.

Производительность в этом тесте зависит от количества и эффективности блоков TMU, но в разных условиях по-разному. Результаты при детализации уровня «High» получаются примерно в полтора раза ниже, чем при «Low», как и должно быть по теории. В D3D10-тестах процедурной визуализации меха с большим количеством текстурных выборок решения Nvidia раньше были заметно сильнее, но последние решения AMD к ним подтянулись, что мы видели уже и ранее.

В варианте без суперсэмплинга большее влияние на производительность оказывает эффективный филлрейт (производительность ROP) и пропускная способность памяти. Поэтому решения Nvidia оказались впереди, и только представленный сегодня топовый Radeon HD 6970 почти догоняет младшую GTX 570. Модель ниже уровнем под именем HD 6950 показывает результат на уровне HD 5870, но примерно того же результата добилась и HD 6870. Это и неудивительно, потому что филлрейт у неё даже больше, чем у старших решений серии HD 6900.

Посмотрим на результат этого же теста, но с включенным «шейдерным» суперсэмплингом, увеличивающим работу в четыре раза: возможно, в такой ситуации что-то изменится, и ПСП с филлрейтом будут влиять меньше:

Как всегда, включение суперсэмплинга увеличивает теоретическую нагрузку в четыре раза, и результаты решений Nvidia заметно падают по сравнению с показателями видеокарт AMD. Теперь тройка моделей с близкими результатами (HD 6870, HD 5870 и HD 6950) опережает GTX 570, а старшее решение HD 6970 с успехом конкурирует с GTX 580. Разница между топовыми картами линеек HD 6000 и HD 5000 осталась примерно той же, новая модель выигрывает несколько процентов у предыдущей.

Второй шейдерный DX10-тест измеряет производительность исполнения сложных пиксельных шейдеров с циклами при большом количестве текстурных выборок и называется Steep Parallax Mapping. При низких настройках он использует от 10 до 50 текстурных выборок из карты высот и три выборки из основных текстур. При включении тяжелого режима с самозатенением число выборок возрастает в два раза, а суперсэмплинг увеличивает это число в четыре раза. Наиболее сложный тестовый режим с суперсэмплингом и самозатенением выбирает от 80 до 400 текстурных значений, то есть в восемь раз больше по сравнению с простым режимом. Проверяем сначала простые варианты без суперсэмплинга:

Второй пиксель-шейдерный тест Direct3D 10 несколько интереснее с практической точки зрения, так как разновидности parallax mapping широко применяются в играх, а тяжелые варианты, вроде нашего steep parallax mapping используются во многих проектах, например в играх Crysis и Lost Planet. Кроме того, в нашем тесте, помимо суперсэмплинга, можно включить самозатенение, увеличивающее нагрузку на видеочип примерно в два раза, такой режим называется «High».

Диаграмма во многом похожа на предыдущую (без SSAA), только позиции Nvidia несколько ослабли. В обновленном D3D10-варианте теста без суперсэмплинга HD 6970 становится на один уровень с GTX 570, что нормально для прямых конкурентов, а лидером остаётся топовая GTX 580. Остальные три видеокарты производства AMD показывают схожие результаты и отстают. Посмотрим, что изменит включение суперсэмплинга, он может вызвать сильное падение скорости на платах Nvidia.

При включении суперсэмплинга и самозатенения задача получается ещё более тяжёлой, совместное включение сразу двух опций увеличивает нагрузку на карты почти в восемь раз, вызывая большое падение производительности. Разница между скоростными показателями протестированных видеокарт изменилась, включение суперсэмплинга сказывается, как и в предыдущем случае — карты производства AMD немного улучшили свои показатели относительно решений Nvidia.

Теперь HD 6970 показывает результаты на уровне GTX 580, а примерно равные по скорости HD 6950 и HD 5870 становятся на одну ступеньку с GTX 570. И лишь более дешёвая HD 6870 немного отстаёт от этой видеокарты Nvidia. Сравнительные цифры в парах HD 6970 и HD 5870 снова повторились, разница в пользу более свежих моделей примерно такая же. По этим тестам можно сделать вывод — обе выпущенные сегодня карты семейства HD 6900 справились с «шейдерными» задачами очень хорошо, на уровне традиционно сильных в этих задачах конкурентов Nvidia.

Direct3D 10: тесты пиксельных шейдеров PS 4.0 (вычисления)

Следующая пара тестов пиксельных шейдеров содержит минимальное количество текстурных выборок для снижения влияния производительности блоков TMU. В них используется большое количество арифметических операций, и измеряют они именно математическую производительность видеочипов, скорость выполнения арифметических инструкций в пиксельном шейдере.

Первый математический тест — Mineral. Это тест сложного процедурного текстурирования, в котором используются лишь две выборки из текстурных данных и 65 инструкций типа sin и cos.

Результаты предельных математических тестов привычно соответствуют разнице в частотах и количестве исполнительных блоков, но с влиянием их эффективности. Современная архитектура AMD в таких случаях имеет большое преимущество перед конкурирующими видеокартами Nvidia, и это объясняет результаты тестов, в которых решения AMD явно оказываются значительно более производительными, хотя и не настолько, насколько велико их теоретическое преимущество.

Теоретически, GTX 580 должен быть чуть ли не вдвое медленнее HD 5870 и HD 6970. На практике же разница не доходит и до полутора раз. Конечно, это мало что меняет, ведь даже HD 6870 значительно быстрее обеих карт Nvidia в таких тестах, не говоря уже про топовые модели. В остальном, решения расположились примерно соответственно теории, за некоторыми исключениями.

К примеру, результаты сравнения нового и старого топовых семейств видеокарт AMD получились любопытными. Во-первых, HD 6870 показала идентичный HD 6950 результат в этом тесте при разнице в теоретических цифрах в пользу модели на базе Cayman. Во-вторых, то же самое можно сказать и про связку HD 6970 и HD 5870 — при схожих теоретических цифрах, в реальности с небольшим перевесом побеждает более старая, с потоковыми процессорами на основе архитектуры VLIW5.

И здесь снова есть несколько возможных объяснений — или AMD ещё не полностью оптимизировала драйверы для новых GPU, или архитектура Cayman менее эффективна в этом тесте (при этом вполне возможно, что она будет более эффективной в менее прямолинейных тестах), или повлияла технология PowerTune, или в этом тесте начало сказываться и ограничение пропускной способностью видеопамяти.

Рассмотрим второй тест шейдерных вычислений, который носит название Fire. Он тяжелее для ALU, и текстурная выборка в нём только одна, а количество инструкций типа sin и cos увеличено вдвое, до 130. Посмотрим, что изменилось при увеличении нагрузки:

В этот раз все GPU остались примерно на тех же позициях, кроме относительной производительности Cayman и Cypress/Barts. Теперь в этих парах уже всё в строгом соответствии с теоретическими цифрами пиковой производительности, а HD 6970 даже немного обгоняет HD 5870, то есть в этом случае новая архитектура сработала эффективнее. И в паре HD 6950 и HD 6870 теперь такая разница в пользу топового решения, какая и должна быть.

В остальном — ничего нового. Так как скорость рендеринга тут ограничена исключительно производительностью шейдерных блоков, то HD 6970 и HD 5870 являются лидерами, за ними следуют остальные видеокарты AMD, а обе Geforce уступают в том числе и младшей модели из другого ценового диапазона. Хотя преимущество решений AMD всё равно остаётся несколько ниже, чем при сравнении теоретических цифр — это говорит о том, что КПД суперскалярных процессоров VLIW5 и VLIW4 ниже 100%.

Direct3D 10: тесты геометрических шейдеров

В пакете RightMark3D 2.0 есть два теста скорости геометрических шейдеров, первый вариант носит название «Galaxy», техника аналогична «point sprites» из предыдущих версий Direct3D. В нем анимируется система частиц на GPU, геометрический шейдер из каждой точки создает четыре вершины, образующие частицу. Аналогичные алгоритмы должны получить широкое использование в будущих играх под DirectX 10.

Изменение балансировки в тестах геометрических шейдеров не влияет на конечный результат рендеринга, итоговая картинка всегда абсолютно одинакова, изменяются лишь способы обработки сцены. Параметр «GS load» определяет, в каком из шейдеров производятся вычисления — в вершинном или геометрическом. Количество вычислений всегда одинаково.

Рассмотрим первый вариант теста «Galaxy», с вычислениями в вершинном шейдере, для трёх уровней геометрической сложности:

Соотношение скоростей при разной геометрической сложности сцен примерно одинаково для всех решений, производительность соответствует количеству точек, с каждым шагом падение FPS составляет около двух раз. Задача для современных видеокарт не особенно сложная, производительность в целом ограничена не только скоростью обработки геометрии, но и пропускной способностью памяти или филлрейтом в определённой мере (в рамках одного производителя).

Увы, хотя мы видели ранее рост геометрической производительности решений на Barts в этом тесте, в этот раз видеокарты нового семейства оказались примерно на том же уровне, что и Radeon HD 5870 предыдущего поколения. Возможно, виновато ограничение производительности ПСП видеопамяти, но ведь HD 6870 весьма силён в этом тесте и обогнал даже HD 6950. Так что скорее всего виноват эффективный филлрейт, то есть производительность ROP.

В любом случае, всем решениям AMD очень далеко до топовых видеокарт Nvidia, и хотя выполнение геометрических шейдеров может и стало более эффективным, но этого явно недостаточно. Основанные на GF110 видеокарты Nvidia справляются с работой почти вдвое быстрее всех видеокарт конкурента. Посмотрим, как изменится ситуация при переносе части вычислений в геометрический шейдер:

При изменении нагрузки в этом тесте цифры почти не изменились ни для решений Nvidia, ни для AMD. Новые видеокарты семейства HD 6900 в данном тесте слабо реагируют на изменения параметра GS load, отвечающего за перенос части вычислений в геометрический шейдер, как и остальные решения, но всё же показывают результаты чуть выше, чем на предыдущей диаграмме. Посмотрим, что изменится в следующем тесте, который предполагает большую нагрузку именно на геометрические шейдеры.

«Hyperlight» — это второй тест геометрических шейдеров, демонстрирующий использование сразу нескольких техник: instancing, stream output, buffer load. В нем используется динамическое создание геометрии при помощи отрисовки в два буфера, а также новая возможность Direct3D 10 — stream output. Первый шейдер генерирует направление лучей, скорость и направление их роста, эти данные помещаются в буфер, который используется вторым шейдером для отрисовки. По каждой точке луча строятся 14 вершин по кругу, всего до миллиона выходных точек.

Новый тип шейдерных программ используется для генерации «лучей», а с параметром «GS load», выставленным в «Heavy» — ещё и для их отрисовки. То есть в режиме «Balanced» геометрические шейдеры используются только для создания и «роста» лучей, вывод осуществляется при помощи «instancing», а в режиме «Heavy» выводом также занимается геометрический шейдер. Сначала рассматриваем лёгкий режим:

Относительные результаты в разных режимах снова примерно соответствуют изменению нагрузки: во всех случаях производительность неплохо масштабируется и близка к теоретическим параметрам, по которым каждый следующий уровень «Polygon count» должен быть менее чем в два раза медленней.

В этом тесте скорость рендеринга должна быть ограничена геометрической производительностью, но обрабатываемых примитивов явно недостаточно, чтобы новая архитектура компании AMD показала значительно более высокий результат, хотя и есть небольшая разница, которая объясняется архитектурными изменениями в GPU.

Видеокарты Nvidia всё так же остаются лидерами теста, но тот же Radeon HD 6970 уже почти догнал младшую модель GTX 570. А HD 6950 обгоняет HD 5870, пусть и не слишком сильно. И эти неплохие результаты явственно говорят о наличии оптимизаций по обработке геометрических данных в новых чипах.

Цифры должны измениться на следующей диаграмме, в тесте с более активным использованием геометрических шейдеров. Также будет интересно сравнить друг с другом результаты, полученные в режимах «Balanced» и «Heavy».

А вот в этом тесте разница между чипами AMD с традиционным графическим конвейером (в т. ч. и Cayman с его двумя растеризаторами) и чипами с архитектурой Fermi заметна сразу. Хотя мы знаем по предыдущим исследованиям, что младшие чипы Nvidia по скорости исполнения геометрических шейдеров отстают, показывая не такие впечатляющие результаты, так как их возможности по геометрической обработке урезаны. Зато результаты GTX 570 и GTX 580, имеющих в основе чип GF110, очень хороши и почти вдвое выше, чем у лучшего из решений компании AMD.

И это решение — новенький Radeon HD 6970. Возможности нового топового чипа по обработке геометрии и скорости исполнения геометрических шейдеров явно выросли по сравнению с другими видеокартами компании. И новые решения на Cayman показывают в этих тестах результаты выше, чем решения на базе Cypress и Barts, хотя и далеко не втрое, и даже не вдвое. Вероятно, инженерам AMD ещё предстоит решать задачу распараллеливания работы блоков установки треугольников (geometry setup), в которую могут упираться эти тесты.

Direct3D 10: скорость выборки текстур из вершинных шейдеров

В тестах «Vertex Texture Fetch» измеряется скорость большого количества текстурных выборок из вершинного шейдера. Тесты схожи по сути, так что соотношение между результатами карт в тестах «Earth» и «Waves» должно быть примерно одинаковым. В обоих тестах используется displacement mapping на основании данных текстурных выборок, единственное существенное отличие состоит в том, что в тесте «Waves» используются условные переходы, а в «Earth» — нет.

Рассмотрим первый тест «Earth», сначала в режиме «Effect detail Low»:

Предыдущие исследования показали, что на результаты этого теста влияет и скорость текстурирования и пропускная способность памяти. Это хорошо видно по сравнительным результатам Radeon HD 5870 и HD 6950, да и прочих решений AMD. Похоже, что именно ПСП и ограничивает их производительность в тесте, поэтому и разница между всеми решениями не так уж велика.

Тем не менее, очень хорошие результаты показывает HD 6970 на новом GPU — он почти достаёт GTX 570, с которым и придётся конкурировать этой модели в реальном мире. Ну и лидером остаётся самая дорогая и производительная GTX 580. Обе карты семейства HD 6900 показали себя неплохо, младшая новая модель идёт почти наравне с предыдущей топовой. Посмотрим на производительность в этом же тесте с увеличенным количеством текстурных выборок:

Взаимное расположение карт на диаграмме заметно изменилось, особенно в тяжёлом режиме. Хотя видеокарты Nvidia почему-то потеряли в производительности именно в наиболее лёгких условиях. Как раз при малом количестве полигонов скорость упирается в ПСП и в этом случае новые платы AMD почти догнали топовые решения конкурента.

А вот в тяжёлых режимах разница в пользу Nvidia выросла до полуторакратной, там GTX 580 и GTX 570 остаются недосягаемыми для соперников. Старшая видеокарта семейства HD 6900 обгоняет остальные решения AMD, хотя это снова слабо заметно при сравнении с HD 5870. Можно было бы сказать о влиянии ПСП, но ведь конкурента-то это не останавливает…

Рассмотрим результаты второго теста текстурных выборок из вершинных шейдеров. Тест «Waves» отличается меньшим количеством выборок, зато в нём используются условные переходы. Количество билинейных текстурных выборок в данном случае до 14 («Effect detail Low») или до 24 («Effect detail High») на каждую вершину. Сложность геометрии изменяется аналогично предыдущему тесту.

Любопытно, что результаты во втором тесте вершинного текстурирования «Waves» совсем не похожи на то, что мы видели на предыдущих диаграммах. В этом тесте все видеокарты AMD и Nvidia показывают очень близкие результаты, что также можно списать на ограничение пропускной способностью видеопамяти. Этот показатель у всех представленных видеокарт находится в районе 130—190 ГБ/с, и разброс невелик. Лучшей среди видеокарт AMD снова стала свежая модель Radeon HD 6970. Рассмотрим второй вариант этого же теста:

И снова произошли изменения, аналогичные тем, что мы видели ранее — видеокарты Nvidia «просели» только в лёгком режиме, а AMD во всех трёх. И поэтому в режиме с малым количеством полигонов разница между решениями небольшая, а вот в среднем и тяжёлом GTX 580 и GTX 570 заметно опережают все модели Radeon, в том числе и из анонсированного сегодня семейства HD 6900. По сравнению с Cypress новый GPU показывает результат примерно на том же уровне, и мы делаем вывод, что в тестах вершинных выборок никаких заметных изменений при переходе от Cypress к Cayman нет.

3DMark Vantage: тесты Feature

Синтетические тесты из пакета 3DMark Vantage могут показать нам что-то, что мы ранее упустили. Тесты Feature этого тестового пакета обладают поддержкой DirectX 10 и интересны уже тем, что отличаются от наших. При анализе результатов новых видеокарт в этом пакете мы сможем сделать какие-то новые и полезные выводы, ускользнувшие от нас в тестах семейства RightMark. К сожалению, ещё более новый тестовый пакет компании — 3DMark11 — не содержит специализированных синтетических тестов и нам в данном случае совсем неинтересен.

Feature Test 1: Texture Fill

Первый тест — тест скорости текстурных выборок. Используется заполнение прямоугольника значениями, считываемыми из маленькой текстуры с использованием многочисленных текстурных координат, которые изменяются каждый кадр.

Хотя текстурный тест компании Futuremark также не показывает теоретически возможного уровня скорости текстурных выборок, но всё же эффективность новых видеокарт семейства Radeon HD 6900 в нём несколько выше, чем в нашем. Да и решения Nvidia также более эффективно используют имеющиеся текстурные блоки. Поэтому в данном текстурном тесте получается несколько иное соотношение результатов по сравнению с нашим.

Видеокарты нового семейства компании AMD показывают результаты, полностью соответствующие теоретическим параметрам. HD 6950 немного быстрее, чем HD 5870, а модель HD 6970 является явным лидером теста. Наглядно видно, что текстурная производительность Cayman заметно выросла по сравнению с Cypress. А вот HD 6870 на основе чипа Barts показывает худший результат, аналогичный цифрам топовой видеокарты Nvidia. Ну а GTX 570 проигрывает в текстурировании вообще всем, как и в нашем тесте.

Feature Test 2: Color Fill

Это тест скорости заполнения. Используется очень простой пиксельный шейдер, не ограничивающий производительность. Интерполированное значение цвета записывается во внеэкранный буфер (render target) с использованием альфа-блендинга. Используется 16-битный внеэкранный буфер формата FP16, наиболее часто используемый в играх, применяющих HDR-рендеринг, поэтому такой тест является вполне своевременным.

Совсем иная ситуация в тесте производительности блоков ROP. Цифры этого подтеста 3DMark Vantage показывают производительность блоков ROP, почти без влияния величины пропускной способности видеопамяти. Модель HD 6970 показывает отличный результат, почти догоняя топовую GTX 580 и опережая своего конкурента GTX 570.

В свою очередь, HD 6950 также оказывается не только впереди своего конкурента GTX 570, а обогнала ещё и предшественницу — HD 5870. Отмечаем несколько бо́льшую эффективность блоков ROP и более высокую скорость заполнения у новых моделей видеокарт компании AMD по сравнению со старыми чипами.

Feature Test 3: Parallax Occlusion Mapping

Один из самых интересных feature-тестов, так как подобная техника уже используется в играх. В нём рисуется один четырехугольник (точнее, два треугольника) с применением специальной техники Parallax Occlusion Mapping, имитирующей сложную геометрию. Используются довольно ресурсоёмкие операции по трассировке лучей и карта глубины большого разрешения. Также эта поверхность затеняется при помощи тяжёлого алгоритма Strauss. Это тест очень сложного и тяжелого для видеочипа пиксельного шейдера, содержащего многочисленные текстурные выборки при трассировке лучей, динамические ветвления и сложные расчёты освещения по Strauss.

Этот тест отличается от других подобных тем, что результаты в нём зависят не исключительно от скорости математических вычислений или эффективности исполнения ветвлений или скорости текстурных выборок, а от всего понемногу. И для достижения высокой скорости важен баланс блоков GPU. Влияет на скорость и эффективность выполнения ветвлений в шейдерах.

Сравнительные результаты видеокарт AMD на диаграмме весьма похожи на то, что мы видели в тесте текстурной производительности из 3DMark Vantage. А вот платы Nvidia в данном случае получили небольшое увеличение производительности, что говорит о том, что не только текстурная производительность влияет на результаты теста.

Новые модели AMD вновь серьёзно заявили о себе, обогнав свою предшественницу в лице HD 5870. А вот HD 6870 из другого ценового сектора показала заметно более слабый результат, став аутсайдером этого теста (что вполне сглаживается её низкой ценой). Что касается сравнения Cayman с конкурирующими решениями Nvidia, то обе новые видеокарты семейства HD 6900 опередили даже топовую модель линейки Geforce GTX 500.

Feature Test 4: GPU Cloth

Тест интересен тем, что рассчитывает физические взаимодействия (имитация ткани) при помощи видеочипа. Используется вершинная симуляция, при помощи комбинированной работы вершинного и геометрического шейдеров, с несколькими проходами. Используется stream out для переноса вершин из одного прохода симуляции к другому. Таким образом, тестируется производительность исполнения вершинных и геометрических шейдеров и скорость stream out.

Скорость рендеринга в этом тесте зависит от многих параметров, но основными являются производительность обработки геометрии и эффективность выполнения геометрических шейдеров. Логично, что видеокарты производства Nvidia чувствуют себя в этом приложении как рыба в воде, и значительно опережают конкурентов, в том числе и представленные сегодня топовые модели.

Это один из немногих тестов без тесселяции, в которых видно преимущество у представленных недавно видеокарт новой серии Radeon HD 6800 и сегодняшних героев HD 6900. Скорость рендеринга всех этих моделей в данном тесте выше, чем у топовой модели предыдущей линейки. Это объясняется тем, что и в Barts, и в Cayman увеличили скорость обработки геометрии и выполнения геометрических шейдеров. И хотя даже HD 6970 продолжает серьёзно отставать от GTX 570, новая модель всё же значительно улучшила позиции компании AMD в этом тесте.

Feature Test 5: GPU Particles

Тест физической симуляции эффектов на базе систем частиц, рассчитываемых при помощи видеочипа. Также используется вершинная симуляция, каждая вершина представляет одиночную частицу. Stream out используется с той же целью, что и в предыдущем тесте. Рассчитывается несколько сотен тысяч частиц, все анимируются отдельно, также рассчитываются их столкновения с картой высот.

Аналогично одному из тестов нашего RightMark3D 2.0, частицы отрисовываются при помощи геометрического шейдера, который из каждой точки создает четыре вершины, образующих частицу. Но тест больше всего загружает шейдерные блоки вершинными расчётами, также тестируется stream out.

Результаты очередного теста из пакета 3DMark Vantage похожи на те, что мы видели на предыдущей диаграмме, но в нём скорость обработки геометрии ещё важнее. Именно поэтому прошлое поколение в виде карты Radeon HD 5870 отстало как от обеих моделей Geforce, являющихся неоспоримыми лидерами сравнения, так и от всех новых моделей видеокарт AMD, семейств HD 6900 и HD 6800. А все платы, основанные на Cayman и Barts, показали более высокие результаты, чем единственное решение на Cypress, уступив только сильным конкурентам.

Похоже, что в синтетических тестах имитации тканей и частиц из тестового пакета 3DMark Vantage, в которых активно используются геометрические шейдеры, снова нет значительного влияния распараллеленной обработки геометрии на Cayman, так как Barts показал близкий результат. Поэтому и оба решения линейки HD 6900 продолжают отставать от конкурирующих видеокарт соперника, имеющих отличную скорость обработки геометрии — до двух раз выше. От топового решения компании AMD, основанного на новой архитектуре с двумя блоками обработки геометрии, мы всё же ожидали несколько большего прогресса.

Feature Test 6: Perlin Noise

Последний feature-тест пакета Vantage является математически-интенсивным тестом видеочипа, он рассчитывает несколько октав алгоритма Perlin noise в пиксельном шейдере. Каждый цветовой канал использует собственную функцию шума для большей нагрузки на видеочип. Perlin noise — это стандартный алгоритм, часто применяемый в процедурном текстурировании, он использует очень много математических расчётов.

В чисто математическом тесте из пакета компании Futuremark, показывающем пиковую производительность видеочипов в предельных задачах, мы увидели ещё более интересную картину, чем в аналогичных тестах из нашего тестового пакета. Показанная на диаграмме производительность решений лишь примерно соответствует тому, что должно получаться по теории и несколько расходится с тем, что мы видели ранее в математических тестах из пакета RightMark 2.0.

Даже по теоретическим характеристикам новых моделей HD 6970 и HD 6950 было понятно, что они не усилили пиковую производительность математических вычислений по сравнению с HD 5870. Но всё же и явного отставания мы не ждали. Да, своих конкурентов из Nvidia обе платы обогнали с огромным запасом, но мы к этому привыкли, ведь видеокарты Geforce показывают не очень высокие результаты в таких случаях; простая и интенсивная математика выполняется на Radeon значительно быстрее.

Неожиданно то, что новая старшая модель проиграла 7% предыдущей топовой, хотя теоретически должна уступать не более 1%. Тут снова можно начинать гадать о том, что послужило причиной этого проигрыша своему же предшественнику. То ли в этом виноват недостаток оптимизации драйверов для новых решений, то ли меньшая эффективность архитектуры VLIW4 в таких тестах, то ли слишком умная система управления питанием на новых моделях, «зарезавшая» тактовую частоту и производительность решений при достижении установленного порога энергопотребления.

Direct3D 11: Вычислительные шейдеры

Чтобы протестировать новые решения компании AMD в задачах, использующих такие новые возможности DirectX 11, как тесселяция и вычислительные шейдеры, мы воспользовались примерами из пакетов для разработчиков (SDK) и демонстрационными программами компаний Microsoft, Nvidia и AMD.

Сначала рассмотрим тесты, использующие вычислительные (Compute) шейдеры. Их появление — одно из наиболее важных нововведений в последних версиях DX API, они уже используются в современных играх для выполнения различных задач: постобработки, симуляций и т. п. В первом тесте показан пример HDR-рендеринга с tone mapping из DirectX SDK, с постобработкой, использующей пиксельные и вычислительные шейдеры.

Возможно, пример для вычислительных шейдеров не самый удачный, но их пока вообще мало. Все видеокарты показывают близкие результаты в этом тесте, но побеждает всё-таки топовая модель Geforce GTX 580. Анонсированные сегодня платы на новом чипе Cayman уступают ей совсем немного, и только при использовании пиксельного шейдера. Прямой конкурент новых решений компании AMD — видеокарта GTX 570 — отстаёт от них в обоих режимах: и с использованием пиксельного, и с использованием вычислительного шейдеров.

Второй тест вычислительных шейдеров также взят из Microsoft DirectX SDK, в нём показана расчётная задача гравитации N тел (N-body) — симуляция динамической системы частиц, на которую воздействуют физические силы, такие как гравитация.

А вот более интересные результаты, для решений AMD чем-то похожие на цифры из математического теста 3DMark Vantage. Несмотря на большое теоретическое превосходство в пиковых цифрах, быстрейшая видеокарта Radeon HD 5870 лишь немного опережает лучшее решение Nvidia. А обе новые модели семейства HD 6900 показывают результаты, близкие к показателям своего прямого конкурента — Geforce GTX 570.

Но нас сегодня больше интересует разница между результатами решений на Cayman и Cypress, и тут мы снова видим, как побеждает старая видеокарта, да с каким преимуществом! 17% между HD 5870 и HD 6970 в пользу первой — в очередной раз математические тесты обнажают разницу между красивой теорией и жестокой практикой. Ну где же те применения, в которых новый GPU сможет показать свою силу? Возможно, в тестах тесселяции всё встанет наконец на свои места.

Direct3D 11: Производительность тесселяции

Вычислительные шейдеры очень важны, но главным нововведением в Direct3D 11 всё же считается аппаратная тесселяция. Мы очень подробно рассматривали её в своей теоретической статье про Nvidia GF100. Тесселяцию уже довольно давно начали использовать в DX11-играх, таких как STALKER: Зов Припяти, DiRT 2, Aliens vs Predator, Metro 2033, Civilization V и других. В некоторых из них тесселяция используется для моделей персонажей (все игры жанра FPS из перечисленных), в других — для имитации реалистичной водной поверхности (DiRT 2) или ландшафта (Civilization V).

Существует несколько различных схем разбиения графических примитивов (тесселяции). Например, phong tessellation, PN triangles, Catmull-Clark subdivision. Схема разбиения PN Triangles используется в STALKER: Зов Припяти, а в Metro 2033 — Phong tessellation. Эти методы сравнительно быстро и просто внедряются в процесс разработки игр и существующие движки, поэтому и стали популярными.

Первым тестом тесселяции будет пример Detail Tessellation из ATI Radeon SDK. Он показывает не только тесселяцию, но и две разные техники попиксельной обработки: простое наложение карт нормалей и parallax occlusion mapping. Что ж, сравним DX11-решения AMD и Nvidia в различных условиях:

Рассмотрим сначала попиксельные техники. Parallax occlusion mapping (средние столбики на диаграмме) на видеокартах обоих производителей выполняется гораздо менее эффективно, чем тесселяция (нижние столбики), а умеренная тесселяция не даёт большого падения производительности — сравните верхние и нижние столбцы. То есть качественная имитация геометрии при помощи пиксельных расчётов обеспечивает даже меньшую производительность, чем оттесселированная геометрия с displacement mapping.

Что касается производительности видеокарт относительно друг друга, то тут самый важный вывод в том, что видеокарты AMD немного быстрее плат Nvidia в самом лёгком режиме, но медленнее в сложных попиксельных расчётах (вспоминаем тесты parallax mapping ранее). А до выхода плат на Cayman карты Geforce были чуть-чуть быстрее решений AMD и при включенной тесселяции.

Но теперь разница по скорости обработки геометрии между HD 6900 и HD 5870 хорошо видна — новые платы на базе Cayman в подтесте с тесселяцией оказались заметно быстрее Cypress. В этом тесте с небольшим коэффициентом разбиения треугольников HD 6970 даже обогнала своего конкурента GTX 570 с хорошим запасом.

Вторым тестом производительности тесселяции будет ещё один пример для 3D-разработчиков из ATI Radeon SDK — PN Triangles. Собственно, оба примера входят также и в состав DX SDK, так что мы уверены, что на их основе создают свой код игровые разработчики. Этот пример мы протестировали с различным коэффициентом разбиения (tessellation factor), чтобы понять, как сильно влияет его изменение на общую производительность.

Лишь в этом примере мы впервые видим по-настоящему полное сравнение геометрической мощи решений AMD и Nvidia. Очень сильно выделяется как графическая архитектура Fermi, так и новый GPU производства AMD под именем Cayman. Отбросим в сторону то, что это чисто синтетический тест и такие экстремальные коэффициенты разбиения не будут использоваться в играх сегодняшнего дня, нам сейчас интересен потенциал. Синтетика ведь и нужна для того, чтобы оценить перспективность и отличия разных решений.

Сразу видно, что с видеокартами Nvidia Geforce на чипе GF110 конкурировать невозможно, в задачах экстремальной тесселяции они в разы быстрее даже обновленной архитектуры AMD. Но это архитектура, специально разработанная изначально с учётом возможностей нового API. А что же с Cayman? По сравнению с Cypress всё очень хорошо!

Новые модели компании AMD в режимах средней нагрузки показывают впечатляющий прирост в скорости, и разница по сравнению с HD 5870 достигает более чем двукратной. Однако такой прирост мы видим не всегда, а чаще всего он укладывается в полуторакратный. Обещанной трёхкратной разницы мы, по крайней мере, точно не увидели. То есть, Cayman хотя и сократил отставание от конкурента в задачах обработки геометрии, но до распараллеленной работы 16 блоков тесселяции в GF110 всё ещё очень далеко.

С другой стороны — наибольшая разница между решениями разных компаний достигается в условиях экстремальной тесселяции, которых нет и пока что не ожидается в реальных играх. Поэтому скорее всего Cayman заметно укрепит позиции компании AMD в существующих игровых бенчмарках с применением тесселяции. Особенно если коэффициент разбиения будет не слишком большим, как в тестах 3DMark11.

Давайте рассмотрим ещё один тест — демонстрационную программу Nvidia Realistic Water Terrain, также известную как Island. В этой демке используется тесселяция и карты смещения (displacement mapping) для рендеринга реалистично выглядящей поверхности океана и ландшафта. Смотрится она просто замечательно, вот чего не хватает в нынешних играх:

Island не является чисто синтетическим тестом для измерения геометрической производительности, он содержит и сложные пиксельные и вычислительные шейдеры, поэтому разница в производительности может быть меньше, чем в предыдущем случае, зато такая нагрузка ближе к реальным играм, в которых используются сразу все блоки GPU.

Мы протестировали программу при четырёх разных коэффициентах тесселяции, эта настройка называется Dynamic Tessellation LOD. Если при самом низком коэффициенте разбиения впереди оказываются видеокарты компании AMD, то при усложнении работы платы на основе GF110 сразу вырываются далеко вперёд. При росте коэффициента разбиения и сложности сцены производительность всех Radeon падает очень сильно, в отличие от скорости конкурирующих решений.

Причём в этот раз HD 5870 почему-то даже опережает обе модели нового семейства. То есть налицо обратная теории разница в задаче со сложной геометрией. И объяснение этому может быть только одно — недостаток оптимизации драйверов для новой архитектуры, ведь в предыдущих тестах мы видели её явное преимущество над Radeon HD 5870, основанном на чипе Cypress. Ну а в этом тесте мы пока что вынуждены констатировать разгром Cayman — при максимальном коэффициенте LOD разница между скоростью Geforce и Radeon достигла 4—6 раз!

Выводы по синтетическим тестам

По результатам проведённых синтетических тестов видеокарт из нового семейства Radeon HD 6900, основанных на графическом процессоре Cayman, а также результатам других моделей видеокарт производства обоих производителей дискретных видеочипов, можно сделать вывод о том, что новинки — неплохая замена линейке Radeon HD 5800, хотя и не слишком сильно отличающаяся от неё по производительности, по крайней мере в синтетических тестах.

Графический процессор Cayman выполнен на основе новой архитектуры и отличается от предыдущих чипов аппаратно, хотя количество некоторых исполнительных блоков в нём не выросло. Зато новый GPU отличается архитектурными улучшениями, направленными на увеличение эффективности вычислений на GPU (таких тестов у нас считайте что и нет) и, что ещё более важно, смягчение важного отставания от конкурента в виде производительности обработки геометрии. Многие из синтетических тестов показывают, что скорость тесселяции и выполнения геометрических шейдеров заметно выросла, пусть и не всегда в несколько раз, как нам было обещано.

Благодаря архитектурным изменениям и своим частотным характеристикам, результаты видеокарт новой серии во многих синтетических тестах являются конкурентоспособными для своего ценового сектора, особенно по сравнению с прямым конкурентом Geforce GTX 570. Ещё более хорошо это видно в вычислительных тестах из пакетов RightMark и Vantage. Да и в остальных приложениях решения семейства HD 6900 показали неплохую скорость, чаще всего уступающую только топовой видеокарте Nvidia.

К сожалению, не обошлось и без не очень приятных сюрпризов. Несмотря на бо́льшую сложность и площадь чипа по сравнению с Cypress, результаты моделей HD 6900 в некоторых математических тестах были ниже, чем у HD 5870, что довольно непросто объяснить, и мы пока не уверены в причинах такого отставания. Возможно, виноват недостаток оптимизации драйверов, а может быть эффективность новой архитектуры VLIW4 в наших тестах оказалась ниже. Вполне вероятно и то, что система управления питанием на новых моделях понижала тактовые частоты при достижении максимального энергопотребления в требовательных синтетических тестах, не позволяя им показать ожидаемую, исходя из числа блоков и их тактовой частоты, производительность.

Наверняка многие ожидали, что Radeon HD 6970 сможет на равных соперничать с GTX 580 во всех тестах, но этого не произошло, хотя результаты были показаны очень неплохие и вполне соответствующие рекомендованным ценам на анонсированные сегодня модели. Предполагаем, что результаты Radeon HD 6970 и HD 6950 в синтетических тестах будут подтверждены и соответствующими цифрами в «игровой» части нашего материала. В играх старшая HD 6970 должна будет выступить примерно на уровне GTX 570, в некоторых тестах чуть медленнее, а в других — быстрее, а HD 6950 хоть и окажется медленнее этой модели Nvidia, но ведь и цена на эту видеокарту установлена ниже. Так давайте же скорее перейдём к исследованию скорости в играх!

Введение

Прошло немногим больше месяца с момента представления компанией Advanced Micro Devices видеокарт среднего ценового сегмента Radeon HD 6800 , основанных на графических процессорах Barts, и вот сегодня - 15 декабря 2010 года - компания выпускает два своих самых мощных однопроцессорных решения на графическом процессоре Cayman.

Пока на «Кайманах» лишь две одночиповых видеокарты: Radeon HD 6950 и HD 6970. В то же время, мы не исключаем возможности появления третьей графической карты, с более скромными характеристиками и по более привлекательной цене, как это не так давно произошло с Radeon HD 5830. Кроме этого, в первом квартале 2011 года на базе Cayman обещает быть представлен двухпроцессорный флагман, который должен будет заменить собой Radeon HD 5970 .

Что же касается героев сегодняшнего материала - Radeon HD 6950 и HD 6970, то их основной задачей, по мнению AMD, является борьба с флагманами компании NVIDIA - видеокартами GeForce GTX 570 и GTX 580. Что самое интересное, борьба эта должна будет навязываться не столько чистой производительностью, сколько ценовым фактором и технологически-эксплуатационными преимуществами новых видеокарт над конкурентами. Интересный подход, надо признать. Ну что же, попробуем познакомиться с новым графическим процессором, и видеокартами на его основе.

Архитектурные особенности новых графических процессоров Cayman

Не смотря на то, что новые графические процессоры Cayman относятся к серии HD 6xxx, архитектурно они отличаются от решений HD 68xx и, конечно же, от HD 58xx. Эти отличия носят как количественный, так и качественный характер, являясь важным шагом в развитии новой графической архитектуры AMD.


Наиболее заметным, и, на наш взгляд, значимым изменением стал переход от VLIW 5-way процессоров, дебютировавших ещё в R600, к VLIW 4-way:


Прежний VLIW 5-way процессор содержал в себе, как можно понять из названия, 5 вычислительных блоков, четыре из которых были способны исполнять только простейшие операции, типа сложения и умножения, а пятый, помимо этих функций, исполнял ещё и так называемые трансцендальные, сложные операции. К ним можно отнести такие, как синус, косинус, извлечение квадратного корня и т.п. В новом VLIW 4-way процессоре этот блок для сложных операций был упразднён, и теперь его функции возложены на пару «простых» или «универсальных» блоков. Таким образом, каждый VLIW 4-way процессор по-прежнему способен исполнять по четыре простых или по одной сложной операции, что требуется в подавляющем числе случаев. Условный проигрыш в производительности старому VLIW 5-way процессору возможен лишь в редких, и, можно так сказать, «подстроенных» случаях, когда требуется одновременно исполнять одну сложную и более двух простых операций. В реальных приложениях такие случаи весьма редки, поэтому можно не принимать их в расчёт, зато высвободившееся место и повысившаяся эффективность блоков приводят к общему росту производительности новых графических процессоров при меньших затратах.


Кроме этого, в новых графических процессорах повышена скорость работы с операциями двойной точности и оптимизирован механизм обмена с системной памятью:


Из остальных, не менее важных улучшений Cayman, можно назвать увеличение производительности блоков растровых операций (ROP) на ряде режимов, ну и традиционное улучшение блока тесселляции, который, по заверениям AMD, стал ощутимо быстрее, чем у предшественника:


Остальные изменения графических процессоров Cayman носят количественный характер. Так, число блоков выборки и фильтрации текстур было увеличено с 80 до 96, количество VLIW процессоров выросло, по сравнению с Cypress, с (1600/5) 320 штук, до (1536/4) 384 штук, то есть на 20 %.

В дополнение к ранее введённому в серии Radeon HD 68xx морфологическому сглаживанию, в Radeon HD 69xx появился новый алгоритм сглаживания - так называемый «Enhanced Quality AA», являющийся дополнением к MSAA и активируемый в панели управления драйверов Catalyst (EQ):



Схематично его работа выглядит следующим образом:


Суть в том, что к двум, четырём или восьми семплам добавляются ещё столько же интерполированных точек, требующих уже куда меньше вычислительной мощности графического процессора. Благодаря этому картинка получается более качественная, а снижение производительности в сравнении с обычным алгоритмом сглаживания, по мнению AMD, не должно превышать 10 %:


Вместе с этим в графические процессоры Cayman внедрена новая энергосберегающая технология, управлять которой можно из панели управления драйверов Catalyst с вкладки Overdrive:


Здесь появился новый «ползунок», называющийся «Power Control settings», с возможностью регулировки от минус 20 до плюс 20 %:



Посредством данной настройки можно изменять предел пиковой мощности видеокарты, и тем самым либо сэкономить электроэнергию, либо, проще говоря, повысить вероятность успешного разгона графического процессора. Теперь в новых графических процессорах Cayman имеются несколько датчиков, постоянно отслеживающих состояние GPU и степень его загрузки, позволяя тем самым работать Кайманам более энергоэффективно. Кроме этого, эти датчики в графическом процессоре при обнаружении программ типа FurMark и ей подобных будут активировать режим защиты, переводя карту в режим своеобразного троттлинга, периодически снижая частоту чипа. Вот как это выглядит на примере теста «Perlin Noise» из синтетического пакета 3DMark Vantage:


Хорошо видно, что частота графического процессора изменяется в зависимости от нагрузки во время теста, однако при этом частота кадров в секунду остаётся неизменной, в чём лично мы сомневаемся. Нет, не в результатах данного конкретного теста, а в принципиально такой же работе механизма энергосбережения и в других весьма ресурсоёмких приложениях. Скорее всего, падение производительности будет иметь место. Правда, в компании AMD таких приложений насчитали не больше, чем пальцев на одной руке. Ну, время покажет.

Чтобы отодвинуть границу срабатывания этого «официально одобренного троттлинга», в драйверах достаточно передвинуть ползунок до максимальных +20 %. На примере всё того же теста «Perlin Noise» влияние данной настройки на производительность выглядит следующим образом:


А можно и наоборот - понизить предельную энергетическую мощность видеокарты, выставив минусовые значения данной настройки. В этом случае произойдёт падение производительности. Впрочем, опять же, по мнению AMD, оно не будет критичным:


Границы регулировки мощности запрограммированы в BIOS видеокарты, и мы надеемся, что со временем появится инструментарий для их расширения (в первую очередь в сторону увеличения, конечно). В этом случае при организации эффективного охлаждения графического процессора можно будет избежать ограничений оверклокерского потенциала видеокарты верхней границей троттлинга.

В завершение краткой теоретической части, без комментариев приведём пару слайдов сравнения производительности AMD Radeon HD 6950 с NVIDIA GeForce GTX 470, и AMD Radeon HD 6970 с NVIDIA GeForce GTX 480:


AMD особо отмечает, что, как и в случае c Radeon HD 68xx , на видеокартах серии Radeon HD 69xx повышена эффективность работы технологии CrossFireX:


Так это на самом деле или нет, мы проверим в одной из следующих статей, а пока перейдём к таблице спецификаций и непосредственному изучению эталонных видеокарт AMD Radeon HD 6950 и HD 6970.

Технические характеристики видеокарт AMD Radeon HD 6950 и HD 6970 и их конкурентов

В таблице характеристик видеокарты расположены слева направо в порядке уменьшения их рекомендованной стоимости:


Видеокарты AMD Radeon HD 6950 и HD 6970 2 Гбайт

На тестирование нам были предоставлены две эталонные видеокарты AMD Radeon HD 6950 и HD 6970 (собственно, не эталонных пока не существует вовсе, и не факт, что появятся). Внешне видеокарты отличаются друг от друга только наклейкой на пластиковом кожухе системы охлаждения с моделью видеокарты и разъёмами питания. Лицевые стороны видеокарт закрыты системой охлаждения, а оборотные - декоративной алюминиевой крышкой:




«Декоративной», так как она не контактирует с какими-либо элементами печатной платы, а защитная функция в данном случае весьма сомнительна. Длина видеокарт составляет 276 мм, а толщина - 39 мм. Нагретый видеокартой воздух частично выбрасывается через решётку в верхней части кожуха, оставаясь, таким образом, в корпусе системного блока. Но, всё же основная его масса выносится из корпуса через решётку на панели с выходами:


Кстати, выходов теперь аж целых пять: два DVI, два miniDP и один HDMI:


В дополнение к такому «джентельменскому набору» выходов можно сказать, что теперь специальных Eyefinity-видеокарт Radeon HD 69xx не будет, а шесть мониторов можно будет подключить к любой из этих видеокарт с помощью специального видео-хаба.

Обе модели видеокарт оснащаются двумя разъёмами для объединения их в CrossFireX-режимы вплоть до четырёх видеокарт:


Рядом с ними соседствует маленький переключатель выбора BIOS с которого видеокарта может загружаться. Да, да, с глазами у вас всё в порядке - теперь в стандартную комплектацию каждой эталонной Radeon HD 6950 и HD 6970 входят две микросхемы BIOS, одна из которых перепрограммируемая, а вторая - резервная, как раз на случай чрезмерно оптимистичных частот или напряжений, зашитых в первую микросхему BIOS:


Теперь посмотрим на отличия эталонных AMD Radeon HD 6950 (на фото здесь и далее - слева) и AMD Radeon HD 6970 (здесь и далее - справа). Первое заключается в уже упомянутых разъёмах дополнительного питания. Если у Radeon HD 6950 два шестиконтактных разъёма, то для HD 6970 потребовались уже шести- и восьмиконтактный разъёмы:


Не удивительно, ведь пиковое энергопотребление старшей видеокарты заявлено на отметке 250 Вт, а у Radeon HD 6950 - 200 Вт. Что интересно, AMD при анонсе «Кайманов» впервые вводит понятие «типичное игровое энергопотребление», которое у Radeon HD 6970 находится у отметки 190 Вт, а у Radeon HD 6950 - 140 Вт. Энергопотребление новых видеокарт в режиме простоя одинаково и должно составлять всего 20 Вт.

Печатные платы видеокарт, за исключением трёх-четырёх элементов, практически неотличимы…




…как и их силовые части:


При более детальном рассмотрении видны отличия в маркировке используемых микросхем, отвечающих за питание видеокарт. Оставим их на суд специалистов.

Площадь кристаллов графических процессоров «Cayman» видеокарт Radeon HD 6950 и HD 6970 существенно возросла в сравнении с Barts и составляет 389 мм². Тем не менее, теплораспределителя на них по-прежнему нет. Заметим, что в нашем случае графический процессор видеокарты Radeon HD 6970 выпущен на 8(!) недель позже графического процессора видеокарты Radeon HD 6950:


Графический процессор видеокарты AMD Radeon HD 6950 имеет 1408 унифицированных шейдерных процессоров и 88 текстурных блоков (ROP), в то время как у графического процессора видеокарты Radeon HD 6970 унифицированных шейдерных процессоров 1536 и 96 текстурных блоков. Число блоков растровых операций у обеих видеокарт одинаково и равно 32. Номинальная частота «Каймана» на HD 6950 составляет 800 МГц, а на HD 6970 - 880 МГц.

В режиме энергосбережения (читай - бездействия) частоты графических процессоров снижаются до 250 МГц, а напряжения - с 1,1 В до 0,9 В на HD 6950, и с 1,175 В до 0,9 В на HD 6970. Прочие характеристики графических процессоров уже были рассмотрены выше в теоретической части и таблице характеристик. Добавим, что на обеих видеокартах расстояние по диагонали между отверстиями крепления радиатора графического процессора равно 75 мм, как и на HD 5850 или HD 5870.

Обе видеокарты имеют одинаковый объём памяти 2048 Мбайт стандарта GDDR5, набранный восемью FBGA-микросхемами производства компании Hynix Semiconductor Inc. На Radeon HD 6950 установлены чипы с маркировкой T2C ">H5GQ2H24MFR T2C с номинальным напряжением 1,5 В и теоретической эффективной частотой 5000 МГц, в то время как на Radeon HD 6970 память с маркировкой H5GQ2H24MFR R0C , напряжением 1,5 В и теоретической эффективной частотой 6000 МГц:


Как вы уже могли видеть по таблице характеристик, у Radeon HD 6950 память функционирует на эффективной частоте 5000 МГц, а у Radeon HD 6970 - на 5500 МГц, что оставляет приличный оперативный простор для любителей разгона. В режиме простоя эффективная частота видеопамяти обеих видеокарт снижается до 600 МГц. Ширина шины обмена с памятью составляет 256 бит. Все микросхемы памяти расположены с лицевой стороны печатных плат.

Таким образом, спецификации новых эталонных видеокарт AMD следующие:


Обе видеокарты оснащены новой системой охлаждения двуслотового типа, состоящей из массивного радиатора с испарительной камерой и тонкими алюминиевыми рёбрами, металлического основания, центробежного вентилятора и закрывающего всё это дело пластикового кожуха:


К слову, этот кожух можно теперь снять без демонтажа самой системы охлаждения с видеокарты, просто отстегнув защёлки по бокам.

Испарительная камера (по заверениям AMD, уже пятого поколения) расположена под всей площадью основания радиатора:


С микросхемами видеопамяти основание камеры не контактирует, за их охлаждение отвечает металлическая пластина в основании системы охлаждения. Контакт осуществлён посредством термопрокладок:


В свою очередь, графический процессор контактирует с испарительной камерой через густой серый термоинтерфейс.

Система охлаждения видеокарт AMD Radeon HD 6950 и HD 6970 оснащается 80-мм центробежным вентилятором производства компании Foxconn (модель PVB070G12N) нетривиальной для видеокарт пиковой мощностью 24 Вт:


Скорость вращения центробежного вентилятора регулируется автоматически методом широтно-импульсной модуляции в диапазоне от 1200 до 5800 об/мин. Напомним, что у видеокарт серий Radeon HD 58xx и HD 68xx максимальная скорость вращения центробежного вентилятора не превышала отметку 5000 об/мин (ещё чаще - не более 4500 об/мин), поэтому можно предположить, что новые Radeon не будут тише предшественников. Однако, это справедливо не для обеих новых видеокарт. Как раз сейчас мы и проверим температурный режим работы новинок.

Тесты температурного режима всех видеокарт сегодняшней статьи были проведены в закрытом корпусе системного блока при комнатной температуре 25 °С. Подробную конфигурацию системного блока вы найдёте в следующем разделе статьи. В качестве типичной игровой нагрузки использовался тест Aliens vs. Predator (2010), запускаемый на пять-шесть циклов в разрешении 1920х1080 с анизотропной фильтрацией уровня 16х. В качестве предельной нагрузки использовался тест FurMark версии 1.8.2 , запускаемый переименованным exe-файлом с опцией «Xtreme Burning Mode» в разрешении 2560х1600 при активированной в драйверах Catalyst и GeForce/ION анизотропной фильтрацией степени 16х. Мониторинг осуществлялся с помощью программ GPU-Z версии 0.4.9 и MSI Afterburner версии 2.1.0 beta 5.

Сначала посмотрим на температурный режим видеокарт при типичной игровой нагрузке в автоматическом режиме работы центробежных вентиляторов:


AMD Radeon HD 6950 AMD Radeon HD 6970
(автоматический режим) (автоматический режим)


Что касается видеокарты Radeon HD 6950, то её температурный режим работы и уровень шума находятся в приемлемых границах, так как графический процессор прогрелся всего лишь до 81 градуса Цельсия, а центробежный вентилятор системы охлаждения раскрутился только до 2260 об/мин. Её стало слышно, но уровень шума видеокарты по-прежнему нельзя было назвать дискомфортным. При увеличении числа циклов игрового теста температура не возрастала. Заметим, что Aliens vs. Predator (2010) является одной из наиболее «тяжёлых» игр в плане прогрева видеокарты.

Прежде чем проанализировать температурный режим видеокарты Radeon HD 6970 нужно сказать следующее. Дело в том, что предоставленный нам на тестирование экземпляр AMD Radeon HD 6970 изначально оказался не совсем работоспособным. Видеокарта могла стабильно функционировать только в 2D-режиме, а при запуске любого 3D-приложения начинались свистопляски со скоростью вращения центробежного вентилятора и скачки температуры. Предположив, что это срабатывает тот самый пресловутый троттлинг, мы изменили регулировку лимита мощности до максимальных +20 %, однако это не привело к исправлению столь неприятной ситуации. Поэтому, предположив, что графический процессор видеокарты попросту перегревается, Radeon HD 6970 была перебрана с заменой штатного высохшего термоинтерфейса на Arctic Cooling MX4. Только после этого видеокарта стабильно заработала в 3D-приложениях. Однако, её температурный режим и уровень шума оставлял желать лучшего. Так, температуры графического процессора достигали отметок 104 градуса Цельсия, а скорость центробежного вентилятора увеличивалась до 4760 об/мин! Естественно, в этом случае говорить о каком-либо комфорте не приходится. Хорошо, что Aliens vs. Predator (2010) оказался единственным тестом из нашего списка, столь сильно прогревающим видеокарту. Однако, мы всё же склонны к мнению, что с предоставленным нам на тестирование экземпляром AMD Radeon HD 6970 не совсем всё в порядке.

Несмотря на это, от тестирования видеокарт в FurMark было решено не отказываться, и вот какие результаты были получены в автоматическом режиме работы центробежных вентиляторов…


AMD Radeon HD 6950 AMD Radeon HD 6970
(автоматический режим) (автоматический режим)


…и на их максимальной скорости:


AMD Radeon HD 6950 AMD Radeon HD 6970
(максимальная скорость) (максимальная скорость)


К Radeon HD 6950 вновь сложно предъявить какие-то претензии - здесь мы видим 90 градусов Цельсия и всего 2800 об/мин в автоматическом режиме, а также 71 градус Цельсия при максимальных 5770 об/мин. В свою очередь, Radeon HD 6970 не справилась с тестом FurMark даже на максимальной скорости центробежного вентилятора, снизив частоту графического процессора до 500 МГц.

Учитывая столь аховые результаты проверки температурного режима Radeon HD 6970 и невозможность организации альтернативного охлаждения (в первую очередь ввиду отсутствия радиаторов на VRM), на разгон была проверена только видеокарта AMD Radeon HD 6950. И вот какие результаты были получены:


Частотный потенциал графического процессора оказался весьма скромным, так как частоту удалось повысить всего на 70 МГц (+8,8 %), а видеопамять не подвела, разогнавшись до впечатляющих 5880 МГц эффективной частоты. Нужно заметить, что после разгона видеокарты её температурный режим не изменился. То есть, совсем не изменился. Лишь центробежный вентилятор системы охлаждения видеокарты повысил скорость на 100-150 об/мин в зависимости от типа нагрузки.

В завершение подраздела приведём ссылки на основные BIOS рассмотренных видеокарт: AMD Radeon HD 6950 2 Гбайт и AMD Radeon HD 6970 2 Гбайт .

Тестовая конфигурация, инструментарий и методика тестирования

Все тесты производительности видеокарт были проведены в закрытом корпусе системного блока на следующей конфигурации:

Системная плата: Gigabyte GA-X58A-UD9 (Intel X58 Express, LGA 1366, BIOS F5g);
Центральный процессор: Intel Core i7 Extreme Edition i7-980X 3,33 ГГц (Gulftown, B1, 1,225 В, 6x256 Kбайт L2, 12 Мбайт L3);
Система охлаждения CPU: ThermoLab baram2010 (1x120 мм, 1100 об/мин);
Термоинтерфейс: Arctic Cooling MX-2;
Оперативная память: DDR3 3x2 Гбайт OCZ Platinum Low-Voltage Triple Channel (1600 МГц / 7-7-7-24 / 1,65 В);
Системный диск: RAID-0 2xSSD Kingston V-series SNV425S2128GB (SATA-II, 2x128 Гбайт, MLC, Toshiba TC58NCF618G3T);
Диск для программ и игр: Western Digital VelociRaptor (SATA-II, 300 Гбайт, 10000 об/мин, 16 Мбайт, NCQ) в коробке Scythe Quiet Drive 3,5";
Архивный диск: Samsung Ecogreen F4 HD204UI (SATA-II, 2 Тбайт, 5400 об/мин, 32 Мбайт, NCQ);
Корпус: Antec Twelve Hundred (передняя стенка - три Noiseblocker NB-Multiframe S-Series MF12-S2 на 900 об/мин; задняя - два Noiseblocker NB-BlackSilentPRO PL-1 на 900 об/мин; верхняя - штатный 200-мм вентилятор на 400 об/мин);
Панель управления и мониторинга: Zalman ZM-MFC2;
Блок питания: Xigmatek «No Rules Power» NRP-HC1501 (1500 Вт), 140-мм вентилятор;
Монитор: 30" Samsung 305T Plus .

32-нм шестиядерный процессор при множителе 24 и активированной функции «Load-Line Calibration» был разогнан до 4,42 ГГц при повышении напряжения в BIOS материнской платы до 1,425 В:



При этом 6 Гбайт оперативной памяти DDR-3 функционировали на частоте 1,47 ГГц с таймингами 7-7-7-16-1T при напряжении 1,64 В. Технологии «Turbo Boost» и «Hyper-Threading» во время тестирования были отключены.

Для сравнения с AMD Radeon HD 6950 и HD 6970 в тестирование были включены видеокарты AMD Radeon HD 6870 1 Гбайт и Inno3D GeForce GTX 570 1,28 Гбайт :


К сожалению, включить в тестирование NVIDIA GeForce GTX 580 у нас не было возможности по причине отсутствие такой видеокарты, а также ввиду жестких временных рамок проведения тестирования и подготовки статьи (4 дня).

Тестирование, начатое 10 декабря 2010 года, было проведено под управлением операционной системы Microsoft Windows 7 Ultimate x64 со всеми критическими обновлениями до указанной даты и со следующими драйверами:

чипсет материнской платы Intel Chipset Drivers - 9.2.0.1015 WHQL ;
библиотеки DirectX End-User Runtimes, дата выпуска - 30 ноября 2010 года ;
драйверы видеокарт на графических процессорах AMD - Catalyst 10.12 RC2 (07.12.2010);
драйверы видеокарт на графических процессорах NVIDIA - GeForce/ION 263.09 WHQL (07.12.2010) включая драйверы PhysX версии 9.10.0514.

Тестирование видеокарт в играх было проведено в двух актуальных для тестируемых сегодня видеокарт разрешениях: 1920х1080 и 2560х1600 пикселей. Для тестов были использованы два режима качества графики: «High Quality + AF16x» - максимальное качество текстур в драйверах с включением анизотропной фильтрации уровня 16х, и «High Quality + AF16x + AA 4(8)x» с включением анизотропной фильтрации уровня 16х и полноэкранного сглаживания (MSAA) степени 4x или 8x, в случае, если среднее число кадров в секунду оставалось достаточно высоким для комфортной игры. Включение анизотропной фильтрации и полноэкранного сглаживания выполнялось непосредственно в настройках игр. Если данные настройки в играх отсутствовали, то параметры изменялись в панелях управления драйверов Catalyst и GeForce/ION. Вертикальная синхронизация принудительно отключена в панелях управления драйверов.

В очередной раз список тестовых приложений и игр был обновлен. В связи с появлением нового 3DMark 2011, из числа используемых для тестирования приложений был исключен старенький «попугаемер» 3DMark 2006. Кроме этого, из списка исключена игра Colin McRae: DiRT 2, которую заменила новая и, можно сказать, родственная ей F1 2010, а также временно убрана NBA 2K11, так как её результаты зачастую не поддавались никакому логическому объяснению. Не забыты и все свежие патчи для игр. В результате, тестовый список составили два полусинтетических пакета, одно техно-демо и 17 игр. Вот как он выглядит с кратким описанием методик (здесь и далее игры расположены в порядке их выхода):

3DMark Vantage (DirectX 10) - версия 1.0.2.1, профили настроек «Performance» и «Extreme» (тестировались только основные тесты);
3DMark 2011 (DirectX 11) - версия 1.0.0.0, профили настроек «Performance» и «Extreme»;
Unigine Heaven Demo (DirectX 11) - версия 2.1, максимальные настройки качества, тесселляция на уровне «normal»;
Crysis (DirectX 10) - версия 1.2.1, профиль настроек «Very High», двукратный цикл демо-записи «Assault Harbor» из Crysis Benchmark Tool версии 1.0.0.5;
Far Cry 2 (DirectX 10) - версия 1.03, профиль настроек «Ultra High», двукратный цикл теста «Ranch Small» из Far Cry 2 Benchmark Tool v1.0.0.1;
BattleForge: Lost Souls (DirectX 11) - версия 1.2 (18.11.2010), максимальные настройки качества графики, тени включены, технология SSAO включена, двойной прогон встроенного в игру теста;
Resident Evil 5 (DirectX 10.1) - версия 1.2, тестирование переменного теста с максимальными настройками графики без размытия движения, за результат принималось среднее значение третьей сцены теста, как наиболее ресурсоёмкой;
(DirectX 11) - версия 1.6.02, профиль настроек «Улучшенное динамическое освещение DX11» с дополнительным выставлением вручную всех параметров на максимум, тестировалась собственная демо-запись «cop03» на уровне «Затон»;
Borderlands (DirectX 9) - версия игры 1.2.1, тестирование «timedemo1_p» с максимальными настройками качества;
Grand Theft Auto IV - Episodes From Liberty City (DirectX 9) - версия 1.1.2.0, тест из части «The Ballad of Gay Tony», настройки «Very High», «View Distance» = 23 %;
Left 4 Dead 2: The Sacrifice (DirectX 9) - версия игры 2.0.5.3, максимальное качество, тестировалась собственная демо-запись «d53» (два цикла) на карте «1. Доки», этапе «Жертва»;
Metro 2033: The Last Refuge (DirectX 10/11) - версия 1.2, использовался официальный тест, настройки качества «High», тесселляция, DOF и MSAA4x отключены, использовалось ААА-сглаживание, двойной последовательный проход сцены «Frontline»;
Just Cause 2 (DirectX 11) - версия 1.0.0.2, максимальные настройки качества, методики «Размытие фона» и Симуляция воды GPU» активированы, двойной последовательный проход демо-записи «Тёмная башня»;
Aliens vs. Predator (2010) (DirectX 11) - «Texture Quality» в режиме «Very High», «Shadow Quality» в режиме «High», технология SSAO включена, два цикла теста в каждом разрешении;
Lost Planet 2 (DirectX 11) - версия игры 1.0, максимальные настройки качества графики, размытие движения включено, использовался тест производительности «А» (среднее по всем трём сценам);
StarCraft 2: Wings of Liberty (DirectX 11) - версия игры 1.0, все настройки графики на уровень «Ультра», физика «Ультра», отражения включены, двукратный двухминутный тест собственного демо «jt1»;
Mafia 2 (DirectX 11) - версия игры 1.0.0.3, максимальные настройки качества графики, двойной прогон встроенного в игру теста;
Sid Meier"s Civilization V (DirectX 11) - версия игры 1.0, максимальные настройки качества графики, двойной прогон «дипломатического» теста из пяти самых тяжёлых сцен;
F1 2010 (DirectX 11) - версия игры 1.01, встроенный тест на Ultra-качестве, состоящий из одного круга по трассе «Silverstone»;
Tom Clancy"s H.A.W.X. 2 (DirectX 11) - версия 1.04, максимальные настройки качества графики, тени активированы, тесселляция включена, двойной прогон тестовой сцены.

Более подробное описание методик тестирования видеокарт и графических настроек в некоторых из перечисленных играх вы можете найти в специально для этого созданной ветке нашей конференции , а также поучаствовать в обсуждении и совершенствовании этих методик.

Если в играх реализована возможность фиксации минимального числа кадров в секунду, то оно также отражалось на диаграммах. Каждый тест проводился дважды, за окончательный результат принималось лучшее из двух полученных значений, но только в случае, если разница между ними не превышала 1 %. Если отклонения прогонов тестов превышали 1 %, то тестирование повторялось ещё, как минимум, один раз, чтобы получить корректный результат.

Результаты тестов производительности видеокарт их анализ

На диаграммах результаты тестирования видеокарт AMD Radeon HD 6870 1 Гбайт выделены фиолетовым цветом, видеокарты AMD Radeon HD 6950 2 Гбайт в номинальном и разогнанном режимах, а также Radeon HD 6970 2 Гбайт отмечены красной гаммой, а GeForce GTX 570 - зелёной (частоты карты Inno3D приведены к эталонным частотам GTX 570). Видеокарты на диаграммах расположены в порядке убывания их рекомендованной стоимости.

3DMark Vantage



Новые Radeon HD 6970 и HD 6950 в этом тесте выглядят неплохо, но лишь на фоне Radeon HD 6870, которую они опережают на величину вплоть до 40 %. Конкурировать с GeForce GTX 570 новинкам не удаётся, «зелёная» видеокарта впереди в обоих режимах качества. Radeon HD 6970 в этом синтетическом тесте быстрее Radeon HD 6950 на 11-15 %, но последняя при разгоне сокращает отставание до 3-5 %.

3DMark 2011



Получше выглядят новинки в новом тесте 3DMark 2011, где Radeon HD 6970 успешно конкурирует с GeForce GTX 570, а HD 6950 не сильно отстаёт от них. Впрочем, от однопроцессорного флагмана AMD наверняка многие ждали более убедительной победы, ведь она позиционируется AMD, как конкурент GeForce GTX 580, но по более привлекательной цене. Что касается преимущества Radeon HD 6970 и HD 6950 над Radeon HD 6870, то оно достигает 28 %. Разница между двумя новыми видеокартами не превышает 12 % и существенно компенсируется разгоном Radeon HD 6950.

Unigine Heaven Demo



Unigine Heaven - тест, активно использующий тесселляцию, не выявил однозначного лидера, так как в режиме без сглаживания и разрешении 1280х1024 лидирует видеокарта GeForce GTX 570, а в более тяжёлом графическом режиме впереди уже Radeon HD 6970. Разница между Radeon HD 6970 и HD 6950 составляет 11 % в пользу старшей видеокарты, но при разгоне младшей она сокращается до 2-3 %. Преимущество Radeon HD 6970 над Radeon HD 6870 в этом тесте наиболее впечатляющее среди всех остальных тестов и составляет 59 % в лёгком графическом режиме и 66 % в режиме со сглаживанием. Весьма неплохо.

Crysis


Crysis по-прежнему остаётся одной из наиболее ресурсоёмких игр, в которой даже топовые видеокарты AMD и NVIDIA могут обеспечить геймерам комфортный игровой режим только без использования сглаживания и в разрешениях не выше 1920х1080. Тем не менее, если сравнивать видеокарты сегодняшней статьи, то нужно отметить, что GeForce GTX 570 в режимах без сглаживания идёт наравне с Radeon HD 6970, а при активации сглаживания - на уровне Radeon HD 6950. Последняя видеокарта при разгоне не отстаёт от своей старшей «сестры». Преимущество Radeon HD 6970 над Radeon HD 6870 составляет от 24 до 56 % в зависимости от разрешения и режима качества.

Far Cry 2


Прямо сказать, в игре Far Cry 2 новые Radeon HD 69xx на фоне GeForce GTX 570 выглядят неубедительно. Видеокарта на графическом процессоре NVIDIA, как минимум, не уступает старшей видеокарте AMD в режимах со сглаживанием, и превосходит её в лёгких графических режимах, не говоря про Radeon HD 6950. Разгон последней видеокарты позволяет сократить отставание от Radeon HD 6970 с 7-12 % до 1-2 %.

BattleForge: Lost Souls


Только в третьем по счёту игровом тесте - BattleForge: Lost Souls - новые Radeon HD 6970 и HD 6950 продемонстрировали преимущество над GeForce GTX 570, но и то только в режиме без сглаживания. При активации в игре MSAA степени 8x впереди вновь видеокарта NVIDIA. Radeon HD 6970 опережает HD 6950 на 10-11 %, но это отставание легко сокращается после разгона HD 6950. Преимущество старшего «Каймана» над старшим «Бартсом» находится у отметки 25 %.

Resident Evil 5


Очевидна безоговорочная победа GeForce GTX 570. Кроме того, у новых Radeon HD 69xx в этой игре какие-то проблемы с производительностью в режиме со сглаживанием, где новые видеокарты не могут оторваться от Radeon HD 6870.

S.T.A.L.K.E.R.: Call of Pripyat



В игре S.T.A.L.K.E.R.: Call of Pripyat новая Radeon HD 6970 оказывается быстрейшей среди тестируемых сегодня, следом идёт GeForce GTX 570, а за ней Radeon HD 6950. При этом необходимо отметить, что минимальное число кадров в секунду на видеокарте с графическим процессором NVIDIA выше, чем на AMD. Преимущество Radeon HD 6970 над HD 6950 составляет 13-17 %, но при разгоне младшей видеокарты на «Cayman» сокращается до 3-4 %. В свою очередь, Radeon HD 6870 отстаёт от Radeon HD 6970 на 35-36 %.

Borderlands


Примечательно, что в режимах без сглаживания новым Radeon HD 69xx не угнаться за GeForce GTX 570. Однако, стоит только активировать MSAA 8x в драйверах, как лидером становится Radeon HD 6970, а GTX 570 может конкурировать лишь с Radeon HD 6950 (кстати, как это и задумывалось AMD). Radeon HD 6970 быстрее HD 6950 на 10-12 %, и быстрее Radeon HD 6870 на 22-26 % в трёх режимах из четырёх. А вот в наиболее ресурсоёмком четвёртом режиме со сглаживанием и в разрешении 2560х1600 преимущество Radeon HD 6970 над Radeon HD 6870 достигает 82 %! Скорее всего, этого преимущества удалось добиться за счёт удвоенного объема памяти у видеокарт на графических процессорах Cayman. И с такой ситуацией сегодня мы ещё не раз столкнёмся.

Grand Theft Auto IV: Episodes From Liberty City



В игре Grand Theft Auto IV: Episodes From Liberty City лидирует видеокарта GeForce GTX 570. Между всеми видеокартами на графических процессорах AMD разница невелика.

Left 4 Dead 2: The Sacrifice


Учитывая высокий FPS в нересурсоёмкой, но очень популярной игре Left 4 Dead 2: The Sacrifice, актуальным режимом является режим со сглаживанием, в котором Radeon HD 6970 оказывается быстрее GeForce GTX 570, а Radeon HD 6950 практически равна ей. Преимущество старшего «Каймана» над младшим составляет 12-13 % и полностью «съедается» разгоном Radeon HD 6950. Добавим, что в этой игре Radeon HD 6970 быстрее Radeon HD 6870 на 24-30 %.

Metro 2033: The Last Refuge



Подруга Crysis, игра Metro 2033: The Last Refuge, не выявила лидеров сегодняшнего теста. Производительность всех видеокарт крайне низкая. Здесь можно отметить разве что неплохой прирост производительности Radeon HD 6970 в сравнении с Radeon HD 6870, составляющий от 24 до 36 %.

Just Cause 2


В игре Just Cause 2 видеокарта GeForce GTX 570 может составить конкуренцию новым Radeon HD 69xx только в одном тестовом режиме из четырёх. При увеличении разрешения или включении сглаживания видеокарта на графическом процессоре NVIDIA существенно отстаёт не только от Radeon HD 6970, но и не может догнать Radeon HD 6950. Преимущество Radeon HD 6970 над HD 6950 в этой игре составляет 12-13 %, а при разгоне HD 6950 сокращается до 0-4 %.

Aliens vs. Predator (2010)


Похожую с Just Cause 2 картину мы можем наблюдать и в игре Aliens vs. Predator. Помимо этого, здесь обращает на себя внимание впечатляющий скачок производительности при переходе от Radeon HD 6870 к Radeon HD 6970, который в режиме без сглаживания составляет 33 %, а при активации MSAA 4x достигает целых 54-69 %!

Lost Planet 2


GeForce GTX 570 берёт реванш за две предыдущие игры в новой Lost Planet 2, опережая оба новых Radeon. Здесь также хотелось бы обратить внимание на существенную разницу в производительности между Radeon HD 6870 и Radeon HD 6970, когда преимущество видеокарты на «Cayman» достигает 94 % в наиболее «тяжёлом» графическом режиме, а в самом «лёгком» не опускается ниже 31 %.

StarCraft 2: Wings of Liberty


В игре StarCraft 2: Wings of Liberty у всех видеокарт AMD проблемы с производительностью в режиме со сглаживанием. Если без него все видеокарты Radeon опережают GeForce GTX 570, то при активации в драйверах MSAA 8x они буквально проваливаются, демонстрируя крайне низкое число кадров в секунду. В то же время, у NVIDIA таких проблем в этой игре, как мы видим, нет.

Mafia 2


В игре Mafia 2 видеокарте GeForce GTX 570 с успехом противостоит Radeon HD 6950, а старшая HD 6970 в трёх из четырёх тестовых режимов оказывается быстрее. Правда, разница в этой тройке невелика.

Sid Meier"s Civilization V


Результаты тестирования видеокарт в игре Sid Meier"s Civilization V не выделяются на общем фоне, но интересны тем, что в разрешении 2560х1600 видеокарта GeForce GTX 570 уступает обеим новинкам AMD, хотя в менее ресурсоёмком 1920х1080 такой картины мы не наблюдаем. Неужели видеокарте на графическом процессоре NVIDIA не хватает памяти в самом высоком разрешении?

F1 2010


В новой игре F1 2010 с GeForce GTX 570 борется Radeon HD 6950, а Radeon HD 6970, за исключением самого «лёгкого» графического режима, чуть-чуть опережает их обеих. Разгоном HD 6950 эта разница сокращается до минимума или исчезает вовсе. Radeon HD 6870 отстаёт от Radeon HD 6970 тем сильнее, чем выше нагрузка на видеопамять и требования к её объёму. Так, в разрешении 2560х1600 и со сглаживанием степени 8x преимущество HD 6970 над HD 6870 достигает впечатляющих 64 %.

Tom Clancy"s H.A.W.X. 2


Думаем, здесь комментарии излишни, так как NVIDIA в данном тесте пока конкурировать попросту не с кем.

В данном подразделе остаётся только приложить , и можно переходить к сводным диаграммам.

Сводные диаграммы сравнения производительности

По двум первым парам сводных диаграмм мы предлагаем вам оценить преимущество AMD Radeon HD 6970 2 Гбайт над HD 6950 2 Гбайт в номинальном режиме работы и при разгоне последней до частот 870/5880 МГц. За нулевую ось приняты результаты Radeon HD 6950, а результаты Radeon HD 6970 показаны в процентах от них:






В среднем, Radeon HD 6970 оказывается быстрее Radeon HD 6950 на 10-11 % в режимах без сглаживания, и на 11-13 % - в режимах со сглаживанием. Примечательно, что и максимальное (20 %), и минимальное (2 %) преимущество старшей видеокарты получено в одной игре - StarCraft 2: Wings of Liberty. Причина проста - неадекватное поведение видеокарт AMD Radeon в режимах со сглаживанием. Разгон Radeon HD 6950 позволяет сократить до минимума отставание от Radeon HD 6970, а в некоторых играх и режимах качества даже опередить её.

На следующих сводных диаграммах приведено сравнение номинальных Radeon HD 6970 и HD 6950 с GeForce GTX 570, результаты которой приняты за нулевую ось, а преимущество или отставание свежеиспечённых конкурентов показано в процентах от этой оси:






Борьба ведётся с переменным успехом. Учитывая небольшую разницу в производительности между Radeon HD 6970 и Radeon HD 6950, GeForce GTX 570 удаётся конкурировать с ними обеими. Во многих играх между AMD и NVIDIA паритет, либо совсем уж незначительное преимущество той или иной видеокарты. В некоторых, таких как Tom Clancy"s H.A.W.X.2, Lost Planet 2, Borderlands и качественных режимах StarCraft 2: Wings of Liberty преимущество явно на стороне GeForce GTX 570. В других играх быстрее Radeon HD 69xx. Какой-то общий вывод сделать здесь невозможно, потому что после самих движков игр первостепенное значение имеют режимы качества и разрешения.

Наконец, третья пара сводных диаграмм отведена под сравнение Radeon HD 6970 и Radeon HD 6870, как старших видеокарт в своих классах. Преимущество однопроцессорного флагмана AMD показано в процентах от результатов HD 6870:






В среднем по всем играм, Radeon HD 6970 опережает Radeon HD 6870 на 26-31 % в режимах без использования сглаживания, и на 27-45 % в режимах с использованием сглаживания. Полезность наличия 2 Гбайт видеопамяти на Radeon HD 69xx наглядно демонстрирует последняя диаграмма, когда в отдельных играх разница между HD 6970 и HD 6870 более чем впечатляет.

Энергопотребление и уровень шума

измерение энергопотребления

Энергопотребление системы в целом (без учёта монитора) с установленными в ней разными видеокартами проводилось с помощью специально доработанного для этих целей блока питания при двух типах нагрузки. Типичную игровую нагрузку мы эмулировали запуском двух циклов теста Aliens vs. Predator в разрешении 2560х1600 с активированной анизотропной фильтрацией 16x и MSAA 4x сглаживания. Теоретическая максимальная нагрузка создавалась посредством запуска FurMark версии 1.8.2 в режиме теста стабильности и разрешении 2560х1600 (с AF16x), а также Linpack x64 (LinX 0.6.4, 4750 Мбайт, 5 потоков). Учитывая, что обе указанные программы генерируют максимальную нагрузку на, соответственно, видеосистему и центральный процессор, таким образом мы сможем узнать пиковое энергопотребление всей системы и определить необходимый для неё блок питания (c учётом КПД).

Полученные результаты приведены на диаграмме:



Все участники тестирования в составе тестовой системы продемонстрировали уровень энергопотребления, соответствующий порядку их рекомендованной стоимости:) Чем дороже видеокарта, тем больше электроэнергии потребляет система, в которой она установлена. Из интересных особенностей здесь можно отметить 100-ваттную разницу в пиковом потреблении систем с видеокартами Radeon HD 6970 и Radeon HD 6950 (в номинальном режиме работы). В то же время, если верить заявленному AMD предельному уровню энергопотребления, то HD 6970 должна потреблять всего на 50 Вт больше, чем HD 6950. Впрочем, в нашем случае речь идёт об энергопотреблении всей системы, а не отдельной видеокарты, входящей в её состав, поэтому проводить такие параллели некорректно. Отдельно было измерено максимальное энергопотребление центробежных вентиляторов систем охлаждения видеокарт, и у Radeon HD 6970/HD 6950 оно составило 12,3 Вт, а у GeForce GTX 570 - 9,2 Вт.

измерение уровня шума

Измерение уровня шума систем охлаждения видеокарт осуществлялось с помощью электронного шумомера CENTER-321 после часа ночи в полностью закрытой комнате площадью около 20 м² со стеклопакетами. Уровень шума каждого кулера измерялся вне корпуса системного блока, когда источником шума в комнате являлся только сам кулер и его вентилятор(ы). Шумомер, зафиксированный на штативе, всегда располагался строго в одной точке на расстоянии ровно 150 мм от ротора центробежного вентилятора кулера. Материнская плата, в которую была вставлена видеокарта с установленной на неё системой охлаждения, размещалась на самом углу стола на пенополиуретановой подложке. Нижняя граница измерений шумомера составляет 29,8 дБА, а субъективно комфортный (не путать с низким) уровень шума кулеров при измерениях с такого расстояния находится около отметки 36 дБА. Скорость вращения центробежных вентиляторов систем охлаждения видеокарт изменялась во всём диапазоне их работы с помощью контроллера путём изменения питающего напряжения с шагом 0,5 В.

По результатам измерений уровня шума видеокарт сегодняшнего тестирования был построен следующий график:



Вертикальными линиями обозначены границы работы центробежных вентиляторов видеокарт в автоматическом режиме при нагрузке видеокарт посредством FurMark. Красные пунктирные линии относятся к Radeon HD 6950, красные сплошные - к Radeon HD 6970, а зелёные пунктирные к GeForce GTX 570.

Как видим, штатная система охлаждения эталонной видеокарты GeForce GTX 570 не только демонстрирует меньший уровень шума во всем диапазоне работы центробежного вентилятора среди тестируемых сегодня видеокарт, но и функционирует на меньших оборотах, не взирая на FurMark. Максимальная скорость её центробежного вентилятора после 12 минут нагрузки составила 2430 об/мин. Новые Radeon HD 69xx, увы, похвастаться столь скромным уровнем шума не могут. Так, центробежный вентилятор Radeon HD 6950 во время тестирования раскрутился до 2820 об/мин, а центробежный вентилятор Radeon HD 6970 и вовсе до 4760 об/мин. Хотя, в последнем случае, как уже было сказано выше, мы всё же склонны винить проблемный экземпляр видеокарты, чем делать окончательные выводы о неприемлемо высоком уровне шума Radeon HD 6970. Добавим, что при игровой нагрузке все видеокарты издавали более комфортные для слуха звуки.

Перейдём к подведению итогов первого знакомства с новыми видеокартами на основе графических процессоров AMD «Cayman».

Заключение

Несмотря на тот факт, что по чистой производительности AMD Radeon HD 6950 и Radeon HD 6970 не смогли безоговорочно опередить NVIDIA GeForce GTX 570 и, за исключением отдельных игр и тестов, конечно, не смогут превзойти GeForce GTX 580, новые видеокарты должны привлечь внимание компьютерных пользователей, решивших обновить свою видеокарту, либо заново приобретающих её. Причиной тому, в первую очередь, является более низкая рекомендованная стоимость, которая у Radeon HD 6950 на 50 долларов США ниже, чем у GeForce GTX 570, а у Radeon HD 6970 - сразу на 130 долларов США ниже, чем у GeForce GTX 580. При этом нужно понимать, что рыночные реалии порой весьма далеки от прогнозируемых или рекомендованных маркетологами цен, да и обе топ-видеокарты NVIDIA имеют фору, так как уже присутствуют на рынке, в то время как появление новых Radeon HD 69xx в рознице мы с вами ещё только ожидаем. Поэтому, как оно сложится на самом деле - покажет время.

Если говорить непосредственно о видеокартах, то Radeon HD 6950 со своим 10-13 % отставанием от Radeon HD 6970 и практически полным его сокращением при разгоне, а также с учётом 70-долларовой разницы в цене и таким же объёмом видеопамяти 2 Гбайт выглядит более привлекательной, чем старшая видеокарта. Кроме того, Radeon HD 6950 функционирует при более низких температурах и, как следствие, при более низком уровне шума. Хотя, конечно, назвать эту видеокарту холодной и тихой было бы не совсем верно. Ценители тихих системных блоков наверняка уже присматривают замену штатной системе охлаждения Radeon HD 69xx, а оверклокеры прицениваются к возможности установки водоблоков. Позитивным моментом мы считаем и появление на видеокартах резервного BIOS. Теперь, в случае повреждения рабочего BIOS ещё одна видеокарта для его восстановления не потребуется. Новый интересный тип сглаживания «Enhanced Quality AA» и режимы энергосбережения также не останутся без нашего внимания в следующих материалах.

Что же дальше? Дальше, на наш взгляд, мы станем свидетелями ответного шага со стороны NVIDIA, которым, как хотелось бы верить, будет не только снижение цен на GeForce GTX 570 и GTX 580, но и выпуск привлекательной с точки зрения соотношения цены и производительности GeForce GTX 560. А от этого, безусловно, все мы будем только в выигрыше, поэтому появление в наших сетях «Кайманов» переоценить довольно сложно.

Благодарим:
российское представительство компании AMD и персонально Кирилла Кочеткова,
компанию Inno3D и персонально Наталию Лагуненко
за предоставленные на тестирование видеокарты
.

Другие материалы по данной теме


Nvidia GeForce GTX 580: рождённый быть первым
Fallout: New Vegas и современные видеокарты
Простая арифметика: видеокарты AMD Radeon HD 68xx в CrossFireX-режимах

Конец прошлого года и практически весь текущий год на рынке настольной графики правит бал компания AMD со своими ускорителями семейства Evergreen. Выпущенные в сентябре 2009 продукты на базе GPU Cypress, а также их младшие модификации по праву заняли своё место в компьютерах множества пользователей. Естественно, успех ускорителей AMD случайным назвать никак нельзя. Пока NVIDIA решала свои производственные проблемы, пытаясь вывести на рынок ускорители на базе GF100, AMD уже вовсю продвигала свои DirectX 11-совместимые решения во всех сегментах рынка настольной графики, активно отвоёвывая рыночную долю у конкурента. Даже появление на свет GeForce GTX 480 не смогло остановить “красный локомотив”, так как новый флагман NVIDIA оказался не так быстр, как того желала публика, кроме того, он был заметно горячее и дороже Radeon HD 5870. Наконец, совсем недавно NVIDIA начала исправлять ситуацию в лучшую для себя сторону. Серьёзная работа над ошибками , проведённая инженерами компании, позволила новым ускорителям GTX 5xx занять достойное место среди самых производительных настольных решений для ПК. Тем временем фанаты AMD с ехидством потирали руки, ожидая мощного ответа от AMD, способного вернуть «красной графике» чемпионский титул среди одночиповых решений.

Сегодня состоялся официальный анонс видеокарт Radeon HD 6950 и Radeon HD 6970 - именно они, по слухам, воспринимались в качестве ответного удара на выпуск GeForce GTX 570 и GeForce GTX 580. Постараемся разобраться, насколько эффективно новое оружие AMD, и как на самом деле компания позиционирует свои новые продукты.

Итак, вопреки ожиданиям публики, AMD не считает свои новые графические ускорители Radeon HD 6970 и Radeon HD 6950 прямыми конкурентами GeForce GTX 580 и GeForce GTX 570. В противовес самому быстрому ускорителю NVIDIA AMD по-прежнему ставит Radeon HD 5970, который, как показало наше тестирование , уже далеко не всегда справляется с возложенной на него миссией. В свою очередь Radeon HD 6970, по мнению AMD, должен оказаться быстрее GeForce GTX 570 и немного медленнее GTX 580, а вот для Radeon HD 6950 уготована особая роль - считается, что новинка должна породить свою собственную нишу в иерархии современных 3D-ускорителей.

При разработке новых GPU перед инженерами AMD ставился целый ряд задач:

  • Создание эффективной архитектуры для графических и неграфических вычислений;
  • Достижение высокой геометрической производительности;
  • Внедрение новых режимов качества картинки;
  • Внедрение эффективных методов управления питанием.

С момента появления графического процессора R600, на базе которого строились ускорители серии HD 2900, тогда ещё компания ATI, а ныне компания AMD использует так называемую VLIW-архитектуру (Very Long Instruction Word - Очень длинное машинное слово).

Блок-схема GPU Cypress

Блок-схема GPU Barts

Блок-схема GPU Cayman

Суть работы этой архитектуры заключается в параллельном исполнении ядром сразу нескольких операций одновременно. До сих пор графические процессоры ATI/AMD использовали так называемую VLIW5-архитектуру. Это означало следующее: в GPU Cypress содержалось 20 SIMD ядер, каждое такое ядро содержало по 16 блоков суперскалярных потоковых процессоров (Stream Core).

Внутренняя структура каждого потокового процессора такова:

  • Четыре исполнительных блока + Блок специальной функциональности (SFU или Special Function Unit);
  • Блок ветвлений;
  • Блок регистров общего назначения.

Выходит, что внутри чипа Cypress находится 20*16=320 потоковых процессоров, а учитывая структуру каждого потокового процессора, можно считать, что GPU Cypress содержит 1600 (320*5) скалярных 32-битных потоковых процессоров. Благодаря такому устройству GPU Cypress обладает пиковой вычислительной мощью до 2,7 Тфлопс при расчётах с одинарной точностью и до 544 Гфлопс в операциях с двойной точностью (FP64). Используемая VLIW-архитектура позволяет отказаться от целого ряда сложных узлов внутри GPU, что делает графические чипы AMD достаточно экономичными, особенно в сравнении с топовыми продуктами конкурента. Однако не всё так гладко, как кажется на первый взгляд. Параллельное исполнение вычислительных операций часто заставляет блоки простаивать в ожидании выполнения той или иной операции, когда результат одного вычисления зависит от результата другого. Ручное программирование для чипов с VLIW-архитектурой требует немало усилий, поскольку программисту требуется учитывать огромное количество внутренних зависимостей нитей кода, вследствие чего эффективность вычислений на таких GPU во многом зависит от оптимизации компиляторов. Графические процессоры Cayman, являющиеся сердцем Radeon HD 6950/6970, получили переработанную VLIW-архитектуру, так называемую VLIW4.

Использование VLIW4 позволяет лучше оптимизировать загрузку потоковых процессоров, улучшить функциональность каждого исполнительного блока (Stream Processing Unit - SPU) и избавиться от блока специальной функциональности (SFU (Special Function Unit)), который отвечал за вычисление так называемых трансцендентных функций. В итоге, по заявлениям AMD, графические чипы Cayman обладают повышенной эффективностью из расчёта на 1 кв.мм. площади кристалла. Благодаря переходу на VLIW4 удалось усовершенствовать дизайн ядра, увеличить количество SIMD-ядер, текстурных блоков, а также переработать ряд других блоков GPU.

Эффективность ROP повышена за счет улучшенного объединения операций записи (более эффективной загрузки шины памяти)

В GPU Cayman впервые реализована технология “Asynchronous dispatch”. Прежде графическое ядро имело одну общую очередь команд, поэтому вычислительные и графические задачи выстраивались в эту очередь по принципу ”первый пришел - первым обслужили”. Это напоминает одноядерный центральный процессор со многими ALU, но всего одним декодером. В ускорителях серии Radeon HD 6900 впервые поддерживается асинхронная обработка многих независимых очередей команд. Каждая очередь имеет свой приоритет и свою виртуальную память. Также доступны два независимых полноскоростных контроллера DMA (Direct Memory Access) для одновременного чтения и записи системной памяти по шине PCI-E. Кроме того, вычисления с двойной точностью достигли ¼ от пиковой скорости вычислений с одинарной точностью.

Не секрет, что AMD долго ругали за невысокую скорость обработки геометрии и медленную работу с тесселляцией. По заявлению разработчика, скорость обработки геометрии выросла вдвое, а при включении тесселляции в некоторых случаях достигается почти трёхкратный рост производительности в сравнении с Radeon HD 5870. Такие результаты стали возможны благодаря наращиванию соответствующих функциональных блоков, отвечающих за работу с примитивами, а также использование более совершенного блока тесселляции.

Наконец, перед тем, как перейти к внешнему осмотру ускорителей Radeon HD 6950/6970, обратимся к сводной таблице с техническими характеристиками и ценами.

Название видеокарты

AMD Radeon HD 5870 1 Гбайт

AMD Radeon HD 6850 1 Гбайт

AMD Radeon HD 6870 1 Гбайт

AMD Radeon HD 6950 2 Гбайт

AMD Radeon HD 6970 2 Гбайт

Кодовое имя ядра

Техпроцесс,нм

Кол-во транзисторов, млн. шт.

Максимальное энергопотребление, Вт (PowerTune Maximum)

Типичное энергопотребление, Вт

Энергопотребление в состоянии покоя, Вт

Частота ядра GPU, МГц

Кол-во блоков ROP, шт

Кол-во TMU, шт

Кол-во универсальных процессоров

Частота шейдерного домена, МГц

Тип видеопамяти

Разрядность шины памяти, бит

Эффективная частота видеопамяти, МГц

ПСП видеопамяти, Гбайт/с

Примерная розничная стоимость по данным Market 3Dnews / рекомендованная розничная стоимость у.е.

Исходя из технических характеристик новинок и памятуя обо всех архитектурных улучшениях в Cayman, мы полагаем, что ускоритель AMD Radeon HD 6950 в целом должен быть примерно на одном уровне по производительности с Radeon HD 5870. Где-то HD 6950 будет быстрее (в случае с тесселляцией - заметно быстрее), где-то медленнее из-за более низкой тактовой частоты графического ядра. В свою очередь Radeon HD 6970 во всех приложениях должен опережать старичка Radeon HD 5870, особенно это касается последних DirectX 11-приложений с поддержкой тесселляции. Если говорить о ценах, то пока данных о розничной стоимости новых ускорителей нет, однако уже сейчас ясно, что новые ускорители AMD окажутся заметно дешевле, чем GeForce GTX 570/580, правда, как нам кажется, по производительности они вряд ли дотянут до уровня флагманских ускорителей NVIDIA. Насколько? Покажет тестирование. А пока переходим к внешнему осмотру героев нашего обзора.

Ускорители AMD Radeon HD 6950/6970 внешне практически ничем не отличаются друг от друга, даже размер плат идентичен. Отличить ускорители можно лишь по наклейке на кожухе СО, а также по разъёмам питания. Ускоритель Radeon HD 6950 питается при помощи двух 6-pin разъёмов PCI-Ex, в свою очередь Radeon HD 6970 требует подключения одного 6-pin и одного 8-pin коннектора. С обратной стороны платы практически полностью закрыты металлическими пластинами. Судя по всему, это сделано для равномерного распределения тепла по поверхности ускорителя.

Количество и тип разъёмов на панели выводов у Radeon HD 6950 и HD 6970 одинаковы: два разъёма Mini DisplayPort версии 1.2, HDMI 1.4A, 2x DVI (DL-DVI + SL-DVI). В сравнении с Radeon HD 6850/6870 никаких отличий в компоновке портов здесь нет.

Демонтируем систему охлаждения Radeon HD 6950/6970. Конструктив СО обеих видеокарт полностью совпадает. К пластиковому кожуху СО крепится массивная металлическая пластина, которая контактирует с чипами памяти и элементами системы питания через специальные термопрокладки. За отвод тепла от GPU отвечает алюминиевый радиатор, подошвой которого является медная испарительная камера. Контакт с GPU происходит через тонкий слой термопасты.

Radeon HD 6950 сзади

Radeon HD 6950 спереди

Radeon HD 6970 сзади

Radeon HD 6970 спереди

Лишь после демонтажа системы охлаждения видно, что PCB ускорителей немного отличаются по цвету. Текстолит ускорителя Radeon HD 6970 имеет коричневый оттенок, а текстолит Radeon HD 6950 - чёрный. Система питания обеих карт идентична:

  • Volterra VT1156MF - напряжение на GPU (6 фаз).
  • Память - 1 фаза.
  • Vddci (контроллер памяти) - 2 фазы.

На обеих видеокартах установлена память Hynix H5GQ2H24MFR . Объём памяти каждой из видеокарт составляет 2 Гбайт, номинальная тактовая частота составляет 6 ГГц (QDR).

Лучшие статьи по теме