Как настроить смартфоны и ПК. Информационный портал
  • Главная
  • Windows 7, XP
  • Программное управление напряжениями и частотами. описание видеокарт и результаты синтетических тестов

Программное управление напряжениями и частотами. описание видеокарт и результаты синтетических тестов

AMD Radeon HD 6950/6970:

описание видеокарт и результаты синтетических тестов

Есть смысл еще раз напомнить, что карты требуют дополнительного питания, причем 6950 — двумя 6-контактными разъемами. А 6970 — 8-контактным и 6-контактным. Надеемся, что партнеры AMD будут вкладывать в комплект соответствующие переходники-разветвители питания.

О системе охлаждения.

AMD Radeon HD 6950/6970 2048 МБ 256-битной GDDR5, PCI-E

Стоит заметить, что CO очень схожа по принципу с той, что мы видели на GTX 580/570, и она также базируется на испарительной камере, которая заключена в медном узком отсеке, соприкасающемся с GPU. Над этой камерой выстроена конструкция из ребер охлаждения, через которые проходит воздух, гонимый цилиндрическим вентилятором на конце всего устройства. Правда, в отличие от GTX 580, в данном случае вся конструкция выполнена из меди, включая ребра радиатора, поэтому СО получилась весьма тяжелой.

Мы уже писали, что такое решение — более эффективно, нежели традиционно использовавшееся ранее на тепловых трубках. Внутри испарительной камеры особая жидкость, которая моментально передает тепло от нижней пластины к верхней.

Особо стоит также отметить, что СО настроена на незначительные реагирования при нагреве, чтобы обеспечить почти бесшумную работу. Поэтому нагрев ядра может даже превышать то, что мы видели в случае с 5870.

Мы провели исследование температурного режима с помощью утилиты MSI Afterburner (автор А. Николайчук AKA Unwinder) и получили следующие результаты:

AMD Radeon HD 6970 2048 МБ 256-битной GDDR5, PCI-E

AMD Radeon HD 6950 2048 МБ 256-битной GDDR5, PCI-E

Результаты исследования показали, что, несмотря на все вышесказанное, СО реально эффективна, и даже при частоте вращения 40% от максимума нагрев равен 92 градуса у 6970, а у 6950 — 84. Это после 6-часового постоянного тестирования под нагрузкой в 3D. Да, кому-то 92 градуса покажутся чрезмерно высокими, однако для акселераторов уровня Hi-End это приемлемо.

Максимальное энергопотребление карт под нагрузкой — 250—260 Вт для 6970 и чуть выше 205 Вт для 6950. Мы специально не приводим всяких графиков потребления, чтобы не усложнять прочтение материала. Читателей ведь всегда интересует — сколько оно потребляет в максимуме, чтобы подобрать нужный БП, а детали уже мало кому интересны.

Комплектация. Учитывая, что референс-образцы никогда не имеют комплектации, мы этот вопрос опустим.

Установка и драйверы

Конфигурация тестового стенда:

  • Компьютер на базе CPU Intel Core i7-975 (Socket 1366)
    • процессор Intel Core i7-975 (3340 МГц);
    • системная плата Asus P6T Deluxe на чипсете Intel X58;
    • оперативная память 6 ГБ DDR3 SDRAM Corsair 1600 МГц;
    • жесткий диск WD Caviar SE WD1600JD 160 ГБ SATA;
    • блок питания Tagan TG900-BZ 900 Вт.
  • операционная система Windows 7 64-битная; DirectX 11;
  • монитор Dell 3007WFP (30″);
  • драйверы ATI версии Catalyst 10.11; Nvidia версии 263.09 / 260.99.

VSync отключен.

Синтетические тесты

Используемые нами пакеты синтетических тестов можно скачать здесь:

  • D3D RightMark Beta 4 (1050) с описанием на сайте 3d.rightmark.org .
  • D3D RightMark Pixel Shading 2 и D3D RightMark Pixel Shading 3 — тесты пиксельных шейдеров версий 2.0 и 3.0, ссылка .
  • RightMark3D 2.0 с кратким описанием: под Vista без SP1 , под Vista c SP1 .

За неимением собственных синтетических тестов DirectX 11 мы ещё раз воспользовались примерами из пакетов SDK Microsoft и AMD и демонстрационной программой Nvidia. Во-первых, это HDRToneMappingCS11.exe и NBodyGravityCS11.exe из комплекта DirectX SDK (February 2010) .

Также мы взяли приложения обоих производителей: Nvidia и AMD. Из ATI Radeon SDK были взяты примеры DetailTessellation11 и PNTriangles11 (они также есть и в DirectX SDK). Дополнительно использовалась демонстрационная программа компании Nvidia — Realistic Water Terrain , также известная как Island11 (автор — Тимофей Чеблоков, очень известный специалист в 3D-графике).

Синтетические тесты проводились на следующих видеокартах:

  • Radeon HD 6970 HD 6970 )
  • Radeon HD 6950 со стандартными параметрами (далее HD 6950 )
  • Radeon HD 6870 со стандартными параметрами (далее HD 6870 )
  • Radeon HD 5870 со стандартными параметрами (далее HD 5870 )
  • Geforce GTX 580 со стандартными параметрами (далее GTX 580 )
  • Geforce GTX 570 со стандартными параметрами (далее GTX 570 )

Для сравнения результатов новых моделей видеокарт серии Radeon HD 6900 были выбраны эти модели, потому что Radeon HD 5870 — предыдущее одночиповое решение компании для топового ценового диапазона, сильнейшее до выхода новых моделей; Radeon HD 6870 — текущее решение компании AMD, стоящее на ступеньку ниже топовых и основанное на недавно вышедшем видеочипе Barts.

А именно эти решения Nvidia были взяты потому, что Geforce GTX 580 — быстрейшая одночиповая модель компании, основанная на свежем GPU. Хотя она не является конкурентом представленных видеокарт по цене, её результаты интересны как некая максимальная для решений Nvidia планка. Ну а GTX 570 взята как прямой конкурент для старшей модели новой серии — HD 6970.

Direct3D 9: тесты Pixel Filling

В этом тесте определяется пиковая производительность выборки текстур (texel rate) в режиме FFP для разного числа текстур, накладываемых на один пиксель:

В данном тесте фильтрации 32-битных (8 бит на цвет) текстур большинство видеокарт показывают цифры, далёкие от теоретически возможных. Вот и результаты нашей текстурной синтетики в случае видеоплат серии HD 6900 не дотягивают до пиковых значений. Далее мы рассмотрим скорость текстурирования ещё раз, в тесте из пакета 3DMark Vantage, где получаются более реалистичные цифры.

А тут получается, что HD 6970 выбирает лишь 67 текселей за один такт из 32-битных текстур при билинейной фильтрации, что почти на треть ниже теоретической цифры в 96 отфильтрованных текселей. Для HD 6950 эти цифры соответствуют 62 текселям из 88 теоретических, то есть эффективность младшей модели получилась чуть выше, и это связано с небольшой разницей по пропускной способности видеопамяти, также влияющей на результаты.

Неудивительно, что все карты AMD показывают такую высокую производительность и значительно опережают своих соперников из стана компании Nvidia. У них ведь и теоретические показатели скорости текстурирования весьма высоки. А вот даже топовая GTX 580 имеет лишь 64 TMU и сильно уступает моделям на Cayman, имеющим 88—96 TMU, да ещё и работающих на более высоких частотах.

Весьма любопытной получилась разница между HD 6950 и HD 5870 в разных условиях. Если в случаях с большим количеством текстур, где больше всего сказывается именно количество TMU и их частота, они идут наравне, то при меньшем количестве текстур на пиксель вперёд выходит модель HD 5870. Причём разницу нельзя списать только на ПСП, и вероятно тут сказываются и различные оптимизации в драйверах.

Рассмотрим эти же результаты в тесте филлрейта:

Эти цифры показывают скорость заполнения, и в них мы видим всё то же самое, разве что с учетом количества записанных в буфер кадра пикселей. Максимальный результат остаётся за новыми топовыми решениями семейства Radeon HD 6900, имеющими просто огромное количество TMU и более эффективными в нашем синтетическом тесте. Удивительно, но в случаях с 0—4 накладываемыми текстурами младшая из рассматриваемых сегодня видеокарт почему-то сильно уступает предыдущему топовому решению AMD, хотя в сложных условиях практически не отстаёт от него.

Direct3D 9: тесты Pixel Shaders

Первая группа пиксельных шейдеров, которую мы рассматриваем, очень проста для современных видеочипов, она включает в себя различные версии пиксельных программ сравнительно низкой сложности: 1.1, 1.4 и 2.0, встречающихся в старых играх.

Тесты очень просты для современных GPU и сильно упираются в производительность текстурирования. Поэтому они показывают далеко не все возможности современных видеочипов, но всё же интересны для оценки баланса между текстурными выборками и математическими вычислениями. В данном случае особых отличий между HD 5870 и HD 6950 нет, результаты этих моделей сопоставимы. Хотя один тест выделился — пиксельный шейдер освещения тремя источниками по Фонгу явно зависит от математической производительности GPU, и поэтому уровня HD 5870 в нём достигла только старшая модель — HD 6970.

Производительность в других тестах ограничена по большей части скоростью текстурных модулей и филлрейтом, но с учётом эффективности блоков и кэширования данных. Новые модели серии Radeon HD 6900 несколько быстрее предшествующих: HD 6970 быстрее HD 5870, а HD 6950 быстрее HD 6870 (из другого ценового диапазона). И почти все они опережают обе топовые модели Geforce — даже GTX 580 в этих тестах показывает результат лишь на уровне HD 6870, и в этом явно виноват недостаток скорости текстурирования.

Посмотрим на результаты более сложных пиксельных программ промежуточных версий:

И в этот раз получилось примерно то же самое, снова GTX 580 конкурирует скорее с HD 6870, чем с реальными топовыми моделями AMD. Тест Cook-Torrance более интенсивен вычислительно, и разница в нём примерно соответствует разнице в количестве ALU и их частоте. Именно поэтому данный тест лучше подходит для архитектуры AMD, чипы которой имеют большее количество математических блоков.

И тут нашлись два интересных момента. Во-первых, HD 5870 обгоняет даже HD 6970, что сложно объяснить одними лишь теоретическими характеристиками. Разница по пиковой математической производительности между этими моделями почти отсутствует, но есть и архитектурные отличия. Похоже, что именно разная эффективность исполнения этого шейдера на тех самых VLIW5- и VLIW4-процессорах и привела к такой разнице не в пользу нового чипа Cayman. Поэтому и HD 6950 в этом тесте выступила лишь на уровне HD 6870, а также GTX 580.

Во втором, сильно зависящем от скорости текстурирования тесте процедурной визуализации воды «Water» используется зависимая выборка из текстур больших уровней вложенности, и видеокарты в нём располагаются по скорости текстурирования, с поправкой на разную эффективность использования TMU.

Вот в этом тесте у новых решений всё прекрасно, HD 6950 обеспечивает результат на уровне HD 5870, а HD 6970 лидирует с хорошим отрывом, почти соответствующим 25-процентной разнице в теоретической скорости текстурирования. Понятно, что видеокартам производства Nvidia здесь ловить нечего, и они показывают результат на уровне заметно более дешёвой модели конкурента.

Direct3D 9: тесты пиксельных шейдеров Pixel Shaders 2.0

Эти тесты пиксельных шейдеров DirectX 9 сложнее предыдущих, они близки к тому, что мы сейчас видим в мультиплатформенных играх, и делятся на две категории. Начнем с более простых шейдеров версии 2.0:

  • Parallax Mapping — знакомый по большинству современных игр метод наложения текстур, подробно описанный в статье .
  • Frozen Glass — сложная процедурная текстура замороженного стекла с управляемыми параметрами.

Существует два варианта этих шейдеров: с ориентацией на математические вычисления и с предпочтением выборки значений из текстур. Рассмотрим математически интенсивные варианты, более перспективные с точки зрения будущих приложений:

Это универсальные тесты, зависящие и от скорости блоков ALU, и от скорости текстурирования, в них важен общий баланс чипа. Производительность новых видеокарт AMD в тесте «Frozen Glass» весьма хороша, HD 6970 снова оказалась заметно быстрее, чем HD 5870, а HD 6950 почти догнала её. Увы для Nvidia, но из-за слабого текстурирования решения компании AMD снова оказались заметно быстрее.

Вот во втором тесте «Parallax Mapping» решения Nvidia чувствуют себя уже немногим лучше, и HD 6870 с HD 6950 близки к результатам карты GTX 580 из другого рыночного сегмента, стоящей дороже. Интересно, что HD 5870 снова оказалась быстрее, чем HD 6970. Это подтверждает нашу теорию о том, что скорость в тесте ограничена математической производительностью и что тест чуть хуже подходит новой архитектуре компании AMD.

Есть ещё одно вероятное объяснение — синтетические тесты зачастую очень сильно грузят GPU параллельными расчётами и энергопотребление новых моделей в синтетике вполне может выходить за рамки выставленного ограничения. Следовательно, может снижаться и тактовая частота, а вместе с ней и результаты оказываются ниже, чем ожидалось. Впрочем, это предположение нужно проверять. Рассмотрим эти же тесты в модификации с предпочтением выборок из текстур математическим вычислениям:

Для решений Nvidia ситуация стала заметно печальнее, так как со скоростью текстурирования у последних чипов AMD, в отличие от конкурентов, всё очень хорошо, поэтому они лишь наращивают своё и без того неоспоримое преимущество. Даже самый-самый GTX 580 уступает тому же HD 6870 в обоих тестах с упором на текстурирование. Ну а наши новые герои из семейства HD 6900 оказались быстрейшими, HD 6950 даже выиграл у HD 5870, пусть и сущие копейки. А HD 6970 снова стал лидером, что вполне объяснимо теоретически, если посмотреть на производительность блоков TMU.

Всё это были устаревшие задачи, в основном с упором в текстурирование, а реже в филлрейт. Далее мы рассмотрим результаты ещё двух тестов пиксельных шейдеров — но уже версии 3.0, самых сложных из наших тестов пиксельных шейдеров для Direct3D 9 API. Они наиболее показательны с точки зрения современных игр на ПК, среди которых много мультиплатформенных. Тесты отличаются тем, что сильно нагружают и ALU, и текстурные модули, обе шейдерные программы сложны и длинны, и включают большое количество ветвлений:

  • Steep Parallax Mapping — значительно более «тяжелая» разновидность техники parallax mapping, также описанная в статье Современная терминология 3D-графики .
  • Fur — процедурный шейдер, визуализирующий мех.

В наших самых сложных DX9-тестах видеокарты производства Nvidia всегда выступают сильнее решений AMD, в противоположность всем предыдущим испытаниям. Такое положение связано с тем, что эти тесты не ограничены производительностью текстурных выборок, а зависят скорее от эффективности исполнения кода пиксельных шейдеров.

В тестах сложных пиксельных шейдеров версии 3.0 новые топовые видеокарты AMD всё же не смогли догнать конкурентов, хотя и заметно приблизились к ним. Скорость в обоих тестах PS 3.0 слабо зависит от ПСП и текстурирования, зато код отличается сложностью, с чем очень неплохо справляется новая архитектура Nvidia и… новая архитектура AMD. Пожалуй, это первый тест, где мы видим заметную положительную разницу между предыдущей и новейшей архитектурами компании AMD.

И последняя справляется с задачей явно лучше. Хотя даже HD 6970 с трудом конкурирует с GTX 570, но ведь о таком раньше мы вообще не помышляли. Решения Nvidia всегда были неоспоримыми лидерами в этой паре тестовых задач, и традиционно показывали результат намного сильнее. А видеокарты на новом графическом чипе Cayman смогли к ним приблизиться вплотную.

Direct3D 10: тесты пиксельных шейдеров PS 4.0 (текстурирование, циклы)

Во вторую версию RightMark3D вошли два знакомых теста PS 3.0 под Direct3D 9, которые были переписаны под DirectX 10, а также ещё два новых теста. В первую пару добавились возможности включения самозатенения и шейдерного суперсэмплинга, что дополнительно увеличивает нагрузку на видеочипы.

Данные тесты измеряют производительность выполнения пиксельных шейдеров с циклами при большом количестве текстурных выборок (в самом тяжелом режиме до нескольких сотен выборок на пиксель) и сравнительно небольшой загрузке ALU. Иными словами, в них измеряется скорость текстурных выборок и эффективность ветвлений в пиксельном шейдере.

Первым тестом пиксельных шейдеров будет Fur. При самых низких настройках в нём используется от 15 до 30 текстурных выборок из карты высот и две выборки из основной текстуры. Режим Effect detail — «High» увеличивает количество выборок до 40—80, включение «шейдерного» суперсэмплинга — до 60—120 выборок, а режим «High» совместно с SSAA отличается максимальной «тяжестью» — от 160 до 320 выборок из карты высот.

Проверим сначала режимы без включенного суперсэмплинга, они относительно просты, и соотношение результатов в режимах «Low» и «High» должно быть примерно одинаковым.

Производительность в этом тесте зависит от количества и эффективности блоков TMU, но в разных условиях по-разному. Результаты при детализации уровня «High» получаются примерно в полтора раза ниже, чем при «Low», как и должно быть по теории. В D3D10-тестах процедурной визуализации меха с большим количеством текстурных выборок решения Nvidia раньше были заметно сильнее, но последние решения AMD к ним подтянулись, что мы видели уже и ранее.

В варианте без суперсэмплинга большее влияние на производительность оказывает эффективный филлрейт (производительность ROP) и пропускная способность памяти. Поэтому решения Nvidia оказались впереди, и только представленный сегодня топовый Radeon HD 6970 почти догоняет младшую GTX 570. Модель ниже уровнем под именем HD 6950 показывает результат на уровне HD 5870, но примерно того же результата добилась и HD 6870. Это и неудивительно, потому что филлрейт у неё даже больше, чем у старших решений серии HD 6900.

Посмотрим на результат этого же теста, но с включенным «шейдерным» суперсэмплингом, увеличивающим работу в четыре раза: возможно, в такой ситуации что-то изменится, и ПСП с филлрейтом будут влиять меньше:

Как всегда, включение суперсэмплинга увеличивает теоретическую нагрузку в четыре раза, и результаты решений Nvidia заметно падают по сравнению с показателями видеокарт AMD. Теперь тройка моделей с близкими результатами (HD 6870, HD 5870 и HD 6950) опережает GTX 570, а старшее решение HD 6970 с успехом конкурирует с GTX 580. Разница между топовыми картами линеек HD 6000 и HD 5000 осталась примерно той же, новая модель выигрывает несколько процентов у предыдущей.

Второй шейдерный DX10-тест измеряет производительность исполнения сложных пиксельных шейдеров с циклами при большом количестве текстурных выборок и называется Steep Parallax Mapping. При низких настройках он использует от 10 до 50 текстурных выборок из карты высот и три выборки из основных текстур. При включении тяжелого режима с самозатенением число выборок возрастает в два раза, а суперсэмплинг увеличивает это число в четыре раза. Наиболее сложный тестовый режим с суперсэмплингом и самозатенением выбирает от 80 до 400 текстурных значений, то есть в восемь раз больше по сравнению с простым режимом. Проверяем сначала простые варианты без суперсэмплинга:

Второй пиксель-шейдерный тест Direct3D 10 несколько интереснее с практической точки зрения, так как разновидности parallax mapping широко применяются в играх, а тяжелые варианты, вроде нашего steep parallax mapping используются во многих проектах, например в играх Crysis и Lost Planet. Кроме того, в нашем тесте, помимо суперсэмплинга, можно включить самозатенение, увеличивающее нагрузку на видеочип примерно в два раза, такой режим называется «High».

Диаграмма во многом похожа на предыдущую (без SSAA), только позиции Nvidia несколько ослабли. В обновленном D3D10-варианте теста без суперсэмплинга HD 6970 становится на один уровень с GTX 570, что нормально для прямых конкурентов, а лидером остаётся топовая GTX 580. Остальные три видеокарты производства AMD показывают схожие результаты и отстают. Посмотрим, что изменит включение суперсэмплинга, он может вызвать сильное падение скорости на платах Nvidia.

При включении суперсэмплинга и самозатенения задача получается ещё более тяжёлой, совместное включение сразу двух опций увеличивает нагрузку на карты почти в восемь раз, вызывая большое падение производительности. Разница между скоростными показателями протестированных видеокарт изменилась, включение суперсэмплинга сказывается, как и в предыдущем случае — карты производства AMD немного улучшили свои показатели относительно решений Nvidia.

Теперь HD 6970 показывает результаты на уровне GTX 580, а примерно равные по скорости HD 6950 и HD 5870 становятся на одну ступеньку с GTX 570. И лишь более дешёвая HD 6870 немного отстаёт от этой видеокарты Nvidia. Сравнительные цифры в парах HD 6970 и HD 5870 снова повторились, разница в пользу более свежих моделей примерно такая же. По этим тестам можно сделать вывод — обе выпущенные сегодня карты семейства HD 6900 справились с «шейдерными» задачами очень хорошо, на уровне традиционно сильных в этих задачах конкурентов Nvidia.

Direct3D 10: тесты пиксельных шейдеров PS 4.0 (вычисления)

Следующая пара тестов пиксельных шейдеров содержит минимальное количество текстурных выборок для снижения влияния производительности блоков TMU. В них используется большое количество арифметических операций, и измеряют они именно математическую производительность видеочипов, скорость выполнения арифметических инструкций в пиксельном шейдере.

Первый математический тест — Mineral. Это тест сложного процедурного текстурирования, в котором используются лишь две выборки из текстурных данных и 65 инструкций типа sin и cos.

Результаты предельных математических тестов привычно соответствуют разнице в частотах и количестве исполнительных блоков, но с влиянием их эффективности. Современная архитектура AMD в таких случаях имеет большое преимущество перед конкурирующими видеокартами Nvidia, и это объясняет результаты тестов, в которых решения AMD явно оказываются значительно более производительными, хотя и не настолько, насколько велико их теоретическое преимущество.

Теоретически, GTX 580 должен быть чуть ли не вдвое медленнее HD 5870 и HD 6970. На практике же разница не доходит и до полутора раз. Конечно, это мало что меняет, ведь даже HD 6870 значительно быстрее обеих карт Nvidia в таких тестах, не говоря уже про топовые модели. В остальном, решения расположились примерно соответственно теории, за некоторыми исключениями.

К примеру, результаты сравнения нового и старого топовых семейств видеокарт AMD получились любопытными. Во-первых, HD 6870 показала идентичный HD 6950 результат в этом тесте при разнице в теоретических цифрах в пользу модели на базе Cayman. Во-вторых, то же самое можно сказать и про связку HD 6970 и HD 5870 — при схожих теоретических цифрах, в реальности с небольшим перевесом побеждает более старая, с потоковыми процессорами на основе архитектуры VLIW5.

И здесь снова есть несколько возможных объяснений — или AMD ещё не полностью оптимизировала драйверы для новых GPU, или архитектура Cayman менее эффективна в этом тесте (при этом вполне возможно, что она будет более эффективной в менее прямолинейных тестах), или повлияла технология PowerTune, или в этом тесте начало сказываться и ограничение пропускной способностью видеопамяти.

Рассмотрим второй тест шейдерных вычислений, который носит название Fire. Он тяжелее для ALU, и текстурная выборка в нём только одна, а количество инструкций типа sin и cos увеличено вдвое, до 130. Посмотрим, что изменилось при увеличении нагрузки:

В этот раз все GPU остались примерно на тех же позициях, кроме относительной производительности Cayman и Cypress/Barts. Теперь в этих парах уже всё в строгом соответствии с теоретическими цифрами пиковой производительности, а HD 6970 даже немного обгоняет HD 5870, то есть в этом случае новая архитектура сработала эффективнее. И в паре HD 6950 и HD 6870 теперь такая разница в пользу топового решения, какая и должна быть.

В остальном — ничего нового. Так как скорость рендеринга тут ограничена исключительно производительностью шейдерных блоков, то HD 6970 и HD 5870 являются лидерами, за ними следуют остальные видеокарты AMD, а обе Geforce уступают в том числе и младшей модели из другого ценового диапазона. Хотя преимущество решений AMD всё равно остаётся несколько ниже, чем при сравнении теоретических цифр — это говорит о том, что КПД суперскалярных процессоров VLIW5 и VLIW4 ниже 100%.

Direct3D 10: тесты геометрических шейдеров

В пакете RightMark3D 2.0 есть два теста скорости геометрических шейдеров, первый вариант носит название «Galaxy», техника аналогична «point sprites» из предыдущих версий Direct3D. В нем анимируется система частиц на GPU, геометрический шейдер из каждой точки создает четыре вершины, образующие частицу. Аналогичные алгоритмы должны получить широкое использование в будущих играх под DirectX 10.

Изменение балансировки в тестах геометрических шейдеров не влияет на конечный результат рендеринга, итоговая картинка всегда абсолютно одинакова, изменяются лишь способы обработки сцены. Параметр «GS load» определяет, в каком из шейдеров производятся вычисления — в вершинном или геометрическом. Количество вычислений всегда одинаково.

Рассмотрим первый вариант теста «Galaxy», с вычислениями в вершинном шейдере, для трёх уровней геометрической сложности:

Соотношение скоростей при разной геометрической сложности сцен примерно одинаково для всех решений, производительность соответствует количеству точек, с каждым шагом падение FPS составляет около двух раз. Задача для современных видеокарт не особенно сложная, производительность в целом ограничена не только скоростью обработки геометрии, но и пропускной способностью памяти или филлрейтом в определённой мере (в рамках одного производителя).

Увы, хотя мы видели ранее рост геометрической производительности решений на Barts в этом тесте, в этот раз видеокарты нового семейства оказались примерно на том же уровне, что и Radeon HD 5870 предыдущего поколения. Возможно, виновато ограничение производительности ПСП видеопамяти, но ведь HD 6870 весьма силён в этом тесте и обогнал даже HD 6950. Так что скорее всего виноват эффективный филлрейт, то есть производительность ROP.

В любом случае, всем решениям AMD очень далеко до топовых видеокарт Nvidia, и хотя выполнение геометрических шейдеров может и стало более эффективным, но этого явно недостаточно. Основанные на GF110 видеокарты Nvidia справляются с работой почти вдвое быстрее всех видеокарт конкурента. Посмотрим, как изменится ситуация при переносе части вычислений в геометрический шейдер:

При изменении нагрузки в этом тесте цифры почти не изменились ни для решений Nvidia, ни для AMD. Новые видеокарты семейства HD 6900 в данном тесте слабо реагируют на изменения параметра GS load, отвечающего за перенос части вычислений в геометрический шейдер, как и остальные решения, но всё же показывают результаты чуть выше, чем на предыдущей диаграмме. Посмотрим, что изменится в следующем тесте, который предполагает большую нагрузку именно на геометрические шейдеры.

«Hyperlight» — это второй тест геометрических шейдеров, демонстрирующий использование сразу нескольких техник: instancing, stream output, buffer load. В нем используется динамическое создание геометрии при помощи отрисовки в два буфера, а также новая возможность Direct3D 10 — stream output. Первый шейдер генерирует направление лучей, скорость и направление их роста, эти данные помещаются в буфер, который используется вторым шейдером для отрисовки. По каждой точке луча строятся 14 вершин по кругу, всего до миллиона выходных точек.

Новый тип шейдерных программ используется для генерации «лучей», а с параметром «GS load», выставленным в «Heavy» — ещё и для их отрисовки. То есть в режиме «Balanced» геометрические шейдеры используются только для создания и «роста» лучей, вывод осуществляется при помощи «instancing», а в режиме «Heavy» выводом также занимается геометрический шейдер. Сначала рассматриваем лёгкий режим:

Относительные результаты в разных режимах снова примерно соответствуют изменению нагрузки: во всех случаях производительность неплохо масштабируется и близка к теоретическим параметрам, по которым каждый следующий уровень «Polygon count» должен быть менее чем в два раза медленней.

В этом тесте скорость рендеринга должна быть ограничена геометрической производительностью, но обрабатываемых примитивов явно недостаточно, чтобы новая архитектура компании AMD показала значительно более высокий результат, хотя и есть небольшая разница, которая объясняется архитектурными изменениями в GPU.

Видеокарты Nvidia всё так же остаются лидерами теста, но тот же Radeon HD 6970 уже почти догнал младшую модель GTX 570. А HD 6950 обгоняет HD 5870, пусть и не слишком сильно. И эти неплохие результаты явственно говорят о наличии оптимизаций по обработке геометрических данных в новых чипах.

Цифры должны измениться на следующей диаграмме, в тесте с более активным использованием геометрических шейдеров. Также будет интересно сравнить друг с другом результаты, полученные в режимах «Balanced» и «Heavy».

А вот в этом тесте разница между чипами AMD с традиционным графическим конвейером (в т. ч. и Cayman с его двумя растеризаторами) и чипами с архитектурой Fermi заметна сразу. Хотя мы знаем по предыдущим исследованиям, что младшие чипы Nvidia по скорости исполнения геометрических шейдеров отстают, показывая не такие впечатляющие результаты, так как их возможности по геометрической обработке урезаны. Зато результаты GTX 570 и GTX 580, имеющих в основе чип GF110, очень хороши и почти вдвое выше, чем у лучшего из решений компании AMD.

И это решение — новенький Radeon HD 6970. Возможности нового топового чипа по обработке геометрии и скорости исполнения геометрических шейдеров явно выросли по сравнению с другими видеокартами компании. И новые решения на Cayman показывают в этих тестах результаты выше, чем решения на базе Cypress и Barts, хотя и далеко не втрое, и даже не вдвое. Вероятно, инженерам AMD ещё предстоит решать задачу распараллеливания работы блоков установки треугольников (geometry setup), в которую могут упираться эти тесты.

Direct3D 10: скорость выборки текстур из вершинных шейдеров

В тестах «Vertex Texture Fetch» измеряется скорость большого количества текстурных выборок из вершинного шейдера. Тесты схожи по сути, так что соотношение между результатами карт в тестах «Earth» и «Waves» должно быть примерно одинаковым. В обоих тестах используется displacement mapping на основании данных текстурных выборок, единственное существенное отличие состоит в том, что в тесте «Waves» используются условные переходы, а в «Earth» — нет.

Рассмотрим первый тест «Earth», сначала в режиме «Effect detail Low»:

Предыдущие исследования показали, что на результаты этого теста влияет и скорость текстурирования и пропускная способность памяти. Это хорошо видно по сравнительным результатам Radeon HD 5870 и HD 6950, да и прочих решений AMD. Похоже, что именно ПСП и ограничивает их производительность в тесте, поэтому и разница между всеми решениями не так уж велика.

Тем не менее, очень хорошие результаты показывает HD 6970 на новом GPU — он почти достаёт GTX 570, с которым и придётся конкурировать этой модели в реальном мире. Ну и лидером остаётся самая дорогая и производительная GTX 580. Обе карты семейства HD 6900 показали себя неплохо, младшая новая модель идёт почти наравне с предыдущей топовой. Посмотрим на производительность в этом же тесте с увеличенным количеством текстурных выборок:

Взаимное расположение карт на диаграмме заметно изменилось, особенно в тяжёлом режиме. Хотя видеокарты Nvidia почему-то потеряли в производительности именно в наиболее лёгких условиях. Как раз при малом количестве полигонов скорость упирается в ПСП и в этом случае новые платы AMD почти догнали топовые решения конкурента.

А вот в тяжёлых режимах разница в пользу Nvidia выросла до полуторакратной, там GTX 580 и GTX 570 остаются недосягаемыми для соперников. Старшая видеокарта семейства HD 6900 обгоняет остальные решения AMD, хотя это снова слабо заметно при сравнении с HD 5870. Можно было бы сказать о влиянии ПСП, но ведь конкурента-то это не останавливает…

Рассмотрим результаты второго теста текстурных выборок из вершинных шейдеров. Тест «Waves» отличается меньшим количеством выборок, зато в нём используются условные переходы. Количество билинейных текстурных выборок в данном случае до 14 («Effect detail Low») или до 24 («Effect detail High») на каждую вершину. Сложность геометрии изменяется аналогично предыдущему тесту.

Любопытно, что результаты во втором тесте вершинного текстурирования «Waves» совсем не похожи на то, что мы видели на предыдущих диаграммах. В этом тесте все видеокарты AMD и Nvidia показывают очень близкие результаты, что также можно списать на ограничение пропускной способностью видеопамяти. Этот показатель у всех представленных видеокарт находится в районе 130—190 ГБ/с, и разброс невелик. Лучшей среди видеокарт AMD снова стала свежая модель Radeon HD 6970. Рассмотрим второй вариант этого же теста:

И снова произошли изменения, аналогичные тем, что мы видели ранее — видеокарты Nvidia «просели» только в лёгком режиме, а AMD во всех трёх. И поэтому в режиме с малым количеством полигонов разница между решениями небольшая, а вот в среднем и тяжёлом GTX 580 и GTX 570 заметно опережают все модели Radeon, в том числе и из анонсированного сегодня семейства HD 6900. По сравнению с Cypress новый GPU показывает результат примерно на том же уровне, и мы делаем вывод, что в тестах вершинных выборок никаких заметных изменений при переходе от Cypress к Cayman нет.

3DMark Vantage: тесты Feature

Синтетические тесты из пакета 3DMark Vantage могут показать нам что-то, что мы ранее упустили. Тесты Feature этого тестового пакета обладают поддержкой DirectX 10 и интересны уже тем, что отличаются от наших. При анализе результатов новых видеокарт в этом пакете мы сможем сделать какие-то новые и полезные выводы, ускользнувшие от нас в тестах семейства RightMark. К сожалению, ещё более новый тестовый пакет компании — 3DMark11 — не содержит специализированных синтетических тестов и нам в данном случае совсем неинтересен.

Feature Test 1: Texture Fill

Первый тест — тест скорости текстурных выборок. Используется заполнение прямоугольника значениями, считываемыми из маленькой текстуры с использованием многочисленных текстурных координат, которые изменяются каждый кадр.

Хотя текстурный тест компании Futuremark также не показывает теоретически возможного уровня скорости текстурных выборок, но всё же эффективность новых видеокарт семейства Radeon HD 6900 в нём несколько выше, чем в нашем. Да и решения Nvidia также более эффективно используют имеющиеся текстурные блоки. Поэтому в данном текстурном тесте получается несколько иное соотношение результатов по сравнению с нашим.

Видеокарты нового семейства компании AMD показывают результаты, полностью соответствующие теоретическим параметрам. HD 6950 немного быстрее, чем HD 5870, а модель HD 6970 является явным лидером теста. Наглядно видно, что текстурная производительность Cayman заметно выросла по сравнению с Cypress. А вот HD 6870 на основе чипа Barts показывает худший результат, аналогичный цифрам топовой видеокарты Nvidia. Ну а GTX 570 проигрывает в текстурировании вообще всем, как и в нашем тесте.

Feature Test 2: Color Fill

Это тест скорости заполнения. Используется очень простой пиксельный шейдер, не ограничивающий производительность. Интерполированное значение цвета записывается во внеэкранный буфер (render target) с использованием альфа-блендинга. Используется 16-битный внеэкранный буфер формата FP16, наиболее часто используемый в играх, применяющих HDR-рендеринг, поэтому такой тест является вполне своевременным.

Совсем иная ситуация в тесте производительности блоков ROP. Цифры этого подтеста 3DMark Vantage показывают производительность блоков ROP, почти без влияния величины пропускной способности видеопамяти. Модель HD 6970 показывает отличный результат, почти догоняя топовую GTX 580 и опережая своего конкурента GTX 570.

В свою очередь, HD 6950 также оказывается не только впереди своего конкурента GTX 570, а обогнала ещё и предшественницу — HD 5870. Отмечаем несколько бо́льшую эффективность блоков ROP и более высокую скорость заполнения у новых моделей видеокарт компании AMD по сравнению со старыми чипами.

Feature Test 3: Parallax Occlusion Mapping

Один из самых интересных feature-тестов, так как подобная техника уже используется в играх. В нём рисуется один четырехугольник (точнее, два треугольника) с применением специальной техники Parallax Occlusion Mapping, имитирующей сложную геометрию. Используются довольно ресурсоёмкие операции по трассировке лучей и карта глубины большого разрешения. Также эта поверхность затеняется при помощи тяжёлого алгоритма Strauss. Это тест очень сложного и тяжелого для видеочипа пиксельного шейдера, содержащего многочисленные текстурные выборки при трассировке лучей, динамические ветвления и сложные расчёты освещения по Strauss.

Этот тест отличается от других подобных тем, что результаты в нём зависят не исключительно от скорости математических вычислений или эффективности исполнения ветвлений или скорости текстурных выборок, а от всего понемногу. И для достижения высокой скорости важен баланс блоков GPU. Влияет на скорость и эффективность выполнения ветвлений в шейдерах.

Сравнительные результаты видеокарт AMD на диаграмме весьма похожи на то, что мы видели в тесте текстурной производительности из 3DMark Vantage. А вот платы Nvidia в данном случае получили небольшое увеличение производительности, что говорит о том, что не только текстурная производительность влияет на результаты теста.

Новые модели AMD вновь серьёзно заявили о себе, обогнав свою предшественницу в лице HD 5870. А вот HD 6870 из другого ценового сектора показала заметно более слабый результат, став аутсайдером этого теста (что вполне сглаживается её низкой ценой). Что касается сравнения Cayman с конкурирующими решениями Nvidia, то обе новые видеокарты семейства HD 6900 опередили даже топовую модель линейки Geforce GTX 500.

Feature Test 4: GPU Cloth

Тест интересен тем, что рассчитывает физические взаимодействия (имитация ткани) при помощи видеочипа. Используется вершинная симуляция, при помощи комбинированной работы вершинного и геометрического шейдеров, с несколькими проходами. Используется stream out для переноса вершин из одного прохода симуляции к другому. Таким образом, тестируется производительность исполнения вершинных и геометрических шейдеров и скорость stream out.

Скорость рендеринга в этом тесте зависит от многих параметров, но основными являются производительность обработки геометрии и эффективность выполнения геометрических шейдеров. Логично, что видеокарты производства Nvidia чувствуют себя в этом приложении как рыба в воде, и значительно опережают конкурентов, в том числе и представленные сегодня топовые модели.

Это один из немногих тестов без тесселяции, в которых видно преимущество у представленных недавно видеокарт новой серии Radeon HD 6800 и сегодняшних героев HD 6900. Скорость рендеринга всех этих моделей в данном тесте выше, чем у топовой модели предыдущей линейки. Это объясняется тем, что и в Barts, и в Cayman увеличили скорость обработки геометрии и выполнения геометрических шейдеров. И хотя даже HD 6970 продолжает серьёзно отставать от GTX 570, новая модель всё же значительно улучшила позиции компании AMD в этом тесте.

Feature Test 5: GPU Particles

Тест физической симуляции эффектов на базе систем частиц, рассчитываемых при помощи видеочипа. Также используется вершинная симуляция, каждая вершина представляет одиночную частицу. Stream out используется с той же целью, что и в предыдущем тесте. Рассчитывается несколько сотен тысяч частиц, все анимируются отдельно, также рассчитываются их столкновения с картой высот.

Аналогично одному из тестов нашего RightMark3D 2.0, частицы отрисовываются при помощи геометрического шейдера, который из каждой точки создает четыре вершины, образующих частицу. Но тест больше всего загружает шейдерные блоки вершинными расчётами, также тестируется stream out.

Результаты очередного теста из пакета 3DMark Vantage похожи на те, что мы видели на предыдущей диаграмме, но в нём скорость обработки геометрии ещё важнее. Именно поэтому прошлое поколение в виде карты Radeon HD 5870 отстало как от обеих моделей Geforce, являющихся неоспоримыми лидерами сравнения, так и от всех новых моделей видеокарт AMD, семейств HD 6900 и HD 6800. А все платы, основанные на Cayman и Barts, показали более высокие результаты, чем единственное решение на Cypress, уступив только сильным конкурентам.

Похоже, что в синтетических тестах имитации тканей и частиц из тестового пакета 3DMark Vantage, в которых активно используются геометрические шейдеры, снова нет значительного влияния распараллеленной обработки геометрии на Cayman, так как Barts показал близкий результат. Поэтому и оба решения линейки HD 6900 продолжают отставать от конкурирующих видеокарт соперника, имеющих отличную скорость обработки геометрии — до двух раз выше. От топового решения компании AMD, основанного на новой архитектуре с двумя блоками обработки геометрии, мы всё же ожидали несколько большего прогресса.

Feature Test 6: Perlin Noise

Последний feature-тест пакета Vantage является математически-интенсивным тестом видеочипа, он рассчитывает несколько октав алгоритма Perlin noise в пиксельном шейдере. Каждый цветовой канал использует собственную функцию шума для большей нагрузки на видеочип. Perlin noise — это стандартный алгоритм, часто применяемый в процедурном текстурировании, он использует очень много математических расчётов.

В чисто математическом тесте из пакета компании Futuremark, показывающем пиковую производительность видеочипов в предельных задачах, мы увидели ещё более интересную картину, чем в аналогичных тестах из нашего тестового пакета. Показанная на диаграмме производительность решений лишь примерно соответствует тому, что должно получаться по теории и несколько расходится с тем, что мы видели ранее в математических тестах из пакета RightMark 2.0.

Даже по теоретическим характеристикам новых моделей HD 6970 и HD 6950 было понятно, что они не усилили пиковую производительность математических вычислений по сравнению с HD 5870. Но всё же и явного отставания мы не ждали. Да, своих конкурентов из Nvidia обе платы обогнали с огромным запасом, но мы к этому привыкли, ведь видеокарты Geforce показывают не очень высокие результаты в таких случаях; простая и интенсивная математика выполняется на Radeon значительно быстрее.

Неожиданно то, что новая старшая модель проиграла 7% предыдущей топовой, хотя теоретически должна уступать не более 1%. Тут снова можно начинать гадать о том, что послужило причиной этого проигрыша своему же предшественнику. То ли в этом виноват недостаток оптимизации драйверов для новых решений, то ли меньшая эффективность архитектуры VLIW4 в таких тестах, то ли слишком умная система управления питанием на новых моделях, «зарезавшая» тактовую частоту и производительность решений при достижении установленного порога энергопотребления.

Direct3D 11: Вычислительные шейдеры

Чтобы протестировать новые решения компании AMD в задачах, использующих такие новые возможности DirectX 11, как тесселяция и вычислительные шейдеры, мы воспользовались примерами из пакетов для разработчиков (SDK) и демонстрационными программами компаний Microsoft, Nvidia и AMD.

Сначала рассмотрим тесты, использующие вычислительные (Compute) шейдеры. Их появление — одно из наиболее важных нововведений в последних версиях DX API, они уже используются в современных играх для выполнения различных задач: постобработки, симуляций и т. п. В первом тесте показан пример HDR-рендеринга с tone mapping из DirectX SDK, с постобработкой, использующей пиксельные и вычислительные шейдеры.

Возможно, пример для вычислительных шейдеров не самый удачный, но их пока вообще мало. Все видеокарты показывают близкие результаты в этом тесте, но побеждает всё-таки топовая модель Geforce GTX 580. Анонсированные сегодня платы на новом чипе Cayman уступают ей совсем немного, и только при использовании пиксельного шейдера. Прямой конкурент новых решений компании AMD — видеокарта GTX 570 — отстаёт от них в обоих режимах: и с использованием пиксельного, и с использованием вычислительного шейдеров.

Второй тест вычислительных шейдеров также взят из Microsoft DirectX SDK, в нём показана расчётная задача гравитации N тел (N-body) — симуляция динамической системы частиц, на которую воздействуют физические силы, такие как гравитация.

А вот более интересные результаты, для решений AMD чем-то похожие на цифры из математического теста 3DMark Vantage. Несмотря на большое теоретическое превосходство в пиковых цифрах, быстрейшая видеокарта Radeon HD 5870 лишь немного опережает лучшее решение Nvidia. А обе новые модели семейства HD 6900 показывают результаты, близкие к показателям своего прямого конкурента — Geforce GTX 570.

Но нас сегодня больше интересует разница между результатами решений на Cayman и Cypress, и тут мы снова видим, как побеждает старая видеокарта, да с каким преимуществом! 17% между HD 5870 и HD 6970 в пользу первой — в очередной раз математические тесты обнажают разницу между красивой теорией и жестокой практикой. Ну где же те применения, в которых новый GPU сможет показать свою силу? Возможно, в тестах тесселяции всё встанет наконец на свои места.

Direct3D 11: Производительность тесселяции

Вычислительные шейдеры очень важны, но главным нововведением в Direct3D 11 всё же считается аппаратная тесселяция. Мы очень подробно рассматривали её в своей теоретической статье про Nvidia GF100. Тесселяцию уже довольно давно начали использовать в DX11-играх, таких как STALKER: Зов Припяти, DiRT 2, Aliens vs Predator, Metro 2033, Civilization V и других. В некоторых из них тесселяция используется для моделей персонажей (все игры жанра FPS из перечисленных), в других — для имитации реалистичной водной поверхности (DiRT 2) или ландшафта (Civilization V).

Существует несколько различных схем разбиения графических примитивов (тесселяции). Например, phong tessellation, PN triangles, Catmull-Clark subdivision. Схема разбиения PN Triangles используется в STALKER: Зов Припяти, а в Metro 2033 — Phong tessellation. Эти методы сравнительно быстро и просто внедряются в процесс разработки игр и существующие движки, поэтому и стали популярными.

Первым тестом тесселяции будет пример Detail Tessellation из ATI Radeon SDK. Он показывает не только тесселяцию, но и две разные техники попиксельной обработки: простое наложение карт нормалей и parallax occlusion mapping. Что ж, сравним DX11-решения AMD и Nvidia в различных условиях:

Рассмотрим сначала попиксельные техники. Parallax occlusion mapping (средние столбики на диаграмме) на видеокартах обоих производителей выполняется гораздо менее эффективно, чем тесселяция (нижние столбики), а умеренная тесселяция не даёт большого падения производительности — сравните верхние и нижние столбцы. То есть качественная имитация геометрии при помощи пиксельных расчётов обеспечивает даже меньшую производительность, чем оттесселированная геометрия с displacement mapping.

Что касается производительности видеокарт относительно друг друга, то тут самый важный вывод в том, что видеокарты AMD немного быстрее плат Nvidia в самом лёгком режиме, но медленнее в сложных попиксельных расчётах (вспоминаем тесты parallax mapping ранее). А до выхода плат на Cayman карты Geforce были чуть-чуть быстрее решений AMD и при включенной тесселяции.

Но теперь разница по скорости обработки геометрии между HD 6900 и HD 5870 хорошо видна — новые платы на базе Cayman в подтесте с тесселяцией оказались заметно быстрее Cypress. В этом тесте с небольшим коэффициентом разбиения треугольников HD 6970 даже обогнала своего конкурента GTX 570 с хорошим запасом.

Вторым тестом производительности тесселяции будет ещё один пример для 3D-разработчиков из ATI Radeon SDK — PN Triangles. Собственно, оба примера входят также и в состав DX SDK, так что мы уверены, что на их основе создают свой код игровые разработчики. Этот пример мы протестировали с различным коэффициентом разбиения (tessellation factor), чтобы понять, как сильно влияет его изменение на общую производительность.

Лишь в этом примере мы впервые видим по-настоящему полное сравнение геометрической мощи решений AMD и Nvidia. Очень сильно выделяется как графическая архитектура Fermi, так и новый GPU производства AMD под именем Cayman. Отбросим в сторону то, что это чисто синтетический тест и такие экстремальные коэффициенты разбиения не будут использоваться в играх сегодняшнего дня, нам сейчас интересен потенциал. Синтетика ведь и нужна для того, чтобы оценить перспективность и отличия разных решений.

Сразу видно, что с видеокартами Nvidia Geforce на чипе GF110 конкурировать невозможно, в задачах экстремальной тесселяции они в разы быстрее даже обновленной архитектуры AMD. Но это архитектура, специально разработанная изначально с учётом возможностей нового API. А что же с Cayman? По сравнению с Cypress всё очень хорошо!

Новые модели компании AMD в режимах средней нагрузки показывают впечатляющий прирост в скорости, и разница по сравнению с HD 5870 достигает более чем двукратной. Однако такой прирост мы видим не всегда, а чаще всего он укладывается в полуторакратный. Обещанной трёхкратной разницы мы, по крайней мере, точно не увидели. То есть, Cayman хотя и сократил отставание от конкурента в задачах обработки геометрии, но до распараллеленной работы 16 блоков тесселяции в GF110 всё ещё очень далеко.

С другой стороны — наибольшая разница между решениями разных компаний достигается в условиях экстремальной тесселяции, которых нет и пока что не ожидается в реальных играх. Поэтому скорее всего Cayman заметно укрепит позиции компании AMD в существующих игровых бенчмарках с применением тесселяции. Особенно если коэффициент разбиения будет не слишком большим, как в тестах 3DMark11.

Давайте рассмотрим ещё один тест — демонстрационную программу Nvidia Realistic Water Terrain, также известную как Island. В этой демке используется тесселяция и карты смещения (displacement mapping) для рендеринга реалистично выглядящей поверхности океана и ландшафта. Смотрится она просто замечательно, вот чего не хватает в нынешних играх:

Island не является чисто синтетическим тестом для измерения геометрической производительности, он содержит и сложные пиксельные и вычислительные шейдеры, поэтому разница в производительности может быть меньше, чем в предыдущем случае, зато такая нагрузка ближе к реальным играм, в которых используются сразу все блоки GPU.

Мы протестировали программу при четырёх разных коэффициентах тесселяции, эта настройка называется Dynamic Tessellation LOD. Если при самом низком коэффициенте разбиения впереди оказываются видеокарты компании AMD, то при усложнении работы платы на основе GF110 сразу вырываются далеко вперёд. При росте коэффициента разбиения и сложности сцены производительность всех Radeon падает очень сильно, в отличие от скорости конкурирующих решений.

Причём в этот раз HD 5870 почему-то даже опережает обе модели нового семейства. То есть налицо обратная теории разница в задаче со сложной геометрией. И объяснение этому может быть только одно — недостаток оптимизации драйверов для новой архитектуры, ведь в предыдущих тестах мы видели её явное преимущество над Radeon HD 5870, основанном на чипе Cypress. Ну а в этом тесте мы пока что вынуждены констатировать разгром Cayman — при максимальном коэффициенте LOD разница между скоростью Geforce и Radeon достигла 4—6 раз!

Выводы по синтетическим тестам

По результатам проведённых синтетических тестов видеокарт из нового семейства Radeon HD 6900, основанных на графическом процессоре Cayman, а также результатам других моделей видеокарт производства обоих производителей дискретных видеочипов, можно сделать вывод о том, что новинки — неплохая замена линейке Radeon HD 5800, хотя и не слишком сильно отличающаяся от неё по производительности, по крайней мере в синтетических тестах.

Графический процессор Cayman выполнен на основе новой архитектуры и отличается от предыдущих чипов аппаратно, хотя количество некоторых исполнительных блоков в нём не выросло. Зато новый GPU отличается архитектурными улучшениями, направленными на увеличение эффективности вычислений на GPU (таких тестов у нас считайте что и нет) и, что ещё более важно, смягчение важного отставания от конкурента в виде производительности обработки геометрии. Многие из синтетических тестов показывают, что скорость тесселяции и выполнения геометрических шейдеров заметно выросла, пусть и не всегда в несколько раз, как нам было обещано.

Благодаря архитектурным изменениям и своим частотным характеристикам, результаты видеокарт новой серии во многих синтетических тестах являются конкурентоспособными для своего ценового сектора, особенно по сравнению с прямым конкурентом Geforce GTX 570. Ещё более хорошо это видно в вычислительных тестах из пакетов RightMark и Vantage. Да и в остальных приложениях решения семейства HD 6900 показали неплохую скорость, чаще всего уступающую только топовой видеокарте Nvidia.

К сожалению, не обошлось и без не очень приятных сюрпризов. Несмотря на бо́льшую сложность и площадь чипа по сравнению с Cypress, результаты моделей HD 6900 в некоторых математических тестах были ниже, чем у HD 5870, что довольно непросто объяснить, и мы пока не уверены в причинах такого отставания. Возможно, виноват недостаток оптимизации драйверов, а может быть эффективность новой архитектуры VLIW4 в наших тестах оказалась ниже. Вполне вероятно и то, что система управления питанием на новых моделях понижала тактовые частоты при достижении максимального энергопотребления в требовательных синтетических тестах, не позволяя им показать ожидаемую, исходя из числа блоков и их тактовой частоты, производительность.

Наверняка многие ожидали, что Radeon HD 6970 сможет на равных соперничать с GTX 580 во всех тестах, но этого не произошло, хотя результаты были показаны очень неплохие и вполне соответствующие рекомендованным ценам на анонсированные сегодня модели. Предполагаем, что результаты Radeon HD 6970 и HD 6950 в синтетических тестах будут подтверждены и соответствующими цифрами в «игровой» части нашего материала. В играх старшая HD 6970 должна будет выступить примерно на уровне GTX 570, в некоторых тестах чуть медленнее, а в других — быстрее, а HD 6950 хоть и окажется медленнее этой модели Nvidia, но ведь и цена на эту видеокарту установлена ниже. Так давайте же скорее перейдём к исследованию скорости в играх!

Общие характеристики

Тип видеокарты

Современные видеоадаптеры можно условно разбить на три класса, которые будут определять производительность и стоимость видеокарты: бюджетные, бизнес-класс и топовые модели. Бюджетные карты не сильно бьют по карману, но не позволят играть в современные, требовательные к ресурсам игры. Модели бизнес-класса позволят играть во все современные игры, но с ограничением по разрешению изображения, частоте кадров и другим параметрам. Топовые модели дают вам возможность играть в самые передовые игры с максимальным качеством.

игровая Графический процессор ATI Radeon HD 6970 Интерфейс

Тип слота, в который устанавливается видеокарта. Через слот происходит обмен данными между видеокартой и материнской платой. При выборе видеокарты необходимо исходить из того, какой слот используется в вашей материнской плате. Наиболее распространены два типа подключения видеокарт - AGP, PCI-E 16x и PCI-E 1x.Словарь терминов по категории Видеокарты

PCI-E 16x 2.1 Кодовое название графического процессора Cayman XT Техпроцесс 40 нм Количество поддерживаемых мониторов 6 Максимальное разрешение 2560x1600

Технические характеристики

Частота графического процессора

Частота графического процессора во многом определяет производительность видеосистемы. Однако при повышении частоты работы процессора увеличивается и его тепловыделение. Поэтому для современных высокопроизводительных видеосистем приходится устанавливать мощную систему охлаждения, которая занимает дополнительное место и зачастую создает сильный шум при работе.Словарь терминов по категории Видеокарты

890 МГц Объем видеопамяти 2048 МБ Тип видеопамяти GDDR5 Частота видеопамяти 5500 МГц Разрядность шины видеопамяти 256 бит Частота RAMDAC 400 МГц Поддержка режима SLI/CrossFire

Технологии SLI от NVIDIA и CrossFire от ATI позволяют объединить вычислительную мощность двух видеокарт, установленных на одной материнской плате. Одновременное использование двух видеокарт может быть интересно в тех случаях, когда необходимо получить суперпроизводительную видеосистему, превосходящую по быстроте все существующие одиночные видеокарты.Словарь терминов по категории Видеокарты

есть Поддержка CrossFire X есть

Подключение

Разъемы поддержка HDCP, DisplayPort x4

Математический блок

Число универсальных процессоров 1536 Версия шейдеров

Шейдеры - это микропрограммы, которые позволяют воспроизводить такие эффекты как, например, металлический блеск, поверхность воды, реалистичный объемный туман, всевозможные деформации объектов, эффект motion blur (размытие при движении) и т. д. Чем выше версия шейдеров, тем больше у видеокарты возможностей по созданию специальных эффектов.Словарь терминов по категории Видеокарты

5.0 Число текстурных блоков 96 Число блоков растеризации 32 Максимальная степень анизотропной фильтрации

Технические характеристики

Ядро: Cayman * Количество транзисторов: 2,64 млрд * Техпроцесс: 40-нм * Количество потоковых процессоров: 1408 шт. * Частота графического ядра: 800 МГц * Частота потоковых процессоров: 800 МГц * Тип, объем памяти: GDDR5, 2 Гб * Частота памяти: 5000 МГц * Шина данных: 256 бит * Количество текстурных блоков: 88 шт. * Количество блоков растеризации: 32 шт. * Энергопотребление: 200 Вт * Интерфейс: PCIe 2.0 x16 * Цена на март 2011 года: 10 000 рублей

В февральском номере мы основательно протестировали новую видеокарту от AMD , Radeon HD 6970 , и пришли к неутешительному выводу, что по сравнению с гораздо более дешевой Radeon HD 5870 она чуть быстрее в DX11-приложениях, но не более того. Другое творение компании, выпущенное в тот же день, дошло до нашей лаборатории только сейчас. Чем порадует Radeon HD 6950 , младшая сестричка одночипового флагмана компании?

Минимум изменений

Сдерживать потенциал Radeon HD 6950 инженеры AMD решили проверенным способом: отключением части функциональных блоков графического ядра и снижением рабочих частот. Из 24 SIMD-ядер отрезали два, так что чип лишился 128 потоковых процессоров и 8 текстурных блоков. Впрочем, оставшийся арсенал все равно впечатляет: видеокарта насчитывает 1408 потоковых процессоров и 88 ROP — этого должно хватить для любой современной игры. Подсистему памяти резать не стали: шина у устройства по-прежнему 256-битная, а объем распаянной GDDR5 равен 2 Гб. Сами чипы, правда, используются менее качественные, так что их рабочая частота составляет 5000 МГц против 5500 МГц у старшей модели. Заметим, что многие производители уже анонсировали удешевленные версии Radeon HD 6950 с 1 Гб памяти.

Обычно AMD наделяет видеокарты на базе одного чипа разным дизайном, однако в случае с HD 6950/6970 это не так. Внешне адаптеры абсолютно идентичны - одна длина, один дизайн кожуха системы охлаждения. Единственное различие кроется в разъемах питания: младшенькая плата довольствуется двумя 6-pin PCIe, поскольку ее максимальное энергопотребление не превышает 200 Вт, а вот HD 6970 с ее TPD в 250 Вт оснащена 6-контактным и 8-контактным разъемами. Как показывает практика, делать это разграничение было не обязательно: платам HD 6950, превращенным в HD 6970 путем перепрошивки BIOS, питания вполне хватает. Под кожухом СО можно узреть уже знакомый нам кулер на основе испарительной камеры. Дизайн печатной платы у обеих видеокарт также идентичен.

В собственной нише

Слайды с презентации Radeon HD 6950 говорят о том, что этот адаптер должен создать на рынке собственную нишу и конкурировать с какой-либо видеокартой напрямую в его обязанности не входит. В сущности, так и есть: рекомендованная цена новинки составляет $280, а в этом сегменте сегодня других актуальных решений нет.

Для сравнения с нашей ASUS EAH 6950 мы взяли четыре видеокарты - Radeon HD 6970 , HD 6870 , HD 5870 и GeForce GTX 470 . Первые две модели - это соседи испытуемой платы в иерархической лестнице AMD. Старая HD 5870 попала в список из-за сопоставимой розничной цены. Ну а GeForce GTX 470 - это плата NVIDIA, наиболее близкая по цене к HD 6950 (правда, разница все равно очень велика).

Что в итоге? Отставание новичка от Radeon HD 6970 колеблется в диапазоне от 5 до 12 процентов в зависимости от теста. При большой разнице в цене такой результат HD 6950 можно считать отличным. Отрыв Radeon HD 6950 от недавней HD 6870 составляет все те же 5-12 процентов в DX10-бенчмарках, но с рендерингом под DirectX 11 свежая Radeon HD 6950 справляется куда лучше - спасибо новеньким движкам тесселяции. А вот Radeon HD 5870 уже устарела и в тестах уступает Radeon HD 6950. Представительница зеленого лагеря, GeForce GTX 470, проиграла HD 6950 во всех тестах, что было вполне ожидаемо.

* * *

Можно констатировать, что у AMD получилась действительно хорошая видеокарта с поддержкой множества новых технологий, в том числе долгожданной тесселяции. Radeon HD 6950 сто ит своих денег, и если вы готовы потратить на графическую плату порядка 10 000 рублей, то выбор очевиден.

ПЛЮСЫ:

  • существенно дешевле, но лишь немного медленнее Radeon HD 6970
  • + перепрошив BIOS, можно превратить плату в Radeon HD 6970
  • есть удешевленные версии с 1 Гб памяти
  • у NVIDIA нет плат в этом ценовом диапазоне

МИНУСЫ:

  • цена завышена из-за отсутствия конкурентов
Таблица 1
Технические характеристики
Характеристика AMD Radeon HD 69 5 0 AMD Radeon HD 6970 AMD Radeon HD 6870 AMD Radeon HD 5870 NVIDIA GeForce GTX 470
Ядро Cayman Cayman Barts XT Cypress GF100
Количество транзисторов 2,64 млрд 2,64 млрд 1,7 млрд 2,15 млрд 3 млрд
Техпроцесс 40-нм 40-нм 40-нм 40-нм 40-нм
Количество потоковых процессоров 1408 шт. 1536 шт. 1120 шт. 1600 шт. 448 шт.
Частота графического ядра 800 МГц 880 МГц 900 МГц 850 МГц 607 МГц
Частота потоковых процессоров 800 МГц 880 МГц 900 МГц 850 МГц 1215 МГц
Тип, объем памяти GDDR5, 2 Гб GDDR5, 2 Гб GDDR5, 1 Гб GDDR5, 1 Гб GDDR5, 1,28 Гб
Частота памяти 5000 МГц 5500 МГц 4200 МГц 4800 МГц 3348 МГц
Шина данных 256 бит 256 бит 256 бит 256 бит 320 бит
Количество текстурных блоков 88 шт. 96 шт. 56 шт. 80 шт. 56 шт.
Количество блоков растеризации 32 шт. 32 шт. 32 шт. 32 шт. 40 шт.
Энергопотребление 200 Вт 250 Вт 151 Вт 188 Вт 215 Вт
Интерфейс PCIe 2.0 x16 PCIe 2.0 x16 PCIe 2.0 x16 PCIe 2.0 x16 PCIe 2.0 x16
Цена на март 2011 года 10 000 рублей 12 500 рублей 7600 рублей 9600 рублей 7800 рублей
Таблица 2
Синтетические тесты
3DMark Vantage
Модель видеокарты GPU CPU Overall
AMD Radeon HD 6950 17 572 17 303 17 504 100%
AMD Radeon HD 6970 19 098 17 175 18 578 106%
AMD Radeon HD 6870 15 131 16 493 15 450 88%
AMD Radeon HD 5870 17 402 17 326 17 383 99%
NVIDIA GeForce GTX 470 13 656 45 937 16 566 95%
Unigine Heaven Benchmark 2.0
Модель видеокарты FPS Overall Соотношение производительности
AMD Radeon HD 6950 23,7 596 100%
AMD Radeon HD 6970 24,8 626 105%
AMD Radeon HD 6870 13,8 348 58%
AMD Radeon HD 5870 11,4 288 48%
NVIDIA GeForce GTX 470 19,9 502 84%
Таблица 3

Игровые тесты (кадров в секунду)

Настройки AMD Radeon HD 6950 AMD Radeon HD 6970 AMD Radeon HD 6870 AMD Radeon HD 5870 NVIDIA GeForce GTX 470
Resident Evil 5 (DX10)
High, 1680x1050, AF 16x, AA 8x 101,5 110,1 96,1 105,8 97
High, 1920x1080, AF 16x, AA 8x 94,5 108,5 89,6 99,4 88,2
Соотношение производительности 100% 112% 95% 105% 94%
Devil May Cry 4 (SC2, DX10)
SuperHigh, 1680x1050, AF 16x, AA 8x - - - - 122
SuperHigh, 1920x1080, AF 16x, AA 8x 143,9 157,9 126,3 131,5 110,4
Соотношение производительности 100% 110% 88% 91% 77%
Aliens vs. Predator (Demo, DX11)
VeryHigh, 1680x1050, AF 16x, AA 2x 49,6 53,9 39,6 48,7 47,2
VeryHigh, 1920x1080, AF 16x, AA 2x 44,4 48,3 35,4 43,5 42,3
Соотношение производительности 100% 109% 80% 98% 95%
Соотношение цены 100% 125% 76% 96% 78%
Соотношение производительности 100% 110% 88% 98% 89%

Вступление

Данный обзор посвящен референсной видеокарте Radeon HD 6950 2048 Мб производства Sapphire, которая относится к категории "уже не high-end, но еще и не mainstream". С момента выхода этих видеокарт на рынок прошло уже немногим более полугода, но они все еще не потеряли актуальность. За это время были оптимизированы драйвера AMD Catalyst и появилось много новых игр, среди которых есть очень ресурсоемкие. К примеру, Crysis 2 с текстурами высокого разрешения в режиме DirectX 11 способен "уронить" производительность ниже уровня "играбельности" на любой single-GPU видеокарте, даже неплохо разогнанной. В этой и еще одиннадцати других играх и будет проведено сегодняшнее тестирование Sapphire Radeon HD 6950 Мб. Так же будет рассказано о разных способах включения заблокированных потоковых процессоров и проведена проверка видеокарты на разгон, как с воздушным, так и с жидкостным охлаждением.

Спецификации

Технические характеристики AMD Radeon HD 6950 и AMD Radeon HD 6970 перечислены в таблице:

Характеристика

Radeon HD 6950
Графический процессор Cayman Pro (RV970) Cayman XT (RV970)
Техпроцесс, нм 40 40

Универсальных процессоров

1408

Объём памяти, Мбайт

2048

Тип памяти

GDDR5 GDDR5

Разрядность шины памяти, бит

256

Частота GPU, МГц

800 880
Частота памяти, МГц 1250 (5000) 1375 (5500)

Напряжение GPU (2D/3D), В

0.90/1.10
Система питания 6 фаз Vgpu + 2 фаза Vmem + 1 фаза Vddci
Поддержка DirectX Direct X 11 Direct X 11
Поддержка OpenGL Open GL Open GL
Поддержка multi-GPU AMD CrossFireX (2-Way, 3-Way, 4-Way)

AMD CrossFireX (2-Way, 3-Way, 4-Way)

Максимальный TDP, Ватт

200
Энергопотребление в нагрузке, Ватт 150 190
Энергопотребление в покое, Ватт 20 20
Интерфейс PCI Express 2.0 x16 PCI Express 2.0 x16
Цена, USD $300 $370

Упаковка, комплектация, дизайн PCB и возможности

Видеокарта поставляется в большой коробке черного цвета, на которой кратко перечислены её характеристики и список поддерживаемых технологий:



Комплектация, кроме самой видеокарты, включает в себя следующий набор:

  • Инструкция по установке;
  • Диск с драйверами и программным обеспечением;
  • Один гибкий мостик Crossfire;
  • Два переходника для подключения дополнительного питания 1x Molex 4-Pin -> 1x PCI-E 6-pin;
  • Один переходник mini-DisplayPort -> DisplayPort;
  • Один переходник DSub <-> DVI;
  • Один кабель HDMI <-> HDMI;
  • Купон для регистрации в Sapphire Select Club и фирменная наклейка.

Видеокарта полностью соответствует референсной AMD Radeon HD 6950. Она использует ту же систему охлаждения, дизайн PCB и номинальные частоты. Отличие только в наклейке на лицевой стороне.

Длина видеокарты без учета планки крепления к корпусу составляет 273 мм (или 286 мм с учетом планки). Этого достаточно, чтобы полностью перекрыть по ширине не только стандартную (ATX) материнскую плату, но так же и увеличенную (EATX). Поэтому желательно чтобы на используемой вами материнской плате не было высоких радиаторов на южном мосту, а разъемы SATA были повернуты вбок.

Высота видеокарты стандартная, почти не превышает высоту планки крепления. Здесь нет выпирающих вверх тепловых трубок или увеличенной по высоте печатной платы, как это нередко бывает на нереференсных моделях видеокарт. А по ширине видеокарта занимает два слота на материнской плате.



На планке для крепления к корпусу расположены отверстия для выдува наружу нагретого воздуха и набор внешних интерфейсов для подключения мониторов (два DVI, два mini-DisplayPort и один HDMI):

Сверху расположены два разъема 6-pin PCI-E для подключения дополнительного питания, два разъема для соединения от двух до четырех видеокарт в режиме Crossfire и переключатель для выбора активной микросхемы BIOS. По умолчанию этот переключатель установлен в положение "1", что соответствует выбору основной микросхемы BIOS, защищенной от записи в неё программными средствами. Если же пользователь захочет поэкспериментировать с BIOS (например, с целью включить заблокированные потоковые процессоры), то сначала будет необходимо переставить переключатель в положение "2", которое соответствует дополнительной микросхеме BIOS, открытой для изменения пользователем.

Сделано это для того, чтобы исключить возможность приведения видеокарты в нерабочее состояние путем прошивки пользователем некорректно модифицированного образа BIOS. Теперь, чтобы восстановить "запоротый" пользовательский BIOS достаточно до следующего старта компьютера переключится на основной BIOS (1), а после загрузки операционной системы переключится обратно на дополнительный (2) и прошить его заново. Это позволяет без последствий экспериментировать с прошивкой BIOS от других видеокарт, а так же менять такие параметры как номинальные частоты, напряжения, обороты вентилятора и верхний предел разгона в AMD Catalyst Control Conter.



Дизайн видеокарты по-прежнему рассчитан на использование двух слотов, как и предыдущие поколения референсных видеокарт AMD. Даже если снять планку для крепления к корпусу и заменить систему охлаждения на однослотовую (например, тонкий водоблок), сдвоенный несъёмный блок из двух разъемов DVI все равно не позволит использовать соседний слот на материнской плате.



На видеокарту установлен графический процессор RV970, более известный как AMD Cayman, произведенный на 45-й неделе 2010 года по техпроцессу 40-нм. Разделение GPU RV970 на Cayman Pro (Radeon HD 6950) и Cayman XT (Radeon HD 6970) условное. Физически это одна и та же микросхема с 1536 потоковыми процессорами. Отличия только в том, что у Radeon HD 6950 они частично программно заблокированы на уровне BIOS (из 1536 включены только 1408).

Графический процессор сверху не закрыт крышкой, но по краям на него наклеена алюминиевая рамка. Высота этой рамки не превышает высоту самого GPU, поэтому нет необходимости её снимать для установки альтернативной системы охлаждения. Вокруг GPU квадратом с расстоянием стороны 53-мм (75-мм по диагонали) расположены четыре отверстия шириной 3-мм для крепления системы охлаждения.



В качестве видеопамяти GDDR5 используются микросхемы Hynix H5GQ2H24MFR-T2C в корпусе FBGA и ёмкостью 2048 Мбит. Все восемь микросхем расположены с лицевой стороны видеокарты. Номинальными режимами работы для этой памяти считаются 900 МГц (3600 Gbps) с напряжением 1.35V либо 1250 МГц (5000 Gbps) с напряжением 1.50V. На AMD Radeon HD 6950 под нагрузкой память работает во втором из этих двух режимов.

Для хранения основного и дополнительно BIOS на видеокарте установлены две микросхемы PMC-Sierra Pm25LV010 с емкостью 1 Мбит. Одна на лицевой стороне и еще одна на обратной.



Номинальные частоты Sapphire Radeon HD 6950 составляют 800 МГц по GPU и 1250 (5000) МГц по видеопамяти:

Система питания, система охлаждения

Система питания

При разработке референсного дизайна для видеокарт серии Radeon HD68 50/HD68 70 компания AMD впервые за долгие годы отказалась от использования компонент производства Volterra в пользу продукции CHiL Semiconductor, Anpec, Texas Instruments и Infineon. Одно из основных преимуществ такого подхода - существенно более низкий нагрев системы питания и как следствие возможность более тихой работы системы охлаждения, а так же отсутствие проблем с охлаждением системы питания при использовании альтернативных кулеров и универсальных водоблоков.

Первоначально для построения системы питания видеокарт Radeon HD69 50/HD69 70 планировалось использовать те же компоненты, что и на Radeon HD6850/HD6870, но возникший дефицит DrMOS-микросхем Texas Instruments CSD59901M вынудил вновь изменить планы и вернутся к использованию компонент Volterra, только уже более новых моделей по сравнению с использовавшимися на предыдущих поколениях видеокарт AMD.

Это не исключает появления в будущем обновленного дизайна для этих видеокарт, но на данный момент все референсные Radeon HD6950/HD6970 (а так же недавно выпущенный Radeon HD6990) используют одни и те же компоненты Volterra с традиционно высоким уровнем нагрева.

Большинство элементов системы питания AMD Radeon HD 6950 сосредоточено в правой части видеокарты с лицевой стороны:

Система питания графического процессора (напряжение Vgpu) состоит из 6 фаз и использует контроллер напряжения Volterra VT1586, шесть микросхем DrMOS Volterra VT1636SF и две сборки дросселей Cooper Bussmann CLA1108-4-50TR-R и CLA1108-2-50TR-R.

И еще одна фаза для питания контроллера памяти (Vddci). Используемый для этого контроллер Volterra VT262WF и дроссель Cooper Bussmann FP1005R1-R15-R расположены в левой части видеокарты.



Осуществлять мониторинг температуры системы питания можно при помощи программы GPU-Z (VReg Temperature на вкладке Sensors).

Система охлаждения

Система охлаждения AMD Radeon HD 6950 крепится при помощи четырнадцати винтов. Десять из них удерживают алюминиевую крышку, выкрашенную в черный цвет, закрывающую обратную сторону видеокарты. Но на обратной стороне нет сильно греющихся элементов, поэтому между крышкой и видеокартой нет никаких прокладок. Эта крышка служит не для охлаждения, а для зашиты от сколов SMD элементов и от короткого замыкания в случае установки нескольких видеокарт вплотную друг к другу или рядом с другими платами.

С внутренней стороны система охлаждения контактирует с графическим процессором через обычную серую термопасту и через термопрокладки со всеми микросхемами видеопамяти, микросхемами DrMOS и контролером напряжения Vddci.

Для охлаждения графического процессора используется медная испарительная камера. В нижней её части в месте контакта с GPU поверхность хотя и не отполированная, но достаточно ровная.

Сверху радиатор закрывает пластиковый кожух, ограничивающий и направляющий поток воздуха.

А создает этот поток воздуха турбина Firstdo FD9238U12D диаметром 92-мм, питающаяся от напряжения 12V и потребляющая ток 1.2A.

Испарительная камера с одной стороны припаяна к черному радиатору, накрывающему видеокарту по всей поверхности, а с другой стороны на неё напаяны тонкие алюминиевые ребра, через которые проходят потоки воздуха.





Как и у многих других референсных видеокарт AMD, выполненных в форме "кирпича", у Sapphire Radeon HD6950 система охлаждения может быть очень тихой, но только до тех пор, пока видеокарта работает без нагрузки в 2D-режиме. При запуске 3D приложений шум уже становится заметным, но вполне терпимым, а температуры поднимаются до уровня около +90°C, что уже близко к границе термо-троттлинга. Но автоматическое управление оборотами работает корректно и не позволяет температуре подняться еще выше.

Проблема в том, что такой уровень температуры уже практически не оставляет никакого запаса для увеличения напряжения и разгона. Их легко можно сбить на несколько десятков градусов, выставив обороты вентилятора на максимум и разогнать видеокарту еще сильней, но использовать такой режим постоянно, мягко говоря, некомфортно.

Выбор, как обычно у референсов, между "тишиной, высокой температурой, низким разгоном" и "шумом, пониженным уровнем нагрева и повышенным разгоном". Добиться от этой системы одновременно тишины, низких температур и высоких частот никак не получится.

Программное управление напряжениями и частотами

Управлять частотами видеокарт AMD можно при помощи функции Overdrive в Catalyst Control Center, но в случае видеокарт Radeon HD 6950 она позволяет поднять частоты всего лишь до 840/1325 МГц.

Плюс 40 МГц к частоте GPU это издевательство, а не разгон. Да и память на этих видеокартах легко разгоняется до частот как минимум 1400, а если повезет, то и выше 1500 МГц. Можно конечно модифицировать BIOS при помощи Radeon BIOS Editor (RBE), чтобы отодвинуть выше предел разгона в Catalyst Control Center, но лучше выставить в нём только +20% к пределу AMD Power Tune и забыть про штатные средства для разгона от AMD. К счастью Overdrive это далеко не единственная возможность для разгона видеокарт AMD.

Sapphire для своих видеокарт Radeon серий HD 5xxx/6xxx разработала специальную утилиту TriXX, позволяющую менять частоты, напряжение на графическом процессоре, управлять оборотами вентилятора системы охлаждения и следить за температурой GPU. Она доступна для свободного скачивания на сайте Sapphire Select Club, но работать будет только с видеокартами Sapphire. Определение "своих" видеокарт реализовано точно так же как и в аналогичных утилитах других производителей (ASUS Smart Doctor), путем считывания и сравнения Vendor ID в BIOS. Поэтому Sapphire TriXX можно легко обмануть, прошив BIOS от Sapphire в любую совместимую видеокарту от другого производителя.

После запуска Sapphire TriXX показывает информацию об установленной видеокарте на вкладке Info:

Эту информацию, так же как и BIOS, можно сохранить в файл.

В правом верхнем углу отображается текущая температура графического процессора.

На вкладке Overclocking можно управлять частотами графического процессора (от 300 до 1200 МГц) и видеопамяти (от 400 до 1800 МГц), а также изменять напряжение на GPU для 3D-режима (от 1.10V до 1.30V). Для хранения настроек пользователя предусмотрено четыре профиля.

Этого вполне достаточно для разгона на воздушном и жидкостном охлаждении. Но при желании предел по частотам можно увеличить, используя несколько программ по очереди. Например, сначала повысить частоты в MSI Afterburner, а затем уже и в Sapphire TriXX.

Следующая вкладка Fan Control предназначена для настройки управления вентилятором системы охлаждения. Доступны три режима - автоматический (управление по алгоритму, заданному в BIOS), фиксированный (жестко заданная скорость вентилятора не зависимо от температуры) и пользовательский (управление по алгоритму, настроенному пользователем). В последнем режиме можно настроить границы, в пределах которых будут меняться обороты вентилятора в зависимости от температуры.

В последней вкладке Settings можно изменить настройки программы:

  • Запускать при старте системы;
  • Сворачивать окно программы при запуске;
  • Восстанавливать частоты при старте;
  • Синхронизировать настройки всех видеокарт при использовании Crossfire;
  • Показывать эффективную частоту памяти (например, 5000 вместо 1250 МГц);
  • Установить информационный "гаджет" на рабочий стол Windows;
  • Применять новые частоты сразу, без нажатия кнопки Apply;
  • Отключить режим Ultra Low Power State (ULPS).

Кроме Sapphire TriXX для разгона Radeon HD 6950 можно использовать и универсальный MSI Afterburner:

Предел по частоте графического процессора в нём такой же как и в Sapphire TriXX, а по частоте видеопамяти даже чуть ниже. Предел по напряжению на GPU в свободно распространяемой версии - 1.30V.

RivaTuner v2.25 после модификации файла конфигурации тоже может работать с Radeon HD 6950:

AMD Radeon HD 6950 благодаря использованию контроллера Volterra VT1586MF поддерживает гораздо более высокие напряжения (примерно до 2 вольт), но для их установки необходимы MSI Afterburner версий Etreme или MOA Edition либо модифицированные самостоятельно. Также можно работать и напрямую с этим контроллером через интерфейс I2C. AMD Radeon HD 6950 "висит" на шине под номером 6, а номер устройства контроллера Volterra VT1586MF - 70. Для снятия дампа можно использовать команду "MSIAfterburner.exe /i2cd6,70":

Красным цветом выделены четыре группы регистров, отвечающих за напряжение на GPU:

  • Регистры 94 и 95 (4B 00);
  • Регистры 96 и 97 (41 00) - это напряжение для 2D-режима (по умолчанию равно 0.90V);
  • Регистры 98 и 99 (55 00) - это напряжение для 3D-режима (по умолчанию равно 1.10V);
  • Регистры 9A и 9B (51 80).

В каждой из этих групп первый байт отвечает за установку напряжения с точностью до одной сотой вольта (0.01V), а второй байт позволяет увеличить эту точность до тысячных и еще больше. Таким образом, напряжение 1.30V соответствует VID-коду "69 00", 1.305V - "69 80" и т.д.

Для установки нужного напряжения его VID-код необходимо записать в соответствующие регистры контроллера Volterra VT1586MF. Поддержка команд для записи в I2C была добавлена в MSI Afterburner, начиная с версии 2.20 beta 5. Но если их выполнить на видеокарте Radeon HD 6950, то ничего не происходит и напряжение остается прежним. Можно предположить, что это или "баг" в MSI Afterburner или эти регистры специально защищены от записи.

Модификация BIOS для включения заблокированных потоковых процессоров

Как уже было сказано выше, для производства Radeon HD 6950/6970 используются одинаковые GPU RV970, имеющие 1536 потоковых процессоров. Но на младшей видеокарте, изначально включены только 1408, а остальные 128 программно заблокированы. Наличие именно программной, а не аппаратной блокировки, говорит о том, что сделано это было не просто так, а с целью повысить привлекательность младшей модели в глазах пользователей. Далеко не каждый покупатель Radeon HD 6950 станет заниматься разблокировкой, но знать о такой возможности будут очень многие. С другой стороны производитель освобождает себя от ответственности, заявляя, что разблокированные видеокарты не попадают под гарантийные обязательства. Заодно обезопасили себя от неопытных любителей "сотфвольтмода", заблокировав повышение напряжения на Radeon HD 6950, прошитых с использованием BIOS от Radeon HD 6970. Сплошные плюсы, как для производителя, так и для покупателей.

Существует два способа включить заблокированные потоковые процессоры на Radeon HD 6950. Оба они требуют перепрошивки BIOS у видеокарты и соответственно ведут к потере гарантии на видеокарту. Но даже если она перестанет стартовать и определятся программными прошивальщиками - вы все еще сможете воспользоватся программатором. Прежде чем приступить к разблокировке, не забудьте переключится на дополнительный BIOS (2), доступный для изменения пользователем. Не бойтесь экспериментировать, в случае проблем вы всегда сможете переключиться обратно на основной BIOS, восстановить резервный и продолжить работу.

Первый способ - перепрошивка BIOS от AMD Radeon HD 6970 . Этот способ стал известен еще до поступления видеокарт в продажу. Первым его проверил на практике W1zzard с сайта Techpowerup.com. А позже посетителями сайта была собрана статистика попыток разблокировки видеокарт разных производителей, которая показала, что успешно разблокированы более 90% всех Radeon HD 6950. Используемый для тестирования экземпляр Sapphire Radeon HD 6950 не стал исключением и сохранил возможность стабильной работы после включения всех потоковых процессоров.

Для того, чтобы разблокировать видеокарту этим способом, сначала вам нужно найти и скачать BIOS от Radeon HD 6970 такого же производителя что и ваша карта и на таком же дизайне PCB. В случае референсных видеокарт подойдет BIOS от любой другой референсной, не зависимо от производителя. Если же у вас есть сомнения насчет дизайна PCB или видеокарта с 1024 мегабайтами памяти, стоит воспользоватся другим способом, описанным ниже.

Особенность этого метода в том, что после прошивки BIOS от Radeon HD 6970 вместе с увеличением потоковых процессоров меняются также и номинальные частоты (с 800/1250 МГц на 880/1375 МГц) и напряжение на GPU (c 1.10V на 1.15V), что естественно приводит к увеличению энергопотребления, нагрева видеокарты и уровня шума. С одной стороны это удобно, если вы все равно планировали немного разогнать свою Radeon HD 6950, как раз до уровня Radeon HD 6970. А с другой стороны, использование этого метода делает невозможным программное управление напряжениями в таких программах как Sapphire TriXX и MSI Afterburner.

Через некоторое время был найден и опубликован более совершенный способ разблокировки - модификация BIOS от Radeon HD 6950 при помощи специального скрипта Mod_BIOS_HD_6950 , написанного на языке PHP все тем же W1zzard с Techpowerup.com.

Как им воспользоваться:

  1. Скачиваете архив со скриптом Mod_BIOS_HD_6950 и распаковываете его в отдельную папку.
  2. Сохраняете текущий BIOS видеокарты при помощи ATIWinflash или ATIFlash и переименовываете его в "original.bin"
  3. Копируете "original.bin" в папку со скриптом.
  4. Запускаете "run.bat" в папке со скриптом.
  5. Полученный в результате работы скрипта "modded.bin" прошиваете в видеокарту при помощи тех же ATIWinflash или ATIFlash

Проверить успешность разблокировки можно при помощи программы GPU-Z:

Этот способ позволяет разблокировать только потоковые процессоры, оставив все остальные параметры BIOS неизменными (частоты, напряжения и т.д.). После разблокировки нет проблем с "софтвольтмодом". Работает с любыми видеокартами AMD Radeon HD 6950, в том числе нереференсными и с объёмом памяти 1024 Мб.

При желании, вместо модификации и прошивки "родного" BIOS можно так же попробовать использовать BIOS и от других AMD Radeon HD 6950. Для этого после скачивания точно так же переименовываем его в "original.bin" и запускаем скрипт.

Тестовая конфигурация

Для тестирования был собран открытый стенд с такой конфигурацией:

  • Процессор: Intel Core i7-2600K D2;
  • Материнская плата: ASUS Maximus IV Extreme, Intel P67, BIOS 1902;
  • Память:
    • 3x2048Mb G.Skill Perfect Storm F3-16000CL7-6GBPS, DDR3-2000 (Elpida Hyper MNH-E);
    • 1x2048Mb Kingston HyperX KHX2000C8D3T1, DDR3-2000 (Elpida Hyper MGH-E);
  • Видеокарта: Sapphire Radeon HD 6950, 2048 Mb GDDR5, PCI-E;
  • Накопители: SSD Crucial m4 128 Gb (ОС, бенчмарки и игры), HDD Western Digital WD1002FAEX;
  • Блок питания: Antec TruePower Quattro TPQ-1000, 1000W;
  • Охлаждение процессора: Thermalright Archon с двумя вентиляторами Thermalright TY-140;
  • Термопаста: Arctic Cooling MX-4.

Программное обеспечение:

  • OS: Windows 7 Enterprise SP1 x64 v6.1.7601 (english);
  • DirectX Redistributable (Jun2010);
  • Intel Chipset Device Software v9.2.3.1016;
  • Intel Rapid Storage Technology Driver v10.6.0.1002;
  • Intel HECI driver v7.0.0.1118;
  • AMD Catalyst v11.8 Preview;
  • CPU-Z v1.58;
  • GPU-Z v0.54;
  • RivaTuner v2.25;
  • MSI Afterburner v2.20 Beta 5;
  • FurMark v1.9.1.

Разгон на воздушном охлаждении и температурный режим

Температура в помещении во время проведения тестирования была равна +25°C.

Для разгона видеокарты использовалась программа MSI Afterburner v2.20 Beta 5. Для мониторинга температур GPU (всех блоков) использовался RivaTuner v2.25, а для мониторинга за температурой системы питания - GPU-Z v0.54. Для создания нагрузка и прогрева видеокарты использовался FurMark v1.9.1.

Чтобы избежать троттлинга по энергопотреблению и снижения частот, предел AMD Power Tune был установлен на максимально возможные +20% в AMD Catalyst Control Center. А чтобы эта настройка не сбрасывалась после применения частот в MSI Afterburner, использовалась опция UnofficialOverclockingMode в файле конфигурации MSIAfterburner.cfg.

Для начала были измерены температуры работы видеокарты на штатных частотах 800x1250 МГц .

В режиме с автоматическим управлением оборотами вентилятора (30% / 1458 RPM в покое и 40% / 2125 RPM под нагрузкой) температура GPU в покое составила +62°C...+65°C, а под нагрузкой - +90°C...+96°C. Система питания под нагрузкой прогрелась до +63°C.

После установки режима работы турбины на 100% (5700 RPM) температура GPU понизилась на 20°C в покое (до +42°C) и на 34°C под нагрузкой (до +54°C...+57°C). Температура система питания снизилась на 24°C (до +39°C).

Разница между максимальным и автоматическим режимами работы кулера огромная, но не только в полученных температурах, а так же и в уровне шума.

Теперь посмотрим, насколько поднимутся температуры от разгона видеокарты при сравнении в тихом (автоматическом) режиме работы турбины. Разгон без поднятия напряжения, то есть на штатных 1.10V, составил 900/1500 МГц . Температура GPU поднялась совсем немного - на 4°C в покое (до +65°C...+70°C) и на 3°C под нагрузкой (до +90°C...+98°C). Температура система питания поднялась на 3°C (до +66°C).

В разгоне на максимальных оборотах турбины можно было достичь частот 940/1520 МГц , но использовать его для постоянной работы невозможно из-за высокого уровня шума.

Так же было проверено влияние включения заблокированных потоковых процессоров на температуру GPU. Тестирование показало, что какой-либо существенной разницы в температуре при использовании метода модификации BIOS от Radeon 6950 (то есть без повышения штатных частот и напряжения) нет.

Разгон с охлаждением проточной водой и результаты в бенчмарках

Для дальнейшего разгона на GPU был установлен медный водоблок Topmods, на микросхемы памяти - алюминиевые радиаторы Zalman. А на элементы системы питания через термопрокладку и при помощи гибкой изолированной проволоки был установлен алюминиевый радиатор от видеокарты ASUS Radeon HD 6850 DirectCU. Для охлаждения водоблока использовалась проточная холодная вода с температурой около +10°C.

Видеокарта сохраняла стабильность до частот 1025/1525 МГц с напряжением 1.30V. Большинство бенчмарков можно было пройти на частотах 1050/1550 МГц с напряжением 1.33V, а 3DMark Vantage один раз был пройден даже на 1085/1585 МГц.

Результаты получились следующие:

  • 3DMark11 - Extreme Preset: (#1)
  • 3DMark11 - Performance Preset: (#1)
  • 3DMark11 - Entry Preset: (#1)
  • 3DMark Vantage - Performance Preset: (#1)
  • 3DMark2001SE: (#3)
  • Aquamark3: (#2)
  • Unigine Heaven - DirectX11: 1941.63 (#2)

Производительность в играх

Для минимизации зависимости результатов от скорости процессора он был разогнан до частоты 5000 МГц с напряжением 1.51V. Разгон осуществлялся путем повышения множителя до x50.

Настройки драйвера AMD Catalyst были оставлены на значениях по умолчанию, за исключением следующих:

  • Catalyst A.I. = High Quality
  • VSync = Always Off
  • Power Control Settings = +20%

Для замера производительности были использованы следующие игры:

  • Crysis 2 v1.9 - DirectX 11, Adrenaline Crysis 2 Benchmark Tool (Central Park);
  • Metro 2033 v1.2 (Update 2) - DirectX 11, встроенный бенчмарк (Frontline);
  • S.T.A.L.K.E.R.: Call of Pripyat v1.6.02 - DirectX 11, встроенный бенчмарк (SunShafts);
  • DiRT 3 v1.1 - DirectX 11, встроенный бенчмарк (L.A. Coliseum);
  • Lost Planet 2 v1.1 (v1.0.1.129) - DirectX 11, встроенный бенчмарк (Test B);
  • Just Cause 2 v1.0.0.2 (Update 1) - DirectX 9, встроенный бенчмарк (Concrete Jungle);
  • Grand Thief Auto IV: Episodes From Liberty City v1.1.2.0 - DirectX 9, встроенный бенчмарк (The Lost and Damned);
  • Far Cry 2 v1.03 - DirectX 10, Far Cry 2 Benchmark Tool (Ranch Small);
  • Total War: Shogun 2 v2.0 (v1.1.0 build 3409.285940) - DirectX 11, встроенный бенчмарк (Sekigahara);
  • Aliens vs. Predator DX11 Benchmark v1.03 - DirectX 11;
  • Mafia 2 v1.0.0.4 (Update 4) - DirectX 9, встроенный бенчмарк;
  • Sid Meier"s Civilization V v1.0.1.348 - DirectX 11, встроенный бенчмарк (Askia).

Настройки во всех играх устанавливались на максимальное качество. Единственное исключение - Mafia 2. В ней пришлось отключить опцию Apex PhysX, чтобы избежать большого разброса результатов от запуска к запуску и ограничения производительности мощностью процессора, используемого для расчета физических эффектов в случае использования этой опции с видеокартами AMD.

Тесты были проведены только с разрешением экрана 1920x1080. Там, где это было возможно, полноэкранное сглаживание устанавливалось в режим MSAA 4x, а анизотропная фильтрация в режим x16. Вертикальная синхронизация была отключена. Во всех играх использовался либо встроенный бенчмарк, либо сторонние утилиты для вызова встроенных в игру средств для замера FPS.

Производительность замерялась в четырех режимах:

  • Номинальные частоты без включения потоковых процессоров: 800/1250 МГц, 1408 SP
  • Номинальные частоты с включением потоковых процессоров: 800/1250 МГц, 1536 SP
  • Разгон на штатной системе охлаждения с автоматической регулировкой скорости турбины: 900/1500 МГц, 1536 SP
  • Разгон на проточной холодной воде: 1025/1525 МГц, 1536 SP

Результаты измерения приведены в виде минимального и среднего FPS. Либо только среднего, когда встроенные средства игры не позволяют получить информацию о минимальном FPS (Just Cause 2, Mafia 2). Для игр, которые позволяют получить статистику по времени построения всех кадров (frametimes) так же приведены графики, показывающие распределение FPS по времени прохождения бенчмарка.




Тестирование показало, что польза от включения заблокированных потоковых процессоров на Radeon HD 6950 есть, но она не велика. Поднятие частот хотя бы до уровня номинальных у Radeon HD 6970 даст примерно такую же прибавку производительности, а разгон позволит выжать из видеокарты еще больше, чем от включения потоковых процессоров. Поэтому данную возможность Radeon HD 6950 стоит рассматривать только как небольшой бесплатный бонус. Там, где скорости видеокарты недостаточно (Crysis 2 в режиме DirectX 11 и Metro 2033) для игры с максимальными настройками, её не хватит и после разблокировки с разгоном.

Заключение

Преимущества и недостатки референсных видеокарт AMD Radeon HD 6950 в целом и Sapphire Radeon HD 6950 в частности:

[+] Возможность программной разблокировки потоковых процессоров, что позволяет за меньшую цену получить аналог Radeon HD 6970. С разгоном до номинальных частот Radeon HD 6970 (и даже выше) так же нет никаких проблем.

[+] Хорошее соотношение производительности и цены. Даже сейчас, спустя полгода после выхода на рынок, Radeon HD 6950 2048 Мб не имеет прямых конкурентов в своей ценовой категории. Снизу есть предложение GeForce 560 Ti 2048 Мб, которая чуть дешевле и медленней даже немодифицерованной Radeon HD 6950, а сверху - GeForce 570 1280 Мб, у которой меньше видеопамяти, больше уровень энергопотребления и примерно равная Radeon HD 6950@6970 производительность.

[+] Поддержка технологии AMD Eyefinity, позволяющей использовать вывод изображения на несколько мониторов одновременно.

[+] Два гигабайта памяти для хранения текстур и буфера экрана позволяют использовать любые разрешения экрана и наивысшее качество текстур во всех современных играх. Это больше, чем у референсных GeForce GTX 570 и GeForce GTX 580.

[+] Возможность программного управления напряжением на GPU. Для этого можно использовать не только универсальный MSI Afterburner, но так же и фирменную утилиту Sapphire TriXX.

[+] Относительно тихая система охлаждения (если видеокарту не разгонять, особенно с поднятием напряжения), выдувающая нагретый воздух за пределы корпуса.

[+] Неплохая комплектация, наличие кабеля HDMI и переходника mini-DisplayPort <-> DisplayPort.

[-] Наличие искусственного ограничителя потребляемой мощности в виде технологии AMD Power Tune. Принудительный сброс частот при превышении потребляемой мощности выше жестко заданного предела. Это очень мешает разгону, особенно экстремальному. Можно отодвинуть предел на 20% выше соответствующей опцией драйвера Catalyst, но для разгона выше 1050...1100 МГц и напряжения выше 1.30V...1.35V этого все равно может оказаться недостаточно. К тому же, если разгонять видеокарту не средствами самого драйвера, то он сбрасывает установленный предел Power Tune при каждой установке частот.

[-] Референсная система охлаждения почти не оставляет запаса по температуре для разгона. Приходится делать выбор между хорошим разгоном с невысокими температурами и тихим режимом работы видеокарты.

[-] Плохая переносимость минусовых температур. Появляются артефакты и нестабильность, даже на температурах, достижимых при использовании слабой "фреонки". Из-за этого абсолютное большинство видеокарт Radeon HD 6950/6970 не могут преодолеть уровень разгона около 1100 МГц.

[-] Система питания построена с использованием компонент производства Volterra, которые для нормальной работы требуют активного охлаждения. Штатная система охлаждения вполне справляется с этой задачей, но при использовании альтернативных кулеров или универсальных (не-fullcover) водоблоков, придется как минимум установить радиаторы на все микросхемы DrMOS (Volterra VT1636SF) и желательно обеспечить хотя бы небольшой обдув этих радиаторов.

Radeon HD 6970 - видеокарта компании AMD, выпущенная в декабре 2010 г. Ее архитектура упростила дизайн потоковых процессоров и обеспечила их большую эффективность.

История модели

В 2008 г. AMD разработала и выпустила видеокарту Radeon серии HD 4000 под кодовым названием R700 и брендом ATI Technologies. Вероятно, многие до сих пор используют ее в своих ПК. Архитектуру R700 сменила долгожданная R800, которая проложила путь модельного ряда 5000. Жемчужиной серии стала карта появившаяся в сентябре 2009 г. Она состояла из 2150 млн транзисторов и имела успех, оставаясь флагманской однопроцессорной моделью в течение примерно 15 месяцев. Заменена в конце 2010 г. В то время это была одна из лучших видеокарт в своем ценовом диапазоне, что говорит само за себя.

Компании Nvidia потребовалось около 6 месяцев, чтобы открыть ответный огонь выпуском 470 и 480, и даже тогда многие считали, что она не оправдала ожиданий. После нескольких быстрых снижений цены и улучшения поддержки драйверов карту удалось сделать конкурентоспособной. Дальнейшее появление GTX 460 и изысканная архитектура GF110 помогли создать жизнеспособный продукт и открыть путь к следующим моделям, а именно GTX 580 и 570.

Между тем компания AMD предложила HD 6000 с октября 209-го, передав эстафету видеокарте HD 6870 в качестве противовеса GTX 460, стоимость которой тогда составляла 240 $. Это была впечатляющая модель, если не считать запутанную политику наименования и постоянные напоминания производителя о том, что она не являлась заменой 5870-й модели. Начиная с этой серии, с брендом ATI Technologies было официально покончено с целью корреляции между графическими продуктами AMD и ее компьютерными платформами. Соответственно, изменился и дизайн логотипа.

После короткой задержки был выпущен новый Radeon HD 6970 2GB. Графический процессор под кодовым названием Cayman составлен из 2640 млн транзисторов, что на 23% больше, чем у 5870-й модели. Подобно GTX 570 и 580, которые представляют собой улучшенные версии и 480, HD 6970 стал модернизированным вариантом 5870-й модели.

Обновления 6900-й серии

Архитектура высокого класса Cayman, применяемая в серии HD 6900, немного отличается от Barts, дебютировавшей в 6870-й и 6850-й моделях. В ней использовалась конфигурация VLIW5 HD 5000, которая включает SIMD с 4 простыми и 1 сложным блоками обработки потока. Видеокарты 6900-й серии отличаются конфигурацией VLIW4, в которой обработка потока организована в группы по 4 блока с общими регистрами. Хотя все они обладают равными возможностями, 2 из них (3-й и 4-й) выполняют специальные функции. Согласно информации от компании AMD, конфигурация VLIW4 обеспечивает вычислительную мощность, не уступающую VLIW5, при уменьшении площади кристалла на 10%.

Процессоры Cayman обеспечивают высокий уровень распараллеливания по сравнению с архитектурой Evergreen/Cypress, используемой в HD 5800. Графические процессоры Barts находятся где-то посредине, так как они были шагом вперед от Cypress в назначении индивидуальных диспетчеров потока для каждого из двух SIMD-блоков. Чипы Cayman обладают еще большими возможностями благодаря двум движкам GPE и назначению каждого из них к SIMD-блоку. Это означает, что архитектура теперь имеет два более эффективных блока тесселяции по сравнению с одним у Barts. У видеокарт HD 6900, таким образом, производительность тесселяции можно значительно улучшить. Согласно AMD, она возросла в 3 раза в сравнении с HD 5870. Кроме того, архитектура Cayman также отличается переработанным движком рендеринга, состоящим из 128 ROP Z/Stencil, 32 ROP цвета, с почти вдвое быстрыми 16-разрядными целочисленными операциями и 2-4-кратным увеличением скорости 32-битных операций с плавающей точкой.

Архитектура Cayman

Переход от VLIW5 к VLIW4 улучшил вычислительные возможности AMD: более узкие SPU легче использовать в полной мере, FP64 повышает производительность по сравнению с FP32 на четверть, а сэкономленное пространство позволяет разместить дополнительные SIMD. Но если Cayman являлся серьезной попыткой утвердиться на рынке графических вычислений и отхватить кусок пирога у NVIDIA, то для этого следовало сделать больше, чем просто добавить новые шейдеры. Поэтому AMD изо всех сил пыталась усовершенствовать функциональные возможности своего графического процессора, чтобы он смог представлять угрозу для архитектуры Fermi.

Главной особенностью Cayman является асинхронная диспетчеризация. Термин очень точно описывает то, что делает карта. В Fermi NVIDIA представила поддержку параллельных ядер, которая обеспечила возможность проводить вычисления нескольких фрагментов кода одновременно. Компания AMD повторила подход NVIDIA, но пошла еще дальше.

Ограничение дизайна Fermi заключается в том, что хотя архитектура позволяет задействовать одновременно несколько ядер, каждое из них должно обслуживаться одним потоковым процессором. Независимые приложения, например, не могут выдавать свой собственный код и выполнять его параллельно, и ГПУ должно контекстно переключаться между ними. Асинхронная диспетчеризация компании AMD призвана разрешить независимым потокам и приложениям формировать код, который бы выполнялся параллельно. По крайней мере, на бумаге это дает существенное преимущество (переключение контекста слишком затратное), которое должно было превзойти производительность Fermi.

Принцип асинхронной диспетчеризации состоит в том, что ГПУ скрывает часть информации о своем реальном состоянии от приложений и кода, что, в сущности, приводит к виртуализации ресурсов графического процессора. Ведь каждый фрагмент кода полагает, что он работает на своем ГПУ со своей очередью команд и собственным виртуальным адресным пространством. Это перекладывает нагрузку на графический процессор и драйверы, но выигрыш заключается в том, что это лучше, чем переключение контекста.

Асинхронная диспетчеризация требует поддержки API. DirectCompute является фиксированным стандартом и этой возможности не поддерживает, по крайней мере в 11-й версии. Поэтому асинхронная диспетчеризация реализована в виде расширения OpenCl.

Остальные улучшения AMD касаются производительности памяти и кэша. Базовая архитектура здесь осталась прежней, но были сделаны некоторые незначительные изменения в произведении вычислений. Локальное хранилище данных, имеющееся при каждом SIMD, теперь может обходить иерархию кэш-памяти и глобального хранилища данных путем прямого считывания. Cayman получил 2-й модуль прямого доступа к памяти, который улучшил скорость чтения и записи, позволив выполнять одновременно 2 операции в каждом направлении.

Наконец, было немного ускорено чтение шейдеров. По сравнению с Cypress, Cayman может сократить число операций, объединяя их.

Дизайн

Длина карты составляет 27 см, что типично для современных высокопроизводительных моделей. Например, длина HD 4870 Х2 равна 28 см, как и HD 5870. Размеры же HD 6970 идентичны GTX 580. Как и ее предшественник, AMD Radeon HD 6970 изготовлен с помощью 40-нм процесса, однако компания добавила еще 486 млн транзисторов, в результате чего размеры кристалла увеличилось на 16%. Ядро ГПУ работает на 880 МГц, что на 3,5% выше, чем у HD 5870, а GDDR5 тоже работает немного быстрее на частоте 1375 МГц. Частота памяти, сопряженная с 256-битной шиной, дает HD 6970 теоретическую пропускную способность 176 ГБ/с, что является 14,5-процентным преимуществом перед HD 5870.

HD 6970 отличается от старшей 5870-й модели также и основной конфигурацией. Если последняя имела 1600 ядер, 80 TAU и 32 блока растеризации, то первая получила 1536 потоковых процессора, 96 текстурных блока и те же 32 ROP (на 4% меньше ядер и на 20% больше TAU).

По отзывам пользователей, пиковая целочисленная билинейная фильтрация текстур выполняется со скоростью 84,5 гигатекселей/с, а заполнение пикселей - 28,2 Гп/с. Производительность равна 2,7 Тфлопс. Трехмерная сцена строится со скоростью 880 млн полигонов/с. Карта поддерживает двухпотоковое воспроизведение HD-видео и имеет встроенный аудио контроллер.

Внутри корпуса находится печатная плата с ГПУ площадью 389 мм 2 в самом центре. Вокруг процессора установлены 8 2-ГБ чипов памяти Hynix GDDR5 с номинальной скоростью передачи данных 6 Гбит/с, что на 0,5 Гбит/с выше рабочей частоты карты. Использование GDDR5 на высоких скоростях осложнено трудностями при создании хорошей шины памяти, что сказалось и на данной модели. AMD добилась прогресса в достижении 5,5 Гбит/с путем совершенствования конструкции печатных плат, но дальнейшее повышение скорости кажется нецелесообразным хотя бы по причине дизайна 256-битной шины.

Кулер

Охлаждение процессора представляет собой достаточно большой алюминиевый радиатор испарительной камеры, составленный из 39 пластин длиной 13,5 см, шириной 6,5 см и высотой 2,5 см. Конструкция испарителя была впервые реализована в AMD ATI Radeon HD5970 и заимствована NVIDIA в GeForce GTX 570 и 580. Наконец, охлаждает радиатор вентилятор 75 x 20 мм, который втягивает воздух из корпуса и выталкивает его наружу в тыловой части карты.

По отзывам пользователей, по большей части кулер работает очень тихо, чему способствует низкое потребление (20 Вт) в режиме простоя. Во время игры вентилятор, конечно, разгоняется, а карта под нагрузкой потребляет до 250 Вт. Это на 33% больше, чем требует Radeon HD 5870, но даже с увеличением тепловой нагрузки уровень шума не повышается до недопустимых значений.

Радиатор и вентилятор заключены в специально сконструированном корпусе, который скрывает всю видеокарту. Это обычная практика AMD при проектировании своих наиболее элитных моделей. По отзывам пользователей, такой дизайн им очень нравится, так как обеспечивает надежную защиту устройства. Компания NVIDIA тоже делала это в прошлом для таких своих самых дорогих видеокарт, как GTX 295 с двумя графическими процессорами, хотя в ее других флагманских продуктах (например, GeForce GTX 580) данная разработка перестала применяться.

Возможности подключения

Для того чтобы обеспечить карту достаточной мощностью, AMD установила 8- и 6-контактный разъемы PCIe. Подобное решение можно найти у HD 5970 и GTX 580, т. к. такая конфигурация, как правило, используется в моделях, потребляющих много энергии. Естественно, HD 6970 поддерживает CrossFire и поэтому на стандартном месте можно найти пару разъемов для соединения двух или более карт. Рядом с ними находится переключатель, который позволяет выбирать между 2 BIOS. Это сделано для повышения надежности модели в случае выхода из строя флеш-памяти. Кроме того, можно запустить ГПУ с помощью резервной системы, а затем переключиться обратно на основную и заново прошить поврежденное ПО. До этого AMD не отличалась поддержкой перезаписываемых BIOS, но такая реализация стала интересным изменением.

Остальные порты расположены на панели ввода/вывода. Эталонный образец видеокарты оборудован двумя двойными DL-DVI-разъемами, двумя портами Mini-DisplayPort и HDMI. Стоит отметить, что 6970-я модель поддерживает максимальное разрешение до 2560 x 1600 на 3 мониторах. А с мультипотоковым хабом, использующим мини-разъемы DisplayPort 1.2, карта способна обслуживать до 6 дисплеев. Подобно 5870, задняя сторона устройства покрыта металлической пластиной. Хотя там нет никаких компонентов, требующих защиты, такое решение пользователями воспринято положительно, поскольку позволяет брать карту, не беспокоясь о том, чтобы не прикоснуться к острым контактам.

Хотя общие размеры HD 670 практически идентичны 5870-й модели, по отзывам пользователей, объемный дизайн AMD оказывается не совсем удачным, когда дело доходит до работы в режиме CrossFire с установленными рядом 2 картами. Кожух 5870-й немного выдавался в центре, сохраняя вентиляционные отверстия от блокирования соседними платами. В 6970-й такой роскоши нет, и можно практически изолировать верхнюю карту в зависимости от того, как она будет установлена. В результате температура повышается, но не до критических значений. Компании AMD стоило бы поучиться у своих конкурентов из NVIDIA и вокруг вентилятора выделить больше пространства, которое бы позволило ему свободно «дышать». Пользователи настоятельно рекомендуют устанавливать графические карты, оставляя между ними максимально возможное расстояние, если материнская плата и корпус это позволяют.

Производительность

По отзывам пользователей, тест Futuremark 3DMark 11 показал, что при выполнении экстремальных испытаний AMD Radeon HD 6970 оказывается быстрее на 7%, чем GTX 570 (1821 балл против 1697). Если такое преимущество сохранится в игровых тестах, то это может сыграть на руку производителю. Согласно тому же тесту, HD 6970 на 7% медленнее, чем GTX 580 (1962 пункта), на 27% отстает от HD 5970 (2506) и на 16% производительнее HD 5870 (1572 балла).

Dirt 2

Эта игра имеет фантастический встроенный тест, который очень точно измеряет фактическую производительность. Пользователи запускали Dirt 2 в режиме DirectX 11 с активированным 4хАА и максимальными настройками качества изображения. Видеокарта Radeon 6970 в среднем обеспечивает 77 к/с в разрешении 1920 х 1200, что делает ее всего на 10% быстрее HD 5870. Что более важно, HD 6970 оказалась на 21% медленнее, чем ее основной конкурент GTX 570. Другие более дорогие модели тоже отстали. HD 5970 был на 23% быстрее 6970-й модели, а у GTX 580 было 33-процентное преимущество. Dirt 2 оказалась беспощадной для HD 6970.

F1 2010

У игры с первым обновлением появился отличный встроенный тест, очень точно измеряющий производительность карты. Пользователи испытывали F1 2010 в режиме DirectX 11 с включенным 8xMSAA и лучшими визуальными настройками. Следует отметить, что им не удалось заставить корректно работать CrossFire с последними драйверами, поэтому HD 6970 так и не смогла вырваться вперед. Результаты F1 2010 не удивляют, так как HD 6970 - вторая самая быстрая видеокарта, которая тестировалась в разрешении 1920 х 1200, что лишь на 9% медленнее мощной GTX 580. Видеокарта HD 6970 только на 5% лучше 5870-й модели. Результаты в этой игре все-таки немного нестандартные, т. к. HD 6970 опережает GTX 570 с убедительным преимуществом в 22%.

COD: Modern Warfare 2

Для оценки производительности видеокарты в этой игре пользователи применили приложение Fraps. Максимальные игровые настройки качества сопровождались 4хАА и 60-секундной записью геймплея. В результате тестирования Radeon 6970 частота обновления дисплея оказалась равной 73 к/с, что на 1 к/с лучше GTX 480. Это почти соответствует производительности GTX 570 (74 к/с) и на 16% отстает от более быстрой GTX 580. По сравнению с двойным процессором Radeon 6970-я модель оказалась на 19% медленнее, хотя она обеспечивает частоту кадров на 30% большую, чем HD 5870.

COD: Black Ops

Fraps также помог произвести сравнительный анализ этой одиночной игры. Пользователи измеряли частоту кадров в течение 1 мин геймплея первого одиночного уровня (Operation 40) с максимальными визуальными эффектами, в том числе 4хАА. Результаты Black Ops продемонстрировали, что Radeon 6970 отстает от GTX 570 на 5% и на 13% - от GTX 580. При средних 105 к/с в разрешении 1920 х 1200 и максимальными настройками в любом случае не остается возможностей для совершенствования, модель превосходит своего предшественника на 24%.

Энергопотребление

В сравнении с HD 5870 6970-я модель потребляет на 16,5% больше мощности, но, учитывая, что она также на 24% быстрее, владельцы находят, что в целом это более производительная видеокарта. В сравнении с HD 5970, 6970-я модель на 3% экономнее, но в среднем медленнее на 15% и на 26% в игре Crysis Warehead, которая использовалась в стресс-тестировании. Radeon HD 6970 расходует примерно такое же количество энергии, как и GTX 570, потребляя на 1% больше при экстремальных нагрузках и на 4% меньше на холостом ходу. Учитывая, что обе видеокарты обеспечивают одинаковую производительность, на этот раз, кажется, они в равной мере соответствуют друг другу.

Температура нагрева

По отзывам пользователей, HD 6970 становится довольно горячим при нагрузочном тестировании в FurMark, достигая 90 °C, что немного выше 87 °C модели HD 5870. с другой стороны, нагревается лишь до 81 °C, что делает ее значительно прохладнее при максимальных нагрузках.

Производительность при разгоне

Панель управления Catalyst Control Panel ограничивает максимальную частоту ядра значением 950 МГц, которую Radeon HD 6970 принимает без проблем. Это вполне достойный показатель. Частота памяти может доходить до 1450 МГц, хотя пользователи при этом сталкиваются с вопросами стабильности и вынуждены отступить к 1440 МГц. Этот 8-процентный разгон ведет к увеличению производительности на 7,6% при тестировании в игре COD: Black Ops, 7,8% - в Crysis Warhead и 7% - в Battlefield Bad Company 2.

Заключение

Похоже, что HD 6900 и GTX 500 повторяют друг друга. С несколькими ключевыми отличиями, конечно. Продукт NVIDIA появился на рынке вовремя и оказался очень эффективным в противостоянии с конкурирующими моделями AMD. GeForce GTX 480 была самой быстрой однопроцессорной видеокартой, и GTX 580 сохранила корону, так как это было не по силам Radeon 6970. Цена модели соответствовала стоимости GTX 570, а нишу 580-й заняла HD 6950. Лишь к началу следующего года AMD получила шанс вернуть себе первенство в производительности, выпустив 2 карты серии под кодовым названием Antilles.

Radeon HD 6970 идет нога в ногу с GTX 570, а рекомендованная розничная цена для этой карты была установлена в размере 369 $, в то время как в GTX 570 дебютировал по 349 $. Несмотря на то что это две очень разные модели, они демонстрируют одинаковые средние показатели во многих играх, тестировавшихся пользователями в разрешении 1920 х 1200. По большей части разница является очень незначительной. Radeon 6970 в одних случаях оказывается на 20% быстрее GTX 570, а в других - примерно на 20% медленнее. По энергопотреблению обе карты также очень близки, демонстрируя аналогичные уровни операционной эффективности. Поэтому HD 6970 является хорошей альтернативой GTX 570. Выбор между двумя картами нелегкий, но правильным будет любое решение, учитывая их цену и производительность.

По сравнению с другими моделями, такими как GTX 580, 6970-я в среднем на 15% медленнее, но стоит на 30% дешевле, так же, как и GTX 570, которая предлагает еще более выгодную цену. Карта, которую HD 6970 эффективно заменяет - это HD 5870. На основе данных тестирования в разрешении 1920 х 1200 можно сказать, что HD 6970 в среднем оказывается на 24% быстрее и лишь на 10% дороже. Кроме того, энергоэффективность модели также была улучшена. Увеличение потребляемой мощности на 16% дает дополнительные 24% производительности. Стоит отметить, что Radeon 6970 выглядит чуть лучше, чем GTX 570 в играх STALKER: Call of Pripyat и Aliens vs. Predator, в которых используется тесселяция. До ее появления компания NVIDIA здесь имела значительное преимущество.

В целом обе видеокарты обеспечивают исключительный уровень производительности и стоимости, делая выбор между ними одновременно легким и сложным. Но любое решение будет правильным.

Лучшие статьи по теме