Главная / Видеокарты

Видеокарты


Два брата-акробата, или Обзор Sapphire Radeon HD 3870 и Radeon HD 3850

Показать одной страницей Печать Написать письмо 0
Содержание:
Одной страницей

После анонса компанией NVIDIA очень удачного чипа G92, нацеленного на средний ценовой диапазон, стало совершенно очевидно,  что у AMD попросту не остается вариантов, кроме как представить широкой публике ответный ход своему конкуренту. Так, 15 ноября 2007 года компанией  AMD был представлена обновленная архитектура RV670 на базе хорошо известного всем чипа R600.  

Однако основное и самое весомое усовершенствование новых чипов  — это технология производства с 55 нм нормами, позволившая значительно снизить себестоимость производства GPU и, как следствие, вывести графические решения в средний ценовой сектор.  

По сути, новинка представляет собой не что иное, как топовые чипы, переведенные на более "тонкий" технологический процесс. RV670 уменьшил не только свою площадь ядра (192 кв.мм против 408 кв.мм у R600), но и, что немаловажно, значительно повысил свою энергоэффективность. Поэтому теперь он потребляет в два раза меньше энергии, чем R600, обладая при этом аналогичными характеристиками и производительностью.  

Помимо нового техпроцесса, маркировки, чип RV670 обзавелся еще и поддержкой новомодного API DirectX 10.1, стал совместим с шиной PCI Express 2.0 и поддерживает обновленную технологию многочипового рендеринга ATI CrossFireX.  

Новоиспеченный GPU используется в двух видеоускорителях -  Radeon HD 3870 и Radeon HD 3850. На этот раз компания AMD решила отказаться от привычной всем маркировки своих видеокарт. Теперь в названии Radeon HD 3870 цифра 3 означает поколение видеокарт, цифра 8 – семейство, 70 указывает на конкретную модификацию платы в семействе (цифра 70 соответствует приставке XT по "старому стилю", 50 соответствует версии PRO).  

Итак, в данном материале мы попытаемся проанализировать основные особенности архитектуры RV670 и разобраться с ее технологическими нововведениями. Безусловно, мы также не упустим случая проверить в деле Radeon HD 3870 и Radeon HD 3850, благо для этого у нас в запасе имеется два замечательных семпла Radeon HD 3870 и Radeon HD 3850 производства компании Sapphire.  

Рекомендуемые для ознакомления материалы: 

Чип RV670 – первый GPU с поддержкой DirectX 10.1  

Поддержки DirectX 10.1 в своем чипе G92 NVIDIA не планировала, считая, что пока введение обновленного API абсолютно бессмысленно в силу того, что даже DX10 находится не на пике своей распространенности и популярности, а что уж тут говорить о DX10.1. А вот AMD решила идти по иному пути, внедрив в RV670 все возможности DX10.1.  

Для начала давайте разберемся с эволюцией интерфейсов API, основные характеристики которых сведем воедино в таблицу:  

Версия API

DirectX 8

DirectX 9

DirectX 9.0c

DirectX 10

DirectX 10.1

Версия шейдеров

1.1/1.4

2.0

3.0

4.0

4.1

Вершинных инструкций

128

256

512

65536

65536

Пиксельных инструкций

4+8

32+64

512

65536

65536

Вершинных констант

96

256

256

16x4096

16x4096

Пиксельных констант

8

32

224

16x4096

16x4096

Вершинных переменных

16

16

16

4096

4096

Пиксельных переменных

2

12

32

4096

4096

Потоков вершин

16

16

16

16

16

Потоков пикселей

4+2

8+2

10

32

32

Мишеней рендеринга

1

4

4

8

8

Вершинных текстур

-

-

4

128

128

Пиксельных текстур

8

16

16

128

128

Размер текстуры, точек

 

 

2048x2048

8192x8192

8192x8192

Целочисленные операции

-

-

-

+

+

Производные

-

-

+

+

+

Управление обработкой вершин

-

статическое

статическое или динамическое

динамическое

динамическое

Управление обработкой пикселей

-

-

статическое или динамическое

динамическое

динамическое

Виртуальная видеопамять

-

-

-

+

+

Произвольный доступ к данным из шейдеров

-

-

-

+

+

Поддержка формата IEEE 754

-

-

-

+

+

Как видно из таблицы, при переходе к DirectX 10 наблюдается целый ряд тенденций. Во-первых, это количественное усложнение шейдерных инструкций, благодаря которому становятся возможными все более и более реалистичные и сложные эффекты. Причем переход от DirectX 9.0c к 10-ой версии вызвал весьма серьезное увеличение числа поддерживаемых инструкций. И если вспомнить, что даже современные игры в основной своей массе находятся по сложности инструкций на уровне шейдеров версии 2.0, становится понятно, с каким серьезным запасом сделан новый API.  

Во-вторых, и это более важно, DirectX 10 обеспечивает некоторые качественные изменения в самом подходе к рендерингу картинки. Во-первых, наконец введена поддержка свопинга текстур на уровне API, проще говоря, теперь любая DirectX 10-видеокарта может пользоваться оперативной памятью в качестве текстурного буфера. Ранее такие технологии под видом проприетарных решений (например, P10 компании 3Dlabs) уже выступали на рынке, но не получили широкого распространения. Теперь же локальная видеопамять может служить лишь кэшем для тех текстур, которые нужны в данный момент, а дополнительные текстуры по мере надобности могут подгружаться из оперативной памяти. В итоге геймдевелоперы получают возможность использовать текстуры фантастически высокого разрешения и качества. Кроме того, малое количество памяти (порядка 128 MB) теперь перестанет быть бутылочным горлышком для недорогих видеокарт.  

Что же касается DirectX 10.1, то здесь основные различия от DX10 состоят не только в обновленной шейдерной модели до версии 4.1, но и в способах реализации сложных алгоритмов рендеринга. 

DX10.1 призван значительно облегчить разработчикам создание различных графических эффектов, а также совершенствует ряд существующих методик построения картинки.  

Из новейших (обновленных) технологий отметим:  

  • глобальное освещение в реальном времени на основе массивов из кубических карт;
  • независимые режимы блендинга;
  • текстурную выборку с алгоритмом Gather4;
  • улучшения, связанные с качеством антиалиасинга;
  • обновлен список минимальных спецификаций GPU для полного соответствия нормам DirectX 10.1.  

В числе прочего DirectX 10.1 должен обеспечить еще более высокую точность расчетов  с плавающей запятой (IEEE 754).  

Как и в случае DirectX 10, из узкоспециализированного ускорителя видеокарта, поддерживающая формат IEEE 754, превращается в небольшой "компьютер в компьютере". По этой причине DX10-видеокарта становится гибким инструментом, пригодным для решения различных инженерных задач.  

Новый старый друг RV670 

Блок-схема чипа RV670, которую вы видите перед собой, фактически ничем не отличается от таковой R600.  

Два

Первое, что сильнее всего бросается в глаза, – огромный модуль унифицированных шейдерных блоков (или процессоров). Этот модуль выделяется на фоне таких важных составных частей любого чипа, как блоки записи в буфер кадра или текстурные блоки. Более того, AMD чуть ли не в первую очередь упоминает число потоковых процессоров – 320.  

Помимо вышеупомянутых потоковых процессоров чип имеет 4 SIMD-блока (Single Instruction - Multiple Data), а также по 4 текстурных блока и блока записи в кадровый буфер (ROP).  

Тут же стоит отметить частоту ядра видеокарты – 775 МГц и тот факт, что все модули ядра работают на этой частоте. К примеру, шейдерный домен G92 работает на более высокой частоте, чем GPU (1.5 ГГц), что значительно увеличивает производительность по отношению с решениями AMD. Память соединена с ядром по 256-битной шине с архитектурой Ring Bus (дословно – кольцевая шина). И это лишь одно единственное весомое отличие новейшего GPU от флагманского прошлого поколения R600, где ширина шины составляла 512 бит.  

Остался также без изменений и Ultra-Threaded Dispatch Processor, или диспетчер потоков. Как и следует из названия, этот модуль ответственен за распределение нагрузки на исполнительные блоки, в первую очередь на потоковые процессоры. Ведь унифицированная шейдерная архитектура с ее гибкостью и возможностью исполнения на одних и тех же блоках различных операций предъявляет серьезные требования к модулю распределения вычислений, которым и является диспетчер потоков. Здесь мы также видим и слабое место архитектуры – даже при заявленном количестве одновременно выполняемых потоков, составляющем тысячи, эффективность архитектуры сильно зависит от софтверной оптимизации. Чем больше на вход диспетчера поступит инструкций, выполнение которых можно распараллелить, тем быстрее будет происходить рендеринг. Таким образом, оптимизацией инструкций на уровне драйвера и самого приложения (игры) можно добиться очень и очень многого.  

Два

Совершенно уникальными особенностями RV670/600 являются блоки тесселизации и встроенный аудиокодек, новый адаптивный алгоритм антиалиасинга, выделенный DMA-контроллер системной памяти для работы со свопингом текстур, новый аппаратный видеодекодер и многие другие вещи. За подробностями мы отсылаем читателей к специальной статье 

Второе пришествие MultiGPU - CrossFireX 

Конечно же, конфигурации на основе двух и более видеокарт не остались без внимания.  

На этот раз AMD официально заявила о поддержке одновременной работы массива из 4 видеокарт.  

C введением 55 нм техпроцесса значительно снизились энергопотребление и тепловыделение чипа RV670, поэтому четыре видеокарты - это не так "страшно", как это было бы для R600.  

Помимо всего прочего, конфигурация CrossFireX позволяет разгонять видеокарты по отдельности и поддерживает мультимониторные режимы (аж до 8 штук). 

PCI Express 2.0

Во второй ревизии PCI Express значительно увеличилась пропускная способность канала - до 5 Гбит/с (PCI Express 1.x – 2.5 Гбит/с). Это означает, что теперь для линии x16 максимальная скорость передачи данных может достигать 8 GB/s в обоих направлениях против 4 GB/s для старого PCI Express 1.х.
Примечательным фактом является то, что PCI Express 2.0 полностью совместим с PCI Express 1.1. На деле это означает, что старые видеокарты будут спокойно работать в системных платах с новыми разъемами, и новые видеоадаптеры будут без проблем работать в старых слотах стандарта PCI Express 1.х. 

Два

В подтверждение тому, что новая шина – это не пустой маркетинговый ход, компания AMD приводит результаты тестирования на разных системах - с PCI Express 1.x и без оного 2.0.

На больших разрешениях, когда объемы текстур весьма объемны преимущество обновленного интерфейса PCI-E 2.0 на лицо.

Что ж, теперь мы уяснили все ключевые моменты архитектуры новоиспеченного RV670, и сейчас мы плавном перейдем от скучной теории к практике. А именно рассмотрим ближе двух представителей   Sapphire Radeon HD 3870 и Sapphire Radeon HD 3850 на основе новейшего GPU. 

Содержание:

Стр.1 Чип RV670, MultiGPU - CrossFireX, PCI Express 2.0

Стр.2 Sapphire Radeon HD 3870: Комплектация, дизайн PCB, система охлаждения (часть 1)

Стр.3 Sapphire Radeon HD 3870: Комплектация, дизайн PCB, система охлаждения (часть 2)

Стр.4 Sapphire Radeon HD 3870: Комплектация, дизайн PCB, система охлаждения (часть 3)

Стр.5 Sapphire Radeon HD 3870: Комплектация, дизайн PCB, система охлаждения (часть 4)

Стр.6 Sapphire Radeon HD 3870: Потребляемая мощность, температурный режим и разгон

Стр.7 Sapphire Radeon HD 3850: Комплектация, дизайн PCB, система охлаждения (часть 1)

Стр.8 Sapphire Radeon HD 3850: Комплектация, дизайн PCB, система охлаждения (часть 2)

Стр.9 Sapphire Radeon HD 3850: Потребляемая мощность, шумовые показатели, температурный режим и разгон

Стр.10 Конфигурация тестового стенда, список тестовых приложений и настроек

Стр.11 Результаты тестирования в программной среде DirectX 9 (Windows XP)

Стр.12 Результаты тестирования в программной среде DirectX 10 (Windows Vista). Выводы.