|
|
|
Видеокарты : Теория |
|
20.04.2007 Новый уровень производительности
Алексей Набережный Так уж получается, что в потребительской оценке 3D-ускорителя большую роль играют показатели производительности, а характеристики эргономики устройства, его комплектация и сопроводительная поддержка оказываются на вторых ролях. Даже в методике испытаний видеоплат американского журнала PC World ( http://www.pcworld.com/printable/article/id,122816/printable) критерий с названием performance имеет вес 50% в итоговом рейтинге протестированного продукта.А между тем производительность графической платы — это объем “3D-работы”, проделанный за единицу времени. В программных тестах эта характеристика измеряется в кадр/с (или FPS — Frames Per Second). И для определения компьютерной 3D-производительности используются как специальные синтетические тесты (например, 3DMark, AquaMark, D3D RightMark, SPECViewperf и т.д.), так и тестовые наборы из настоящих игровых приложений. Конечно, синтетические тесты в ходе измерительных работ способны максимально нагрузить графические процессоры передовыми алгоритмами и в самых неожиданных режимах. Но так ли важны для потребителя результаты специализированных измерений, если во многих режимах тестового пакета 3DMark06 самые мощные ускорители 2006 г. еле-еле дотягивают до показателя в 20 кадр/с, но при этом данные видеоплаты прекрасно справляются со всеми актуальными играми? Разумеется, полезно знать, как поведет себя графическая подсистема в проблематичной ситуации, но для пользователей гораздо важнее информация о производительности в реальных приложениях и в типичных ситуациях. Поэтому в наших исследованиях вычислительного потенциала ПК мы будем использовать специальный сценарий, написанный на языке C#, вызывающий измерительные модули популярных игр Call of Duty 2, Battlefield 2, Serious Sam 2, Call of Juarez, Quake 4, Prey и The Chronicles of Riddick: EFBB. По результатам своей работы программа-скрипт выдает информацию о производительности протестированной конфигурации в среднем показателе кадр/с (AvgFPS) для каждой игры. При этом уникальная фиксация условий запуска игровых приложений придает сопоставлениям графических подсистем высокую степень корректности и исключает возможность появления многих ошибок в измерениях. Итак, давайте по-честному в самых популярных играх столкнем новую гвардию империи NVIDIA на базе процессоров GeForce 8800GTX и GeForce 8800GTS со старой сборной из графических кристаллов GeForce 7950GX2, GeForce 7900GTX, Radeon X1950 XTX и Radeon X1900 XTX. Возможно, новейшая линейка GeForce 8800 окажется бесполезной в играх нашего времени и ее эпоха наступит лишь с появлением первых приложений для DirectX 10. FOXCONN GeForce 8800GTX 768Mb (GeForce 8800GTX) Во-первых, в новейшей архитектуре нет деления вычислительных блоков на пиксельные и вершинные, а есть 128 универсальных процессоров, которые могут просчитывать как пиксельные, так и вершинные шейдеры (для сравнения: на кристалле GeForce 7900GTX расположено всего 24 пиксельных и восемь вершинных блоков). Причем такой вычислительный батальон из 128 универсалов поделен на восемь подразделений (по 16 скалярных процессоров), которые еще включают в себя по четыре текстурных блока (всего 32 “текстурника”) и по кэшу первого уровня (всего восемь кэшей L1). И здесь нужно добавить, что все компоненты шейдерного батальона работают на частоте 1350 МГц, которая значительно превышает основную частоту работы кристалла G80 (575 МГц). Во-вторых, увеличилась ширина шины обмена данными с видеоОЗУ с привычных 256 до 384 бит (шесть 64- битовых контроллеров), что, в свою очередь, позволило довести максимальный объем памяти ускорителя GeForce 8800GTX до 768 Мбайт. По пути отметим, что контроллер управления памятью G80 поддерживает работу как с GDDR3, так и с GDDR4, а значит, после разумного понижения цен на ОЗУ типа GDDR4 мы сможем увидеть на рынке плату NVIDIA GeForce 8900GTX (G81) на основе видеопамяти стандарта GDDR4 объемом 768 Мбайт. В-третьих, улучшена работа алгоритмов анизотропной фильтрации и полноэкранного сглаживания (добавлена схема CSAA — Coverage Sampling Antialiasing), а также появилась возможность одновременной работы разных методов сглаживания и технологии HDR (High Dynamic Range — визуализация в широком динамическом диапазоне), что было присуще раньше лишь графическим решениям ATI. И в-четвертых, графический процессор G80 умеет работать с геометрическими шейдерами (программы, обрабатывающие параметры геометрических примитивов) и способен просчитывать различные физические эффекты в рамках технологии NVIDIA Quantum Effects. И эти инновации стали реальностью отчасти благодаря революционной возможности записи и передачи промежуточных данных прямо из шейдеров. Chaintech GeForce 8800GTX 768Mb (GeForce 8800GTX) Причем впечатляющие характеристики решения GeForce 8800GTX не возникли из воздуха, а достигнуты с помощью логической схемы из 681 млн. транзисторов, которые требуют эффективного охлаждения, впрочем, как и 12 модулей памяти GDDR3 вокруг микропроцессора. Поэтому давайте внимательней посмотрим на новый охладитель NVIDIA, ведь ему приходится особенно жарко в работе. В его основе лежит радиаторная рама с медной вставкой посередине, к основанию которой подводится капиллярная трубка с большим числом буквально нанизанных алюминиевых пластин. Вся эта конструкция заключена в пластиковый кожух, где с одного края установлен вентилятор, который забирает воздух внутри компьютера и транспортирует его через воздуховод наружу. Благодаря внушительным размерам и продуманности конструкции система охлаждения GeForce 8800GTX эффективно справляется со своими задачами и работает очень тихо даже в горячие моменты игровых баталий. Огорчает другое. Длина печатной платы NVIDIA GeForce 8800GTX составляет 27 см (для сравнения: ускоритель GeForce 7900GTX имеет длину 22 см), и во многих корпусах она упирается в блок установки жестких дисков, так что некоторым владельцам ПК вместе с GeForce 8800GTX придется покупать и новые корпуса. К тому же для полноценной работы GeForce 8800GTX потребуется очень мощный блок питания (с двумя разъемами 3x2 для видеоплат), самый производительный ЦП и скорее всего новый монитор с высоким разрешением (от 1600x1200 точек и выше). Вот и получается, что затраты на 3D-акселератор NVIDIA GeForce 8800GTX и сопутствующие расходы очень трудно назвать приемлемыми. BFG GeForce 8800GTS 640Mb (GeForce 8800GTS) Так, видеоплата BFG GeForce 8800GTS имеет всего 96 потоковых процессоров (шесть наборов по 16 вычислительных блоков), урезанную до 320 бит шину доступа к памяти GDDR3 (с максимально допустимым объемом 640 Мбайт) и пониженную частотную формулу — 500/1200/ 1600 (основная частота работы/частота шейдерных блоков/эффективная частота видеоОЗУ). Но в плюсах у этой модели числятся небольшие габариты (длина платы 22 см) и приемлемая стоимость. Кроме того, в необычном комплекте поставки BFG можно обнаружить фирменную футболку, а также тефлоновые наклейки для мышки, которые, согласно заявлению компании, улучшат ее скольжение. Leadtek WinFast PX8800 GTS TDH 640Mb (GeForce 8800GTS) А вот по производительности акселератор WinFast PX8800 GTS не отличался от показателей инженерного образца NVIDIA GeForce 8800GTS. Оно и понятно, ведь в основе продукта Leadtek заложены те же самые характеристики и параметры. Так что нам остается еще похвалить глянцевое покрытие упаковки WinFast да парочку устаревших игр в комплекте (Spell Force 2 и Trackmania). Gigabyte GV-3D1-7950-RH 2Ё512Mb (GeForce 7950GX2) Во-первых, две платы на базе ГП NVIDIA G71 работают с пониженными частотами — 500/1200 МГц (ядро/память) вместо типичных 650/1600 МГц. Во-вторых, для работы SLI-акселератора Gigabyte GV-3D1-7950-RH достаточно одного разъема PCI Express 16x на системной плате, ведь соответствующие контакты у решения GeForce 7950GX2 имеются лишь на нижней PCB, в то время как верхний ускоритель жестко связан с нижним через специальный мост. И в-третьих, две SLI-упряжки NVIDIA GeForce 7950GX2 можно еще раз объединить в режим SLI и получить “четырехъядерное” графическое решение, и такая Quad-система годится для использования в самых высокопроизводительных станциях (например, в платформе AMD 4Ё4). Кстати, обе платы, объединенные в ускорителе Gigabyte GV-3D1-7950-RH, имеют собственные системы охлаждения, в основе которых лежит радиатор с впаянной пластиной из меди и небольшой вентилятор с приемлемым уровнем шума. И хотя в процессе тестирования двухуровневая конструкция Gigabyte все равно сильно грелась, она работала без сбоев и замечаний не вызывала. MSI NX7900GTX-T2D512E 512Mb (GeForce 7900GTX) Разумеется, с появлением линейки высокопроизводительных решений NVIDIA GeForce 8800 судьба моделей семейства GeForce 79xx становится предопределенной, хотя пока на прилавках магазинов они встречаются чаще, чем ускорители с ГП NVIDIA G80. Sapphire Radeon X1950 XTX 512Mb (Radeon X1950 XTX) Однако помимо небольшой оптимизации интегральной микросхемы ATI R580 налицо серьезная переработка эталонной системы охлаждения высокопроизводительных акселераторов ATI. Теперь она более эффективна и к тому же функционирует значительно тише. Можно даже предположить, что именно эту конструкцию начнут устанавливать на некоторые будущие платы линейки Radeon X2000 на базе микросхем ATI R600 и R620. В основе нового охладителя ATI лежит массивный радиатор из медного сплава и капиллярная трубка, обеспечивающая отвод тепла к многочисленным тонким пластинам. Как и в системе охлаждения G80, конструкция ATI Radeon X1950 XTX заключена в пластиковый кожух, где с одного края установлена турбина со специальными лопастями, которые усиленно гонят нагретый воздух изнутри корпуса ПК наружу через воздуховод. Остается добавить, что в нашем обзоре решение ATI Radeon X1950 XTX было представлено высокоточной копией производства Sapphire. На российский рынок она поставляется с двухлетней гарантией и с неудачной игрой The Davinco Code в комплекте. ASUS EAX1900XTX/2DHTV 512Mb (Radeon X1900 XTX) Но все же в большинстве актуальных игр значительное количество пиксельных конвейеров в Radeon X1900XTX никак не сказывается, ведь процессор ATI R580, как и R520, имеет всего 16 текстурных блоков (для сравнения: GeForce 7900GTX обладает 24 “текстурниками”), и таким образом интегральная микросхема выбирает лишь 16 текстур за такт. Так что многие результаты игровых тестов для платы ASUS EAX1900XTX/2DHTV оказались самыми скромными в нашем обзоре. Что показали тесты И вовсе не обязательно покупать ОС Windows Vista и ждать выхода специальных версий игровых проектов Age of Conan, FPS Creator, Company of Heroes и Flight Simulator X с поддержкой новой версии Direct3D. Даже в играх нашего времени мы констатируем порой двукратный рост производительности платы GeForce 8800GTX по сравнению с вчерашними лидерами NVIDIA и ATI. Разумеется, самый большой прогресс наблюдается в наиболее высоких экранных разрешениях, и далеко не все мониторы поддерживают такие режимы работы. Но приятно, что технический прорыв все же могут наблюдать и обычные пользователи, а ведь так бывает далеко не всегда. Вспомните момент появления на рынке 64-битовых ЦПУ компании AMD в 2003 г. И много с тех пор вы видели владельцев ЦП AMD Athlon 64, которые получают выгоду от возможностей 64-разрядных вычислений? А между тем к 2007 г. первые процессоры Athlon 64 успели безнадежно устареть, так и не порадовав нас резким скачком производительности в 64-битовых ОС. Очевидно, внедрение графических процессоров GeForce 8800GTX пойдет по другому сценарию и массовое проникновение G80 в игровые компьютеры — лишь вопрос цены и времени. И жаль, что пока не всем любителям игр по карману видеоплаты FOXCONN GeForce 8800GTX или Chaintech GeForce 8800GTX. Но при желании сэкономить 150—200 долл. ситуация выглядит неоднозначно. Ведь решение GeForce 8800GTS по цене соответствует ускорителю GeForce 7950GX2, однако по производительности оно значительно уступает “бутербродной” конструкции NVIDIA в играх Call of Duty 2, Quake 4, Prey и The Chronicles of Riddick: EFBB. Конечно, в пользу приобретения плат BFG GeForce 8800GTS и Leadtek WinFast PX8800 GTS TDH говорит поддержка DirectX 10 и Shader Model 4.0, а также усовершенствованные методы анизотропной фильтрации и сглаживания. Однако акселераторы NVIDIA GeForce 7950GX2 предпочтительней в плане игровой производительности и к тому же пока доступней в компьютерных магазинах. Что касается решений GeForce 7900GTX, Radeon X1950 XTX и Radeon X1900 XTX, то по производительности они находятся в самом низу таблицы результатов испытаний и соперничают между собой с переменным успехом. Но если цены на вчерашних победителей видеообзоров упадут еще немного, то для большинства игроманов покупка экс-чемпионов будет выгодной, ведь в разрешениях 1280x1024 и 1600x1200 они пока выдают комфортный уровень частоты смены кадров в играх. А вопрос о целесообразности использования высоких настроек анизотропной фильтрации и полноэкранного сглаживания каждый пользователь должен решать индивидуально, выбирая между субъективным ощущением улучшения качества изображения и уменьшением количества кадров в секунду. Полный вариант статьи см. на “Мир ПК-диске”. Вопросы качества ПримерработыалгоритмовтипичнойфильтрациинаверхуианизотропнойфильтрациивнизувигревниманиенасекциииПримерработыалгоритмовтипичнойфильтрациинаверхуианизотропнойфильтрациивнизувигревниманиенасекциииПри сравнении видеоплат кроме показателей производительности в игровых приложениях большая роль отводится качеству отображения, которое складывается из самых сложных режимов анизотропной фильтрации (AF) и полноэкранного сглаживания (AA), а также из фирменных методов реализации этих технологий (см. “ Нанометровая граница позади”, “Мир ПК”, №5/06).Например, ускорители ATI начиная с моделей Radeon 9700, а также платы NVIDIA от GeForce6 и старше использовали похожие алгоритмы фильтрации, которые были достаточно экономичны с точки зрения использования вычислительных ресурсов. В то же время эти методы таили в себе упущения по качеству визуализации. Представьте себе сцену из игры, где вы располагаетесь рядом со спуском переменного наклона (см. рисунок). Достаточно очевидно, что поверхности, находящиеся на одном и том же расстоянии от вас, будут видны одинаково хорошо. Однако весь секрет упрощенной анизотропной фильтрации в том, что далеко не все плоскости обработаны с равной четкостью. Выбранный уровень анизотропии (2х, 4х, 8х и 16х) работает только для определенных поверхностей, которые наклонены к оси зрения (перпендикулярно поверхности экрана) пользователя под углами, близкими к 0, 45, 90, 135, 180o. В остальных случаях плоскости обрабатываются в упрощенных режимах и качество AF при определенных углах наклона опускается ниже отметки 2x, что особенно заметно при установке уровня анизотропной фильтрации в режимах 8х и 16х. Но теперь все будет иначе. Для устранения упомянутых недочетов AF в работе видеоплат ATI можно включать опцию High Quality AF, которая приводит к улучшению качества изображения и уменьшению количества кадров в секунду (см. табл. 5 на “Мир ПК-диске”). А в продукции компании NVIDIA начиная с линейки GeForce 8800 текстурные модули изначально спроектированы с расчетом на повышение эффективности работы анизотропной фильтрации. И в кристалле G80 число возможных выборок текстур было повышено в 2 раза по сравнению с общим количеством текстурных модулей нового поколения. Такие оптимизации сделали возможным использование анизотропной фильтрации полноценного качества, при котором все поверхности обрабатываются в соответствии с уровнем анизотропии, выставленным через драйвер. Кроме того, падение производительности при включении AF на платах GeForce 8800GTX и GeForce 8800GTS оказалось ничуть не выше, чем у карт предыдущего поколения. При сравнении производительности стоит также иметь в виду, что качество визуализации, предлагаемое ускорителями NVIDIA GeForce 8800 GTS и GTX, находится на более высоком уровне. Поэтому в тестировании более корректные выводы в плане производительности можно делать в процессе анализа результатов в режимах с отключенными анизотропной фильтрацией и полноэкранным сглаживанием. Что же касается сглаживания, то тут есть свои нюансы, требующие отдельного исследования. Пока же мы можем сказать, что появилось несколько новых режимов более высокого качества, чем то, что мы привыкли видеть (примеры см. на рисунке). ПримерработыновогорежимаполноэкранногосглаживаниявигренаплатеПримерработыновогорежимаполноэкранногосглаживаниявигренаплате Таблица 1. Сравнительные характеристики видеоадаптеров PCI Express (технология производства 90 нм)
1 Составляющие итоговой оценки: особенности — 20%, производительность — 40, эргономика — 15, цена — 25%.Таблица 2. Результаты игровых тестов при AA:00 и AF:00, кадр/с
Таблица 3. Зависимость производительности от качества анизотропной фильтрации на примере платы ATI Radeon X1950 XTX, при AA:04 и AF:16, кадр/с
Статью "20.04.2007 Новый уровень производительности" |
||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
|
Copyright by MorePC - обзоры, характеристики, рейтинги мониторов, принтеров, ноутбуков, сканеров и др. | info@morepc.ru |
|