Главная - Видеосистема - Voodoo Scalable Architecture, VSA-100, Voodoo4 и Voodoo5 от 3dfx
Voodoo Scalable Architecture, VSA-100, Voodoo4 и Voodoo5 от 3dfx
Итак,
это свершилось. 15 ноября 1999
года компания 3dfx официально
анонсировала свою новую
технологию VSA (Voodoo Scalable Architecture),
ранее известную под кодовым
именем Napalm, а также первые
графические процессоры и карты,
реализующие эту технологию.
В
последние полгода только
ленивый пользователь или
обозреватель не пинал компанию
3dfx. В принципе, было за что
пинать, однако компания не
сдалась, а продолжала упорно
работать над своим новым
детищем. Прежде всего, перед 3dfx
стояла проблема правильного
выбора стратегии.
Руководителям компании вместе
с инженерным персоналом нужно
было решить, какими
функциональными возможностями
должны обладать новые продукты
3dfx. Новые продукты должны
сочетать в себе такие качества,
которые смогут обеспечить
популярность среди
потребителей и сохранить за 3dfx
место среди ведущих игроков
массового рынка 3D-графики. В
связи с тем, что продукты
конкурентов обладают
определенным набором новых
функциональных возможностей,
инженерам 3dfx нужно было
создать продукт, по крайней
мере, не уступающий по
параметрам. Но этого было бы
достаточно лишь для того, чтобы
остаться на рынке. Если же 3dfx
хочет вернуть себе место
лидера, новый продукт должен
обладать тем, чего нет у
конкурентов, но что очень
понравится пользователям, или
обладать всем тем, что есть
передового и нового у
конкурентов, но вместе с тем
быть лучше. Подготовку к
премьере новой технологии и
продуктов, воплощающих ее,
компания 3dfx начала еще этим
летом. Сначала нам рассказали о
новой технологии T-Buffer от 3dfx,
затем о новой технологии
компрессии текстур FXT1 от той же
3dfx. Плюс ко всему, по сети еще с
прошлого года ходили слухи о
том, что в лабораториях 3dfx
готовится какой-то новый чудо-продукт
с невероятными возможностями.
Так или иначе, но интерес к
новому продукту от 3dfx
существует довольно давно, и
очень устойчивый. Одни с
нетерпением и надеждой ждут
нового продукта от любимой
компании, другие ждут тоже с
нетерпением, в тайне надеясь,
что 3dfx облажается и компания исчезнет
с рынка, расчистив дорогу более
сильным конкурентам. Примерно
за пару недель до 15 ноября на
сайте 3dfx можно было увидеть
следующее:
Нас
приглашали заглянуть на сайт 3dfx
в 19:00 по московскому времени и
узнать, что же нового нам
приготовила компания 3dfx. Идея
NVIDIA с нагнетанием
таинственности и привлечения
всеобщего внимания явно
прижилась. В этом нет ничего
плохого, так как все самые
удачные идеи конкуренты всегда
перенимают. Самое интересное,
что уже в 14:00 по Московскому
времени любознательные
пользователи раскопали на
европейском сайте 3dfx секретный
пресс-релиз со всей
информацией о грядущем пятью
часами позже событии. К слову, в
первые 30 минут после времени
"Ч" сайт 3dfx был явно
перегружен обращениями
страждущих, немного позднее
ситуация улучшилась. Видимо,
положительную роль сыграло то,
что на многих сайтах,
посвященных компьютерным
новостям, заранее было все
рассказано, что и снизило поток
желающих попасть на сайт 3dfx
именно в 19:00. На мой взгляд,
событие с представлением новой
архитектуры VSA и новых
графических акселераторов
ничуть не потускнело из-за
утечки информации. Стало ли это
событие новой вехой в развитии
массового рынка 3D графики,
покажет только время. Сейчас мы
можем лишь констатировать, что
многие наши прогнозы вновь
оправдались, и посмотреть
более внимательно на то, что
предлагает нам 3dfx. Тем не менее,
любой желающий может отметить
этот день для себя, как
праздник, или просто, хмыкнув,
проигнорировать.
Практически
все конкурирующие продукты в
области 3D-графики поддерживают
отображение трехмерной
графики при 32-битной глубине
представления цвета,
поддерживают AGP-текстурирование
и текстуры большого размера, а
также еще набор некоторых функций,
ставший как минимум стандартом
де факто. С этими и другими,
ставшими уже стандартными
параметрами для современных
графических акселераторов, в
принципе, все ясно. Можно вести
споры о том, что часть из
функциональных возможностей
не поддерживаются в
приложениях, а значит, не особо
и нужны, но эти споры
бессмысленны. Если сложилось
мнение, что то-то и то-то -
необходимая функциональная
черта, значит, любой продукт
должен обладать это чертой,
иначе asta la vista, baby. Новый
продукт от 3dfx просто обязан
соответствовать установленным
стандартам на рынке. Но вот что
предложить покупателям, кроме
стандартного набора
возможностей? Заметим, что
наличие интегрированного
геометрического сопроцессора
мы пока относим к новейшим, или
нестандартным функциональным
возможностям графических
процессоров для массового
рынка. Можно пойти по пути
конкурентов и также предложить
в своих новых продуктах
аппаратную поддержку расчетов
T&L. Известно, что NVIDIA и S3 пошли
как раз по пути интеграции
геометрических сопроцессоров
в свои чипы и сделали это
первыми в решениях для
массового рынка 3D-графики. Этот
путь развития, безусловно,
верен, и есть все основания
предполагать, что через
полгода год мы увидим массу игр,
которые будут требовать
наличия аппаратного расчета
преобразования координат
полигонов и установки
освещения. Тем не менее,
правильных путей развития
может быть несколько. После
анонса технологии T-Buffer стало
совершенно очевидно, что в
будущих новых продуктах от 3dfx
будет реализована аппаратная
поддержка T-Buffer. Напомним
вкратце, в чем суть технологии T-Buffer.
Суть
технологии T-Buffer состоит в
обеспечении возможности
управления несколькими
кадровыми буферами, что
позволяет использовать ряд
специальных эффектов. Самый
важный цифровой эффект - это full
scene spatial anti-aliasing (или просто FSAA).
Кроме того, уже сейчас
разработаны техники
использования таких эффектов,
как motion blur, depth of field, soft shadows и soft
reflectance. Технология T-Buffer - это,
прежде всего, инструментарий.
Имея возможность управлять
рендерингом сразу в нескольких
кадровых буферах, разработчик
приложений может создавать
свои собственные специальные
эффекты. Для реализации
эффекта full-scene spatial anti-aliasing не
нужно каких-либо специальных
интерфейсов, для всех других
эффектов, которые можно
накладывать с помощью T-Buffer,
потребуется поддержка через
интерфейсы, которая, впрочем,
может быть реализована через
расширения к OpenGL или Direct3D.
Главная идея T-Buffer состоит в
обеспечении визуализации
более качественной 3D-графики.
После
анонса новой технологии от 3dfx,
получившей замысловатое имя VSA-100
стало ясно, что упор сделан на
скорость и качество, а ключевым
термином стало слово Scalable (масштабируемость).
Поддержка аппаратного расчета
T&L пока отложена на неопределенный
срок.
В
принципе, идею инженеров 3dfx
легко понять. Зачем делать
продукт, часть функциональных
возможностей которого будет
использоваться лишь через
полгода, а то и через год? Если
компании NVIDIA и S3 хотят быть
локомотивами, которые будут
проталкивать идею аппаратной
реализации расчетов T&L среди
разработчиков игр, то пусть
этим и занимаются. К тому же они
еще и между собой будут
конкурировать. Кроме того,
весной и NVIDIA и S3 все равно
выпустят следующее поколение
своих GPU, а тогда к конкурентной
борьбе может подключиться и
компания 3dfx. Конечно, если
картина с поддержкой
аппаратной реализации T&L в
играх станет очевидной. Если
весной все еще будет не ясно,
нужны ли на массовом рынке
графические карты с
геометрическими
сопроцессорами на борту, никто
не мешает отложить 3dfx анонс
поддержки аппаратного расчета
T&L до осени 2000 года. Если же
уже весной 2000 станет очевидно,
что аппаратная поддержка T&L
является необходимой
функциональной чертой
графических акселераторов для
массового рынка, никто не
мешает 3dfx установить на свои
карты внешний геометрический
сопроцессор. Замечу, что, на мой
взгляд, пока логичнее вести
речь именно о внешнем
геометрическом сопроцессоре
на платах от 3dfx. Причин тому
несколько. Во-первых, если верить
неподтвержденной официальными
источниками информации, 3dfx уже
ведет работы по использованию
в своих продуктах внешнего
геометрического сопроцессора
IMPAC-GE от Mitsubishi. Основная
проблема с такой реализацией
это поддержка в драйверах. Главный
плюс - минимальные затраты на
разработку, т.к. чип IMPAC-GE
существует и присутствует на
профессиональном графическом
рынке уже более года, т.е. это
отлаженное решение. Во-вторых,
можно пересмотреть дизайн
продуктов сери VSA и
интегрировать в них
геометрический сопроцессор.
Главный минус такого решения -
это большие затраты на
разработку, дизайн и отладку, т.к.
все нужно фактически делать с
нуля (если, конечно, эти работы
уже не ведутся). Плюсом такого
решения является его
потенциальная вычислительная
мощность, читай
производительность. Дело в том,
что ключевой особенностью
архитектуры VSA является
масштабируемость, т.е.
подразумевается, что на одной
плате может быть установлено
параллельно несколько
графических процессоров. Если
в каждом процессоре будет
интегрированным свой
геометрический сопроцессор, то
в итоге мы получим
суперкомпьютер в формате AGP
карты. С другой стороны, никто
не мешает установить на одной
PCB несколько геометрических
сопроцессоров, главное, чтобы
хватило электропитания и места
на карте. При этом идеология
технологии SLI может быть
применена и к параллельным
вычислениям, выполняемым сразу
несколькими геометрическими
сопроцессорами. Какой путь на
самом деле выберет 3dfx, покажет
только время. Тем не менее,
приведу высказывание CTO
компании 3dfx Скотта Селлерса (Scott
Sellers): "3dfx will have HW T&L when it
matters in the market". Проще говоря,
когда аппаратная поддержка
T&L будет необходима на рынке,
мы ее реализуем.
Архитектура
VSA
VSA
расшифровывается как Voodoo Scalable
Architecture, что по-русски звучит
как масштабируемая
архитектура Voodoo. Сразу можно
отметить, что 3dfx не отказалась
от хорошо раскрученной марки
Voodoo. Это вполне логичное и
ожидаемое решение. По крайней
мере, это экономит деньги на
рекламу, а режим экономии
сейчас очень необходим для 3dfx,
особенно в свете того, что
продажи карт серии Voodoo3 не
обеспечивают достаточных
доходов, а новые карты появятся
на рынке лишь весной 2000 года,
уже после новогоднего пика
продаж на массовом рынке.
Первый чип, реализующий
архитектуру VSA, получил имя VSA-100.
Простое, незамысловатое
название.
Итак,
в чем же заключается
масштабируемость новой
архитектуры? Масштабируемость
VSA заключается в возможности
параллельной работы от 2 до 32
графических процессоров. При
этом параллельная работа
графических процессоров может
использоваться двумя методами.
Первый
метод подразумевает
использование технологии SLI (scan
line interleave), хорошо известной со
времен классического чипсета
Voodoo2. Во времена Voodoo2 технология
SLI представляла собой
следующее: два графических
процессора осуществляют рендеринг
разных строк одного кадра,
формирующих конечное
изображение. При этом все чипы
используют один общий кадровый
буфер. Затем сформированный
кадр выводится из общего
кадрового буфера на экран
монитора. Архитектура VSA
поддерживает новую реализацию
технологии SLI, в которой
устранены такие ограничения
старого варианта SLI, как
использование только двух
графических чипсетов
параллельно и отсутствие
поддержки разрешений более чем
1024х768 (теперь поддерживаются
разрешения вплоть до 1600х1200).
Более того, новая версия
технологии SLI представляет
собой совершенно другую
идеологию. В силу того, что
современные графические
ускорители ориентированы на
использование AGP-интерфейса, а
по заявлению 3dfx чип VSA-100
специально оптимизирован на
работу с AGP, теперь режим SLI
ориентирован на реализацию
протокола взаимодействия
нескольких графических процессоров,
расположенных на одной PCB. В
случае с VSA-100 новая версия
технологии SLI позволяет
обеспечить совместную работу в
параллельном режиме до 32
графических процессоров.
Теперь каждый чип, работающий в
режиме SLI, может заниматься
формированием определенной
последовательности или полосы
из строк одного кадра, а каждая
такая последовательность
может содержать от 1 до 128 строк.
При этом число строк в
последовательности или полос
может динамически изменяться.
Речь идет о том, что каждый чип
формирует строки, которые идут
подряд и составляют полосу, а
из набора полос формируется
полный кадр. Например, если мы
имеем четыре чипа, работающих в
режиме SLI, то каждый чип может
формировать полосы из 40 строк
каждая, которые все вместе
сформируют кадр. Разумеется,
можно использовать и режим
чередования строк, а не
последовательностей строк.
Например, в случае 4
процессоров в режиме SLI
присвоим каждому чипу индекс CN,
где N=1, 2, 3, 4. Тогда чип C1 будет
формировать строку S=1, 5, 9 и т.д.
или S=4*M+N, где M=[0...1200], а N
соответствует номеру
графического процессора.
Зачем
понадобилось использовать
именно полосы с возможностью
изменения количество строк,
содержащихся в них? В зависимости
от глубины представления цвета,
числа полигонов в сцене и их
расположения возможность
изменять число строк,
составляющих полосы, позволяет
оптимальным образом загружать
и использовать технику SLI. При
этом возможна ситуация, когда
формирование маленького
полигона может выполняться
полностью одним графическим
чипом и в пределах одной полосы
строк. В такой ситуации использование
SLI будет неэффективным. С
другой стороны, если
графический чип формирует
больше одной строки сразу, т.е.
полосу, это позволяет
загружать более равномерно всю
систему и эффективно
использовать текстурный кэш. В
итоге было решено использовать
полосы, в которых число строк
динамично изменяется от 1 до 128,
что обеспечивает равномерную
загрузку системы работающей в
режиме SLI.
Замечу,
что каждый из чипов VSA-100,
используемых в режиме SLI, имеет
собственный кадровый буфер, в
котором осуществляется
рендеринг строк или
последовательностей строк (полос),
после чего данные из разных
кадровых буферов передаются в
общий кадровый буфер, где
формируется полный кадр и уже
оттуда происходит вывод на
экран монитора. При этом каждый
чип VSA-100 имеет собственную шину
памяти и собственный локальный
кадровый буфер. Напомню, что
каждый чип VSA-100 поддерживает
работу с локальной
видеопамятью объемом до 64 Мб.
Часть доступной для каждого
чипа памяти используется под
кадровый буфер (с двойной или
даже тройной буферизацией), а
остальная память используется
для хранения текстур и Z-буферизации.
На тот случай, если доступных
объемов памяти окажется мало, 3dfx
рекомендует использовать один
из двух поддерживаемых методов
компрессии текстур: DXTC или FXT1.
Такая организация работы
графических процессоров
способствует более
равномерному распределению
нагрузки на полосу пропускания
шины памяти. Кстати, благодаря
такому решению, когда потоки
данных равномерно
распределяются между
графическими процессорами,
работающими в режиме SLI,
суммарная ширина полосы
пропускания памяти
существенно возрастает. Именно
поэтому вполне допустим
вариант использования
стандартной памяти SDRAM/SGRAM, как,
вероятно, и будет на самом деле.
Второй
метод подразумевает
использование технологии T-Buffer.
В этом случае каждый
графический процессор
формирует полностью один кадр
изображения в собственном
кадровом буфере. После чего T-Buffer
производит совмещение
содержимого нескольких кадровых
буферов и выводит полученный
результат на экран монитора в
виде единого кадра. Не буду
повторять, какие возможности
предоставляет использование T-Buffer
, просто напомню, что главное
это улучшение качества и
восприятия графики. Улучшение
качества достигается за счет
аппаратной реализации
сглаживания всей сцены (full scene
anti-aliasing), а восприятие
улучшается за счет применения
специальных эффектов типа depth of
field, soft shadows и т.д.
Остается
один важный, на мой взгляд,
вопрос. Будет ли возможность
одновременно использовать T-Buffer
и режим SLI? Судя по всему да,
такая возможность будет, но
работать все это будет по-разному
в конфигурациях с двумя и
четырьмя (и более) чипами VSA-100. И
вот почему. Для реализации
аппаратного эффекта full scene anti-aliasing
для формирования конечного
пикселя изображения
используется четыре
пиксельных семпла. В случае,
когда на карте используется
только два чипа VSA-100, за один
такт они могут сформировать
как раз 4 пиксельных семпла, но
не более, т.е. использовать
чередование строк или полос из
строк это просто лишняя потеря
времени. С другой стороны,
действие эффектов T-Buffer может
применяться не к полному кадру,
а лишь к его определенной части.
В этом случае, видимо,
допустимо использование
техники чередования строк для
оптимизации нагрузки на шину
памяти, а значит, можно
одновременно использовать T-Buffer
и режим SLI. Если все эти
предположения верны, то для
оптимальной работы T-Buffer, а
значит аппаратного применения
эффекта FSAA (full scene anti-aliasing) и
других специальных эффектов
без ощутимого урона общей
производительности, т.е. с
применением техники SLI,
требуется использование не
менее четырех процессоров VSA-100
одновременно. В случае
использования лишь двух
процессоров VSA-100 техника SLI
будет применяться
ограниченным образом, либо
вообще не применяться, если
задействован T-Buffer, либо будет
применять только режим SLI для
достижения максимальной производительности
и при этом полностью не будет
задействован T-Buffer.
Если
все эти идеи верны, то
пользователь получит
возможность выбирать между
высокой производительностью и
высоким качеством и
реалистичностью изображения.
Косвенно это подтверждается
тем, что, по заявлению3dfx, у
пользователя будет
возможность отключения T-Buffer (а
значит, отключения аппаратной
реализации эффекта FSAA), чтобы
получить максимальную
величину fillrate, а значит,
максимальные значения fps.
Поясню важную деталь. Если
пользователь выберет для себя
режим наивысшего качества графики
и наилучшего восприятия
изображений на мониторе, читай:
решит использовать технологию
T-Buffer, это вовсе не означает, что
он проиграет в скорости. По
крайней мере, 3dfx обещает, что
высокое качество графики и
реализм изображений при
использовании специальных
эффектов типа motion blur, depth of field и
т.д. не скажется на величине
fillrate. Проще говоря, наряду с
высоким качеством графики и
использованием специальных
эффектов пользователь получит
высокую частоту смены кадров
на экране, например, 60 fps при
разрешении 1024х768 и с
использованием T-Buffer. Если
пользователю плевать на
специальные эффекты и его
устраивает обычное качество
графики, которое обеспечивают
продукты от NVIDIA, Matrox или ATI, но
не хватает скорости и хочется
получить сумасшедшие значения
fps, то достаточно отключить T-Buffer
и включить режим SLI.
Отметим
один важный момент. По
сравнению с технологией MAXX от
ATI у технологии SLI от 3dfx нет
такой проблемы, как возможное
возникновение лага. Отсутствие
проблемы связано с тем, что в
случае с режимом SLI графические
процессоры каждый раз занимаются
формированием текущего кадра,
не выполняя работы впрок.
Теперь
уместно рассмотреть параметры
первого чипа, реализующего
архитектуру VSA.
Общие
данные VSA-100
- Интегрированный
128-разрядный 2D/3D/Video
ускоритель
- Чип
содержит 14 млн.
транзисторов,
изготавливается по 0.25 мкм
технологическому процессу
с использованием
шестислойной технологии
- Частота
графического ядра - 66 - 183 MHz
(в зависимости от типа
используемой памяти)
- 2
конвейера рендеринга с 2
блоками текстурирования
на каждом (вопрос спорный,
есть мнение, что каждый
конвейер имеет лишь один
блок текстурирования)
- Fillrate
333 - 367 млн. пикселей в
секунду (включая режим
мультитекстурирования)
- Интегрированный
350 MHz RAMDAC (возможно, будет
использоваться 400 Мгц RAMDAC)
- Рендеринг
при 32-битной глубине
представления цвета
- 24-бит
Z & W-буферы,
- 8-битный
стенсель буфер
- Текстуры
с 32-битной точностью
представления данных и
размером вплоть до 2040x2048
пикселей
- Предположительно
128-разрядный интерфейс
памяти
- Один
чип VSA-100 поддерживает до 64
Мб локальной видеопамяти
типа SDRAM/SGRAM и, возможно, DDR
SDRAM/SGRAM
- PCI
2.2 и AGP x2/4x с SBA и DME
- Максимальное
разрешение 2048x1536@85Hz
3D-часть
Поддерживается
весь набор функций как у серии
Voodoo3 и плюс к этому:
- Мультитекстурирование
за один проход и один такт
- Рельефное
текстурирование за один
проход и один такт
- Трилинейная
фильтрация за один проход
и один такт
- Попиксельный
mip-mapping и режим альфа
смешивания
- Поддержка
8-битных палетизированных
текстур (гарантирует
высокую совместимость с
играми и не снижает общей
производительности)
- Наложение
табличного и
попиксельного тумана
- Поддерживается
"triangle strips and fans" (При
наличии смежных
треугольников не
требуется передавать
информацию о всех трех
вершинах каждого из них, а
просто передаются данные
сразу о
последовательность
треугольников, для каждого
из которых определяется
лишь одна вершина. В
результате снижаются
требования к ширине полосы
пропускания шины памяти)
- Динамичное
наложение текстур
окружающей среды
- Поддерживаются
все режимы смешивания
текстурных цветов
описанные в DX6, DX7 и OpenGL 1.2
- Поддерживаются
технологии компрессии
текстур DXTC и FXT1
Программная
часть
- Драйверы
с поддержкой интерфейсов
DirectX, OpenGL и Glide (обещается,
что новый ICD OpenGL позволит
работать с профессиональными
графическими приложениями)
- Поддерживаются
ОС Windows 95, 98, NT4.0 и Windows 2000
Первое,
что вызывает вопросы - это тот
факт, что чип VSA-100 будет
производиться по 0.25 мкм
процессу, и это в первом
квартале 2000 года, когда
конкуренты собираются
переходить на 0.18 мкм процесс.
Уже сейчас S3 использует 0.18 мкм
технологию при производстве
своих чипов Savage2000, а GPU GeForce 256 от
NVIDIA производится по 0.22 мкм
технологическому процессу.
Ответ на этот вопрос дал Скотт
Селлерс в интервью сайту "Thresh's FiringSquad". Вот
что сказал Скотт: "NVIDIA
использует пятислойный металлический
0.22 мкм процесс, что
обеспечивает меньшие размеры
кристалла и более низкое
энергопотребление. Мы используем
шестислойный дизайн и
улучшенный 0.25 мкм
технологический процесс, что
позволяет уменьшить размер
кристалла по сравнению с
обычным 0.25 мкм технологическим
процессом и таким же
количеством транзисторов, а
главное в результате всего
этого количество годных
кристаллов на выходе
существенно увеличивается".
Остается принять все это на
веру и успокаивать себя мыслью
о том, что 3dfx знает, что делает.
Интересно,
а почему в VSA-100 используется 14
млн. транзисторов? Чип Savage2000 от
S3 содержит 12 млн. транзисторов.
При этом Savage2000, как и VSA-100, имеет
два конвейера и по два
текстурных блока на каждом.
Однако Savage2000 имеет
интегрированный
геометрический сопроцессор, а
в VSA-100 его нет. Или есть, но нам
об этом не говорят?
Представляете ситуацию, когда
в марте 2000 года 3dfx вдруг заявит,
что VSA-100 имеет геометрический
сопроцессор, просто раньше об
этом молчали из-за недоработок
в программном обеспечении. Но
это все мечты, не имеющие
ничего в основе.
Отметим,
что в дизайне чипа VSA-100
использовались разработки,
которые применялись во всех
предыдущих сериях графических
процессоров от 3dfx, что должно
обеспечить полную
совместимость со всеми
существующими приложениями,
оптимизированными под них.
Хотя, все это, на мой взгляд, не
исключает ситуации, когда
придется вновь ждать патчи для
игр, рассчитанных под
предыдущие версии Glide, чтобы
насладиться старыми играми на
новой графической карте.
Один
важный момент пока не имеет
четкого объяснения. Это ширина
полосы пропускания локальной
видеопамяти и интерфейс памяти.
Дело в том, что чип VSA-100
обеспечивает довольно высокие
показатели fillrate, а если на
карте установлено 2 или более
чипов VSA-100, то величина fillrate
возрастает еще больше. При этом
с ростом fillrate возрастает
нагрузка на шину памяти. Если
пропускной способности шины
локальной видеопамяти будет
недостаточно, то потенциальный
fillrate так и останется
потенциальным. Память может
просто не успеть передать
необходимое количество данных,
следствием чего станет падение
производительности, а пользователь
не получит в высоких
разрешениях ожидаемых
значений fps. Особую критичность
вопрос о типе локальной
видеопамяти становится при
воспроизведении 3D-графики при
32-битной глубине представления
цвета, тем более что этот режим
поддерживается VSA-100. Тем не
менее, использование новой
версии технологии SLI позволяет
довольно изящным образом
решить проблему с нагрузкой на
шину памяти. Шина памяти
разгружается за счет того, что
каждый чип VSA-100 формирует лишь
часть строк, из которых состоит
полный кадр. В результате
каждому чипу VSA-100 вполне
достаточно иметь 128-битную шину
памяти.
Кроме
того, пока нет никакой ясности
с поддержкой памяти типа DDR SGRAM/SDRAM.
На наш взгляд, ничто не мешает
реализации такой поддержки,
например, с прицелом на будущее.
К тому же никак нельзя назвать
низкой объявленную цену карт
на базе VSA-100, особенно учитывая,
что карты должны попасть на
рынок лишь в первом квартале 2000
года. Зато если за объявленную
цену будут предложены платы с
локальной видеопамятью типа DDR
SGRAM на борту, привлекательность
новых продуктов от 3dfx
существенно возрастет. С
другой стороны, 3dfx может просто
снизить цену, не прибегая к
изменению параметров своих
карт.
Отметим,
что частота шины памяти вновь
будет синхронизирована с
частотой графического ядра,
как это было у продуктов серии
Voodoo3.
Как
и ожидалось, чип VSA-100
поддерживает воспроизведение 3D-графики
при 32-битной глубине
представления цвета и при 24-битной
Z-буферизации и при
использовании 8-битного
стенсель буфера. Та
функциональная возможность, за
отсутствие которой так ругали 3dfx
в последний год, наконец
поддерживается. Открытым
остается вопрос о том, каким
будет качество 3D-графики при 32-битной
глубине представления цвета, т.к.
это первый опыт 3dfx. В принципе,
поддержка таких функций, как
однопроходная трилинейная фильтрация,
режимы смешивания цветов с
использование альфа-канала,
рельефное текстурирование и
мультитекстурирование способствует
обеспечению очень высокого
качества графических моделей.
Будем надеяться, что качество
нас действительно не разочарует.
К
слову, когда речь идет о работе
с 32-битной глубиной
представления цвета, сразу
встает вопрос о том, как сильно
пострадает от этого
производительность
видеоподсистемы. 3dfx обещает,
что при работе с 32-битным
цветом пользователь все равно
сможет играть при средних
значениях fps, соответствующих 60
кадрам в секунду. Чего, по
мнению 3dfx, более чем достаточно
для комфортной игры. При этом
уже не важно, какая величина fps
при том же разрешении и в том же
приложении достигается при 16-битной
глубине цвета. В принципе, все
логично. Если вас устраивает
скорость и качество, то и
проблемы нет. Посмотрим, как
все будет обстоять на самом
деле.
Отметим,
что VSA-100 поддерживает 32-битные
текстуры с разрешением до 2040х2048
пикселей и AGP-текстурирование.
Это тоже две функциональные
особенности, поддержку которых
так долго ждали от 3dfx. Остается
проверить на практике, как все
это будет работать.
Чип
VSA-100 поддерживает две
технологии компрессии текстур
DXTC и FXT1. Первая технология
является вариантом S3TC, лицензированным
Microsoft и включенным в состав
DirectX, вторая технология
разработана самой компанией 3dfx
и является полностью открытой.
Интересно то, что, поскольку FXT1
поддерживается чипом VSA-100, это
гарантирует, что и DXTC также
будет поддерживаться
аппаратно. Дело в том, что для
DXTC используется один алгоритм
компрессии, а для FXT1 - четыре
алгоритма. FXT1 поддерживается
на аппаратном уровне, и было бы
логично встроить аппаратную
поддержку алгоритма DXTC, тем
более, что общая привлекательность
продукта от этого только
выигрывает. Остается надеяться,
что все так и обстоит на самом
деле.
Совершенно
неясно обстоит дело с тем,
какой именно метод или методы
рельефного текстурирования
поддерживаются чипом VSA-100,
можно только предположить, что
наверняка поддерживаются
методы Embossing и Dot Product. Опять же
ждем разъяснений от 3dfx.
Отдельно
стоит упомянуть поддержку
декодирования MPEG2 видео. К
сожалению, тут нет ничего
хорошего. Есть аппаратная
поддержка преобразования
данных из планарного вида в
упакованный. Все. Больше ничего
не заявлено. Нет ни слова об
оверлеях и о компенсации
движения. Остается надеяться,
что хотя бы оверлеи
поддерживаются в необходимом
объеме.
Карты
на базе чипа VSA-100
Компания
3dfx решила более четко
разделить решения для
массового рынка и
профессионального рынка. Для
массового рынка 3dfx
предполагает выпустить целую
серию карт, использующих чип VSA-100:
Voodoo4
4500 PCI/AGP:
- Один
чип VSA-100
- RAM
32 Mb
- Fillrate
333-367 млн. пикселей в
секунду, включая режим
мультитекстурирования
- Поддержки
T-Buffer нет со всеми
вытекающими (нет FSAA и спец.
эффектов)
- Ориентировочная
цена - $179
По
сути, Voodoo4 - это карта серии Voodoo3,
но с поддержкой AGP-текстурирования,
больших текстур, 32-битной
глубины представления цвета в 3D-графике
и 24-битной Z-буферизацией и 8-битного
буфера шаблонов. Если бы эта
карта появилась на рынке
весной 1999 года или хотя бы
осенью 1999, ее перспективы были
бы вполне ясны. По крайней мере,
она бы конкурировала с платами
на базе чипов NVIDIA RIVA TNT2 Ultra и Matrox
G400 Max. Продажи ее были бы очень
успешными, и свое положение на
рынке 3dfx как минимум не
потеряла бы. Но карты Voodoo4
должны попасть на рынок лишь в
первом квартале 2000 года, и
единственным их неоспоримым
преимуществам над
конкурентами, присутствующими
на рынке уже почти год,
является лишь native-поддержка API
Glide. На мой взгляд, карты Voodoo4
просто опоздали на рынок. Кто
будет покупать эти карты при
цене в $179, мне не понятно. Если
цена будет менее $100, то свою
нишу эта карта захватит.
Voodoo5
5000 PCI:
- Два
чипа VSA-100
- RAM
32 Mb
- Fillrate
667-733 млн. пикселей в
секунду, включая режим
мультитекстурирования
- Поддержки
T-Buffer есть, т.е. есть
аппаратный FSAA и спец.
эффекты
- Ориентировочная
цена - $229
Интересно,
а почему заявлен только PCI-вариант?
Что мешает сделать AGP-вариант?
Может быть, оптимизация под AGP
какая-то особенная? Странная
карта. 3dfx заявляет, что очень
заботится о пользователях
старых систем без AGP-порта. При
этом сама же 3dfx позиционирует
свои новые карты для систем на
базе 700 МГц процессоров.
Покажите мне систему только с
PCI слотами, в которой
установлен процессор Athlon или
Pentium III EB.
Если
не будет AGP-варианта, то, на мой
взгляд, ее ниша на рынке будет
очень ограниченной. К тому же
цена выглядит несколько завышенной.
При такой стоимости карта
будет конкурировать с
продуктами в ценовой категории
до $200, и вряд ли кто-то захочет
переплачивать за аппаратную
поддержку FSAA и специальных
эффектов при прочих равных
функциональных возможностях и
параметрах. Никто не захочет
переплачивать за Voodoo5 5000, если
подтвердится гипотеза о том,
что использование T-Buffer (в
частности, использование FSAA)
существенно повлияет на общую
производительность данной
карты. С другой стороны, если в
разрешения вплоть до 1024х768 при
32-битной глубине представления
цвета пользователь при
использовании T-Buffer получит
среднюю величину 60 fps в своих
любимых приложениях, то
привлекательность карты сразу
существенно возрастет.
Большинство пользователей все
равно играют в разрешениях
вплоть до 1024х768, так что
остается лишь проверить все
гипотезы на практике и принять
самостоятельное решение.
Voodoo5
5500 AGP:
- Два
чипа VSA-100
- RAM
64 Mb
- Fillrate
667-733 млн. пикселей в
секунду, включая режим
мультитекстурирования
- Поддержки
T-Buffer есть, т.е. есть
аппаратный FSAA и спец.
эффекты
- Ориентировочная
цена - $299
Это
модернизированный вариант
карты Voodoo5 5000: добавили памяти 32
Мб, задействовали AGP-интерфейс
и подняли цену на $70. Если для
нормальной работы карты в AGP-варианте
требуется, чтобы для каждого
чипа VSA-100 было установлено по 32
Мб памяти, то тогда непонятно,
почему в PCI-версии обошлись
лишь по 16 Мб локальной
видеопамяти. Обратите внимание
на фотографию карты Voodoo5 5500,
видите в верхнем правом углу
разъем белого цвета? Это
стандартный разъем для
электропитания внутренних
периферийных устройств
компьютера. Нечто похожее мы
уже видели у карты Canopus Spectra 7400
на базе GPU GeForce 256. В принципе,
ничего удивительного в таком
решении 3dfx нет. Два графических
чипа VSA-100 потребляют около 25
Ватт в сумме. Использование
питания напрямую от блока
питания должно обеспечить
надежное снабжение энергией, а
значит, и стабильную работу
карты Voodoo5 5500. Скорее всего,
именно эта плата будет
пользоваться наибольшим
спросом среди желающих
получить в играх эффект FSAA и
другие специальные эффекты,
обеспечиваемые T-Buffer. Если 3dfx
снизит цену карту, то успех у
нее на рынке определенно будет.
Voodoo5
6000 AGP:
- Четыре
чипа VSA-100
- RAM
128 Mb
- Fillrate
1.32 - 1.47 млн. пикселей в
секунду, включая режим
мультитекстурирования
- Поддержки
T-Buffer есть, т.е. есть
аппаратный FSAA и спец.
эффекты
- Ориентировочная
цена $599
Самая
мощная из объявленных карт.
Имеет четыре чипа VSA-100, 128 Мб
локальной видеопамяти и
невероятно высокую стоимость.
Судя по всему, только карта Voodoo5
6000 сможет в полной мере
продемонстрировать все
прелести аппаратной
реализации FSAA без
существенного ущерба общей
производительности
видеоподсистемы. Прежде всего,
это станет возможно из-за
использования четырех чипов VSA-100
в режиме SLI. Скорее всего,
ощутить разницу между Voodoo5 5500 и
Voodoo5 6000 можно будет только в
высоких разрешениях, например,
3dfx обещает, что можно будет
играть в разрешении 1600х1200 при 32-битной
глубине представления цвета
при 60 fps с использованием всех
эффектов T-Buffer, включая
аппаратный FSAA. Большие объемы
локальной видеопамяти
объясняются тем, что память
распределяется между четырьмя
чипами VSA-100 и не является общей.
Наличие же 32 Мб доступной
памяти под буферизацию и
текстуры для каждого
графического процессора
вполне достаточно для
нормального функционирования.
Тем не менее, за такие немалые
деньги нам предлагается карта
с невероятными показателями
fillrate. Фактически, если не случится
чуда в виде релиза от какой-либо
"темной лошадки", вроде
BitBoys, то плата Voodoo5 6000 AGP станет
первым акселератором с
возможностью вывода более 1
Гигапикселя в секунду на экран
монитора, рассчитанной на
массовый рынок. Посмотрим, как
все это будет выглядеть на
практике.
К
слову, на фотографии карты Voodoo5
6000 AGP отчетливо виден чип с
маркировкой Intel. Судя по всему,
это Non-transparent PCI-to-PCI bridge. Зачем
нужен этот непрозрачный мост
на видеокарте? Если посмотреть
на описание Non-transparent PCI-to-PCI bridge,
то мы узнаем, что этот мост
позволяет представить некую
подсистему в качестве одного
единственного устройства для
CPU компьютера. При этом
непрозрачный мост еще и
скрывает все ресурсы
подсистемы от CPU. В результате
за непрозрачным мостом можно
расположить очень мощную
графическую подсистему,
состоящую из нескольких
работающих параллельно чипов.
Означает ли использование
этого моста, что карта Voodoo5 6000
не будет поддерживать AGP-текстурирование?
Вряд ли. Мне кажется, что данный
непрозрачный мост применяется
только для представления карты,
представляющей собой целую
графическую подсистему, в виде
одного устройства. Было бы
совершенно нелогично
отказываться от использования
всех возможностей AGP лишь для
того, чтобы позволить работать
параллельно четырем чипам VSA-100.
В любом случае, будем ждать
разъяснений от 3dfx.
Замечу,
что есть неподтвержденная
информация о том, что
микросхема от Intel - это не что
иное, как процессор i960, который
в силу своей универсальности,
может выполнять роль как AGP-to-AGP
bridge, так и выступать в какой-либо
другой специфической роли.
На
картах серии Voodoo5 5000 не
применяется аналогичный мост (по
крайней мере, его не видно на
иллюстрациях), видимо из-за того,
что при использовании лишь
двух чипов VSA-100 нет проблем с
взаимодействием графической
подсистемы с CPU. При этом разделить
доступ к AGP-памяти можно чисто
программными методами, т.е.
через драйвер. По крайней мере,
ATI в своей технологии MAXX
использует именно программный
метод разделения доступа к AGP-памяти
двух графических чипов,
установленных на одной карте, и
никаких мостов ATI не использует.
Теперь уместно перейти к
вопросу с электропитанием.
Если картам серии Voodoo5 5000 с
двумя чипами VSA-100
потребовалось дополнительное
питание, то как обстоит дело у
карты с четырьмя чипами VSA-100?
Каждый чип VSA-100 потребляет от 12
до 13 Ватт электроэнергии, что
примерно на 30% больше, чем
потреблял чип Voodoo3. На карте Voodoo5
6000 расположено сразу четыре
чипа VSA-100, а кроме того еще и 128
Мб локальной видеопамяти и
дополнительный мост от Intel. В
итоге 3dfx решила применить
очень оригинальное решение
проблемы с электропитанием.
Карта Voodoo5 6000 будет иметь
собственный источник
электропитания под названием
"Voodoo Volts" и мощностью
100 Вт. Причем это действительно
отдельный источник питания,
который будет подключаться
непосредственно к стандартной
розетке 220 или 110 Вольт, и
обеспечивать
работоспособность карты Voodoo5
6000. По внешнему виду этот
источник питания очень похож
на те, которые используются с
ноутбуками. К карте Voodoo5 6000
внешний источник питания будет
подключаться через разъем
рядом с VGA-выходом платы. Такое
решение обеспечит надежную
работу карты и гарантирует
работоспособность в любом
компьютере.
Несмотря
на огромную мощность карты и
внешний источник питания, цена
в $599 выглядит завышенной. Если 3dfx
снизит цену хотя бы до $499, то
перспективы продать некоторое
количество таких карт для hardcore
gamers вполне реальны.
Для
профессионального применения 3dfx
рекомендует использовать
решения от Quantum3D под общим
названием AAlchemy. AAlchemy - это новое
семейство мощных систем 3D-графического
моделирования в реальном
времени. Каждая графическая
подсистема AAlchemy состоит из
одного, двух или четырех карт,
на каждой из которых
установлено 4 или 8 чипов VSA-100 и
по 32 или 64 Мб локальной
видеопамяти для каждого чипа.
Графическая система AAlchemy
потенциально может обеспечить
величину fillrate более 3
Гигапикселей в секунду!
Графические подсистемы AAlchemy
рассчитаны на использование в
системах серии Heavy Metal. Правда, и
стоимость таких систем
измеряется четырех и
пятизначными суммами в
долларах.
Выводы
Итак,
попробуем подвести черту.
Компания 3dfx анонсировала не
просто новый графический чип VSA-100,
она анонсировала новую
идеологию создания
высокопроизводительных
графических решений. Сама по
себе идея параллельной
обработки данных очень интересная
и перспективная. Пока сложно
прогнозировать, как отнесется
рынок к новым решениям от 3dfx.
Особенно в свете того, что есть
ряд неясных моментов и
вопросов. Не вызывает споров
только одно: пока мы не увидим
все обещанное в действии,
делать какие-либо выводы
преждевременно.
Фактически
в первом квартале 2000 года
пользователям придется
сделать выбор между T-Buffer (включая
эффект FSAA) и аппаратным
расчетом T&L. Очень сильно на
принятие решения повлияет
ситуация с поддержкой в
приложениях геометрических
сопроцессоров. При этом нужно
понимать один нюанс.
Недостаточно простого
заявления о том, что такая-то
игра рассчитана на аппаратную
реализацию вычислений T&L.
Только в том случае, если эта
игра при использовании
графической карты с
геометрическим сопроцессором
будет выглядеть на экране
монитора пользователя
однозначно лучше, чем при
использовании карт серии Voodoo5,
пользователь выберет продукты
конкурентов, а не 3dfx. Если
окажется, что большинство игр с
заявленной поддержкой
аппаратного расчета T&L не
используют в полной мере этих
аппаратных возможностей
графических карт, читай:
используют в сцене точно такое
же количество полигонов, как
при запуске на системе без
поддержки геометрического
сопроцессора, тогда никакого
смысла покупать карты с
геометрическими
сопроцессорами не будет.
Действительно, зачем покупать
карту с геометрическим
сопроцессором, если уже осенью
2000 года нам предложат новое
поколение подобных карт. В
таком случае на передний план
действительно выйдут карты
серии Voodoo5, так как они
предлагают пользователю
возможности, которые он сможет
использовать немедленно,
причем как в новых, так и в
старых играх. Речь идет о T-Buffer,
точнее, о главном его эффекте -
full scene anti-aliasing (FSAA). При этом
одним эффектом FSAA все не
исчерпывается. T-Buffer позволяет
также на аппаратном уровне
реализовать массу специальных
эффектов, которые широко
используются в киноиндустрии.
Применение этих эффектов
требует поддержки в
интерфейсах, в то время как
аппаратная реализация FSAA
совершенно прозрачна для
приложений и API. В общем, нас
ждет интересное время, когда
придется делать выбор и
расплачиваться за него из
собственного кармана.
К
слову, если бы 3dfx анонсировала
поддержку в своих новых
продуктах аппаратного расчета
T&L ситуация с поддержкой
геометрических сопроцессоров
в приложениях могла бы
существенно изменится. Причем
изменится ситуация могла бы в
сторону ускорения поддержки
геометрических сопроцессоров.
Пока же остается надеяться на
то, что у NVIDIA и S3 хватит сил и
красноречия убеждать разработчиков
и издателей игр использовать
возможности некоторых новых
акселераторов по аппаратному
расчету T&L.
Что
касается расплаты, то еще раз
подчеркну свою мысль о том, что
пока заявленные цены на карты
Voodoo5 выглядят несколько
завышенными и немного пугают. С
другой стороны, вспомните цены
на карты Obsidian2 X-24 от Quantum3D, на
которых использовалось два
чипсета Voodoo2 в режиме SLI. Эта
карта стоила $650, а ведь на ней
было всего 24 Мб локальной
видеопамяти и всего два
чипсета Voodoo2. Кстати, эти карты
неплохо покупали даже в Москве,
в то время как две карты на базе
Voodoo2 обходились тогда в $480, т.е.
по $240 каждая. Так что, если
карты сери Voodoo5 будет стоить
своих денег, их будут покупать.
Тем более, что никто не мешает 3dfx
снизить цену.
Пока
нам остается искать ответы на
вопросы, копить деньги и ждать
появления на рынке первых
реальных карт на базе VSA-100.