Главный долгострой 2011 года, а именно процессоры с архитектурой AMD Bulldozer, в октябре был-таки , однако на дворе уже декабрь кончается, а их доступность оставляет желать лучшего. Фанаты компании утверждают, что связано это с тем, будто такие процессоры очень хорошо покупаются, мы же придерживаемся другой точки зрения: плохо поставляются. В частности, флагманский FX-8150 (который мы и тестировали в октябре) ни в одном крупном московском магазине с тех пор так ни разу и не появился. Судя по всему, самую крупную партию в истории этой модели привезла сама компания AMD и раздала ее тестерам Да и с FX-8120 (отличается от топовой модели только тактовыми частотами) дела обстоят плохо. Особенно рельефно это проступает на примере компаний, указывающих на своих сайтах точное количество в складских запасах: например, когда я пишу эти строки, в «Юлмарте» есть ровно один (!) такой процессор в ОЕМ-исполнении и 8 коробочных. Т. е. если хотя бы каждый миллионный житель Москвы вдруг решит приобрести этот процессор в данном магазине, процессоров уже не хватит. Вот с младшими FX-4100 и FX-6100 дела обстоят получше (их хотя бы штук по 20 каждого на складах найти можно) и здесь, и в других компаниях, что только подтверждает версию о недопоставках из-за проблем с производством — так и должно быть: дефицит старших «полных» моделей и относительная доступность младших «урезанных».
В общем, мы честно хотели протестировать все четыре официально поставляемых процессора линейки AMD FX, но нам так и не удалось за разумное время добыть FX-8120. С другой стороны, посмотреть, на что способны младшие модели, крайне интересно и полезно (благо их-то можно легко пойти и купить). Ну и компания Intel несколько обновила свой ассортимент, причем тут уж обошлось без эксцессов: очередной подарок — 100 МГц к знакомым моделям за те же деньги — естественно, никаких технических проблем не создает. В общем, материала на статью набралось, так что ее вы в данный момент и читаете.
Конфигурация тестовых стендов
Процессор
Pentium G630
Pentium G860
Core i3-2130
Core i5-2320
Название ядра
Sandy Bridge DC
Sandy Bridge DC
Sandy Bridge DC
Sandy Bridge QC
Технология пр-ва
32 нм
32 нм
32 нм
32 нм
Частота ядра (std/max), ГГц
2,7
3,0
3,4
3,0/3,3
Стартовый коэффициент умножения
27
30
34
30
Схема работы Turbo-режима
—
—
—
3-2-2-1
Кол-во ядер/потоков вычисления
2/2
2/2
2/4
4/4
Кэш L1, I/D, КБ
2×32/2×32
2×32/2×32
2×32/2×32
4×32/4×32
Кэш L2, КБ
2×256
2×256
2×256
4×256
Кэш L3, МиБ
3
3
3
6
Частота UnCore, ГГц
2,7
3,0
3,4
3,0
Оперативная память
2×DDR3-1333
2×DDR3-1333
2×DDR3-1333
2×DDR3-1333
Видеоядро
GMA HD
GMA HD
GMA HD 2000
GMA HD 2000
Сокет
LGA1155
LGA1155
LGA1155
LGA1155
TDP
65 Вт
65 Вт
65 Вт
95 Вт
Начнем с Intel, благо с процессорами этой компании, как мы уже сказали выше, все обстоит очень просто — стандартный частотный сдвиг «по просьбам трудящихся». Даже сравнивать процессоры с предшественниками нет смысла — результаты-то предсказуемые. А вот с процессорами AMD мы их сравним. И пусть вас не смущает наличие в списке аж пары Pentium (в том числе, и самого младшего ныне G630) — всякое, знаете ли, бывает при сравнении процессоров разных архитектур
Процессор
FX-4100
FX-6100
FX-8150
Название ядра
Zambezi
Zambezi
Zambezi
Технология пр-ва
32 нм
32 нм
32 нм
Частота ядра (std/max), ГГц
3,6/3,8
3,1/3,7
3,6/4,2
Стартовый коэффициент умножения
18
15,5
18
Схема работы Turbo-режима
2-2-1-1
6-6-6-3-3-3
6-6-6-6-3-3-3-3
Кол-во ядер/потоков вычисления
4/4
6/6
8/8
Кэш L1, I/D, КБ
2×64/4×16
3×64/6×16
4×64/8×16
Кэш L2, КБ
2×2048
3×2048
4×2048
Кэш L3, МиБ
8
8
8
Частота UnCore, ГГц
2
2
2,2
Оперативная память
2×DDR3-1866
2×DDR3-1866
2×DDR3-1866
Видеоядро
—
—
—
Сокет
AM3+
AM3+
AM3+
TDP
95 Вт
95 Вт
125 Вт
Наши главные герои представляют собой два младших процессора семейства FX и один самый старший — сравнивать так сравнивать. Можно было, конечно, и на небольшой подлог пойти, сделав 8120 из 8150, но мы стараемся такими делами не увлекаться без необходимости. Тем более, а так ли уж интересна производительность FX-8120? Честно говоря (и положив руку на сердце), абсолютно не интересна — заранее очевидно, что он везде будет вести себя в точности как 8150, отставая от него примерно на 10-15%: пропорционально разнице в тактовой частоте. Слишком уж эти модели похожи, чего о младших линейках сказать нельзя. Тем более, что, вопреки ожиданиям, в AMD не стали «резать» им кэш-память третьего уровня — все те же 8 МиБ. А если еще учесть и большой L2, то по «кэшевооруженности» младшие FX являются настоящими рекордсменами на современном рынке. Жаль вот только (тоже вопреки изначальным ожиданиям) пока с разблокировкой ядер дело обстоит туго. Соответствующие пункты в EFI Setup есть, но на FX они не действуют. Или пока не действуют. В любом случае, от идеи купить FX-4100 и сделать из него примерно вдвое более дорогой FX-8150 на данный момент придется отказаться — нежизнеспособна. А в будущем — посмотрим.
Процессор
A8-3850
Phenom II X4 980
Phenom II X6 1035T
Название ядра
Llano
Deneb
Thuban
Технология пр-ва
32 нм
45 нм
45 нм
Частота ядра (std/max), ГГц
2,9
3,7
2,6/2,9
Стартовый коэффициент умножения
29
37
33
Схема работы Turbo-режима
—
—
3-3-3-0-0-0
Кол-во ядер/потоков вычисления
4/4
4/4
6/6
Кэш L1, I/D, КБ
4×64/4×64
4×64/4×64
6×64/4×64
Кэш L2, КБ
4×1024
4×512
6×512
Кэш L3, МиБ
—
6
6
Частота UnCore, ГГц
—
2
2
Оперативная память
2×DDR3-1866
2×DDR3-1333
2×DDR3-1333
Видеоядро
Radeon HD 6550D
—
—
Сокет
FM1
AM3
AM3
TDP
100 Вт
125 Вт
95 Вт
Поскольку новых процессоров AMD у нас сегодня всего два, мы решили добавить побольше старых — дополнительно к FX-8150 в статье примут участие A8-3850 (уже не самый старший Llano, но A8-3870K был анонсирован буквально на днях и до нас пока не добрался), старший Phenom II X4 980 и самый младший Phenom II X6 1035T. Немного вразнобой, конечно, но у нас в тестировании сегодня процессоры вообще сильно разные, так что и точные ориентиры не нужны — достаточно наиболее показательных
Традиционно, мы разбиваем все тесты на некоторое количество групп и приводим на диаграммах средний результат по группе тестов/приложений (детально с методикой тестирования вы можете ознакомиться ). Результаты на диаграммах приведены в баллах, за 100 баллов принята производительность референсной тестовой системы iXBT.com образца 2011 года. Основывается она на процессоре AMD Athlon II X4 620, ну а объем памяти (8 ГБ) и видеокарта () являются стандартными для всех тестирований «основной линейки» и могут меняться только в рамках специальных исследований. Тем, кто интересуется более подробной информацией, опять-таки традиционно предлагается скачать , в которой все результаты приведены как в преобразованном в баллы, так и в «натуральном» виде.
Единственное отступление от стандарта связано с недавно нашумевшим обновлением Microsoft KB2592546, которое (как изначально предполагалось) должно было «улучшить» планировщик задач Windows 7 с целью увеличения производительности систем, основанных на процессорах с архитектурой Bulldozer. Правда, оно было достаточно быстро отозвано Microsoft, а AMD вообще заявила, что это лишь половина того, что ожидалось, и высказала удивление тем, что обновление вообще вышло. В общем, казалось бы, все ясно. Но на фоне постоянного ожидания того, что вот-вот — и вся щетина превратится в золото (фанаты компании давно уже упорно чего-то ждут — сначала самих процессоров линейки FX, потом «волшебных» BIOS, которые должны увеличить производительность, теперь уже обновлений ПО, после которых «бульдозер» в обязательном порядке «взлетит»), шум это обновление вызвало изрядный. Поэтому мы решили проверить, что же там в действительности меняется в плане производительности. Ограничились только одним процессором, а именно FX-6100 — и этого оказалось достаточно, чтобы отказаться от использования данного патча в будущем. Ну а чтобы результаты не пропали, мы приведем на диаграммах и их — вдруг у кого-то надежды еще не умерли
Интерактивная работа в трёхмерных пакетах
Результат именно такой, какого и следовало ожидать в группе малопоточных тестов. Соответственно, главными являются «однопоточная производительность» и тактовая частота, а очевидным лидером — Core i3-2130: с первой тут все хорошо, и частота высокая (стартовая — так и вовсе как у бывшего еще совсем недавно топовым Core i7-2600). Процессоры AMD в таких условиях могут «вытянуть» только частоты, что в случае старших Phenom и FX мы и наблюдаем, однако этого все равно достаточно лишь для того, чтобы потягаться с Pentium, не более. Причем речь идет только о младших Pentium — старшие бюджетники им и то «не по зубам».
Финальный рендеринг трёхмерных сцен
Как мы уже писали в обзоре FX-8150, положение дел в этих тестах портит то, что FPU/SIMD-блоков в процессорах новой архитектуры вдвое меньше, чем «х86-ядер». Результат не заставляет себя ждать — новые «шестиядерные» модели не только с треском проигрывают самому младшему старому шестиядерному процессору, но и даже с Core i3 конкурируют не слишком успешно. А четыре ядра нового образца не смогли даже с Llano справиться! Причем, вообще говоря, 101 балл — это лишь на 1% больше, чем набирает Athlon II X4 620, взятый нами за точку отсчета, т. е. самый медленный ранее четырехъядерный процессор AMD! В общем, от такой многоядерности пользы пока в части задач слишком мало. Может быть, использование FMA4 как-то поможет, однако сложно сказать, что наступит раньше — поддержка новых наборов команд или моральное устаревание нынешних процессоров.
Упаковка и распаковка
Зато все процессоры линейки FX прекрасно справляются с архиваторными тестами, что немудрено — при такой-то емкости кэш-памяти! Да и дополнительные целочисленные потоки вычисления в 7-Zip небесполезны. В общем, уже FX-4100 догоняет былого флагмана линейки Phenom II X4, а остальные еще быстрее. Но радость, конечно, сильно омрачает то, что старший Core i3, в общем-то, не хуже, несмотря на свои официальные два ядра, а младший Core i5 — лучше FX-4100 и FX-6100.
Кодирование аудио
Выбранный нами подход к организации этих тестов однозначно голосует за многопоточность в любом виде, однако даже это не позволяет назвать результаты младших FX иначе как провалом: FX-4100 имеет производительность на уровне младших Athlon II X4 и отстает что от Core i3, что от A8-3850 (причем последний-то, несмотря на устаревшую архитектуру, все еще способен обгонять любые Core i3, отставая только от не менее «настоящих» четырехъядерных процессоров Intel), а FX-6100 проигрывает как старшему Phenom II X4, так и самому младшему Phenom II X6.
Компиляция
И здесь аналогичные результаты, несмотря на то, что компиляторы всегда были группой, в которой процессоры AMD смотрелись очень неплохо на фоне продуктов Intel. А сейчас этим разве что FX-8150 способен похвастаться, в то время как младшим моделям гордиться уже нечем. Что бы там компания ни говорила о более высокой эффективности «удвоения х86-ядер» сравнительно с Hyper-Threading, однако… Однако FX-4100 с 12 МиБ кэш-памяти и тактовой частотой 3,6+ ГГц проигрывает Core i3-2130, у которого частота пониже, а кэша вообще в четыре раза меньше (кстати — и память в случае Core i3 работает на частоте 1333 МГц против 1866 у AMD FX)! И это при том, что ранее с Core i3 в этих тестах могли «пободаться» и Athlon II X4, и Phenom II X3, т. е. либо самые дешевые четырехъядерники, либо середнячки с всего тремя ядрами. «Новые» же четыре ядра на такое не способны, а новые шесть, опять же, конкурируют лишь с четырьмя «старыми» (но чуть более высокого уровня, естественно) либо с четырьмя бюджетными у Intel.
Математические и инженерные расчёты
И снова малопоточная группа, а значит — триумф Pentium. Можно сказать, что именно Pentium: Core еще быстрее, но этого уже не требуется: недорогие «бульдозеры» проигрывают даже G630.
Растровая графика
Борьба за многопоточность в этой группе уже привела к относительно неплохим результатам (в частности, ACDSee и ImageMagick утилизируют дополнительняе ядра лучше, чем Photoshop), однако все дивиденды «пожали» разные модели Core i3. Они теперь заметно обгоняют Pentium, чего модели семейства FX не делают. Разве что FX-8150 на первый взгляд неплох, но он изначально позиционируется куда выше, чем все остальные сегодняшние участники (да и купить его еще надо суметь).
Векторная графика
Про обе программы в точности известно лишь то, что они однопоточные. А подо что их оптимизировали, и делали ли это вообще — неизвестно. Во всяком случае, новую архитектуру AMD они на дух не переносят ни в каком виде. Вот к старой относились довольно неплохо, но не более того.
Кодирование видео
Как мы уже , программам для работы с видео увеличение числа вычислительных потоков требуется на практике в меньшей степени, чем можно было бы предположить. Поэтому тут наиболее интересен результат Pentium G860 — еще немного, еще чуть-чуть, и будет достигнут уровень четырехъядерных моделей. Athlon II X4 620 (как всем известно) имеет результат 100 баллов, а Core 2 Quad Q8200 (этого мы пока официально не объявляли ) — 99 баллов. В общем, даже здесь «классический», но быстрый двухъядерник может на равных потягаться и с моделями, поддерживающими большее число потоков, а то и содержащими большее количество ядер. Но, разумеется, при равных условиях 2+НТ лучше просто двух, а четыре — еще лучше. Увы, но ничего утешительного для медленных четырех, шести и даже восьми ядер в этом нет.
Офисное ПО
Дайте офисному работнику Celeron — и ему хватит. Дайте Pentium — и он будет доволен. А получив Core i3 — просто счастлив Можно, конечно, использовать для этой цели и процессоры AMD, но именно потому, что здесь хватит как Celeron, так и Athlon II X2. У Llano чересчур мощная для этой сферы применения интегрированная графика, хотя в целом A4 и E2 будут достаточно привлекательным решением. А вот зачем может пригодиться FX — непонятно: потрясающей производительности (даже если отвлечься от вопроса, нужна она или нет) не наблюдается, потрясающей экономичности (ни в плане розничной цены, ни по счетчику электроэнергии) — тоже. К тому же «классическая» для AMD трехчиповая платформа имеет все недостатки такого подхода: моделей под Mini-ITX точно придется ждать долго, да и ассортимент их наверняка будет оставлять желать лучшего. Конечно, это специфический сегмент рынка, но миниатюрные платы с FM1 уже есть хотя бы в каталогах производителей, а с LGA1155 и вовсе — частые гости в российских магазинах.
Java
В этом тесте FX-4100 и вовсе оказался медленнее, чем Athlon II X4 620! О конкуренции со старшими Llano, Phenom II или Core i3, естественно, речи тоже не идет. Да и FX-6100 хватает только на то, чтобы героически обойти последнюю группу, но не на состязание хотя бы с нормальными четырехъядерными процессорами. FX-8150, впрочем, лидер, однако о цене такого лидерства мы уже выше говорили: этот процессор — самое быстрое из того, что есть у AMD. И стоит он дороже любых Core i5, так что и работать просто обязан быстрее. А младшие модели обязаны справляться со своими конкурентами. В теории. На практике же они выглядят на фоне тех бледно.
Игры
Хоть какая-то радость для фанатов, связанная в первую очередь с тем, что для выбранных условий тестирования вполне достаточно и FX-4100, а вовсе не с какими-либо феноменальными результатами последнего. Феноменальным на деле оказался совсем иной процессор, а именно FX-6100: выяснилось, что F1 2010 «ненавидит» не только Phenom II X6, но и «новые» шестиядерные модели AMD. К Intel же относится нормально. Правда, там потоков не 6, а 12, так что, возможно, это стоит считать потенциальной темой какого-нибудь из будущих специальных исследований — в продолжение темы «числа зверя» и его отрицательного влияния на производительность процессоров Но даже если бы этого отклонения от нормы не было, все равно никакого прорыва — как видим, даже FX-8150 заметно отстает здесь от Core i3-2130, так что процессор FX-4100 не может спасти цена чуть ниже Core i3-2100, а модель FX-6100 еще и дороже.
Для начала пара слов о нашумевшем патче: как видим, пользы от него точно нет — хотя в некоторых приложениях результаты чуть-чуть и увеличились, однако в общем и целом они оказались даже ниже, чем вовсе без патча. В общем, тему можно закрывать — по мнению оптимистов, временно, хотя пессимисты могут считать, что и навсегда.
Еще пара слов о новых процессорах Intel, благо в их случае долго рассуждать тоже не о чем. Просто компания добавила чуть-чуть производительности за те же деньги, ну а поле для таких маневров у нее было и остается огромным. Естественно, частоты Pentium G600 можно поднимать как минимум до уровня нынешних G800. Естественно, последние могут аналогичным образом двигаться вверх — на освобождаемые Core i3 позиции. Естественно, и Core i3 можно ускорять еще долго — для того им изначально частоты и ограничили, а так они вполне способны достичь высот двухъядерных Core i5-600.
Тем более, что и нынешние Core i5 потихоньку наращивают силы. Год назад нас удивляли почти равные цены на 2300 и 2400, различающиеся на 300 МГц. Однако выпуском модели 2310, а потом и 2320 компания этот зазор выбрала до минимума. Это тоже не конец — теперь можно то же самое проделать и с 2400, снизив цену на него и выпустив 2410. А потом и 2420, если понадобится. В общем, никаких поводов для спешки у Intel нет: в сегменте выше 150 долларов компания занимается конкуренцией сама с собой. Да и от 100 до 150 тоже — хотя некоторые предложения AMD и выглядят привлекательно, но не так уж сложно «задушить» AMD ценами. В конце концов, самые дешевые SBDC Intel продает всего по 50 долларов, так что даже до перехода на 22 нм запас снижения цен огромный — достаточный для того, чтобы подобные шажки делать хоть каждый месяц. К вящему неудовольствию тех, кто хотел бы получить «все и сразу», но… Бизнес есть бизнес.
А что хорошего можно сказать про FX? Честно говоря, ничего. Не потому, что новые процессоры AMD так уж плохи — есть у них и приятные особенности. Причем есть они даже сейчас, а после доработки архитектуры — тем более будут: AMD не раз уже удачно «допиливала» не самые блестящие изначально кристаллы. Правда, без соответствующей доработки идея замены четырех «атлоновских» ядер на два «бульдозерных» модуля в APU перестает казаться привлекательной: при всех недостатках старой архитектуры, A8-3850 быстрее, чем FX-4100! Да, дороже, но дороже за счет наличия очень хорошего видеоядра. И при этом TDP всего APU лишь на 5 Вт больше. Т. е. очень может быть, разумным вариантом конкуренции в нижнем сегменте стало бы сознательное (а не в виде утилизации брака) расширение FM1 и на рынок систем с дискретной графикой. Для этого стоит сделать специальный кристалл, представляющий собой «чистый» CPU. Возможно, с кэш-памятью третьего уровня — места освободится много. В общем, тот самый «рестайлинг» Phenom II, который многие ждали.
В том, что дела с AM3+ идут так плохо, справедливости ради, виновата сама компания — слишком уж она переоценила FX. Да, конечно, количество ядер продавать проще, но можно ли делать это долго? Вот если бы на рынок были выпущены Phenom III с двумя, тремя или четырьмя ядрами, на деле представляющими собой нынешние модули, получилось бы все куда красивее. Ведь с чисто технической точки зрения FX-4100 всяко привлекательнее Phenom II X2, а FX-6100 — прекрасное продолжение линейки Phenom II X3. Соответственно, FX-81x0 хорошо смотрелись бы как развитие линейки Phenom II X4, а со временем и Phenom II X6 появилось бы чем заменить. Правда, для этого, пожалуй, новую архитектуру нужно было выпустить на рынок в середине года (хотя бы — как планировалось; а лучше еще раньше), да и выход годных процессоров требовалось обеспечить на более высоком уровне — чтобы сохранить возможность ценовой конкуренции.
Был и еще один практически беспроигрышный выход. Высокая предварительная популярность АМ3+ была связана и с тем, что предполагалась его полная (т. е. и прямая, и обратная) совместимость с АМ3. Что ее не будет — стало очевидно даже не в июне (когда процессоры отложили на осень), а не позднее мая — именно тогда производители системных плат начали спешно клепать модели на старых чипсетах с «черным сокетом», что при наличии совместимости не требовалось бы. Кто мешал AMD в июне честно сказать: «Ребята, лажа вышла — тот Bulldozer, который мы обещали, не получается, а тот, который получается, нам выпускать стыдно»? Отложить процессоры на осень, что все равно было сделано. А в оставшееся время спешно «запихивать» в Zambezi контроллер PCIe, дабы… выпустить этот процессор для FM1, попутно отменив AM3+ и похоронив АМ3.
Претензий, конечно, и в этом случае было бы немало, однако через месяц-другой все бы успокоились и приняли это решение. Просто потому, что для рынка одна платформа, в рамках которой предлагаются решения для всех сегментов (APU для недорогих компьютеров и более мощные процессоры для использования совместно с дискретными видеокартами) — это хорошо, а три, одна из которых не универсальна, а две вообще одинаковы с потребительской точки зрения — безобразно. И, кстати, меньше было бы поводов для недовольства тем фактом, что старые Phenom не сильно-то и хуже новых FX — это были бы процессоры для разных платформ, а в таких случаях пересечения по производительности — нормальное дело. Получился бы у AMD своеобразный аналог LGA1156, ну и ничего страшного — зато можно было бы уже начинать рекламировать FM2, намекая, что там все будет еще красивее, чем вышло у Intel
При текущем же состоянии дел непонятно, зачем вообще нужны новые процессоры. Не новая архитектура, а именно процессоры. И не AMD, а покупателям. Причем не когда-нибудь, а конкретно сейчас. Что такого могут предложить новые FX по сравнению даже не с Core второго поколения, а хотя бы с Phenom II? Преимущества новой платформы? Это верно для FM1, но AM3+ с потребительской точки зрения неотличима от AM3. Новый уровень производительности? В какой-то степени это верно для FX-8150, но его еще нужно суметь купить, а младшие модели никаких рекордов не ставят. Экономичность? Просто не смешно. Дешевую многоядерность? Это с успехом делали как раз Athlon II X3 и X4, а у FX преимущество в количестве ядер не подтверждено их производительностью, т. е. имеем лишь ядра ради ядер. В общем, может, оно и хорошо, что процессоров пока поставляется не так уж много? Все равно пока их много и не нужно — истинные фанаты, которые невзирая ни на что будут приобретать только продукцию любимой компании, причем исключительно последние ее модели, в реальной жизни встречаются редко.
Благодарим компании , , и «»
за помощь в комплектации тестовых стендов
Заядлых любителей популярной многопользовательской ролевой онлайн-игры «Runes of Magic» компания Sapphire Technology Limited решила порадовать выпуском в ограниченном количестве особых версий графических адаптеров AMD RadeonHD 6870 и AMD Radeon HD 6850 на базе созданных по 40-нм технологии чипов (в первом случае Barts XT с 1120 потоковыми процессорами, а во втором Barts PRO с 960 потоковыми процессорами).
Модели SapphireRadeonHD 6870Runes of Magic Edition и SapphireRadeon HD 6850 Runes of Magic Edition упакованы в оформленные соответствующим образом коробки, внутрь которых в качестве бонуса добавлена игрушка в виде одного из героев игры. Обе модели изготовлены на синих печатных платах под шину PCI Express 2.1 x16, укомплектованы гигабайтом памяти GDDR5 с 256-битным интерфейсом и оборудованы оригинальными по конструкции двухслотовыми кулерами активного типа. Что же касается частотных показателей ядра/памяти, то они составляют 920/4200 МГц у SapphireRadeonHD 6870Runes of Magic и 775/4000 МГц у SapphireRadeon HD 6850 Runes of Magic.
Теперь осталось выяснить, когда и по каким ценам описанные выше ускорители можно будет приобрести.
Стали известны свежие подробности о гибридных процессорах AMDTrinity, которые должны прийти на смену существующим решениям серии Llano. По информации источника, производство этих APU должно начаться в марте следующего года, примерно в то же время, возможно, состоится и официальный дебют этих интересных чипов.
Причем, первыми, как сообщается, начнут производиться десктопные модели AMDTrinity с относительно невысоким энергопотреблением и TDP в 65 ватт, а выпуск более высокопроизводительных APU с показателем TDP на уровне 100 ватт стартует в мае. В первой волне AMDTrinity окажутся чипы серий A10-5700, A8-5500, A6-5400 и A4-5300, а вслед за ними на свет появятся мощные APU в линейках A10-5800 и A8-5600.
В дополнение к более высоким показателям быстродействия, которые должны продемонстрировать ускорители вычислений AMDTrinity по сравнению со своими аналогами семейства Llano, ожидается улучшение ситуации с доступностью новых APU в связи с отладкой 32 нм производственного процесса на предприятиях GlobalFoundries. Кроме того, в грядущем январе линейку Llano пополнят новые чипы, включая A8-3820, A6-3620 и A4-3420, а также A8-3870K и A6-3670K с разблокированным множителем.
Если выпуск игровых процессоров и продукции для массового потребителя чаще всего сопровождается шоу, и в качестве места для проведения презентаций обычно выбирают курорты и южные страны.
То презентации «серьезной» продукции для бизнеса логично проводить в местах с деловой энергетикой. И столица Баварии в этом плане — очень подходящее место.
Да, большинству туристов Мюнхен известен в первую очередь как место проведения ежегодного «пивного фестиваля» Oktoberfest. Но в остальное время — это солидный и спокойный город. Кому-то может показаться скучным, поскольку этот город, хоть и третий по величине в Германии, но общее количество жителей всего 1,3 млн. Хотя в сравнении с Москвой практически любой европейский город (даже мегаполисы вроде Лондона или Парижа) кажутся не столь многолюдными. И просто на интуитивном уровне воспринимаются как более уютные и гостеприимные.
Впрочем, погоду в Мюнхене в эти дни сложно было назвать гостеприимной. Поздняя осень, вероятно, вообще создана для того, чтобы мы больше ценили солнце и тепло в другие сезоны. Или лишний раз подумали о ни чем не заменимой необходимости обмениваться душевным теплом с близким человеком…
Как и человек, любой серьезный город, может иногда позволить себе быть в глубине души слегка сентиментальным. В Мюнхене городские куранты на Marienplatz в 11 часов утра (и в 5 вечера) исполняют забавную пьесу со средневековыми рыцарями, посмотреть которую даже в плохую погоду собирается немало желающих.
Но пора — и к теме, в конце концов, что жаловаться на облака и прочий туман, если основная тема мероприятия: облачные вычисления? Именно на сегмент «датацентров», то есть вычислительных комплексов с большой плотностью компоновки, и ориентированы в первую очередь новые процессоры на ядре Interlagos.
Мероприятие открыл Альберто Боццо (вице-президент, руководитель представительства в регионе EMEA). Давайте, посмотрим, что интересного намерена предложить AMD в сегменте высокопроизводительных систем.
Итак, чем же привлекательны «облачные вычисления»? И почему именно с этим понятием связывают в AMD будущее новых серверных процессоров? Для конечных пользователей: будь то крупные или средние компании и «отдельно взятые» домашние пользователи, перенос приложений и собственных данных из локальных сетей и компьютеров в арендуемые виртуальные сервисы означает разные возможности.
Для бизнеса это естественное стремление делигировать все, что не относится непосредственно к основной деятельности тем, кто может сделать это «лучше». То есть подрядить тех, кто в свою очередь специализируется на этой частной задаче, имеет меньшие издержки и может решить вопрос дешевле, эффективнее и надежнее. Хороший пример уже свершившегося перехода — это виртуальный хостинг. Да, у большинства провайдеров по-прежнему существуют услуги «выделенных серверов», но новым пользователям по большому счету гораздо интереснее иметь гарантии определенной пропускной способности, пиковой нагрузки и постоянной доступности сайта.
А надо ли для этого выделять сервера, или вопрос можно решить другим способом — для конечного пользователя не имеет значения.
Тем не менее, есть большая разница в сравнении эры мейнфреймов и современными «облачными» вычислительными центрами. И не только в многократно большей вычислительной мощности серверов. Если тогда необходимость подключаться к центральному «мозгу» была вызвана отсутствием «интеллекта» у терминалов, то сейчас клиентские устройства вполне в состоянии справиться с типичными пользовательскими задачами.
Поэтому гонять по сетям гигабайты мультимедийных данных, ради исключения из состава ПК какого-нибудь 3D-ускорителя не предлагается. Это просто никому не нужно. С другой стороны свести диалог пользователя с компьютером до уровня если не телевизора, то интернет-браузера, с возможностью обращаться к своему «рабочему столу» с любого компьютера, подключенного к интернету, имеет смысл. И даже не только для тех, кто много путешествует. Отпадает необходимость следить за обновлениями, ставить антивирусы, вспоминать о резервном копировании и прочее.
И поскольку все вышеперечисленное важно и полезно, но речь идет никак не о революции, а более чем плавной эволюции, серверная платформа должна быть «заточена» под стандартные потребности «датацентров» с уклоном в специальные требования, которые становятся актуальными по мере перехода к «облакам». Так считают в AMD.
В количественных цифрах это выглядит примерно так. Внушительно, а что с чем сравнивается посмотрим дальше.
Из этого слайда видно, почему именно о «облачных» вычислительных центрах речь. Дело в том, что когда решается задача не получить какую-то фиксированную вычислительную мощность (когда мы выбираем сервер или персональный компьютер под какие-то определенные собственные задачи), а выжать максимум производительности в пересчете на киловатт потребляемой мощности и квадратный метр площади помещения, правила игры существенно меняются. Нам уже не важно какую вычислительную мощность обеспечивает отдельно взятое вычислительное ядро, важно сколько «терафлопов» получится в совокупности. Поскольку чем больше этот показатель, тем более конкурентноспособным будет наш «облачный» вычислительный центр. Довольна интересна в этой связи технология TDP Power Cap, которая позволяет управлять (ограничивать) максимально допустимый уровень потребления с точностью до ватта. Это позволяет достигнуть максимального заполнения стоек серверными модулями.
То что архитектура Bulldozer ориентирована на серверные потребности даже в большей степени, чем на те, что типичны для настольных ПК, мы уже отмечали. Поэтому сейчас выделю лишь главное.
В серверном классе новая архитектура будет представлена в двух линейках: Opteron 6200 включает модели с 16 целочисленными ядрами, 16 МБ памяти L3 (по 2 МБ на модуль) и 4 линками HyperTransport 3.0, что дает возможность использовать их на 4-процессорных платах. Сохраняется прежний диапазон TDP от 89 до 140 Вт. В младшей линейке представлены модели с 8 целочисленными ядрами, 8 МБ кэша L3 и 3 линками HyperTransport 3.0 (для 2-процессорных плат). Уровень TDP также соответствует непосредственным предшественникам из ряда Opteron 4100 и составляет от 35 до 95 Вт.
Модулей FPU вдвое меньше, поскольку каждый такой модуль блокируется с двумя целочисленными. Тем не менее, по сравнению, с предыдущим семейством и процессорами Intel, набор команд расширен до максимального на сегодняшний день количества.
Разумеется, ценообразование «завязано» на схожие по позиционированию модели конкурента. И вряд ли для кого явилось сюрпризом, что в целочисленных вычислениях (SPECint) у AMD теперь солидная фора. Это самая сильная сторона новых процессоров.
А поскольку в средах виртуализации большое количество ядер особенно хорошо утилизируется, становится понятным, почему собственно «облачные вычисления» были взяты за основу маркетинга новых процессоров.
Разумеется, на «общественных» сервисах в большом ходу Web-приложения, и тут тоже ситуация обещает быть весьма благоприятной.
Ну а в сегмент суперкомпьютеров поставки новых процессоров начались уже давно, тут какая-либо реклама не требуется, поскольку те, кто занимается производством подобных систем, наверное, в наименьшей степени подвержены «маркетинговому воздействию». Скорее наоборот, тот факт, что Cray со товарищи выкупили первые партии «на корню» может быть неплохой рекламой для остальных.
Давайте, взглянем на готовые системы на новых процессорах, которые выпущены всеми ведущими производителями серверов. Собственно, сами сервера уже знакомые, поскольку новые процессоры могут быть установлены в прежний конструктив. Вот, например, 4-процессорный Dell PowerEdge C6145, занимающий два отсека в стандартной стойке и поддерживающий до 1 ГБ оперативной памяти.
А это HP ProLiant BL465 G7 (вернее сказать — сборка из этих серверов) с HP FlexFabric (сетевая карта с двумя портами по 10 ГБ/с), здесь очень логично будут смотреться процессоры из новой энергоэффективной серии с пониженным TDP.
Процессорный разъем тот же самый: G34, представленный с выпуском первых процессоров в линейке Opteron 6100 полтора года назад, так что обещанная преемственность сохраняется.
4-процессорный (и 64-ядерный) сервер трудится над 32 потоками SETI@home.
Хочется больше? Пожалуйста, вот такой «мобильный» (на колесиках!) вычислительный центр к вашим услугам. Количество потоков можете пересчитать самостоятельно. Кстати, лейбл Fusion-io обозначает систему хранения данных на SSD-накопителях одноименной фирмы. Идея серверного варианта APU-процессоров AMD пока реализована лишь сторонними компаниями и энтузиастами по «собственной инициативе», сама AMD пока не планирует официального серверного варианта и соответствующей инфраструктуры под эти процессоры.
На последовавшей после презентации дискуссии, с участием руководителей ведущих компаний-производителей серверов было высказано несколько интересных мнений. В первую очередь, среди одной из причин неспешной миграции в «облака» средних и небольших компаний (их ИТ-инфраструктуры) называются опасения пользователей по поводу сохранности конфиденциальных данных. С другой стороны, не нужно далеко бегать за статистикой, чтобы убедиться в том, что основной канал утечки был и будет связан с «заинтересованными» лицами внутри самих компаний. Поскольку они в первую очередь знают и могут применить эти данные, например, переходя на работу к конкуренту. Тем не менее, использование во всей цепочке криптостойких алгоритмов и протоколов важно и, конечно же, требует определенных вычислительных ресурсов…
В перерыве мне удалось взять небольшое интервью у вице-президента AMD по глобальной инфраструктуре. И конечно же, первый вопрос, который я задал:
iXBT.com: Господин Пейнтер, а как обстоят дела с «миграцией в облака» в отношении инфраструктуры самой AMD на текущем этапе? Не секрет, что даже высокотехнологичные компании не все пока готовы внедрять эту идею «снизу доверху»…
Tom Painter: Наша инфраструктура, на самом деле, состоит из двух частей. Помимо, естественно, офисных компьютеров и стандартной инфраструктуры, характерной для любого бизнеса, у нас имеется «частное облако», объединяющее вычислительные центры в разных странах, где расположены наши исследовательские лаборатории и производственные мощности.
И вот для этой части инфраструктуры виртуализация очень важна, она обеспечивает гибкость и масштабируемость ресурсов внутри компании. Например, какие-то продукты могут быть перенесены, выпуск отодвинут или ускорен, соответствующие лаборатории, где бы они не находились, должны оперативно получать вычислительные ресурсы, необходимые для моделирования и тестирования новых продуктов. Раньше для этого необходимо было предусматривать «запасы» в виде резервных серверов и в целом уровень утилизации вычислительных ресурсов не превышал 60% и все равно возникали «узкие места», сейчас мы достигли порядка 80-90%, при этом очень легко можем наращивать и масштабировать такую сеть.
На уровне корпоративной инфраструктуры мы в первую очередь используем Web-технологии доступа к данным, чтобы упростить резервное копирование, повысить надежность на случай «непредвиденных происшествий». Но клиентские устройства по-прежнему остаются полноценными, то есть переносить офисные приложения (особенно некритичные к ресурсам) в виртуальную среду для нас не является принципиальным фактором. Мы на этом просто не сможем сильно сэкономить. И тут надо просто считать в каждом индивидуальном случае, в зависимости от специфики компании.
iXBT.com: А насколько распределенной получилась основная вычислительная инфраструктура (для инженерных исследований)?
Tom Painter: У нас несколько основных вычислительных центров: два — в США, еще один в Малайзии, есть еще несколько менее мощных, все они объединены высокоскоростными соединениями.
iXBT.com: В чем качественное отличие современного «облачного» подхода к организации централизованных вычислительных систем по сравнению со всем тем, к чем мы уже давно привыкли («тонкие» клиенты, VPN и т.п.)? С точки зрения технологий?
Tom Painter: Я думаю, виртуализация серверной инфраструктуры — это ключевой момент. Она значительно упрощает и делает более гибкой использование, в том числе, и всех ранее применявшихся сервисов для совместного доступа. Но если 5 лет назад среды для виртуализации сами по себе «съедали» до 50% серверной мощности, теперь по мере развития технологий и переноса поддержки на аппаратный уровень в процессоры, эта величина составляет менее 5%.
iXBT.com: Вычислительная мощность клиентских устройств постоянно растет, даже в очень компактном ноутбуке уже можно получить практически все, что необходимо среднестатистическому пользователю. И на будущее запланированы еще более мощные процессоры, видеокарты и прочее. Не будет ли этот факт сдерживать развитие «облачных технологий», замедлять миграцию пользователей в сторону серверо-зависимых устройств?
Tom Painter: Сейчас, безусловно есть большая разница, по сравнению с «эрой мейнфреймов», в первую очередь за счет повсеместного использования мультимедийных интерфейсов. То есть клиентские устройства должны быть достаточно мощными, чтобы воспроизвести всю ту визуальную информацию, которая требуется пользователю. Эти задачи зачастую нерационально «выгружать» на сервер, либо просто невозможно, когда речь идет о мобильном компьютере, несмотря на весь прогресс беспроводных технологий связи. Тут будут развиваться оба направления, как я думаю. Даже в развлекательной индустрии, например, клиентские устройства вполне могут справиться с прорисовкой 3D, даже недорогие ноутбуки и в перспективе даже планшеты, при этом сам игровой мир может «жить» на сервере, который позволит сделать его гораздо более реалистичным.
iXBT.com: Спасибо, господин Пейнтер! Если позволите, напоследок хотел бы задать вопрос не совсем по теме. Как я прочитал в Вашей биографии, Вы начинали свою карьеру с должности системного администратора в небольшой компании, и «продвинулись» до руководящих должностей в ведущих мировых компаниях (до AMD Вы уже занимали высокую должность в Dell?) Что бы Вы могли посоветовать своим коллегам, которые только начинают работать по аналогичной специальности, но имеют амбиции? Это не самая простая должность для старта карьеры руководителя, к сожалению, к «сисадмину» часто относятся как к обслуживающему персоналу, который не играет ключевой роли в бизнесе…
Tom Painter: Вряд ли скажу что-то оригинальное: будьте собой! Если человеку действительно интересно «возиться» с компьютерами, он не боится столкнуться с нестандартными ситуациями, старается найти творческое решение для очередной задачи (а не просто стремится, чтобы его «оставили в покое»)… Скорее всего, такой подход к работе приведет вас сначала в среднюю, а потом при достаточном стремлении и в крупную компанию, где есть возможности для роста. Просто потому что вам захочется решать более масштабные задачи, более «интересную» инфраструктуру иметь под своим началом
iXBT.com: Спасибо большое за интересный рассказ!
Резюмируя, можно отметить, что благодаря «заточенности» архитектуры Bulldozer под серверное применение, в этом сегменте у AMD есть объективные шансы не просто сохранить позиции, но и продвинуться, получить большую долю рынка. Об этом косвенно свидетельствуют не только характеристики самих процессоров, но и поддержка запуска новой линейки ведущими производителями серверов, для которых миграция на Opteron серии 6200/4200 не требует смены платформы, что должно ускорить процесс и снизить затраты на выпуск новых моделей или обновление уже проинсталлированных серверов.
Уже два поколения платформ компания AMD придерживается максимально эволюционной стратегии обновления процессорных разъемов. Это весьма удобно для пользователей, привыкших самостоятельно обновлять свой компьютер, поскольку есть возможность сохранить на какое-то время старый процессор после приобретения новой платы. Или поставить новый процессор, не меняя остальной начинки корпуса.
Вот и на этот раз, несмотря на то, что готовящиеся инновации более серьезные: все же новая архитектура и т.д., преемственность сохраняется. Соответственно уже сейчас можно подготовиться и приобрести плату с разъемом Socket AM3+, поставив на нее пока что процессор нынешнего поколения. Это актуально для тех, кто предпочитает «обкатанные» технологии. Сейчас, например, можно взять лучшее из нынешнего поколения, а через год-полтора, когда новое семейство будет представлено на рынке во всех разновидностях, выбрать лучшее на тот момент.
Плату, подходящую для такой цели, мы и рассмотрим в этом обзоре.
Сразу надо внести ремарку, что поддержка Socket AM3+ в данном случае означает в первую очередь поддержку повышенной частоты HT-шины и оперативной памяти DDR3-1866. Это, конечно, полезно, но поставить процессоры на ядре Bulldozer можно будет и на плату с прежней версией разъема Socket AM3. Также надо отметить, что для процессоров на ядре Llano логичнее приобретать недорогие платы со специальной версией чипсета, которые появятся в ближайшее время. В любом случае, процессоры с интегрированным графическим ядром рассчитаны на установку в свой разъем (Socket FM1), поэтому тут над совместимостью раздумывать не приходится.
Ну а активные геймеры все равно еще долго будут использовать дискретные видеокарты, и возвращаясь к тестируемой плате от ASRock, отмечаем, что она позволяет собрать максимально возможную CrossFire-конфигурацию, в том числе 4-процессорную (из двухчиповых видеокарт). Соответствующая пара PCI Express-портов обеспечена максимальным количеством линий (по 16), а третий порт располагает 4 линиями, что вполне достаточно в случае, если в этот порт, например, устанавливается третья видеокарта для физических расчетов.
по — вид платы в 3/4 со стороны задней панели
Плата насыщена дополнительными контроллерами и располагает избыточным набором современных интерфейсов (4 порта USB 3.0, 2 дополнительных SATA 3.0, если кому покажется недостаточно 6 чипсетных портов). Однако при этом сохранены и уже архаичные интерфейсы. Причем не только IDE, что действительно может пригодиться для тех, у кого еще «живы» добротные оптические приводы с таким интерфейсом. Но и COM, и даже FDD.
Компоновка особых нареканий не вызывает, хотя небольшой дизайнерский просчет все же есть: та половина платы, на которой расположен южный мост и слоты расширения, не имеет ни одного разъема для подключения корпусных вентиляторов. Поскольку они все сосредоточены в верхней половине платы.
Плата имеет индикатор POST-кодов, позволяющий выявить причину зависания в процессе загрузки, если таковое случится, также для упрощения тестирования имеются кнопки для включения и перезапуска, а перемычка для очистки CMOS также продублирована кнопкой на задней панели платы и снабжена подсветкой.
Мы уже отмечали на предыдущей версии платы ASRock на этом же чипсете странное совмещение eSATA и восьмого порта SATA на самой плате. Если вы попытаетесь использовать одновременно оба порта, виден будет только один диск, а второй пропадет из системы. И скорее всего виден будет внешний, тот, который вы подключите позже. Хорошо, если при этом на внутреннем диске не были открыты какие-то файлы, иначе данные могут повредиться. Те кто знают историю плат ASRock, наверняка, вспомнят модели, у которых пользователь должен был сам коммутировать внутренний порт с внешним обычным шлейфом. Фактически теперь этот шлейф реализован на уровне дорожек печатной платы. Не худо бы добавить выбор активного порта в BIOS.
Система охлаждения уже знакомая. И действительно удачное решение, которое сохранено в данном случае: возможность установки вентилятора, имеющегося в комплекте, если пользователь сочтет недостаточным пассивный режим охлаждения. Например, в случае разгона или использования кулеров, плохо вентилирующих область вокруг процессорного гнезда.
Процессорное гнездо Socket AM3+ внешне неотличимо от предыдущей версии, лишь конструкция крепления процессорного кулера несколько отличается. Впрочем, на платах будут ставить универсальный крепеж, который подойдет и для прежних кулеров под AM3 и AM2.
Стабилизатор напряжения питания процессора: 10-канальный, во всех каналах установлено по 2 полевых транзистора, установлены 11 конденсаторов по 820 мкФ и 4 — по 270 мкФ, все конденсаторы на плате твердотельные, и если верить описанию, элитные из «золотой серии» от японских производителей. Заявлена поддержка процессоров с TDP до 140 Вт включительно.
Плате досталась высокая коробка с «металлическим» дизайном, в комплектации обращает на себя внимание планка для вывода 2 USB 3.0 портов на переднюю панель. 4 SATA-шлейфа с металлическими защелками и два переходника питания для SATA-устройств, на случай если соответствующих разъемов на блоке питания не хватит. Также имеется IDE-шлейф и мало для кого актуальный шлейф для флоппи-дисковода (тут вероятно в ASRock раскопали на складе старую коробку с такими шлейфами и решили «до кучи» приложить их к оставшимся немногочисленным платам, на которых такой разъем имеется).
Из утилит собственной разработки ASRock предлагает Extreme Tuning Utility (AXTU) для разгона, XFast USB (поддержка весьма полезного режима, позволяющего существенно ускорить обмен с устройствами по интерфейсу USB 2.0). Куда-то пропала утилита IES и возможность включать «зеленый» режим из BIOS, хотя для избыточных многоканальных схем питания, это была достаточно актуальная опция, и у ASRock она действительно работала.
Из сторонних утилит прилагается Norton Internet Security и CyberLink DVD Suite. Толстая книжка-руководство пользователя включает в себя разделы на разных языках, включая русский. Кроме того, имеется плакат по настройке режима Instant Boot (о назначении которого мы уже ), также с разделом и на русском.
Плата основана на чипсете (северный мост AMD 890FX и южный SB850), о возможностях которого вы можете узнать из обзорной статьи по ссылке.
В качестве оперативной памяти может быть установлено до 32 ГБ DDR3-800/1066/1333/1600/1866. Для подключения накопителей установлено 8 внутренних портов SATA 3.0, из них шесть поддерживаются чипсетом, и эти диски могут объединяться в режимах RAID 0, 1, 0+1 и 5, поддержка еще двух портов обеспечивается контроллером Marvell SE9123. Полный список дополнительных контроллеров включает:
интегрированный звук (7.1-канальный HDA-кодек Realtek ALC892), на заднюю панель выведены коаксиальный и оптический S/PDIF-Out, имеется поддержка THX TruStudio Pro;
сетевой контроллер (Realtek RTL8111E, интерфейс PCIEx1), с поддержкой скоростей 10/100/1000 Мбит/с (Gigabit Ethernet) с поддержкой энергосбережения по стандарту 802.3az;
USB 3.0 (2×NEC D720200F1, интерфейс PCIEx1), с поддержкой четырех портов USB 3.0;
SATA 3.0 (Marvell SE9123, интерфейс PCIEx1), с поддержкой двух портов SATA 3.0;
cистемный мониторинг (NuvoTon NCT6775F), поддерживается режим автоматического управления частотой вращения процессорного кулера и трех системных. предусмотрена возможность задать целевой порог температуры, которая будет автоматически поддерживаться (45—65 °C), а также «целевую скорость» в виде значения от 1 до 9 (чем выше значение, тем более высокой будет минимальная частота вращения). Регулировка в случае с процессорным вентилятором работает только для 4-контактных вентиляторов. Также есть возможность ограничить скорость вращения вручную (задается уровень от 1 до 9) по отдельности для всех 4 вентиляторов.
Качество аналоговых выходов интегрированного звукового решения мы оценили в режиме 16 бит, 44 кГц при помощи тестовой программы и звуковой карты :
Неравномерность АЧХ (от 40 Гц до 15 кГц), дБ
+0,00, −0,03
Уровень шума, дБ (А)
−83,5
Динамический диапазон, дБ (А)
84,1
Гармонические искажения, %
0,0060
Гармонические искажения + шум, дБ (А)
−80,1
Хорошо
Интермодуляционные искажения + шум, %
0,017
Взаимопроникновение каналов, дБ
−87,7
Интермодуляции на 10 кГц, %
0,019
Общая оценка: Очень хорошо ().
Разработчики на этот раз решили поставить наиболее распространенный из современных кодеков от Realtek и достаточно качественный. Объективные результаты чуть выше, чем у ранее использовавшегося кодека от VIA.
Методику тестирования производительности, разгона и конфигурацию тестового стенда можно посмотреть на этой .
DDR3-800—DDR3-1866
0,6125—1,7500 В (CPU)
0,6125—1,7000 В (CPU NB)
2,56—2,70 В (CPU VDDA)
1,250—2,065 В
1,110—1,795 В
1,110—1,390 В
(*) Диапазоны регулировки коэффициента умножения и напряжения процессора, а также шины HT, в BIOS, зависят от установленного процессора и приведены для используемого в наших тестах Phenom II X4 810. Использовалась версия BIOS 1.23.
Классический набор параметров: все необходимое есть, диапазоны регулировок также достаточны для абсолютного большинства случаев, но каких-то редких и малоиспользуемых параметров в меню не содержится. Что и неплохо: не к чему сбивать с толка пользователей. Тем более, что шаг навстречу пользователям, родившимся уже во времена графических интерфейсов, сделан: используется UEFI BIOS с графической оболочкой. Есть возможность выбирать параметры мышкой.
С другой стороны, перестали отображаться фактические параметры (с учетом текущей опорной частоты и множителей) — вернее, для памяти и иногда для других компонентов частота отображается правильно, но для остальных компонентов множитель умножается на 200 МГц вне зависимости от выставленной опорной частоты, и реальную величину приходится прикидывать самостоятельно. Возможно, в следующих версиях BIOS это поправят.
Есть возможность загрузить автоматически предустановленные параметры для разгона, исходя из желаемой частоты ядер, а также задать режим динамического разгона (4—20%). На заданную величину будет подниматься опорная частота при максимальной нагрузке на процессор (в остальное время она будет оставаться стандартной, функция сочетается с работой Cool’n’Quiet).
Автоматическая загрузка с параметрами по умолчанию не всегда срабатывает четко, иногда приходится несколько раз перезапускаться, чтобы система, наконец, определила сбой и вышла из ступора. Разумеется, есть возможность сохранения пользовательских профилей, а сброс содержимого CMOS на этой плате удобно реализуется с помощью кнопки на задней панели.
Phenom II X4 975 Black Edition (3,6 ГГц)
4300
3835
200 (x21,5)
295 (x13)
1,48/1,40
1,45/1,40
2655 (x9)
2360 (x8)
DDR3-1180
Результат в разгоне за счет опорной частоты выдался на славу, как и разгон процессора с разблокированным множителем. Впрочем, по этому экземпляру Phenom II X4 975 у нас пока нет своей статистики, но само по себе значение достаточно высокое и приближается к типичному пределу для процессоров на степпинге C3 под воздушным охлаждением.
Для сравнения взяты результаты ранее протестированной платы на аналогичном чипсете.
ASRock 890FX Extreme3
ASRock 890FX Deluxe5
2:19
2:15
1:15
1:15
HDPlay (DXVA Off/On), CPU load
26%/3%
26%/3%
61
60
World in Conflict (Very High@1680×1050), fps
30
29
Мощность измеряется встроенным в блок питания ваттметром, для системы в целом.
ASRock 890FX Extreme3
ASRock 890FX Deluxe5
Редактирование текста, Вт (Cool’n’Quiet On)
95 (Green Power Off)
82 (Green Power On)
93
Редактирование текста, Вт (Cool’n’Quiet Off)
112
105
168—204
156—201
По производительности обе платы равноценны (и было бы удивительно обнаружить иной результат), а что касается экономичности, то исчезновение «зеленого» режима несколько ухудшило экономичность в режиме простоя, хотя разница очень мала и вряд ли как-то проявится при учете месячного потребления даже в очень экономном домохозяйстве.
Платы под Socket AM3+ на чипсетах из 800-го семейства являются переходным продуктом, который может заинтересовать тех, кто предпочитает отлаженные технологии и опасается, что приобретая плату на новом чипсете, первое время может столкнуться с шероховатостями в конструкции и ошибками в BIOS. C точки зрения функциональности, плата располагает всем необходимым для постройки мощной игровой станции с несколькими видеокартами. Мы, тем не менее, в самое ближайшее время продолжим исследование плат под Socket AM3+ уже на новых чипсетах из 900 серии, в частности, на приемнике топового чипсета — 990FX.
AMD прилагает усилия, чтобы формально сдержать обещание представить настольные процессоры семейства Llano до конца текущего квартала. В ближайший четверг запрет на публикацию полноценных обзоров A8-3850 будет снят, и они заполнят информационное пространство Сети. По информации сайта , в продажу процессоры Llano начнут поступать на следующей неделе, уже во втором полугодии.
Примечательно, что в ближайшие недели насыщать розницу будут только четырёхъядерные модели Llano серий A8 и A6, а двухъядерные решения серий A4 и E2 поступят в продажу не ранее августа. Заметим, что материнские платы с разъёмом Socket FM1 активно анонсируются производителями со вчерашнего дня, в продажу они готовы поступить уже на этой неделе, если верить коллегам с сайта .
Только в пятницу представители AMD , что TSMC и Globalfoundries могут в равной степени претендовать на заказы компании по выпуску 28 нм изделий, не указав конкретно, о каком типе продукции идёт речь. В 2012 году по 28 нм технологии будут выпускаться мобильные процессоры Wichita, Krishna и Hondo с усовершенствованной архитектурой Bobcat, а производство графических решений по 28 нм технологии начнётся уже в текущем году. Традиционным подрядчиком AMD по выпуску графических процессоров является компания TSMC, изменится ли что-то на этот раз?
Как сообщает сайт со ссылкой на китайское издание Commercial Times, пробные партии 28 нм графических решений AMD поколения Southern Islands уже сошли с конвейера TSMC. При производстве этих микросхем применяется технология HKMG - транзисторы с металлизированным затвором и материалы с высоким значением диэлектрической константы. В массовое производство соответствующие графические решения должны быть запущены ближе к концу 2011 года.
TSMC будет выпускать и 28 нм процессоры Krishna и Wichita, выполняя основную часть заказов AMD по этому направлению. Массовое производство соответствующих гибридных процессоров начнётся в первой половине 2012 года. Наладить массовый выпуск 28 нм изделий TSMC сможет в четвёртом квартале этого года, подходящее оборудование уже монтируется на одной из фабрик компании. Таким образом, Globalfoundries должна достаться часть заказов на выпуск гибридных 28 нм процессоров Krishna и Wichita, а производство графических решений AMD ей пока не доверяет, если не считать гибридных процессоров Llano и Trinity, которые тоже оснащены графической подсистемой. Впрочем, это не означает, что Globalfoundries не сможет заняться выпуском графических процессоров AMD позже, когда для этого возникнут необходимые условия и предпосылки.
Итоги анонса процессоров Llano вызывают у потребителей противоречивые чувства. С одной стороны, партнёры AMD начали представлять мобильные компьютеры на базе первых представителей этого семейства. На сайте AMD даже можно найти характеристик гибридных мобильных процессоров серии A, но нельзя найти официальные цены. В принципе, для продаваемых только в составе ноутбуков процессоров отсутствие их в прайс-листе AMD не так критично, а вот с ценами на настольные процессоры этого семейства покупателям познакомиться уже хотелось бы.
Как вы можете помнить, AMD лаконично сообщила, что первые системы на базе настольных и мобильных процессоров Llano попадут на рынок до конца текущего квартала, читай - июня. Характеристики настольных версий Llano были частично обнародованы только авторами первых обзоров, а о ценовой политике AMD мы можем догадываться только по . Коллеги с сайта заявляют, что американские магазины начали выставлять на своих интернет-витринах первые предложения настольных процессоров Llano:
A8-3850 -> четыре ядра, частота 2.9 ГГц, графическая подсистема Radeon HD 6550D (400 потоковых процессоров, частота ядра 600 МГц), объём кэша 4 Мб, уровень TDP не более 100 Вт, поддержка двухканальной памяти типа DDR3-1866, цена около $150;
A6-3650 -> четыре ядра, частота 2.6 ГГц, графическая подсистема Radeon HD 6530D (320 потоковых процессоров, частота ядра 443 МГц), объём кэша 4 Мб, уровень TDP не более 100 Вт, поддержка двухканальной памяти типа DDR3-1866, цена около $130.
По ценовому позиционированию процессоры A8-3850 и A6-3650 соперничают с процессорами Core i3-2120 (3.3 ГГц) и Core i3-2100/2105 (3.1 ГГц), которые имеют только два физических ядра и 3 Мб кэша, а также обладают более слабой графической подсистемой, поддерживающей только DirectX 10.1. Не будем забывать, что для процессоров Llano потребуются новые материнские платы с разъёмом Socket FM1, поэтому переход на новую платформу сторонникам продукции AMD обойдётся дороже, чем в случае замены только процессора.
MSAA 2х—8х
CFAA до 24x
SSAA 2x—8x
MLAA
EQAA до 16x
MSAA 2х—8х
CFAA до 24x
SSAA 2x—8x
MLAA
Спецификации референсных карт на базе чипов семейств R9XX
карта
чип
блоков ALU/TMU/ROP
частота ядра, МГц
частота памяти, МГц
объем памяти, МБ
ПСП, ГБ/c
(бит)
тексту-
рирование, Гтекс
филлрейт, Гпикс
TDP, Вт
Radeon HD 6990
2x(1536/96/32)
830(880)
1250(5000)
2x2048 GDDR5
320 (2x256)
159(169)
53(56)
350(415)
Radeon HD 6970
«Cayman»
1536/96/32
880
1375(5500)
2048 GDDR5
176 (256)
84,5
28,2
250
Radeon HD 6950
«Cayman»
1408/88/32
800
1250(5000)
1024/2048 GDDR5
160 (256)
70,4
25,6
200
Radeon HD 6870
«Barts»
1120/56/32
900
1050(4200)
1024 GDDR5
134 (256)
50,4
28,8
151
Radeon HD 6850
«Barts»
960/48/32
775
1000(4000)
1024 GDDR5
128 (256)
37,2
24,8
127
Radeon HD 6790
«BartsLE»
800/40/16
840
1050(4200)
1024 GDDR5
134 (256)
33,6
13,4
150
Radeon HD 6670
«Turks»
480/24/8
840
1000(4000)
1024 GDDR5
64 (128)
19,2
6,4
66
Radeon HD 6570 GDDR5
«Turks»
480/24/8
650
900-1000(3600-4000)
512/1024 GDDR5
58-64 (128)
15,6
5,2
60
Radeon HD 6570 DDR3
«Turks»
480/24/8
650
900(1800)
512/1024 DDR3
29 (128)
15,6
5,2
44
Radeon HD 6450 GDDR5
«Caicos»
160/8/4
625-750
800-900(3200-3600)
512/1024 GDDR5
26-29 (64)
5-6
2,5-3
27
Radeon HD 6450 DDR3
«Caicos»
160/8/4
625-750
533-800(1066-1600)
512/1024 DDR3
9-13 (64)
5-6
2,5-3
18
Подробности: Cayman, серия Radeon HD 6900
Кодовое имя чипа «Cayman»
Технология 40 нм
2,64 млрд. транзисторов (почти на четверть больше, чем у Cypress и в 1,5 раза больше Barts)
Площадь кристалла 389 мм2 (в полтора раза больше, чем Barts)
Унифицированная архитектура с массивом общих процессоров для потоковой обработки многочисленных видов данных: вершин, пикселей и др.
Аппаратная поддержка DirectX 11, в том числе и новой шейдерной модели — Shader Model 5.0
256-битная шина памяти: четыре контроллера шириной по 64 бита с поддержкой памяти GDDR5
Частота ядра до 880 МГц (для Radeon HD 6970)
24 SIMD-ядра, включающих 384 потоковых процессора, и в общем 1536 скалярных ALU для расчётов с плавающей точкой (целочисленные и плавающие форматы, поддержка точности FP32 и FP64 в рамках стандарта IEEE 754)
24 укрупненных текстурных блока, с поддержкой форматов FP16 и FP32
96 блоков текстурной адресации и столько же блоков билинейной фильтрации, с возможностью фильтрации FP16-текстур на полной скорости и поддержкой трилинейной и анизотропной фильтрации для всех текстурных форматов
32 блока ROP с поддержкой режимов антиалиасинга с возможностью программируемой выборки более чем 16 семплов на пиксель, в том числе при FP16- или FP32-формате буфера кадра. Пиковая производительность до 32 отсчетов за такт (в т. ч. для буферов формата FP16), а в режиме без цвета (Z only) — 128 отсчетов за такт
Интегрированная поддержка RAMDAC, шести портов Single Link или трёх портов Dual Link DVI, а также HDMI 1.4a и DisplayPort 1.2
Спецификации видеокарты Radeon HD 6970
Частота ядра 880 МГц
Количество универсальных процессоров 1536
Количество текстурных блоков — 96, блоков блендинга — 32
Эффективная частота памяти 5500 МГц (4×1375 МГц)
Объем памяти 2 гигабайта
Пропускная способность памяти 176 гигабайт в сек.
Теоретическая максимальная скорость закраски 28,2 гигапикселей в сек.
Теоретическая скорость выборки текстур 84,5 гигатекселей в сек.
Два разъёма CrossFireX
Шина PCI Express 2.1
Разъёмы: DVI Dual Link, DVI Single Link, HDMI 1.4a, два mini DisplayPort 1.2
Энергопотребление от 20 до 250 Вт (типичное энергопотребление в играх — до 190 Вт)
Один 8-штырьковый и один 6-штырьковый разъёмы питания
Двухслотовый дизайн
Рекомендованная цена для рынка США $369
Спецификации видеокарты Radeon HD 6950
Частота ядра 800 МГц
Количество универсальных процессоров 1408
Количество текстурных блоков — 88, блоков блендинга — 32
Эффективная частота памяти 5000 МГц (4×1250 МГц)
Объем памяти 2 гигабайта
Пропускная способность памяти 160 гигабайт в сек.
Теоретическая максимальная скорость закраски 25,6 гигапикселей в сек.
Теоретическая скорость выборки текстур 70,4 гигатекселей в сек.
Два разъёма CrossFireX
Шина PCI Express 2.1
Разъёмы: DVI Dual Link, DVI Single Link, HDMI 1.4a, два mini DisplayPort 1.2
Энергопотребление от 20 до 200 Вт (типичное энергопотребление в играх — до 140 Вт)
Два 6-штырьковых разъёма питания
Двухслотовый дизайн
Рекомендованная цена для рынка США $299
Применение отработанного 40-нанометрового техпроцесса всё же позволило компании AMD выпустить новый топовый GPU, пусть и не в таком виде, каким он мог быть на 32 нм. Сложность Cayman по сравнению с Cypress выросла менее чем на четверть, как и площадь ядра, но некоторые характеристики, влияющие на производительность, остались практически на том же уровне. Это и количество ALU, и неизменное число блоков ROP, да и пропускная способность видеопамяти не сильно выросла. Но всё же, во многом благодаря повышенным тактовым частотам и возросшей эффективности нового чипа AMD, он должен в среднем превзойти Cypress.
Принцип наименования моделей был несколько изменён с предыдущего поколения. По сравнению с предыдущей серией, у топовых решений поменялась не только первая, но и вторая цифра индекса. Radeon HD 6970 и HD 6950 являются наиболее производительными одночиповыми решениями и должны заместить видеокарты HD 5870 и HD 5850, становясь в линейке выше выпущенных недавно решений семейства HD 6800. Что касается сравнения с конкурентом, то по указанным выше рекомендованным ценам понятно, что по производительности HD 6970 на одном уровне или несколько производительнее GeForce GTX 570, а вот у HD 6950 конкурент на другом чипе — GTX 560 Ti.
Два варианта серии, как это принято у видеокарт AMD, отличаются как тактовыми частотами видеочипа и памяти, так и отключенной частью исполнительных блоков у младшей модели. На обе видеокарты новой серии устанавливается память типа GDDR5 одинакового объёма в 2 гигабайта. Оптимальным объёмом памяти на сегодняшний день до сих пор является 1 гигабайт, но вполне возможно, что для топовых моделей и такой объём оправдан, так как в каких-то случаях нехватка 1 ГБ памяти всё-таки будет наблюдаться, да и для игр на трёх мониторах (Eyefinity) экранный буфер такого объёма будет весьма полезен. К слову, партнёры компании уже выпустили и модель Radeon HD 6950 с 1 ГБ видеопамяти с меньшей стоимостью.
Обе видеокарты имеют двухслотовую систему охлаждения, закрытую привычным для всех современных плат AMD пластмассовым кожухом по всей длине карты. Энергопотребление младшей карты ниже, что позволило обойтись в её случае двумя 6-штырьковыми разъёмами питания. Кроме максимального энергопотребления AMD теперь указывает и типичное потребление в играх (typical gaming power) — показатель потребления, замеренный при тестировании в наборе из 25 популярных игр.
Архитектура Cayman
При проектировании Cayman (а именно такое кодовое имя получил новый GPU компании) основными задачами инженеров AMD было создание эффективной графической и вычислительной архитектуры с новыми возможностями GPGPU, значительное увеличение производительности геометрических блоков, улучшения в алгоритмах, влияющих на качество рендеринга (текстурная фильтрация и полноэкранное сглаживание), а также улучшенное управление питанием.
Судя по всему, архитектуру Cayman можно назвать промежуточным решением между архитектурой Cypress и так и не рождённой 32-нанометровой архитектурой, так как в состав нового GPU были включены лишь некоторые возможности из неё. Интересно, что цель инженеров по размеру Cayman была +15% к площади Cypress, что позволило потратить эти дополнительные транзисторы на некоторые новые вычислительные и графические возможности, о которых мы расскажем ниже. Итак, посмотрим, что получилось у AMD.
При взгляде на схему чипа, сразу же обращают на себя внимание два блока по обработке геометрии и тесселяции (graphics engine, включающий растеризатор, тесселятор и некоторые другие блоки), а также сдвоенный диспетчер. Это одно из важнейших нововведений в Cayman, к которому явно сподвигло отставание по скорости обработки геометрии от конкурента, уже почти год имеющего распараллеленный графический конвейер.
Важнейшим архитектурным изменением стала суперскалярная VLIW4 архитектура вычислительных процессоров, в отличие от VLIW5 в предыдущей. С одной стороны это может показаться ухудшением, ведь каждый из имеющихся процессоров теперь может выполнять меньше операций параллельно. Но с другой — это может увеличить эффективность использования (КПД) потоковых процессоров, так как подобрать четыре независимые команды явно проще, чем пять.
В целом, новый графический процессор включает 24 SIMD-ядра, каждое из которых состоит из 16 процессоров, умеющих вычислять до четырех команд одновременно. Другими словами, всего вычислительных блоков в Cayman стало 24×16×4=1536 штук, что даже несколько меньше, чем у Cypress. Но так как КПД использования этих блоков явно должен увеличиться, то и производительность также вырастет, скорее всего.
Каждое SIMD-ядро нового графического процессора имеет по четыре блока текстурирования, как и в предыдущих GPU, то есть общее число текстурных процессоров — 96 TMU. Это несколько больше, чем у Cypress, и заметно больше, чем имеет топовый чип конкурента. Так, преимущество по текстурированию должно остаться за AMD. Другие численные характеристики мало отличаются от тех же HD 5800 и HD 6800, чип имеет четыре 64-битных контроллера памяти и 256-битную шину в целом, а также 32 блока ROP. Хотя они всё же отличаются от тех, что используются в предыдущих GPU, и об этом будет написано далее.
Архитектура потоковых процессоров
Новые потоковые процессоры отличаются от предыдущих тем, что умеют выполнять одновременно до четырёх независимых инструкций (4-way co-issue), и все четыре исполнительных устройства ALU в процессоре имеют одинаковые возможности, в отличие от предыдущей архитектуры. Напомним, что каждый потоковый процессор Cypress имеет четыре блока ALU + блок специального назначения SFU (также называемый «T-unit»), служащий для выполнения трансцендентных функций (синус, косинус, логарифм и т. д.), а Cayman выполняет такие команды при помощи трёх из четырёх «обычных» ALU.
Всё вместе это теоретически даёт лучший показатель эффективности использования потоковых процессоров, по сравнению с VLIW5. Хотя VLIW5 обеспечивает достаточно высокий КПД во многих случаях, но средняя загрузка ALU получается явно ниже 100%, и часто лишь три или четыре блока из пяти заняты работой. Снижение количества ALU в каждом процессоре увеличивает их эффективность, и, по оценке компании AMD, улучшение соотношения скорости вычислений и площади чипа составляет порядка 10%. Плюс к этому, дополнительным бонусом идёт упрощение управляющих блоков: шедулера и управление регистрами.
Ещё одной важной деталью перехода от VLIW5 к VLIW4 является то, что для асимметричной архитектуры сложнее оптимизировать и скомпилировать эффективный код. А для симметричного VLIW4 блока работа компилятора упрощается. И в этом мы видим пока что нераскрытый потенциал Cayman — скорее всего, компилятор пока оптимизирован для нового GPU недостаточно и в будущем весьма вероятны приросты по мере оптимизации компилятора для новой архитектуры.
Новая архитектура VLIW4 привела к увеличению производительности вычислений с двойной точностью. 64-битные вычисления теперь исполняются лишь вчетверо медленнее, чем 32-битные. А у решений предыдущей архитектуры это соотношение было ниже — 1/5. Такое изменение позволило повысить пиковую производительность 64-битных вычислений нового Radeon HD 6970 до 675 GFLOPS (для сравнения — у HD 5870 этот показатель равен 544 GFLOPS).
Изменения в блоках ROP
Блоки ROP в новом чипе компании AMD также получили некоторые усовершенствования. Cayman теперь умеет значительно быстрее обрабатывать данные в некоторых форматах, в числе которых 16-битный целочисленный (вдвое быстрее) и одно- или двухкомпонентный 32-битный (ускорение в два-четыре раза, в зависимости от количества компонентов). Это улучшение важнее всего для широко распространённых сейчас случаев отложенного (deferred) рендеринга, хотя применение 32-битных буферов в играх пока что явно ограничено.
Неграфические вычисления на GPU
Пожалуй, больше всего изменений в Cayman произошло как раз в вычислительных возможностях. Прежде всего нужно отметить асинхронную отправку команд на выполнение и одновременное исполнение нескольких вычислительных процессов (kernel), каждый из которых имеет свою очередь команд и свою область защищённой виртуальной памяти. По сути, в Cayman появились возможности вычислений по принципу MPMD (Multiple Processor/Multiple Data) — когда несколько процессоров выполняют множество потоков данных.
В предыдущих архитектурах компании AMD была возможность одновременного запуска и распределения нескольких процессов (kernel), но они имели лишь один конвейер команд, что затрудняло одновременную работу вычислительных и графических приложений. GPU новой архитектуры способен эффективно выполнять несколько потоков команд одновременно. Потоки имеют свои отдельные кольцевые буферы и очереди, а очередность исполнения команд независима и асинхронна, и выполняются они в зависимости от приоритета. Это позволяет запускать вычисления и получать итоговый результат вне очереди.
Также для каждого kernel новый чип предоставляет независимую виртуальную память, и все потоки команд теперь защищены друг от друга. А в дополнение к асинхронной подаче команд, чип имеет два двунаправленных контроллера прямого доступа к памяти (DMA), что поможет увеличить пропускную способность в обоих направлениях.
Но и это ещё не все «вычислительные» изменения в Cayman. Появилась возможность выборки данных из памяти в обход ALU напрямую в локальную память, а оптимизированные чтение и комбинированная запись данных увеличила производительность подсистемы ввода-вывода. Также в новом GPU было улучшено управление потоком передачи данных (flow control) и многое другое.
Параллельная обработка геометрии
В своих материалах мы не раз упоминали, что одним из основных архитектурных преимуществ конкурирующих решений от NVIDIA является распараллеленная обработка геометрии, применяемая во всех их современных решениях, которые весьма эффективны при использовании тесселяции. геометрические примитивы в топовых чипах конкурента AMD обрабатываются одновременно 16-ю блоками, в отличие от одного блока у Cypress и Barts, равно как и остальных предшествующих чипах.
Соответственно, AMD нужно было срочно улучшить производительность геометрических блоков. Частичный шаг был сделан ещё в Barts, оптимизации которого привели к повышению скорости обработки геометрии и тесселяции в полтора раза в лучшем случае. Но даже тесселятор седьмого поколения всё ещё серьёзно уступал тесселяторам Fermi первого же поколения.
Блоки обработки геометрии и тесселяции в Cayman названы уже восьмым поколением, и они получили установку геометрических примитивов (geometry setup) удвоенной скорости, улучшенную буферизацию геометрических данных и двойной блок обработки геометрии. Именно так, AMD тоже пришлось распараллеливать работу над геометрическими данными, хотя и не настолько радикально, как это сделано в GPU конкурента.
Двойной блок геометрии в Cayman обрабатывает два примитива за такт, то есть скорость трансформации и отбрасывания задних граней (backface culling) возросла вдвое, а нагрузка между блоками распределяется при помощи разбиения на тайлы. Вместе с улучшением буферизации, по данным AMD, это приводит к росту производительности тесселяции у топового решения Radeon HD 6970 до трёх раз, по сравнению с HD 5870.
Но всё же, как видите, чаще всего скорость обработки геометрии и тесселяции возросла вдвое, а не втрое. Даже по данным самой AMD. К слову, они приводят и цифры из игр и бенчмарков с применением тесселяции, и приросты там достигают впечатляющих цифр порядка 30—70%, в зависимости от количества оттесселированных поверхностей и степени разбиения примитивов. Мы проверим эти цифры в следующей части материала, посвящённой исследованиям производительности новых решений в синтетических тестах и некоторых из игровых, которые также используют тесселяцию.
Улучшения в качестве рендеринга
Одной из задач новой архитектуры было повышение качества рендеринга. Это касается как улучшения существующих алгоритмов текстурной фильтрации и сглаживания, так и появления новых возможностей, вроде нового типа полноэкранного сглаживания — морфологического (MLAA — MorphoLogical Anti-Aliasing).
Часть из новых возможностей доступна и на младших представителях серии — видеокартах Radeon HD 6800, но есть одно аппаратное нововведение, которое появилось именно в серии HD 6900, в чипе Cayman. Это улучшенный метод полноэкранного сглаживания, названный Enhanced Quality Anti-Aliasing (EQAA). Если совсем коротко, то это аналог Coverage Sampling Anti-Aliasing (CSAA), имеющийся у NVIDIA ещё со времён чипа G80 (серия GeForce 8800), о котором мы ещё несколько лет назад.
Суть метода в том, что цвета отсчётов и глубина хранятся отдельно от информации об их местоположении, и на один пиксель может приходиться по 16 отсчетов при 8 вычисленных значений глубины, что экономит пропускную способность. Метод позволяет обойтись передачей и хранением одного значения цвета или Z на каждый субпиксель, уточняя усредненное значение экранного пикселя за счёт более подробной информации о том, как этот пиксель перекрывает края треугольников. Понимание этого запутанного объяснения вам облегчит следующая картинка:
В предыдущих чипах компании AMD (включая серию HD 6800) число рассчитанных семплов и сохранённых было одинаковым. В решениях серии HD 6900 эти два значения можно изменять независимо друг от друга, и число выборок на пиксель и число сохранённых в буфере может быть разным. Это позволяет получить качество выше, чем при обычном мультисэмплинге (MSAA) при сохранении сравнительно высокой производительности.
EQAA позволяет обеспечивать качество сглаживания заметно выше, чем у MSAA 4х, лишь с небольшой потерей производительности. По оценке компании AMD, разница в производительности между режимами с включенным и выключенным EQAA в играх составляет единицы процентов, что отлично соотносится с результатами видеокарт NVIDIA.
Дополнительным положительным фактором является то, что метод совместим с адаптивным сглаживанием (Adaptive AA), суперсэмплингом (Super-Sample AA) и морфологическим сглаживанием, о котором мы рассказывали в статье о Radeon HD 6800. Но каким образом включается этот самый EQAA? AMD и тут переняла опыт конкурента, введя в настройки драйвера аналогичные возможности по подмене метода сглаживания (к примеру, с обычного MSAA на EQAA, но не обязательно именно так).
Об остальных улучшениях качества рендеринга у новых решений AMD мы подробно рассказывали в статье о семействе Radeon HD 6800, как и о «морфологическом» сглаживании и об улучшениях текстурной фильтрации. Morphological Anti-Aliasing — это новый метод сглаживания, известный нам по некоторым мультиплатформенным играм. Это фильтр постобработки, применяемый к финальной картинке при помощи вычислительного или пиксельного шейдера.
Данный метод сглаживает все пиксели сцены, а не только края полигонов и полупрозрачных текстур как MSAA, и поэтому после него может отмечаться излишняя замыленность картинки. Зато этот метод теоретически быстрее суперсэмплинга, так как он обрабатывает только нужные участки, на которых фильтр нашёл резкие переходы цвета. Отличие от ещё одного метода, известного как edge-detect CFAA в том, что фильтр применяется ко всем граням, а не только краям треугольников.
Все эти методы можно смешивать и друг с другом. Иными словами, EQAA полностью совместим и с так называемыми «custom resolve» фильтрами и «морфологическим» сглаживанием и все они могут применяться одновременно. Что позволит повысить качество рендеринга в случае излишка производительности, часто имеющегося у топовых видеокарт.
Технология AMD PowerTune
Одним из наиболее интересных изменений в Cayman, напрямую не связанным с 3D-графикой, является технология, получившая название PowerTune. Собственно, к гибкому управлению тактовой частотой, напряжением и питанием GPU дело уже давно шло. Те же центральные процессоры давно умеют плавно или ступенчато изменять производительность и «прожорливость», снижая некоторые параметры в простое и повышая при нагрузке. Да и видеочипы тоже умеют изменять указанные параметры, но до сих пор делали это ступенчато и не имели пределов, за которые нельзя было бы выйти.
Обычные игры и другие приложения, использующие вычисления на GPU, редко когда предъявляют повышенные требования к питанию и не подходят к опасным пределам энергопотребления, превышающим возможности системы. В отличие от тестов стабильности, вроде Furmark и OCCT, которые выжимают из системы всё до капли. Ещё в семействе Evergreen (серия Radeon HD 5000) был некий зачаток ограничителя производительности при превышении определённого уровня потребления, а в HD 6900 эта система перешла на качественно иной уровень.
Новый GPU имеет специальные датчики во всех блоках чипа, которые отслеживают параметры загрузки, таким образом графический процессор постоянно измеряет нагрузку и энергопотребление и не позволяет выйти последнему за определённый порог, автоматически регулируя частоту и напряжение так, чтобы параметры оставались в рамках указанного теплопакета. Эта технология помогает установить высокие частоты GPU и при этом не бояться, что видеокарта выйдет за безопасные пределы по энергопотреблению. AMD приводит следующие приложения в виде примера:
Как видите, наиболее требовательными 3D-приложениями являются средства тестирования стабильности и некоторые из синтетических тестов. А вот игры, даже самые тяжёлые, совсем не требуют максимальной энергии от GPU и не выходят за установленные рамки.
В отличие от ранних технологий управления питанием, PowerTune обеспечивает прямой контроль над энергопотреблением GPU, по сравнению с косвенным управлением при помощи изменения частот и напряжений. И более не требуется ставить ограничитель для избранных приложений, технология будет работать с тем же успехом для всех программ, в т. ч. и будущих.
Для компании AMD технология полезна сразу по нескольким причинам: она предохранит видеокарты от выхода из строя в некоторых случаях (например, нерадивые и невнимательные любители разгона) и позволит выжать максимальную производительность из GPU без проблем с питанием и охлаждением. Важно и то, что данная технология позволяет пользователю самому ограничивать потребление при помощи средств AMD OverDrive, как это показано на скриншоте:
Естественно, что регулировать параметр максимального потребления можно лишь в определённых пределах и с перекладыванием ответственности на плечи пользователя и лишения последнего каких-либо гарантий. В некоторых случаях будет полезно не только повысить этот предел, но и снизить его, добившись снижения потребления в случае отсутствия необходимости в высокой производительности.
Изменение тактовой частоты GPU и полученная при этом производительность при разных уровнях максимального потребления наглядно отображены на следующем графике. На нём указано изменение частоты GPU видеокарты Radeon HD 6950 в тесте Perlin Noise из набора 3DMark Vantage в трёх режимах: по умолчанию и с повышенным пределом по питанию на 5% и 10%. Этот график соответствует тому, что получится при работе наиболее требовательных к питанию приложений:
В режиме по умолчанию GPU не может постоянно работать на частоте в 800 МГц, не превысив установленной AMD границы потребления, и показывает результат на уровне 140 FPS. При добавлении 5% к максимальному потреблению частота GPU становится выше, но всё ещё часто не достигает максимально положенных 800 МГц, и в результате достигается скорость 155 FPS. В случае же добавленных 10% к пределу потребления, чип всегда работает на частоте около 800 МГц и не достигает изменённой границы потребления, показывая при этом 162 средних кадров в секунду.
Если рассматривать обратную ситуацию, когда нужно снизить потребление, то и в таком случае технология будет полезна. AMD приводит пример игры Aliens vs Predator и трёх режимов: по умолчанию, -10% от максимального потребления и -20%. Если в режимах по умолчанию и -10% разница получилась небольшой, то в последнем случае, при снижении потребления на 30 Вт можно получить вполне комфортные 40 FPS вместо 50 FPS при максимальном потреблении:
Таким образом, каждый пользователь может настроить PowerTune под себя (при условии отказа от гарантий, разумеется) и выбрать или меньшее энергопотребление системы, или более высокую производительность в тех приложениях, в которых GPU становится весьма требовательным к питанию. Можно даже вручную настраивать меньшее потребление для постоянной работы и максимальное — для требовательных приложений.
Другие изменения
Из других интересных отличий видеокарт топового семейства Radeon HD 6900 хотелось бы отметить следующую полезную особенность — наличие двух микросхем BIOS на карте и защиту от перезаписи для одной из них, имеющей заводские настройки. Для этого на плате рядом с CrossFire разъёмами расположен микропереключатель.
Переключатель BIOS служит для обеспечения работоспособности видеокарты в случае каких-либо проблем у пользователя, возникших в процессе перепрошивки. Данный переключатель определяет, с какого образа будет загружаться видеокарта: 1 — незащищённая от записи микросхема BIOS с возможностью пользовательской перепрошивки, 2 — не перезаписываемая пользователем копия BIOS с заводскими настройками.
Эта функциональность тоже призвана помочь в решении проблем вышедших из строя видеокарт. Ведь теперь даже в случае неудачной попытки прошивки BIOS пользователь всегда сможет воспользоваться вторым образом. Можно только похвалить AMD за такое решение проблем пользователей. Наконец-то можно будет выбросить запасную PCI-видеокарту, бережно хранимую многими энтузиастами для таких случаев.
Всё новое семейство видеокарт AMD — и HD 6800, и HD 6900, — поддерживает DisplayPort 1.2 в рамках улучшенной мультимониторной технологии AMD Eyefinity Multi-Display Technology. Её отличие от предыдущих — в возможности вывода сразу нескольких каналов по одному разъёму DisplayPort, что позволяет (точнее — позволит в будущем) подключить большее количество мониторов к одной видеокарте. Для подключения нескольких мониторов при помощи одного разъёма будет необходим специальный хаб, приобретаемый отдельно.
Cayman содержит и новый блок обработки видео Unified Video Decoder 3, самой интересной новой возможностью которого нам видится появление поддержки аппаратного декодирования формата DivX/XviD, который ранее не ускорялся на GPU. Но не только в декодировании этого формата заключаются улучшения в UVD3, он также теперь декодирует MPEG-2 полностью на GPU и поддерживает кодеки с двумя потоками для возможности проигрывания 3D-дисков Blu-ray.
Более подробно об изменениях в технологиях вывода изображения, включая возможности Eyefinity, технологии AMD HD3D и новом поколении блока обработки видео Unified Video Decoder 3 вы можете прочитать в .
Подробности: Barts, серия Radeon HD 6800
Кодовое имя чипа «Barts»
1,7 млрд. транзисторов (более чем на четверть меньше, чем у «Cypress»)
256-битная шина памяти: четыре контроллера шириной по 64 бита с поддержкой памяти GDDR5
Частота ядра до 900 МГц
14 SIMD-ядер, включающих 1120 скалярных ALU для расчётов с плавающей точкой (целочисленные и плавающие форматы, поддержка точности FP32 в рамках стандарта IEEE 754)
14 укрупненных текстурных блоков, с поддержкой форматов FP16 и FP32
56 блоков текстурной адресации и столько же блоков билинейной фильтрации, с возможностью фильтрации FP16-текстур на полной скорости и поддержкой трилинейной и анизотропной фильтрации для всех текстурных форматов
32 блока ROP с поддержкой режимов антиалиасинга с возможностью программируемой выборки более чем 16 семплов на пиксель, в том числе при FP16- или FP32-формате буфера кадра. Пиковая производительность до 32 отсчетов за такт (в т. ч. для буферов формата FP16), а в режиме без цвета (Z only) — 128 отсчета за такт
Запись результатов до восьми буферов кадра одновременно (MRT)
Интегрированная поддержка RAMDAC, шести портов Single Link или трёх портов Dual Link DVI, а также HDMI 1.4a и DisplayPort 1.2
Спецификации видеокарты Radeon HD 6870
Частота ядра 900 МГц
Количество универсальных процессоров 1120
Количество текстурных блоков — 56, блоков блендинга — 32
Эффективная частота памяти 4200 МГц (4×1050 МГц)
Пропускная способность памяти 134,4 гигабайт в сек.
Теоретическая максимальная скорость закраски 28,8 гигапикселей в сек.
Теоретическая скорость выборки текстур 50,4 гигатекселей в сек.
Поддержка CrossFireX
Разъёмы: DVI Dual Link, DVI Single Link, HDMI 1.4a, два mini DisplayPort 1.2
Энергопотребление от 19 до 151 Вт (два 6-штырьковых разъёма питания)
Рекомендованная для рынка США цена $239
Спецификации видеокарты Radeon HD 6850
Частота ядра 775 МГц
Количество универсальных процессоров 960
Количество текстурных блоков — 48, блоков блендинга — 32
Эффективная частота памяти 4000 МГц (4×1000 МГц)
Объем памяти 1024 мегабайта
Пропускная способность памяти 128,0 гигабайт в сек.
Теоретическая максимальная скорость закраски 24,8 гигапикселей в сек.
Теоретическая скорость выборки текстур 37,2 гигатекселей в сек.
Поддержка CrossFireX
Разъёмы: DVI Dual Link, DVI Single Link, HDMI 1.4a, два mini DisplayPort 1.2
Энергопотребление от 19 до 127 Вт (один 6-штырьковый разъём питания)
Рекомендованная для рынка США цена $179
Применение того же 40-нанометрового техпроцесса, но в отработанном виде позволило компании AMD выпустить решения среднего уровня, примерно соответствующие по производительности предыдущим топовым. Сложность чипов снизилась на четверть, равно как и площадь ядра, а вот многие характеристики, влияющие на производительность, остались почти на том же уровне, во многом из-за повышенных тактовых частот. Естественно, что новый чип стал ещё более эффективен энергетически.
Принцип наименования моделей изменился, о причинах такого решения мы писали выше. По сравнению с предыдущей серией поменялась и первая, и вторая цифры. Radeon HD 6870 и HD 6850 предназначены для смены HD 5870 и HD 5850, хотя они должны быть чуть медленнее их попарно. А новыми верхними моделями стали карты серии HD 6900.
Два варианта серии, как обычно для видеокарт AMD, отличаются тактовыми частотами видеочипа и памяти, а также у младшей модели отключена и часть исполнительных блоков. На обе видеокарты серии устанавливают память типа GDDR5, одинакового объёма — 1 гигабайт. Это оптимальный объём памяти на сегодняшний день, от большего объёма на решениях среднего уровня никакой пользы просто не будет.
А ещё младшее решение отличается дизайном платы, и референсные кулеры у них разные. Обе видеокарты имеют двухслотовую систему охлаждения, закрытую привычным пластмассовым кожухом по всей длине карты. А вот энергопотребление младшей карты ниже, что позволило обойтись в её случае лишь одним 6-штырьковым разъёмом питания.
Архитектура «Barts»
Обновленную архитектуру Cypress мы рассматривали в соответствующей базовой статье. Как вы помните, особенных изменений в нём не было, это в основном развитие идей предыдущих поколений, хотя небольшие модификации затронули практически все блоки чипа. А отличия чипа Barts от Cypress вообще в основном количественные, хотя и не только.
Итак, какие изменения принесла переработанная архитектура в Barts? В основном, увеличенную производительность на каждый Ватт и миллиметр площади, то есть улучшенную эффективность. Хотя AMD называет Barts «вторым поколением DirectX 11», изменений в архитектуре практически нет, они почти исключительно количественные — просто иное количество исполнительных блоков и другой баланс между производительностью и потреблением с себестоимостью.
Да, некоторые оптимизации привели к повышению скорости обработки геометрии и тесселяции — больного места решений AMD, по сравнению с конкурирующими. Но эти улучшения не изменили скорость тесселяции в разы, а лишь в полтора-два раза в лучшем случае.
Нам кажется более интересным улучшение качества полноэкранного сглаживания и текстурной фильтрации, хотя они скорее программные, а не аппаратные. Также любопытна поддержка декодирования DivX и Blu-ray 3D-видео, да и улучшения в AMD Eyefinity и поддержке новых стандартов HDMI 1.4a и DisplayPort 1.2 весьма логичны и своевременны.
Хотя это в основном изменения, связанные не с ядром GPU, а с прочими блоками, которые не относятся к 3D-части чипа, которая наиболее интересна для нас сейчас. Итак, давайте рассмотрим блок-схему нового чипа.
Смотрим, что изменилось. По сути, это только блоки в составе Graphics Engine и общее количество блоков SIMD. Блок тесселяции ныне улучшен (это седьмое поколение, см. далее), растеризаторов стало два (или вдвое увеличен темп обработки примитивов, что также вполне вероятно), а количество блоков SIMD снизилось с 18—20 (у Cypress) до 12—14 штук (у Barts), в зависимости от модели.
Ровно настолько же уменьшилось и общее количество процессоров потоковой обработки, теперь их максимум 1120 штук, в отличие от 1600 у Cypress. Всё остальное осталось прежним, и 256-битная шина памяти с поддержкой GDDR5 видеопамяти, и блоки ROP, и остальное.
Благодаря более высоким тактовым частотам, производительность Radeon HD 6870 оказывается выше, чем у HD 5850 (внимание — ниже, чем у HD 5870 даже теоретически!), при меньшей площади GPU. Но это сравнение по цене, а если сравнивать чипы Barts и Cypress на одной частоте, то анонсированное сегодня решение будет в основном медленнее.
Тесселяция и обработка геометрии
Известно, что относительно слабым местом ранних решений AMD была тесселяция, появляющаяся в DX11-приложениях. И вполне логично, что в Barts частично исправили именно это. Блок тесселяции в данном GPU объявлен уже седьмым поколением тесселятора ATI/AMD (см. слайд ниже). Первый появился ещё в древнем ATI Radeon 8500, второй в консоли Xbox 360 от Microsoft, а далее пошли серии видеокарт AMD. Вероятно, 8-е поколение мы увидим уже в серии HD 6900…
Честно говоря, нам не совсем понятно такое большое количество поколений тесселяторов, особенно если большинство их изменений ограничивались введением совместимости с версиями DirectX и уж тем более исключительно небольшими приростами производительности. А можно вспомнить и решения конкурента, первое же поколение тесселяторов которого превосходит по производительности все существующие семь (а то и восемь) поколений тесселяторов AMD. Так есть ли смысл гордиться этой цифрой?
Впрочем, важнее то, что по данным синтетических тестов компании AMD, скорость тесселяции в HD 6870, по сравнению с HD 5870, увеличилась в полтора-два раза (конечно, мы это проверим в практическом исследовании). Причём, новый чип эффективнее всего справляется со средними уровнями тесселяции, а при высоких скорость почти не выросла. Но это не будет проблемой, так как в играх такие уровни не используются и не будут нужны в ближайшее время. Вот пример увеличения сложности геометрии при разных степенях разбиения:
Это уже камешек в огород конкурента. Действительно, вряд ли кому нужны треугольники размером в один пиксель, а при слишком большой детализации эффективность загрузки других блоков (растеризаторов, к примеру) значительно снижается, да и в целом такая работа недостаточно эффективно выполняется на нынешних GPU. В недостатках высокой степени тесселяции: лишняя работа по шейдингу (overshading), большое количество краёв полигонов, нуждающихся в обработке при мультисемплинге и т. д. В общем, такой подход вызывает лишь растрату ресурсов, на взгляд представителей AMD.
В идеале нужно добиваться наиболее эффективных оттесселированных моделей, чтобы размер каждого треугольника был около 16 пикселей на полигон. Это весьма выгодно для попиксельной обработки, которая ведётся именно такими блоками. Таким образом достигается идеальный баланс между качеством рендеринга и производительностью.
Именно для достижения этой цели служат такие методы, как адаптивная тесселяция, когда высокие уровни разбиения используются для объектов на первом плане и отдельных поверхностей, требующих высокой детализации, а для дальних объектов применяются меньшие уровни тесселяции, что улучшает производительность и почти не сказывается на качестве итоговой картинки.
Улучшения в качестве рендеринга
Как известно, предыдущие чипы AMD сделали правильный шаг в направлении достижения наиболее качественной картинки — в них появилась поддержка нового алгоритма анизотропной фильтрации, текстурные мип-уровни при которой расположены по идеальным окружностям. Также можно отметить возможность включения сглаживания методом суперсемплинга, который заметно улучшает общее качество рендеринга.
Что радует, в серии HD 6800 продолжили вносить изменения, направленные на улучшение качества картинки. С одной стороны, почти все уже забыли об этом, так как качество у решений и AMD и NVIDIA схожее и в целом уже весьма неплохое, но с другой — возможности для улучшения всегда есть. В данном случае компания AMD решила ввести новый режим сглаживания, улучшить качество текстурной фильтрации и (наконец-то!) дать возможности по отключению оптимизаций Catalyst AI.
Новый метод сглаживания — это известный по некоторым мультиплатформенным играм Morphological Anti-Aliasing (MAA). Это не совсем привычный нам метод сглаживания, а скорее фильтр постобработки, применяемый к финальной картинке при помощи вычислительного шейдера. Данный метод сглаживает все пиксели сцены, а не только края полигонов и полупрозрачных текстур как MSAA, хотя в недостатках у него — излишняя замыленность, как видно по картинке.
При этом MAA быстрее суперсемплинга, так как обрабатывает только нужные участки, на которых шейдером найдены резкие цветовые переходы. Производительность и суть алгоритма схожа с методом edge-detect CFAA в драйверах AMD, но сглаживание применяется ко всем резким граням. Что весьма немаловажно, обещается, что метод форсирования MAA из AMD Catalyst Control Center совместим со всеми приложениями DirectX 9/10/11.
Но этот новый метод сглаживания — это полностью программное нововведение. А что инженеры AMD изменили в алгоритмах текстурной фильтрации? По их словам, алгоритм анизотропной фильтрации был переработан для улучшенной обработки «шумных» текстур, в частности — получения более плавных переходов между мип-уровнями текстур при анизотропной фильтрации. При этом обещается отсутствие потерь в производительности и отсутствие зависимости качества фильтрации от угла наклона поверхности, как и было ранее. На скриншоте слева — HD 5800, а справа — HD 6800.
Что не менее важно, так это новый пользовательский интерфейс в AMD Catalyst Control Center, позволяющий изменять качество текстурной фильтрации и даже полностью отключать все оптимизации. Для этого в настройки драйверов внедрили новый ползунок Catalyst AI:
Как видите, Texture Filtering Quality может иметь три значения, и отдельно отключаются оптимизации текстурных форматов (когда один текстурный формат подменяется в драйвере другим, чуть менее качественным, но более быстрым), к которым имели некоторые претензии конкуренты AMD.
Улучшения в технологиях вывода изображения
Полезно отметить поддержку DisplayPort 1.2 новыми решениями AMD, которая включена в улучшенную мультимониторную технологию AMD Eyefinity Multi-Display Technology. Её отличие в возможности вывода сразу нескольких каналов по одному разъёму DisplayPort, что позволит подключить большее количество мониторов к одной видеокарте.
Для подключения нескольких мониторов при помощи одного разъёма будет необходим специальный хаб или соединение мониторов типа «daisy chain». DisplayPort 1.2 обеспечивает поддержку большего количества мониторов, высоких разрешений и частот обновления, в том числе для стереомониторов следующего поколения. К слову, на все мониторы при этом могут выводиться изображения разного разрешения и частоты обновления.
На новых видеокартах AMD установлен порт HDMI версии 1.4a, пригодный для вывода стереокартинки. Для этого используется специальный стандарт передачи стереокадров, поддерживаемый новыми 3D-телевизорами, поэтому никаких проблем с выводом стерео на них не будет (читайте отдельный раздел о поддержке стереорендеринга компанией AMD ниже по тексту).
Немаловажным фактором качества вывода картинки является качественная цветокоррекция при выводе изображения на мониторы с расширенным цветовым охватом. И у серии AMD Radeon HD 6800 есть соответствующий аппаратный движок для этой задачи.
Но мультимониторные технологии и вообще технологии вывода изображения имеют не очень много смысла без соответствующей поддержки. И тут всё в порядке, мониторов с разъемами DisplayPort на рынке уже более трёх десятков, а игр, специально оптимизированных и подготовленных для мультимониторного вывода, — под полсотню (а сотни других игр просто совместимы с технологией Eyefinity). Также в последнее время появились недорогие адаптеры DP to Single-Link DVI, позволяющие подключить несколько недорогих мониторов к одной видеокарте.
В драйверах улучшений не меньше, ко всему, что уже есть в настройках (деление устройств на группы, продвинутый конфигуратор, цветокоррекция для каждого устройства отдельно, компенсация рамок дисплея, поддержка CrossFireX и др.), скоро добавятся новые режимы, такие как группа мониторов 5×1 в портретном режиме, автоматический вывод HydraGrid и т. п.
Технология AMD HD3D
Видя успешное продвижение стереовидения на рынке, AMD не могла остаться в стороне, не выступив с очередной открытой инициативой. Теперь она относится к стереорендерингу. Инициатива была анонсирована на GDC 2010, суть её в сотрудничестве производителей программного и аппаратного обеспечения, предоставлении широкого выбора решений, снижении их стоимости и повышения гибкости.
Инициативу поддержало большое количество компаний. Так, программное обеспечение по конвертации в Stereo 3D выпускается компаниями DDD и iZ3D, проигрыванием 3D-видео занимаются компании Cyberlink, Arcsoft, Roxio и Corel. За аппаратную часть отвечают производители дисплеев: LG, Samsung, CMI и Viewsonic, а производство очков и передатчиков остаётся за компаниями Bit Cauldron, XpanD и RealD.
Собственно, ничего нового инициатива Stereo 3D не предлагает, это всё те же стереомониторы и стереоочки, стереоигры и поддержка Blu-ray 3D, ПО для конвертации контента в стереоформат и т. п. Свою задачу компания AMD видит в предоставлении возможностей технологии AMD HD3D для игр в стереорежиме. Для этого видеодрайверами обеспечивается поддержка четырёхбуферного рендеринга в приложениях DirectX 9, DirectX 10 и DirectX 11, а при помощи партнёров из компаний DDD и iZ3D уже поддерживается более 400 игр в стереоформате.
Так, TriDef 3D Experience от DDD позволяет просматривать в стереоформате фотографии и видео, TriDef Ignition автоматически «конвертирует» порядка четырёх сотен DirectX 9, 10 и 11 игр в стереоформат, а TriDef Media Player делает то же самое с видеоданными с DVD и с видео высокого разрешения. Причем заявлено, что первые стереорешения, основанные на AMD Radeon HD были показаны (где и кому — вопрос отдельный) еще год назад, в октябре 2009-го. Такое решение совместимо со всеми стандартами вывода стереокартинки, всеми типами стереоочков и «безочковых» технологий.
Кстати, об очках. На мероприятии AMD для журналистов выступал Colin Baden, CEO компании Oakley, всемирно известной своей спортивной оптикой и солнцезащитными очками. Он рассказал о модели стереоочков Oakley HDO-3D. Естественно, не обошлось без похвальбы, эти очки были названы «первыми оптически корректными стереоочками на Земле», якобы снижающими эффекты засветки и двоения картинки, заметные во многих случаях, в т. ч. и при использовании очков из комплекта 3D Vision. Было бы интересно сравнить эти варианты вживую, ну а пока остаётся верить (или не верить) на слово.
К слову, компания AMD скоро планирует запустить на сайте портал, посвящённый технологии стереовывода HD3D, помогающий пользователям получить информацию о программных и аппаратных решениях для игр, просмотра фото и видео в стереоформате. При должном старании и средствах может получиться неплохо.
Блок обработки видео Unified Video Decoder 3
Решения Radeon давно славятся своими возможностями по декодированию и обработке видеоданных. Ещё со времён ATI именно у них в этой сфере были одни из лучших решений. Впоследствии и компания AMD продолжила эти традиции. В UVD3 появилась не только поддержка декодирования новых форматов, но и более качественная постобработка видеоданных.
Новые возможности постобработки привели к дальнейшему усилению позиций в известном тесте HQV 2.0. При максимально возможном счёте в 210 баллов, новая видеокарта AMD Radeon HD 6870 набирает 198 баллов, а лучшая из конкурирующих — лишь 138 баллов. Впрочем, это тест самой компании AMD, и к таким результатам всегда нужно относиться осторожно. Не потому что обман, но зачастую лукавство.
Весьма интересной новинкой нам кажется появление поддержки декодирования формата DivX/XviD (читай, MPEG-4). Но не только этот формат получил улучшения, теперь и MPEG-2 декодируется на GPU полностью, да и поддержка кодеков с двумя потоками (Blu-ray 3D) у AMD появилась.
И всё же интереснее то, что свежевышедшие видеокарты компании AMD, благодаря включению в GPU последней модификации блока UVD третьего поколения, умеют ускорять проигрывание видеороликов формата MPEG-4. Это важно не только и не столько из-за самой по себе сниженной загрузки CPU при декодировании, но поможет продлить время автономной работы ноутбуков и нетбуков, снизит шум от вентиляторов домашних кинотеатров на основе ПК (HTPC) и позволит проигрывать файлы MPEG-4 высокого разрешения на бюджетных ПК.
На мероприятии для журналистов была показана демонстрация одновременного декодирования на CPU и GPU. Как видите, при полностью программном декодировании CPU загружен работой более чем на 20%, а при перекладывании работы на GPU производства AMD, центральный процессор системы практически перестаёт выполнять какую-то значимую работу, ибо она становится в 10 раз меньше. Понятно, что всё это делалось и ранее, но не для DivX/XviD-формата.
Неграфические вычисления
В этом смысле в Barts аппаратных изменений нет, зато они есть в программной части. AMD предпочитает называть вычисления на GPU параллельной обработкой (Parallel Processing). И естественно, что ими поддерживаются исключительно индустриальные стандарты — открытый OpenCL и закрытый, но не менее индустриальный DirectCompute из DirectX 11.
OpenCL привлекает AMD как открытый и мультиплатформенный API для так называемых гетерогенных архитектур, что очень неплохо подходит для всё того же AMD Fusion. Именно при помощи OpenCL можно раскрыть вычислительные возможности как CPU, так и GPU. Понятное дело, что AMD была первой компанией, которая представила OpenCL для CPU и GPU одновременно. А в целом OpenCL поддерживается такими крупными компаниями, как Apple, IBM, Intel, NVIDIA, Sony и др.
У DirectCompute другие преимущества: распространение в составе DirectX компанией Microsoft и очень простой метод внедрения вычислений на GPU в уже существующие DirectX приложения, и особенно 3D-игры.
Изменения в параллельных вычислениях AMD произошли скорее с названиями, чем с аппаратной частью. На смену марке ATI Stream пришла технология AMD Accelerated Parallel Processing (APP). На мой взгляд — длинновато, хотя и лучше описывает то, что технология означает, и вполне соответствует повсеместному отказу от марки ATI. В компании решили сделать изменения в марке именно сейчас, при анонсе нового поколения графических карт и выпуске новой линейки, что абсолютно логично.
Теперь пакет SDK называется AMD APP SDK (бывший ATI Stream SDK) и он включает полноценную платформу разработки на OpenCL для GPU и многоядерных x86 CPU, также поддерживается и AMD Fusion. На веб-сайте компании теперь есть раздел OpenCL Zone, названием подозрительно напоминающий CUDA Zone, где разработчики могут найти свежую информацию по OpenCL, учебные материалы по работе с OpenCL, утилиты для разработчиков и различные библиотеки, а также любые другие материалы по теме.
Подробности: Antilles, серия Radeon HD 6990
Кодовое имя «Antilles»
2 чипа по 2,64 млрд. транзисторов каждый
Площадь каждого кристалла 389 мм2
Унифицированная архитектура с массивом общих процессоров для потоковой обработки многочисленных видов данных: вершин, пикселей и др.
Аппаратная поддержка DirectX 11, в том числе и новой шейдерной модели — Shader Model 5.0
Двойная 256-битная шина памяти: дважды по четыре контроллера шириной по 64 бита с поддержкой памяти GDDR5
Частота ядра от 830 до 880 МГц (см. объяснение далее)
2x24 SIMD-ядра, включающих 768 потоковых процессора, и в общем 3072 скалярных ALU для расчётов с плавающей точкой (целочисленные и плавающие форматы, поддержка точности FP32 и FP64 в рамках стандарта IEEE 754)
2x24 укрупненных текстурных блока, с поддержкой форматов FP16 и FP32
2x96 блоков текстурной адресации и столько же блоков билинейной фильтрации, с возможностью фильтрации FP16-текстур на полной скорости и поддержкой трилинейной и анизотропной фильтрации для всех текстурных форматов
2x32 блока ROP с поддержкой режимов антиалиасинга с возможностью программируемой выборки более чем 16 сэмплов на пиксель, в том числе при FP16- или FP32-формате буфера кадра. Пиковая производительность до 64 отсчетов за такт (в т.ч. для буферов формата FP16), а в режиме без цвета (Z only) — 256 отсчетов за такт
Для каждого GPU интегрированная поддержка RAMDAC, шести портов Single Link или трёх портов Dual Link DVI, а также HDMI 1.4a и DisplayPort 1.2
Спецификации видеокарты Radeon HD 6990 (HD 6990 OC)
Частота ядра 830(880) МГц
Количество универсальных процессоров 3072
Количество текстурных блоков — 2x96, блоков блендинга — 2x32
Эффективная частота памяти 5000 МГц (4×1250 МГц)
Объем памяти 2x2 гигабайта
Пропускная способность памяти 2x160 гигабайт в сек.
Теоретическая максимальная скорость закраски 53 (56) гигапикселей в сек.
Теоретическая скорость выборки текстур 159 (169) гигатекселей в сек.
Разъём CrossFireX
Разъёмы: DVI Dual Link, четыре mini DisplayPort 1.2
Энергопотребление от 37 до 375(450) Вт
Типичное энергопотребление в играх — до 350(415) Вт
Два 8-штырьковых разъёма питания
Двухслотовое исполнение;
Рекомендованная цена для России — 22999 руб. (для США — $699).
Как мы уже упоминали ранее, в этом поколении видеокарт AMD принцип наименования моделей был изменён. Так как на смену видеокартам HD 5870 и HD 5850 вышли сразу две линейки: HD 6800 и HD 6900, и последняя получила быстрейший GPU, то вполне логично, что и двухчиповая карта на тех же GPU также вошла в серию HD 6900. Но так как индекс 6970 был уже занят топовым одночиповым решением, поэтому новой видеокарте достался индекс 6990. То есть, по сравнению с предыдущей аналогичной платой HD 5970 поменялась не только первая, но и третья цифра индекса.
На новую видеокарту AMD устанавливается память типа GDDR5 и объёмом по 2 гигабайта на каждый GPU. Это решение вполне обосновано для продукта такого уровня, ведь в некоторых игровых приложениях при максимальных настройках, высоком разрешении и включенном сглаживании максимального уровня, объёма памяти в 1 гигабайт на чип сегодня уже не хватает. И ещё больше это относится к рендерингу в стереорежиме или на трёх мониторах в режиме Eyefinity со сверхвысокими разрешениями.
Естественно, что видеокарта имеет двухслотовую систему охлаждения, довольно длинную и закрытую привычным для всех современных плат AMD пластмассовым кожухом по всей длине. Энергопотребление карты с двумя GPU на борту довольно высокое по понятным причинам, поэтому пришлось установить на неё два 8-штырьковых разъёма питания, что ранее в референсных образцах не встречалось (хотя некоторые производители видеокарт такие решения самостоятельно делали).
Так как видеоплата «Antilles» основана на двух GPU семейства «Cayman», то особенно распинаться в данном разделе просто нет никакого смысла — всё уже сделано ранее, в . Но всё же вкратце повторим основу. Задачей инженеров AMD было создание эффективной графической и вычислительной архитектуры с улучшенными GPGPU возможностями, а также внедрение распараллеленной работы геометрических блоков и улучшения в текстурной фильтрации и полноэкранном сглаживании.
Архитектура Cayman стала промежуточным решением между предыдущей архитектурой Cypress и не рождённой 32 нм архитектурой, которой не суждено выйти на рынок. Но в состав нового GPU всё же вошли некоторые возможности из неё. Дополнительные транзисторы, по сравнению с Cypress, были потрачены на новые вычислительные и графические возможности.
Самое важное в GPU — это два блока graphics engine, включающие растеризатор, тесселятор и другие блоки по обработке геометрии, а также сдвоенный диспетчер. Двойной блок геометрии в топовом GPU компании AMD теперь умеет обрабатывать по два примитива за такт, то есть, скорость трансформации и отбрасывания задних граней выросла вдвое, а вместе с улучшением буферизации — до трёх раз в некоторых случаях, по сравнению с решениями на основе Cypress.
Ещё одним важнейшим архитектурным изменением стала суперскалярная VLIW4 архитектура вычислительных процессоров, в отличие от VLIW5 в предыдущей. Каждый потоковый процессор имеет 4 блока ALU, а не 5, как это было ранее. Такое решение увеличило эффективность использования потоковых процессоров, хотя и снизило при этом потенциальную пиковую производительность. Более подробную информацию об архитектуре Cayman смотрите в базовом обзоре, ссылка на который дана выше.
Питание и охлаждение
При проектировании видеокарт с двумя мощнейшими GPU на одной плате и их серьёзными требованиями по питанию, к соответствующей системе должно быть приковано максимальное внимание. Поэтому в схеме питания Radeon HD 6990 применяются цифровые программируемые регуляторы напряжения производства Volterra нового поколения, а также мощные четырёхфазные силовые индукторы производства Cooper Bussmann серии CL1108.
Всё это привело к увеличению эффективности схемы питания, по сравнению с предыдущими устройствами, используемыми компанией AMD, а значит и сниженной температуре и меньшему потреблению энергии. Кроме того, в деле увеличения эффективности сработала и симметричная схема расположения регуляторов в центре печатной платы.
Эффективное охлаждение столь горячего двухчипового решения — пожалуй, ещё более важная и сложная задача. В кулере Radeon HD 6990 применён новый предустановленный термоинтерфейс с изменяемым фазовым состоянием. Компанией AMD он признан на 8% более эффективным, по сравнению с предыдущими используемыми для этой задачи материалами. Цифра может показаться небольшой, но в деле охлаждения таких экстремальных устройств каждая мелочь на счёту.
Сам же новый кулер использует две испарительные камеры (по одной на каждый GPU) и единственный вентилятор, расположенный между ними по центру платы. Он вполне справляется с приёмом и отведением до 450 Вт тепла, и хотя новая плата размером точно такая же, что и Radeon HD 5970, все вышеперечисленные улучшения привели к тому, что новый кулер обладает заметно лучшей эффективностью, по сравнению с системой охлаждения предыдущего решения.
Технология AMD PowerTune
Поддержка данной технологии на двухчиповой видеокарте Radeon HD 6990 — решение ожидаемое. Именно в случае таких требовательных к питанию плат обязательно нужно проконтролировать энергопотребление и ограничить его в случае чего. Технология впервые была анонсирована вместе с Radeon HD 6970 и HD 6950, и в о них мы максимально подробно описали её работу. Поэтому повторим лишь самые важные моменты.
GPU серии Cayman имеют специальные датчики в исполнительных блоках, которые отслеживают параметры загрузки, а графический процессор постоянно контролирует нагрузку и энергопотребление, и не позволяет последнему выйти за определённый порог, автоматически изменяя частоту и напряжение так, чтобы эти параметры оставались в рамках определённого теплопакета. Технология помогает устанавливать сравнительно высокие частоты GPU и при этом не бояться выхода из строя видеокарты по причине превышения безопасных пределов энергопотребления.
Технология полезна по нескольким причинам. Она предохраняет видеокарты от выхода из строя в случае неадекватных экспериментов с разгоном, а также позволяет выжать максимальную производительность из GPU. Кроме того, PowerTune позволяет пользователю самому изменять ограничение потребления при помощи средств AMD OverDrive в определённых рамках (плюс-минус 20%). Естественно, регулирование параметра максимального потребления лишает пользователя каких-либо гарантий.
Важно, что технология PowerTune нацелена на получение максимальной производительности в игровых приложениях, а не тестах стабильности, зачастую неадекватно сильно загружающих сразу все блоки GPU. Как видно на приведённой диаграмме, технология позволяет повысить тактовые частоты GPU именно в играх, поддерживая установленный уровень энергопотребления и не требуя программных решений в коде видеодрайвера, как это сделано в аналогичной (но значительно упрощённой) технологии конкурента.
Переключатель BIOS (Dual-BIOS)
Когда у Radeon HD 6970 и HD 6950 появился переключатель между двумя версиями BIOS, сразу стало понятно, что это не только и не столько решение, направленное на большую надёжность, а решение, позволяющее ставить смелые эксперименты над видеокартой. Причём, не только для пользователей, но и производителей видеокарт. Собственно, так и получилось — некоторые из производителей в качестве второго образа BIOS записывали не просто версию с фабрично увеличенными частотами, но даже образ от старшей модели видеокарты, превращая Radeon HD 6950 в HD 6970.
Логично, что подобное решение появилось и в Radeon HD 6990. Причём, оно даже получило дальнейшее развитие. Переключатель между двумя версиями BIOS в новом решении даже в референсном варианте позволяет включить суперрежим (uber mode) — с увеличенными тактовыми частотами GPU с 830 МГц до 880 МГц и напряжением с номинальных 1.12 В до 1.175 В. Естественно, одновременно значительно возрастает и количество потребляемой энергии, и скорее всего именно для этого режима на плату установили два 8-штырьковых разъёма дополнительного питания.
Позиция переключателя «2» — это номинальный режим с частотой 830 МГц, в таком положении видеокарта поставляется. Режим «1» переключателя BIOS включает фабричный разгон и предназначен для любителей разгона и энтузиастов, понимающих, что в таком режиме потребуется значительно более мощный блок питания и улучшенное охлаждение в корпусе.
Внимание! Несмотря на то, что фабричный разгон теперь включается на абсолютно всех Radeon HD 6990 при помощи переключателя BIOS, это совсем не означает, что компания берёт на себя гарантийные обязательства в случае выхода из строя видеокарты по вине разгона! Гарантия AMD не покрывает такие случаи, и не важно, каким образом видеокарта была разогнана, при помощи программных настроек драйвера в Catalyst Control Center или при помощи переключателя Dual-BIOS.
Видимо, AMD осознаёт, что видеокарты вроде Radeon HD 6990 покупаются лишь энтузиастами и оверклокерами, которые в массе своей знают, как не допустить выхода из строя видеокарты при небольшом (880 МГц) разгоне, но на всякий случай защищается от экстремальных горе-оверклокеров, которые жгут видеокарты, как забывчивая бабуля свои пирожки в духовке.
Хотя даже и для обычных пользователей смысл в таком предразогнанном режиме есть — лишние 5-6% (в реальности чаще всего около 3-4%) к производительности не помешают, если БП хороший и охлаждение в корпусе устроено правильно. Ведь для автоматического разгона теперь нужно всего лишь переместить рычажок переключателя, а всё остальное уже сделано.
Технология AMD Eyefinity
Эта мультимониторная технология от AMD давно известна нашим читателям. По сути, все видеокарты компании поддерживают Eyefinity — лучшую мультимониторную систему на данный момент, поддерживающую до шести мониторов даже в случае одночиповых решений. Единственное, что поддержка шести мониторов одновременно потребует применения специальных хабов, совместимых с многопоточной передачей сигнала по DisplayPort — Multi-Stream Transport.
Но даже без использования хабов любая из двух десятков ныне выпускаемых моделей AMD Radeon поддерживает подключение трёх мониторов в различных конфигурациях. А для поддержки Eyefinity от игр требуется всего лишь уметь работать с нестандартными разрешениями и соотношениями сторон. На данный момент, проверенной поддержкой технологии могут похвастать около 70 игр, а ещё сотни приложений совместимы с ней.
Причем, именно такое мощное решение как Radeon HD 6990 позволит комфортно играть на трёх мониторах с общим разрешением 7680x1600 или пяти расположенных вертикально с разрешением 6000x1920, выдавая 30 кадров в секунду и более даже в тяжёлых играх, что ранее было недоступно для одиночных видеокарт. Хотя такие режимы остаются скорее уделом выставок и различных мероприятий, нежели обычных домашних пользователей, которые скорее предпочтут проектор или огромный телевизор вместо пяти мониторов на бедном столе.
Из-за необходимости эффективного охлаждения, а в частности — максимального отвода нагретого воздуха, пришлось поменять и набор выводов видеосигнала. Ровно половину площади заглушки слота заняли отверстия выхлопа системы охлаждения. А на оставшейся части разместили один разъём Dual Link DVI и четыре разъёма mini DisplayPort 1.2. Таким образом, при всех ограничениях мощного кулера, удалось сохранить максимально возможное количество выводов.
Но ведь для этого нужно искать довольно редкие и не такие уж дешёвые переходники с mini DisplayPort, спросит въедливый читатель? Совсем не обязательно. В комплекте поставки каждой видеокарты Radeon HD 6990 будет приложен комплект таких переходников из трёх штук: пассивный mini DisplayPort — Single Link DVI, активный mini DisplayPort — Single Link DVI и пассивный mini DisplayPort — HDMI.
Такое решение позволило сохранить компактность блока выводов на видеокарте, и одновременно с этим предоставить каждому пользователю новой видеокарты возможность вывести изображение на четыре подходящих приёмника сигнала.
Подробности: Barts LE, серия Radeon HD 6700
Кодовое имя чипа «Barts»
Технология 40 нм
1,7 млрд. транзисторов
Унифицированная архитектура с массивом общих процессоров для потоковой обработки многочисленных видов данных: вершин, пикселей и др.
Аппаратная поддержка DirectX 11, в том числе и новой шейдерной модели — Shader Model 5.0
256-битная шина памяти: четыре контроллера шириной по 64 бита с поддержкой памяти GDDR5
Частота ядра до 840 МГц
14 (10 активных) SIMD-ядер, включающих 1120 (800 активных) скалярных ALU для расчётов с плавающей точкой (целочисленные и плавающие форматы, поддержка точности FP32 в рамках стандарта IEEE 754)
14 (10 активных) укрупненных текстурных блоков, с поддержкой форматов FP16 и FP32
56 (40 активных) блоков текстурной адресации и столько же блоков билинейной фильтрации, с возможностью фильтрации FP16-текстур на полной скорости и поддержкой трилинейной и анизотропной фильтрации для всех текстурных форматов
32 (16 активных) блока ROP с поддержкой режимов антиалиасинга с возможностью программируемой выборки более чем 16 сэмплов на пиксель, в том числе при FP16- или FP32-формате буфера кадра. Пиковая производительность до 16 отсчетов за такт (в т. ч. для буферов формата FP16), а в режиме без цвета (Z only) — 64 отсчетов за такт
Запись результатов до восьми буферов кадра одновременно (MRT)
Интегрированная поддержка RAMDAC, шести портов Single Link или трёх портов Dual Link DVI, а также HDMI 1.4a и DisplayPort 1.2
Спецификации карты Radeon HD 6790
Частота ядра 840 МГц
Количество универсальных процессоров 800
Количество текстурных блоков — 40, блоков блендинга — 16
Эффективная частота памяти 4200 МГц (4×1050 МГц)
Тип памяти GDDR5
Объем памяти 1024 мегабайта
Пропускная способность памяти 134,4 гигабайт в сек.
Теоретическая максимальная скорость закраски 13,4 гигапикселей в сек.
Теоретическая скорость выборки текстур 33,6 гигатекселей в сек.
Поддержка CrossFireX
Шина PCI Express 2.1
Разъёмы: DVI Dual Link, DVI Single Link, HDMI 1.4a, два mini DisplayPort 1.2
Энергопотребление от 19 до 150 Вт (два 6-штырьковых разъёма питания)
Двухслотовый дизайн
Рекомендуемая цена для рынка США $149
Применение всё того же чипа Barts в решении такого уровня стало возможным из-за улучшения характеристик 40 нм техпроцесса, а также желательности избавиться от отбракованных чипов. К сожалению, новое решение нельзя назвать особенно энергоэффективным, так как уровень его максимального потребления установлен даже выше, чем у той же Radeon HD 6850. Видимо, это сделано для того, чтобы повысить напряжение на GPU вместе с тактовой частотой, а заодно и использовать большую часть чипов, ранее шедших в мусорную корзину.
Конкурировать новой видеокарте AMD придётся с решениями на основе NVIDIA GeForce GTX 550 Ti, которых вышло довольно много, в том числе и разогнанных, и с разным объёмом видеопамяти. Также придётся повоевать и с вариантами вроде GeForce GTX 460, которые продаются уже давно и успели сильно подешеветь, поэтому при выборе видеокарты этого ценового диапазона на них тоже обязательно будет обращено внимание потенциального покупателя.
Принцип наименования моделей остался тем же, что и у последних решений компании. По сравнению с другими решениями поменялась не только вторая, но и третья цифра в индексе. Она по какой-то странной причине вдруг стала не 7, как это было принято ранее (5870, 6870, 6970), а 9. Видимо, это должно говорить о совсем небольшой разнице в производительности между Radeon HD 6850 и HD 6790.
Вполне логично, что на видеокарту устанавливается один гигабайт памяти типа GDDR5. Это — оптимальный объём памяти на сегодняшний день даже для решений из нижнего ценового диапазона. Что интересно, хотя ширина шины видеопамяти в HD 6790 осталась 256-битной, но количество блоков ROP было урезано вдвое, с 32 до 16. Такое решение уже встречалось нам ранее в предыдущих «обрезанных» продуктах компании AMD.
Несмотря на принадлежность к нижнему ценовому диапазону, новая видеокарта имеет двухслотовую систему охлаждения, закрытую уже привычным для карт AMD пластмассовым кожухом по всей длине (впрочем, речь о референсном дизайне, а производители чаще всего будут делать свои платы и кулеры). Про энергопотребление мы уже говорили, оно довольно высокое. Именно поэтому пришлось установить не один, а целых два 6-штырьковых разъёма дополнительного питания.
Архитектуру графического процессора Barts мы уже рассматривали в , и за всеми подробностями следует обращаться к ней. Как вы помните, данный чип — это развитие идей предыдущих поколений, и отличия Barts от Cypress в основном количественные, хотя и не только.
Как и в случае последних видеочипов конкурента, в Barts в основном улучшили производительность на каждый потребляемый Ватт и миллиметр площади, то есть улучшили эффективность, по сравнению с предыдущими GPU. Но всё же Barts нельзя назвать совершенно новым чипом, ведь по сравнению с предыдущими он просто имеет иное количество исполнительных блоков и изменённый баланс между производительностью и потреблением.
Небольшие оптимизации привели к повышению скорости обработки геометрии, но это не особенно заметно изменило положение, в задачах тесселяции решения конкурента остаются сильнее. Более интересна поддержка новыми видеочипами с UVD3 декодирования видеоданных форматов DivX, а также Blu-ray 3D-видео, и улучшения в AMD Eyefinity и поддержке DisplayPort 1.2.
Что изменилось в GPU по сравнению с Radeon HD 6870 и HD 6850? По сути, в видеочипе просто отключены некоторые из 14 имеющихся аппаратно блоков SIMD, а также половина блоков ROP. Соответственно уменьшилось и общее количество процессоров потоковой обработки, теперь их лишь 800 штук, в отличие от 1120 у полноценного Barts. А вот блоков ROP стало и вовсе не 32, а лишь 16. Всё остальное осталось прежним, даже 256-битная шина памяти.
Благодаря довольно высоким тактовым частотам и не слишком сильно урезанному по основным исполнительным блокам GPU (филлрейта может не хватать только в редких случаях и с включенным сглаживанием, скорее всего), производительность Radeon HD 6790 должна оказаться почти такой же, что и у HD 6850, и в то же время несколько выше, чем у HD 5770. А заодно и главного соперника в лице GeForce GTX 550 Ti новая модель Radeon должна обойти.
По версии , на протяжении всего 2010 года компания NVIDIA теряла позиции на рынке графических решений, который включает в себя и сегмент интегрированных продуктов. Как известно, Intel и AMD перенесли графические ядра в центральные процессоры, и NVIDIA постепенно вытесняется с рынка интегрированной графики для процессоров с x86-совместимой архитектурой. Конечно, компания неплохо себя чувствует в сегменте ARM-решений благодаря растущей популярности процессоров Tegra, но сегодня речь идёт не о них.
Сайт опубликовал выдержки из отчёта Mercury Research по динамике рынка графических процессоров за 2010 год и первый квартал 2011 года. В мобильном сегменте, где традиционно пользуются спросом интегрированные графические решения, NVIDIA действительно утратила позиции, немного отыгравшись только в двух предыдущих кварталах. Сейчас на её долю приходится 42% рынка, тогда как AMD контролирует 58% рынка мобильной графики. Судя по всему, речь идёт о дискретных решениях, поскольку такое распределение не оставляет места для других игроков. Либо методика Mercury Research не учитывает процессоры с интегрированным видео.
В настольном сегменте NVIDIA теряла позиции менее стремительно, за год её доля сократилась с 65% до 59,4%. На близких уровнях она колеблется уже на протяжении трёх последних кварталов.
Если же учитывать рынок графических решений в целом, без деления на настольный и мобильный сегменты, то после достижения паритета с AMD в третьем квартале прошлого года компании NVIDIA удалось перетянуть на себя один процент, определяющий статус лидера.
Как справедливо отмечают эксперты, этот скромный перевес достигается популярностью настольных видеокарт NVIDIA. И всё же, рассматривая годовой интервал, нельзя не отметить экспансию интегрированных в центральные процессоры графических решений.
В записи нет меток.