Ситуация, когда для нового процессора требуется и новая материнская плата с новым же чипсетом, встречалась уже достаточно часто. Все производители материнских плат спешили представить свои новые продукты, играя в курицу и яйцо. Однако, как вы уже , этой весной все проходит иначе — новые процессоры Intel с кодовым названием Ivy Bridge можно использовать на «старых» платах. Но это совсем не означает, что лидерам рынка компонентов можно не волноваться — пользователи, которые хотят все самое новое, наиболее активны и очень интересны в финансовом плане, так что выход линейки чипсетов седьмой серии все восприняли с энтузиазмом.
В арсенале компании ASUS появилась сразу дюжина продуктов на максимальной версии чипсетной линейки — Intel Z77. Честно говоря, на наш взгляд это перебор: разобраться в отличиях и многочисленных суффиксах пользователям будет непросто, если речь будет идти об обычных «рабочих лошадках». В этом материале мы рассмотрим материнскую плату модели P8Z77-V Pro.
Среди ее отличительных сторон производитель упоминает использование чипа Digi+ для управления цепями питания, возможность использования четырехчиповых SLI и CrossFireX, систему управления вентиляторами в корпусе Fan Xpert 2.
Комплектация и фирменные утилиты
Традиционно, из дюжины моделей на одном чипсете только некоторые удостоились оригинальных упаковок. Нашему сегодняшнему герою не повезло — обычная картонная коробка средних размеров. Оформление ее, на первый взгляд, почти не отличается от множества других массовых устройств. Но при внимательном рассмотрении на картоне можно заметить фактуру (конгрев).
Обращает на себя подробное описание многочисленных особенностей платы. Жаль, что только на английском. Причем это не просто переписанные красивыми словами технические характеристики, а действительно уникальные функции устройства. Подробнее на некоторых из них мы остановимся ниже.
Комплект поставки у данной модели достаточно богатый: заглушка на заднюю панель платы с черной вставкой и подписями разъемов, два кабеля SATA 6 Гбит/с с защелками (один разъем прямой, второй угловой), два кабеля «просто» SATA с такими же разъемами, мостик CrossFire, специальные переходники для удобства подключения разъемов на передней панели корпуса к разъемам на плате (один для кнопок и индикаторов, второй — для портов USB), планка на заднюю панель корпуса с парой портов USB 2.0 и одним eSATA, фирменный беспроводной модуль Wi-Fi с внешней антенной, толстое руководство пользователя (на английском языке), DVD-диск с драйверами, программами и документами.
В комплекте с материнской платой идет множество утилит, некоторые из которых заслуживают специального рассмотрения в отдельном материале и мы постараемся вернуться к этому вопросу в ближайшее время. Все они собраны в единой оболочке AI Suite II для упрощения как установки, так и работы с ними.
С сайта производителя можно загрузить обновленную версию комплекта в виде одного архива. В комплекте есть утилиты для мониторинга состояния системы, сбора системной информации, обновления ПО и BIOS, управления контроллером Wi-Fi (в том числе и для организации точки доступа), настройки портов USB, выбора режимов энергосбережения, настройки управления питанием, разгона системы, установки приоритетов сетевому трафику, удаленного управления с беспроводных мобильных устройств.
Для автоматического разгона системы применяется утилита TurboV. Мы проверили ее работоспособность в автоматическом режиме с процессором Intel Core i5-2500K и системой жидкостного охлаждения Corsair H100. Выбор профиля «Fast» позволил буквально за пару секунд увеличить частоту процессора на треть — до 4,3 ГГц.
Более длительный процесс в профиле «Extreme» показал еще более впечатляющие результаты — частота превысила 5,2 ГГц. Правда, надо отметить, что второй вариант оказался неустойчив под нагрузкой программы LinX. В «красивом» режиме 5 ГГц (100 МГц × 50) система справилась и с этим тестом. Упомянем также и наличие системы автоматического сброса настроек в случае неудачного разгона
Особенности платы
Материнская плата использует текстолит черного цвета, что позволяет ей выглядеть и строго, и стильно. Она имеет стандартный размер ATX (304×244 мм), так что все элементы конфигурации смогли разместиться свободно. Процессорный разъем LGA1155 можно использовать как с 32-нанометровыми, так и с новыми 22-нанометровыми процессорами Intel (кодовые названия Sandy Bridge и Ivy Bridge соответственно). Про большинство современных плат нельзя сказать, что около сокета есть много свободного места и будет легко установить систему охлаждения любого формата. Рассматриваемый продукт не является исключением из этого правила, но все расположено по стандарту, и боксовые кулеры конечно установятся без проблем. А если вы соберетесь приобрести что-то крупное и более эффективное, то рекомендуем предварительно убедиться в возможности установки.
На данной модели установлено четыре слота для оперативной памяти стандарта DDR3. Производитель говорит о возможности работы на частотах до 1200 МГц (DDR3-2400) включительно в режиме разгона. Поддерживаются профили XMP — в частности, тестовые модули Kingston без проблем заработали в своем «родном» режиме DDR3-2133 (достаточно было изменить только один параметр в BIOS Setup). Защелки у слотов «односторонние», что призвано упростить установку модулей, хотя с эффективностью можно и поспорить. Не забыли и про кнопку MemOK!, которая поможет запустить систему в случае установки «не очень совместимых» модулей памяти.
Конфигурация слотов расширения непростая. Отличия в цветовой маркировке разобраться не помогают. Есть два слота PCIe формата x16, подключенных к процессору и способных работать в режиме x16 с одной видеокартой, устанавливаемой в первый слот, и в режиме x8+x8 с двумя видеокартами. Эти порты поддерживают стандарт версии 3.0 в случае установки соответствующего процессора (это подтверждается и использованием соответствующих стандарту чипов ASMedia для коммутации). Расположение этих слотов позволяет работать картам с трехслотовыми системами охлаждения. Третий слот формата x16 версии 2.0 работает через чипсет и поддерживает максимальный режим x4. По информации производителя, он делит линии чипсета с другими слотами (оба PCIe x1) и внешними контроллерами (внутренние порты USB 3.0 и SATA 6 Гбит/с на чипах ASMedia). Так что при максимальном использовании всех устройств от него можно ожидать только режима x1.
Последняя пара — слоты PCIe x1 — расположены с двух сторон от «главного» графического слота. Так что один из них будет свободен в любой конфигурации (если не помешает крупный процессорный кулер), а второй в большинстве случаев будет недоступен при установке внешней игровой видеокарты, поскольку большинство из них имеет двухслотовую систему охлаждения. Кроме того, эти порты делят линии PCIe с третьим слотом PCIe x16, а второй из них — еще и с внешним чипом SATA 6 Гбит/с.
Многочисленные внешние контроллеры и большой набор портов расширения полностью используют доступные в чипсете 8 линий PCIe 2.0. Отметим также поддержку данной платой технологии LucidLogix Virtu MVP (мы писали о ), призванной увеличить производительность графических приложений благодаря совместному использованию интегрированной и внешней видеокарт, хотя, на наш взгляд, удобнее все-таки приобрести более производительную внешнюю видеокарту, чем рассчитывать на эту функцию.
Микросхема BIOS на 8 МБ установлена на панельке, но в большинстве случаев это не пригодится — в данной плате реализована технология USB BIOS Flashback. Она позволяет восстановить полностью «убитую» прошивку с подключаемой в выделенный USB-порт флешки с образом. Для этого используется специализированная микросхема на плате. Правда, корпус открывать придется — для доступа к кнопке запуска процесса восстановления.
Как и у многих других материнских плат ASUS, у P8Z77-V Pro есть специальные светодиоды, которые помогут определить причины проблем с загрузкой. Причем для этого не потребуется долгое изучение документации и кодов — индикаторы расположены около всех критичных элементов (процессора, памяти, порта видеокарты).
Большинство разъемов материнской платы собраны вдоль ее нижнего края (левого на фотографии). Причем занимают они его практически полностью (кроме двух отсутствующих в этой модификации платы разъемов). Из-за этого может быть затруднен доступ к кнопке экстренного восстановления BIOS. Перемычка для сброса CMOS тоже расположена не очень удобно — слишком близко к разъемам.
Схемы питания и охлаждения
Подключение к блоку питания происходит стандартными разъемами на 24 контакта и 8 контактов (допускается работа с четырехконтактным подключением коннектором ATX12V). Для управления электропитанием компонентов системы используются несколько чипов Digi+. Производитель называет это технологией «Dual Intelligent Processors 3». Всего на процессор поступает 12 фаз, четыре на графическое ядро (в данном случае речь идет о работе восьмиканального ШИМ-контроллера с удвоением фаз), и две на оперативную память.
Элементы цепей питания процессора около сокета закрыты относительно небольшими алюминиевыми радиаторами высотой около 25 мм. Отметим, что их конструкция дополняется пластинами с обратной стороны печатной платы. Никаких тепловых трубок здесь нет, что скорее хорошо, чем плохо. Также можно увидеть радиатор со сложной формой верхней поверхности на микросхеме чипсета. Его высота всего 12 мм и он не будет мешать установке карт расширения — разве только доступу к защелкам слотов PCIe x16. Данной конфигурации системы охлаждения более чем достаточно для рассматриваемой модели. В тестах с разогнанным процессором Intel Core i5-2500K на радиаторы питания мы направляли поток от неторопливого 120-миллиметрового вентилятора, поскольку на процессор была установлена жидкостная система охлаждения. В этих условиях их температура не вызывала никаких опасений.
Для подключения вентиляторов на плате предусмотрено целых шесть разъемов — «двойной» для процессора и четыре для корпуса. Все они четырехконтактные и поддерживают автоматическое управление скоростью вращения, что позволит создать эффективную и тихую систему. Отметим реализацию в данной плате новой уникальной технологии Fan Xpert 2. Она способна обеспечить необходимый температурный режим с сохранением низкого уровня шума системы. Для этого после сборки ПК, установки и подключения всех вентиляторов нужно запустить специальную программу, которая автоматически откалибрует работу системы вентиляторов: она сможет определить влияние каждого вентилятора на температуру системных компонентов и предложить оптимальный режим работы.
В данном разделе упомянем также наличие на плате переключателей и индикаторов TPU и EPU. Первый активирует функцию автоматического разгона системы с участием одноименного чипа. Можно задействовать ее и после загрузки операционной системы через фирменную утилиту. EPU призвана сократить энергопотребление системы путем динамического управления цепями питания.
BIOS
BIOS реализован по технологии UEFI и имеет в основе код AMI. Он допускает управление мышкой (хотя без клавиатуры не обойтись) и имеет несколько вариантов локализации. На русскую нельзя взглянуть без слез — как будто в Китае есть единственная версия русского шрифта, которую часто можно встретить в «безымянных» смартфонах.
Первая страница, которую видит пользователь после входа в BIOS Setup, представляет собой реализацию упрощенной версии «EZ Mode». Здесь можно проверить конфигурацию процессора, памяти, винчестеров, посмотреть данные мониторинга встроенных в плату датчиков (температуры, напряжения, вентиляторы), изменить порядок загрузки и выбрать один из режимов «оптимизации» параметров процессора — «эко», «нормальный», «оптимальный по версии ASUS».
Для доступа к полному набору настроек нужно перейти в режим «Advanced Mode». В нем традиционно представлены разделы:
Main — отображении версии BIOS, установка времени и даты;
Ai Tweaker — настройки частот, напряжений и режимов для разгона и оптимизации системы;
Advanced — установка параметров CPU/PCH/SA, настройка SATA и USB, внешних контроллеров;
Monitor — мониторинг датчиков системы, настройка Q-Fan для управления скоростью вентиляторов;
Boot — параметры загрузки ОС, выбор устройств;
Tool — доступ к утилите прошивки BIOS EZ Flash, управление профилями разгона, отображение информации из SPD модулей памяти (в том числе и XMP).
Начинающим пользователям не рекомендуем заходить в Ai Tweaker, на первый взгляд там находится около сотни параметров. Тем более что эффективный разгон можно осуществить и фирменной утилитой из Windows. Остальные пункты достаточно просты и не вызывают никаких проблем с поиском нужных опций.
Функциональность
Больше всего места на задней панели занимают видеовыходы — здесь их целых четыре на любой вкус: VGA, DVI-D, HDMI, DisplayPort. Сложно сказать, действительно ли такая конфигурация востребована, но то, что для подключения любого монитора не потребуются никакие переходники, вполне можно отнести к плюсам. Разъем PS/2 уже давно стоит списать в утиль, лучше установить вместо него еще пару USB или eSATA. Последних, кстати у этой платы нет ни одного. Немного компенсируется это за счет того, что 4 порта USB соответствуют версии 3.0 этого интерфейса. Причем два из них — чипсетные, а вторая пара работает от внешнего контроллера. Порты USB 2.0 реализованы контроллером чипсета.
Звуковые выходы и сеть стандартны — аналоговые миниджеки для конфигурации 7.1, цифровой оптический выход S/PDIF-Out, порт RJ-45 со встроенными индикаторами. Отдельное место отводится контроллеру Wi-Fi для подключения антенны и светодиода индикации работы.
Несмотря на использование современного многофункционального чипсета , на рассматриваемой плате установлено множество дополнительных контроллеров, которые добавляют новые функции и расширяют существующие. Полный список состоит из:
двух контроллеров USB 3.0 на базе микросхем ASMedia ASM1042 (PCIe x1), каждая с поддержкой 2 устройств, два порта выведены на заднюю панель, два — на коннектор планки для подключения к разъемам на корпусе;
интегрированного звука на базе HDA-кодека Realtek ALC892 формата 7.1, с оптическим разъемом S/PDIF-Out на задней панели платы и дополнительным разъемом S/PDIF-Out на текстолите;
гигабитного сетевого контроллера на базе MAC-контроллера в чипсете и PHY Intel;
контроллера шины PCI на чипе ASMedia ASM1083 (PCIe x1) для реализации двух слотов;
SATA-контроллера ASMedia ASM1061 (PCIe x1) с поддержкой двух внутренних портов SATA 6 Гбит/с.
На материнской плате предусмотрено восемь разъемов SATA для подключения накопителей. Из них шесть чипсетных, два из которых поддерживают скорость интерфейса 6 Гбит/с. Оставшиеся два реализованы на внешнем контроллере ASMedia и также поддерживают скорость 6 Гбит/с. Расположены порты около края платы под углом, так что их кабели не будут мешать картам расширения. Цветовая маркировка позволяет легко определить тип порта. Внешний порт eSATA можно реализовать через подключение комплектной планки для задней панели корпуса (коннектор от нее втыкается в любой порт на текстолите на ваш выбор, обеспечивая ту скорость и функциональность порта eSATA, которая вам нужна «сзади»). Чипсетный контроллер поддерживает RAID 0, 1, 5, 10, Matrix RAID и технологии Intel — Smart Response, Rapid Start и Smart Connect. Кстати, ASUS решила предложить и свою утилиту для использования SSD в качестве кэша для винчестера.
Встроенный звуковой кодек реализует стандартные режимы с подключением к аналоговым выходам до 7.1, а также поддерживает работу с цифровым звуком, включая HD-дорожки в BD и вывод через штатный HDMI.
Z77 впервые для Intel имеет встроенные контроллеры USB 3.0 (напомним, что именно как 3.0 они работают сегодня только в Windows 7, поскольку только для нее есть соответствующие драйвера). Но ASUS решил добавить и пару внешних контроллеров. В результате пользователь получает четыре порта версии 3.0 и два версии 2.0 на задней панели, а также разъемы на плате еще на четыре порта 3.0 и на восемь 2.0. Плата поддерживает стандарт USB 3.0 UASP (подробнее об этой технологии можно прочитать в ) для портов, реализованных на базе чипов ASMedia, а также быструю зарядку мобильных устройств (USB Charger+).
Одно из нововведений в данной линейке материнских плат — комплектация беспроводным модулем. Честно говоря, реализация, на наш взгляд, выбрана несколько странно. Сегодня есть неплохие USB-контроллеры, обеспечивающие высокую скорость работы в стандарте 802.11n. Их легко выбрать, подключить и использовать. Но ASUS пошел своим путем — стандартная карта формата half mini-PCIe устанавливается в фирменный переходник, который ставится на материнской плате в специальный слот между разъемами задней панели и закрепляется винтом с обратной стороны. Антенна (или несколько) при этом использует также микроразъемы собственного, оригинального формата. В результате пользователь сталкивается со множеством ограничений — нельзя установить другую плату, сложно заменить антенну, нельзя использовать этот продукт с другими устройствами. Возможно, именно последний пункт и стал причиной подобной конструкции. В P8Z77-V Pro используется одноканальный однодиапазонный чип Qualcomm Atheros AR9485 с поддержкой максимальной скорости подключения 150 Мбит/с. Отметим, что у других материнских плат этой серии встречаются и более производительные решения.
Наличие на плате двух стандартных слотов PCI будет интересно пользователям, которым необходимо использовать платы расширения старого стандарта.
Заключение
Анонс нового чипсета и новой линейки процессоров в очередной раз подстегнул производителей к обновлению своих продуктов. Желая поддержать высокий статус одного из лидеров рынка, компания ASUS выпустила сразу дюжину моделей на чипсете Z77. Выбрать подходящую из них — непростая задача. И даже наличие на сайте компании функции сравнения продуктов мало помогает в этой ситуации. Так что рекомендуем вам записать точные требования и «примерять» их на представленные на рынке решения.
Формат ATX позволил реализовать на P8Z77-V Pro достаточно интересную конфигурацию слотов расширения, допускающую одновременную работу трех видеокарт. Также в этой модели доступны два слота формата PCI, что может быть интересно пользователям, которые не успели или не смогли заменить оборудование на более современное. Отметим использование сетевого контроллера самой Intel, которые считаются образцовыми, хотя и более дорогими, и наличие беспроводного адаптера стандарта 802.11n (но самой младшей конфигурации). Другие дополнительные контроллеры добавляют к возможностям чипсета четыре порта USB 3.0 и пару SATA. Остальные параметры продукта вполне соответствуют современному решению для построения высокопроизводительной вычислительной системы на базе процессоров Intel Core прошлого и последнего поколений. Из фирменных программ и технологий упомянем TurboV для разгона системы и Wi-Fi Go! для работы с мобильными устройствами.
этой модели в московской рознице: $220()
Благодарим компанию
за предоставленный для стенда БП
Благодарим компанию
за предоставленную для стенда жидкостную систему охлаждения
Компании Intel и McAfee рассказали о вопросах защиты данных, которые встают при рассмотрении возможности внедрения облачных технологий, и о том, как они помогают компаниям создавать новые решения для защиты. Компании также представили ключевые вопросы, которые необходимо будет решить в будущем для повышения безопасности облачных вычислений.
Для того чтобы более глубоко понять проблемы, которые возникают в сфере ИТ, и определить, каким образом можно повысить уверенность компаний при внедрении облачных технологий, Intel недавно провела опрос. Согласно его результатам, 61% специалистов обеспокоен потерей контроля над частными средами, 55% обеспокоены недостаточной защитой данных в публичных инфраструктурах, а 57% опрошенных отказались размещать данные, для которых необходимо соблюдение требований регулирующих органов, в облачные центры обработки данных (ЦОД). Респонденты отметили, что решение этих проблем положительно скажется на их уверенности в надежности защиты данных и будет способствовать внедрению облачных технологий в их корпоративных средах.
Intel и McAfee используют комплексный подход для решения вопросов безопасности облачных сред и повышения доверия к частным, публичным и гибридным облачным инфраструктурам. Компании реализуют свои усилия по четырем основным направлениям для обеспечения защиты и для создания различных открытых решений для безопасности, реализуемых в рамках всей отрасли. Эти направления включают в себя обеспечение защиты ЦОДов, сетевых подключений, устройств, подключаемых к облачным сервисам, и ускорение разработки унифицированных стандартов в области защиты облачных данных.
В области обеспечения защиты облачных ЦОД, Intel и McAfee сосредоточили свое внимание на вопросах повышения целостности инфраструктуры, защиты данных и предоставления возможностей для более простого контроля соответствия облачных сред нормативным требованиям. Так, например, программный комплекс McAfee ePolicy Orchestrator (McAfee ePO) обеспечивает согласованное управление на базе политик всеми физическими, виртуальными и облачными средами. За счет адаптированной интеграции ПО McAfee ePO может использоваться для внедрения политик в ЦОД для определения, к примеру, активности технологии Intel Trusted Execution Technology (Intel TXT). Intel TXT – это аппаратное решение для защиты данных, которое позволяет защитить ИТ-инфраструктуры от программных атак путем проверки в момент запуска ключевых компонентов серверов на базе процессоров Intel Xeon E5. Другие средства обеспечения безопасности включают технологию McAfee Management for Optimized Virtual Environments AntiVirus (McAfee MOVE AntiVirus), которая обеспечивает улучшенную защиту от вредоносных программ и попыток взлома, и технологию McAfee Application Control, которая в проактивном режиме предотвращает риск утечки данных, целевые атаки и незапланированный простой оборудования за счет выполнения только авторизированных кодов.
McAfee Cloud Security Platform повышает безопасность за счет обеспечения защиты данных, электронной почты, интернет-трафика и персональных данных, передаваемых между устройствами и ЦОД. С помощью платформы McAfee Cloud Security Platform ИТ-департаменты могут ограничить доступ к информации за счет внедрения политик безопасности и доступа в облачные среды. Новая разработка использует преимущества уникальной технологии McAfee Global Threat Intelligence (McAfee GTI), которая обеспечивает в реальном времени защиту от существующих и новых угроз. За счет сохранения контроля над всеми потенциальными источниками угроз — файлами, сетью Интернет, электронной почтой и корпоративной сетью — и оперативного получения информации обо всех последних уязвимостях, McAfee сопоставляет данные, полученные от миллионов физических источников, для обеспечения комплексной защиты облачных соединений.
Постоянно увеличивающееся количество различных устройств и тенденции к использованию личных устройств для работы создают новые проблемы для обеспечения безопасности в облачных средах. Они включают в себя комплексное управление идентификаторами пользователей (в среднем, 12 комбинаций имени и пароля пользователя), новые виды вредоносного ПО и постоянно увеличивающееся количество онлайн-атак, для борьбы с которыми требуются новые уровни обеспечения безопасности для устройств, подключаемых к облачным сервисам.
Для того чтобы минимизировать подобного рода риски Intel и McAfee повышают защиту устройств, включая настольные и мобильные ПК, путем защиты данных и ограничения доступа к информации и приложениям. Решение McAfee Deep Defender, совместно разработанное McAfee и Intel, представляет собой новое поколение аппаратных решений для защиты клиентских устройств. McAfee Deep Defender поддерживает технологию Enabled by McAfee DeepSAFE и обеспечивает аппаратную защиту с помощью технологии Intel Virtualization Technology (Intel VT), встроенной в процессоры Intel Core i3, i5 и i7 для обнаружения и удаления в реальном времени низкоуровневых угроз, которые сложно распознать при помощи традиционных методик, работающих на уровне операционной системы. Для более эффективного управления идентификаторами пользователей ПО McAfee Cloud Identity Manager, предлагаемое в рамках McAfee Cloud Security Platform, обеспечивает комплексный контроль доступа для облачных приложений, использующих корпоративные идентификаторы. Также для этих целей может использоваться инструмент Intel Cloud SSO (single-sign on), который создает в облачных средах решение «идентификатор-как-услуга». Технология Intel Identity Protection обеспечивает дополнительную аппаратную защиту, которая использует вспомогательные данные для идентификации.
Вначале заметим, что за последний год наша заметно обновилась и дополнилась (что будет регулярно происходить и далее), поэтому некоторые термины (например, «диспетчер» и «планировщик») имеют несколько иные значения. Также, по многочисленным просьбам отдельных товарищей, в конце статьи указаны ссылки на основные источники (помимо собственных изысканий автора и его коллег).
Что это?
Проще всего ответить так: ЦП серий Zacate, Ontario и Desna с ядрами Bobcat это то же, что и , но от AMD и на 3 года позже. Как и Atom, Bobcat разработано с нуля специально для массовых мобильных устройств, где экономия энергии и дешевизна намного важнее скорости. Впрочем, Intel уже который год отчаянно и безуспешно старается протолкнуть Atom ещё и для смартфонов, где безраздельно властвует ARM. AMD же c этим рынком связываться не собирается. Кроме того, в отличие от «Атомов», получивших встроенные , видеодекодер и (ГП) со 2-го поколения, «Бобкэт» имеет это с самого начала, а потому по новой терминологии AMD считается не просто , а . Конечно, мы дополнили наш словарь этим сокращением, но называть микросхему по-прежнему будем центральным процессором
Существование этого проекта открылось в 2007 г. когда после покупки ATI AMD объявила, что ещё за год до этого начала разработку энергоэффективной для диапазона потребления 1–10 Вт (на 45- ), которая должна выйти в 1-й половине 2009 г. На деле же первые ЦП с ядрами Bobcat вышли в январе 2011 г. с 9 и 18 Вт (на 40 нм), но на вопрос «почему так долго» разработчики из Остина вполне могут ответить в стиле «сам дурак» — Intel тоже долго мурыжила Atom. Очевидно, при такой конкуренции (уже занятый рынок и 3-летняя фора) надо выставить что-то передовое — помимо вечного «наше дешевле». Кроме изначально интергированного северного моста и видеочасти, AMD предлагает и более высокую производительность, причём и в -ядрах, и в ГП.
Перед тем как перейти к деталям, по традиции упомянем этимологию — Bobcat можно перевести нарицательно (обитающая в Северной Америке рыжая рысь) и как имя собственное (марка небольших тракторчиков и погрузчиков для мелких работ одноимённой фирмы). В свете выхода архитектуры Bulldozer (не нуждающейся в переводе и разъяснении) второй вариант выглядит более разумным, хотя и ссылается на чужую торговую марку. В любом случае — перед нами нечто маленькое, прыткое и с амбициями. Кодовое имя архитектуры — K14.
Фронт
у Bobcat 2- — как и у Atom. Для академического интереса также можно вспомнить и процессоры VIA Nano с для той же целевой ниши, но с 3-путным конвейером — правда, там и мобильными ваттами не очень пахнет… ожидаемый: , , и . Но в каждом пункте есть изюминка.
Предсказатель переходов
Как обычно, этот блок диктует, каков будет адрес следующей кода. Есть 4 источника адреса: следующий по порядку, предсказанный для , исправленный при и возврат из подпрограммы (считывается из на 12 адресов). Как и в большинстве современных архитектур, предсказываемая порция равна 32 байтам, причём она совпадает и со считываемой (у Intel последняя вдвое меньше). Выбор очевиден, учитывая средний размер (4 байта) и расстояние между переходами (≈10 команд).
Впрочем, встречаются случаи и частых переходов. Для этого предусмотрено два — один («редкий») хранит первые 2 перехода для каждой 64-байтовой кэша и (официально) до 8 ссылок на ячейки второго («плотного») буфера, хранящего остальные переходы (в тех строках, где они есть) по 2 перехода на каждые 8 байт. При этом фраза «первые 2 перехода» относится к обнаруженным и срабатывающим командам: т. к. строка не обязательно выполняется с начала и до конца, есть вероятность, что позже в ней будут найдены новые переходы, либо до сих пор не срабатывавшие вдруг сработают. Как при этом дополняются записи в обоих BTB — неизвестно.
Если первые два перехода предсказываются как несрабатывающие, но и непоследние в этой порции, то начинается последовательная обработка переходов из плотного BTB в ячейках, на которые ссылается запись из редкого. Очевидна сомнительность одновременного считывания и, следовательно, хранения в ячейке редкого BTB до 8 ссылок на ячейки плотного. Объяснения два: либо ссылка только одна, и каждая ячейка из плотной BTB указывает на следующую, если переходы в строке ещё остались — потому они и обрабатываются последовательно. Либо ссылка всё равно одна, но 8 соответствующих записей в плотном BTB идут подряд, и конкретная выбирается в зависимости от смещения адреса в строке кэша. Последний вариант проще и быстрее, но куда менее оптимален по расходу плотного BTB: достаточно в одной из восьмушек строки иметь более двух переходов — и ей выделят 8 записей даже при отсутствии переходов в других частях строки. Поэтому примем первую версию.
Редкий BTB хранит 512 ячеек (по числу строк в кэше L1I), т. е. 1024 перехода, а плотный — вдвое больше. Это очень достойно не только в сравнении с крошечной таблицей в Atom на 128 адресов, но и с настольными ЦП. Механизм индексации плотного BTB и вытеснения из него неизвестен. Очевидно, речь не может идти о 512-путной структуре, а т. к. в кэше могут оказаться 512 строк с парой переходов в каждой 8-байтовой восьмушке (и им не хватит плотного BTB) — может проявиться наложение адресов и вытеснение не столь уж старых переходов.
По идее, при такой организации можно точно предсказать до 18 переходов на строку, из которых 16 будут содержаться в 8 ячейках плотного BTB. Но в тестах было получено до 16 или 17 безошибочных предсказаний в зависимости от их положений в строке. Значит, механизм разметки положений работает сложнее, чем описано. А что делать с ещё более частыми переходами, учитывая, что они могут встречаться каждые 2 байта, а возвраты — даже каждый байт? Переходы начиная с 3-го в 8-байтовом куске вытесняют первую пару, а потому имеют шанс 50% быть угаданными по поведению и ≈0% — по адресу. До сих пор у предсказателей AMD при переполнении хранящих структур «лишние» переходы динамически не предсказывались и считались всегда несрабатывающими, эффект от чего примерно тот же, что и у Bobcat.
Каждая запись в BTB, предположительно, хранит тип перехода (3 бита), адрес его последнего байта (6 бит — только смещение в строке), младшие 12 бит целевого адреса (т. е. смещение в текущей ) и бит, указывающий на переход за пределы страницы. Судя по описанию, базовые адреса страниц для таких «дальних» переходов хранятся в отдельной таблице, индексируемой, видимо, смещением в целевой странице. Это странное решение, ибо куда логичней хранить в дополнительной таблице полный адрес (база + смещение), а в поле смещения основной — индекс ячейки с адресом. Размер дополнительного BTB для «дальних» переходов достоверно неизвестен, но мы его сможем вычислить чуть позже.
Тип перехода определяет алгоритм предсказания поведения. Разумеется, для экономии энергии на время предсказания тактируются только реализующие этот алгоритм блоки, а остальные спят. Для относительных переходов проверяется предсказанный адрес и, в случае его несовпадения, производится коррекция (в т. ч. в таблицах), занимающая меньшее время, чем обычное фальш-предсказание. Кстати, про последнее: официально оно штрафуется 13 тактами. В тестах же эта цифра оказалась средней, а полный диапазон — 8–17 тактов, что зависело от последующих команд после точки перехода. Причём их вычислительная сущность (например, или ) роли не играла — видимо, есть некая зависимость от числа команд и/или переходов в целевой строке.
Алгоритм предсказания лишь один (предсказателя для циклов нет): 2-уровневый, адаптивный, с 26-битным (GBHR) и (BHT) неизвестного размера, но уж точно меньше, чем 226 — т. е. (как обычно для 2-уровневых BPU) используется хэш-функция, сворачивающая 26 бит GBHT и часть адреса перехода в N бит индекса для BHT размером 2N. В BHT попадают только переходы, причём лишь те, что записаны в BTB (т. е. хотя бы раз сработавшие) — для удаления шумового эффекта малозначимых ветвлений. Помимо рекордно длинного GBHR (у Atom он на 12 бит) — ничего особенного.
Половина фронта ядра Bobcat. Чёрные массивы и логика выше них — микросеквенвсер декодера. Всё остальное — детали предсказателя.
А теперь досрочно посмотрим на вырезку фото (детально он будет описан далее) в области BPU. Как мы позже покажем, 3 длинных массива в углу ядра (разделены посредине селекторной логикой) имеют размер по 4 КБ. Выше них — группа из двух блоков по 2 КБ (ближе к центру) и ещё одна из трёх таких блоков (слева вверху). Т. к. BHT должен иметь двоичный размер, предположим, что это первая группа: суммарный размер её массивов — 4 КБ, чего хватит на 16 384 2-битных счётчика и потребует от хэш-функции 14-битный индекс. 16 «килосчётчиков» это столько же, как и у K8/10/12 (хотя у них L1I на 64 КБ), и вчетверо больше, чем у Атома, где те же 32 КБ в L1I.
Теперь вернёмся к BTB. Редкий имеет размер вдвое меньше плотного, а три оставшихся массива по 2 КБ — вдвое меньше трёх по 4. Мы предположили, что адрес в BTB занимает 22 бита, а в каждой ячейке — 2 адреса и одна 10-битная ссылка на первую или следующую в цепочке ячейку из плотного BTB. В сумме получается 54 бита, что почти столько же, как в записи (там, помимо 24-битного базового адреса страницы, есть ещё её атрибуты). Проверяется это тем, что TLB L2D (на вырезке не показан) также использует массив на 4 КБ, который тоже делится на 512 записей, как и у каждого BTB. Скорее всего, 3 длинных массива это оба BTB (1 для редкого и 2 для плотного), и тогда на 3 коротких остаётся вышеупомянутый дальний BTB с «хвостами» адресов.
Адресация в BTB , поэтому хвост это 48 бит т. н. канонического (для ) адреса минус 12 бит, хранимых как смещение в основных таблицах. 36 бит — число неудобное, но (снова забегая вперёд) все массивы, в т. ч. для TLB, имеют биты чётности, и если их, как обычно, 1 на байт, то физический размер записи окажется 72 бита, как раз на два хвоста. Однако для BTB чётность не обязательна, т. к. при крайне редкой аппаратной ошибке считывания самое страшное — лишнее фальш-предсказание. Таким образом, на пару ячеек BTB приходится в среднем один адресный хвост, и пара таких хвостов хранится в ячейке дальнего BTB, обслуживая две (видимо, парные) ячейки остальных BTB. К сожалению, мы не проверили — что будет, если на каждые хранимые четыре адреса более двух окажутся дальними. Зато можно точно сказать, что индексация дальнего BTB простейшая — делим индекс запрашивающего BTB на 2.
Стадия
Описание
1
Проверка типа перехода.
Проверка редкого BTB.
2
Проверка плотного BTB.
3
Проверка косвенных переходов.
Переход при попадании в редкий BTB.
4
Проверка косвенного адреса.
Переход при попадании в плотный BTB.
5
?
6
Косвенный переход.
Весь миниконвейер предсказателя состоит из 6 тактов, но работают они не параллельно, как обычный конвейер, а последовательно, т. е. разделение на такты условно и сделано лишь для синхронизации с основным конвейером. За первый такт проверяется первая пара переходов; если оба не срабатывают, то все следующие проверяются далее по одному за такт; при срабатывании любого перехода вставляется задержка в 1 такт, поэтому самый короткий цикл будет 2-тактовым. Косвенные переходы проверяются на третьем такте — при их обнаружении задержка составит 6 тактов. Итого, по численным параметрам предсказателя Bobcat не только впереди всех в своём классе, но и местами догоняет настольных собратьев, что уже поднимает вопрос об избыточности — а ведь надо экономить драгоценные миллиметры…
Предекодер и декодер
16- или 32-байтовые порции по предсказанному адресу считываются из L1I и помещаются в буфер (у Atom — 8 байт/такт). Буфер предекодера имеет 12 16-байтовых ячеек, за такт принимает 16 или 32 байта и столько же отправляет. 16 байт записываются, если целевой адрес оказался во 2-й половине порции, либо в 1-й половине есть переход, предсказанный как срабатывающий. В остальных случаях записывается пара ячеек.
На выходе из буфера находится 2-путный и 2- предекодер- с пиковой производительностью 22 байта/такт. Таким образом, Bobcat является первой архитектурой AMD со времён древнющего Am486, не использующей спаренный с L1I кэш предекодера и выполняющей замеры длин команд «на лету». Длиномер считывает текущую ячейку буфера до конца и ещё до 6 байт из следующей. Впрочем, учитывая, что в большинстве тактов он начинает обработку не с 0-го байта порции, средняя скорость длиномера оказывается 16 байт/такт, что всё равно более чем достаточно для 2-путного ЦП (Intel довольствуется этими же 16 байтами/такт и для 4-путных ЦП). Никаких пагубных влияний разнообразных , так отравляющих жизнь декодерам x86-ЦП вообще и ЦП Intel в частности, тут нет. Видимо, поэтому решили обойтись без буфера перед самим декодером.
Декодер преследует ту же цель, что и у Atom — преобразовать команды в минимальное число , используя , т. к. остальная часть конвейера также 2-путная. не поддерживается. По терминологии AMD мопы у Bobcat называются COP (complex microoperations, составные микрооперации), т. е. они сложнее обычных для «больших» ЦП слитых мопов. Почти все самые частые скалярные команды генерируют 1 моп, включая и команды с модификандом в памяти, для которых требуется 4 действия — , чтение из памяти, с данными и запись в память.
Команды для работы со стеком 1-моповые, хотя им надо совмещать обмен с памятью и арифметику с регистром-указателем E(R)SP — это намекает на наличие стекового движка, аналога «stack pointer tracker» в ЦП Intel (подробней о нём см. ). Однако в отличие от последнего, исполнение команд, вызывающих E(R)SP напрямую, не требует вставки синхронизирующих мопов и не вызывает задержку. Да и вызовы подпрограмм (но не возвраты) требуют 2 мопа.
Декодер, как и ожидается для 2-путного конвейера, состоит из двух простых (выдают по 1 мопу/такт), сложного транслятора (2 мопа/такт) и (последовательности из 3 и более мопов по 2 за такт). По статистике AMD, 89% команд декодируются в 1 моп, 10% — в 2, и 1% — в 3 и более. Однако для поднаборов SSE эта статистика не подходит — ниже станет ясно, почему. Поддерживаются 64-битные расширения, команды , поднаборы , , SSE2, SSE3, SSSE3 и SSE4A, а также отдельные команды LZCNT и POPCNT для подсчёта битов. Не хватает не таких уж новых SSE4.1 и 4.2, а также родного для AMD , который компания признала окончательно устаревшим. Впрочем, одна команда для программной оттуда всё же поддерживается, для чего ей выделили отдельный бит в «паспорте» для .
Стадия
Описание
4
Разметка байтов.
5
Измерение длин команд.
6
Классификация команд.
7
Расширение полей констант.
Запись в очередь команд (?).
8
Чтение ПЗУ микрокода.
Распаковка микрокода (+1 такт).
Декодирование в трансляторах.
9
Передача в FPU.
10
Декодирование команд FPU (?).
Официальное описание этой части фронта, приведённое в таблице, изобилует загадками. Например, упоминается очередь команд, которая по всем канонам должна располагаться после декодера и перед тылом, но тут она находится уже на первой стадии декодера. К тому же, ни в каких других местах она не упоминается, что создаёт впечатление отсутствия всякой очереди «около» декодера.
Ещё одна странность в том, что собственно декодирование растянуто аж на 3 стадии (6–8), причём это касается лишь простых команд общего назначения. команды на 8-й стадии читают свои мопы из , а на следующей — распаковываются, что намекает на паузу в 1 такт, когда после простой команды попадается сложная. Более того, аж целый такт тратится на передачу - и SSE-команд в расположенный впритык к обычному «вещественный декодер», который занимает целый 10-й такт — но что там может происходить после работы основных трансляторов? На ум приходит лишь одно: почти все команды поднаборов SSE, работающие со 128-битными векторами, в этом такте каждый свой моп преобразуют в пару мопов-близнецов, т. к. векторно-вещественный (традиционно для AMD неточно называемый ) — лишь 64-битный, и все его стадии работают с физическими регистрами половинной ширины. А значит, нужно дублировать и использующие их мопы. Детали этого безобразия опишем позже.
Тыл
Диспетчер и планировщики
В этом месте проявляется одно из основных отличий Bobcat от Atom — процессор имеет (чем хвастает и VIA Nano). Мопы из декодера без всяких (по крайней мере, согласно нашим тестам…) попадают в , который и мопы после их разделения на вычислительные и адресные компоненты. Мопы попадают в две (!) (общего назначения и для FPU) и в нужный , причём обменным мопам выделяются и записи в блоке . Одновременно диспетчер принимает до 4 или 6 мопов/такт после и производит до 2 .
Общая ROB умещает 56 мопов, а векторно-вещественная — 40 (причём эта почему-то называется «retire queue», т. е. очередь отставки, хотя вроде бы это синонимы). Суммарные 96 мопов это в 2–3 раза меньше «больших» 4-путных ЦП, но больше, чем у 3-путного Nano. Главный вопрос вот в чём: до сих пор ни один ЦП не имел диспетчер с двумя ROB; почему же AMD решила использовать эту схему, если синхронизация запусков, приёмов и отставок мопов с двумя очередями сложнее, чем с одной суммарной длины?
Наш постоянный Внимательный Читатель вспомнит, что у современных настольных ЦП Intel общая очередь ROB делится поровну между двумя потоками, когда они исполняются в одном ядре, но мопы двух потоков можно уводить в отставку независимо. К тому же архитектура Bobcat всё равно 1-поточная. В случае с AMD всё может объясняться просто — в описывающем документе просто сделали ошибку (не в первый и не в последний раз…). Однако загадочная фраза, где появляется цифра 40, написана очень уверенно: «Retirement logic contains a 56-entry reorder buffer (ROB)… [Через 2 абзаца:] ROB size of 56 entries let designers reduce the floating-point retire queue size to 40 entries at no performance cost». Дополнительный аргумент к тому, что FPU имеет отдельную ROB/RQ, даёт приведённое ниже распределение тактов тыла в двух трактах: все действия диспетчера для команд FPU оказываются на 2 такта позже. К сожалению, представители компании на всех уровнях упорно не дают нам возможности даже задать вопросы о таких деталях…
Для экономии энергии, как и во всех современных архитектурах (, и Bulldozer, о котором тоже скоро будет статья) инженеры применили некопирующий вид планировщиков, работающих со ссылками на (РФ). Оба РФ имеют по 64 64-битных . Причём для экономии энергии как минимум в РФ с регистрами общего назначения () при записи может включиться только младшая половина регистра-приёмника, если старшую обновлять не надо; этот же принцип наверняка применяется и в других частях ядра при похожих обстоятельствах. Хотя число небольшое, AMD расположила для них аж три 2- планировщика (тут полумопом названа часть слитого мопа после его разделения диспетчером):
целый — на 16 полумопов для скалярных целочисленных операций с РОНами;
адресный — на 8 полумопов для вычисления адресов с РОНами;
векторный (для FPU) — на 18 полумопов для векторных и/или вещественных операций с векторными регистрами.
Векторный планировщик оказывается одним из узких мест ЦП, учитывая, что в среднем на векторную команду приходится пара полумопов. Впрочем, по сравнению с векторными планировщиками для «больших» ЦП AMD, этот умеет исполнять простейшие команды за такт; точнее, ФУ их исполняют за такт, но лишь у Bobcat планировщик успевает зафиксировать это до конца такта. Кроме того, векторные планировщики архитектур K7–K12 печально знамениты своими «пузырями» — внутренними , вставляемыми в тройки мопов, если последние не соответствуют правилам распределения мопов по очередям портов. Неоптимальное распределение вызывает дополнительные такты ожидания на регистрацию мопов. У Bobcat каждый планировщик имеет общую для портов (как у всех ЦП Intel и VIA Nano), куда мопы попадают без всяких ограничивающих правил. Похожие улучшения сочетаемости уходящих в отставку мопов есть и у диспетчера.
Стадия
Целый конвейер
Конвейер FPU
8
«Размещение меток» (?).
9
Переименование РОНов.
Разделение слитых мопов.
Передача в FPU.
10
Запись в ROB и
резервацию(и). Планировка.
Переименование x87-стека.
Декодирование в FPU.
11
Чтение регистров.
Настройка .
Переименование регистров .
Разделение слитых мопов.
Запись в ROB и резервацию.
12
Работа ФУ (≥1 такта).
Планировка.
13
и передача
по шлюзам результатов.
Чтение регистров.
Настройка шлюзов.
14
Работа ФУ (≥1 такта).
15
Обратная запись и передача
по шлюзам результатов.
Странная штука под названием «Размещение меток» (token allocation) нигде в официальном тексте не пояснена, как и её положение до того места, где обычно происходит выделение ресурсов тыла — т. е. после переименования, а не до. Внимательный Читатель заметит, что это та самая 8-я стадия, которая накладывается на работу трансляторов декодера, хотя в оригинальной схеме она почему-то отнесена уже к планировщику. Тем не менее — что можно размещать для ещё не до конца декодированных команд? Более того, почему попадающие в команды FPU требуют дополнительного декодирования? Также интересно сравнить расположение действий по стадиям у целого и векторного трактов: вроде бы одинаковый 16-моповый планировщик в одном случае занимает весь такт на срабатывание, а в другом совмещает его с записями в свои ROB и резервацию.
Исполнительные тракты
В целом исполнительном тракте есть РФ (которому требуется 8 портов чтения и 2 записи), 2 (сложное и простое), (аналогично), 2 (отдельно для чтений и записей), и, предположительно, (уточним позже). Очевидно, адресный планировщик подключен только к паре AGU, а целый — ко всем остальным ФУ. В векторном тракте — РФ (4 чтения + 2 записи) и два ФУ. В целом домене 2 АЛУ, 2 сдвигателя, 2 и умножитель; в вещественном — 2 логических устройства, 2 перестановщика, , умножитель, преобразователь форматов (точнее, это могут быть несколько фУ, занимающих оба порта) и делитель-корнеизвлекатель (являющийся надстройкой над умножителем). В этих списках не указаны некоторые редкоиспользуемые ФУ, предназначенные лишь для нескольких команд.
Интересно дублирование некоторых ФУ для двух доменов, хотя в компактном ядре, где каждый квадратный микрон на счету, пара одинаковых ФУ в одном порту, из которых в каждый момент времени лишь один сможет работать, выглядит расточительством. Можно было бы предположить, что на самом деле есть лишь одна пара перестановщиков, а АЛУ умеет исполнять и «вещественную логику» (тем более, что она никак не отличается от целой) — если бы сама AMD не нарисовала на схеме ядра отдельные ФУ вещественной логики.
Между доменами расположена пара внутритрактовых шлюзов, вносящих в 1 такт, когда результат из одного домена требуется как аргумент в другом. Хотя есть версия, что таких шлюзов вообще нет: 4 порта чтения подключены к двум наборам из 4 шин аргументов (по одному для домена); пары шин результатов тоже отдельные, и пары шлюзов — лишь внутридоменные (т. е. перепуск «своего» результата на «свой» аргумент). При запросе результата в чужом домене он сначала записывается в РФ (что и так должно произойти), а затем читается в другую четвёрку шин аргументов, на что и уходит лишний такт.
Впрочем, такая схема была бы оправданной для сверхвысокочастотного ЦП, где нагрузка на шины (в т. ч. по числу «лишних» шлюзов) не может быть большой. Для компактного ядра объяснение может быть другое: РФ разделён на 2 полунабора регистров — по одному для доменов, и каждый набор имеет свои 4+2 порта. Но и это не показывает, чем эта схема лучше простой установки пары междоменных шлюзов, которые (как и внутридоменные) могли бы срабатывать в тот же такт, что и генерация передаваемого через них результата. Наконец, есть версия о двух отдельных векторных трактов, как в настольных ЦП Intel — как и там, это объясняется банальной нехваткой места для единого тракта с учётом всего массива ФУ. Проверить это можно при детальном анализе фото ядра.
Распределение по портам и специализация ФУ почти такие же, как и у Atom, но есть и кардинальное отличие. Главный недостаток вообще всей архитектуры в том, что в векторном блоке нет ни одного 128-битного ФУ, а потому даже простейшие копирования регистров xmm и простая арифметика делаются парой АЛУ над половинами логических регистров. Это даёт пиковую вещественную скорость всего в 4 - и 1,5 DP-, хотя все конкуренты имеют бо́льшие значения: Atom выдаёт 6 и 1,5 флопа/такт (правда, 1,5 DP-флопа достижимы только скалярами), Nano — 8 и 3, а все «большие» ЦП — 8 и 4 (у кого есть поддержка — и вдвое больше). (В трёх мобильных архитектурах DP-пики достигаются при соотношении сложений и умножений как 2:1, в остальных случаях — 1:1, что более адекватно потребностям кода.) Впрочем, сложение полноконвейерно и для «расширенной» точности (EP), из чего можно сделать вывод, что тракт скорее 80-битный, но дополнительные биты сумматора и умножителя редко используются по причине устаревания поднабора x87 вообще и в мобильных программах особенно. Если бы его по-тихому убрали (хотя бы для экономии места и упрощения логики), никто бы не огорчился.
Как всегда, полные таблицы с , портами запуска и числом мопов для всех команд можно найти (стр. 175–184), а тут не менее традиционно покажем нашу . В колонках цифр для нескольких старых архитектур и свежего K14 теперь встречаются плюсы. А внизу пояснение: каждый плюс добавляет к задержке 1 такт, если следующая команда требует в первом такте обе части результата данной.
Дело в том, что многие векторные команды исполняют свои действия над элементами независимо. Скажем 4 SP-сложения для SSE (ADDPS) могут происходить параллельно, если все части аргументов уже готовы. Т. к. вещественный сумматор лишь 64-битный, в первом такте начнётся сложение, допустим, младшей половины регистров xmm. Но он полноконвейерный, и со второго такта можно начинать складывать старшие половины этих же регистров. Когда закончится сложение младших половин, младшие суммы сразу могут быть использованы в любой команде, которой (как и сложению) достаточно иметь лишь половину элементов. Через такт она получит и старшие суммы. Т. к. вычислительные мопы планируются на запуск независимо, временной разрыв и порядок запусков обработок половин регистров могут быть какие угодно — например, старший моп может начаться за 2 такта до младшего, если его аргументы будут получены на 2 такта ранее. Наглядно это показать поможет тестовый код, циклически повторяющий такие команды:
ADDPS xmm0, xmm0; Сложить вектор SP-чисел из xmm0 с самим собой PS xmm0, xmm0, 123; Переставить элементы xmm0 HLPS xmm0, xmm0; Скопировать старшую половину xmm0 в младшую
Посмотрим, как это работает на K8, где векторный тракт также был 64-битным. На схеме ниже указаны первые две итерации, причём длина второй является устоявшимся значением (жирные цифры), и именно для неё приведены номера тактов. Цветом показаны 3 вида мопов, запускаемых в тракт для работы над половинами регистра xmm0. 64-битное (по ширине вектора) сложение занимает 4 такта, а копирование — 2. 128-битная перестановка — 3-тактная и требует трёх мопов: два пишут по 2 элемента в половины регистра-приёмника (за 2 такта каждый), а третий нужен, скорее всего, для синхронизации физических половин архитектурного регистра. За неимением точных данных запишем его в «старшей» колонке, где он совпадёт с первым тактом первого «рабочего» мопа. Главное — что обеим половинам SHUFPS нужны обе половины аргумента. Если бы за ADDPS шло ещё одно сложение, то оно могло бы начаться уже с 5-го такта, получив задержку 4 и 2 (старт нового независимого сложения возможен по нечётным тактам). Но с SHUFPS требуется ждать старшую половину, поэтому задержка увеличивается на 1 — что и обозначено плюсом в таблице таймингов.
Теперь посмотрим, что будет если заменить MOVHLPS на MOVLHPS, копирующую младшую половину в старшую. Вроде бы всё симметрично, никаких изменений быть не должно. На самом деле копирование младшей половины перемешанного xmm0 начнётся уже после её готовности, что на такт раньше, т. е. на 7-м такте, пока старшая половина ещё не готова. Впрочем, она и не нужна, т. к. одновременно с младшим сложением запускается копирование этой половины в старшую. Такая тройка команд выполнится не за 9, а не за 8 тактов, и эта сумма ограничена сложениями старших половин.
Рядом показана аналогичная ситуация для Bobcat, исполняющего каждую из этих команд на такт быстрее. Впрочем, если для MOVHLPS можно получить ожидаемые 6 тактов, то для MOVLHPS быстрее не получится, хотя в течение 5-го такта есть возможность запустить и перестановку старшей половины, и копирование уже перемешанной младшей, и её же сложение. Но портов всего 2, и запустятся самые «старые» мопы (последний для SHUFPS и MOVLHPS), а ADDPS стартует в следующем такте. Из этих примеров видно, что при половинной ширине вычислительного тракта компилятору и программисту на ассемблере требуется детально разбираться, что́ должно происходить в ядре, чтобы оптимизировать скорость до последнего такта даже в тривиальных (как кажется) случаях.
Однако вышеперечисленные цифры являются теоретическими; практика же внесла неприятные коррективы. После тестирования оказывается, что и K8, и K14 исполняют вариант с MOVHLPS на такт дольше, чем по модели. У K8 это можно было бы объяснить тем, что загадочный третий моп для SHUFPS исполняется не 1, а 2–4 такта, и от него зависит пропуск всей команды — но тогда задержка всей команды была бы на такт дольше. Кроме того, ещё замена ADDPS на ADDSS (скалярное сложение только младших элементов, имеет лишь младший моп) предсказуемо уменьшает сумму таймингов до 6 тактов.
Дальнейшие эксперименты показали, что теория сходится с практикой, если заменить обычное сложение на горизонтальное (HADDPS, 4+2 такта задержки и 2 такта пропуска), требующее обеих половин источников для каждой половины результата: 11 тактов для версии с MOVHLPS и 10 для MOVLHPS. А вот если вообще убрать сложение, то начальные задержки уменьшаются на 4: 6 для пары SHUFPS+MOVHLPS и 4 для SHUFPS+MOVLHPS (согласно теории должно быть 5 и 4). Попытки прояснить ситуацию в фирменном профайлере AMD Code Analyst успехом не увенчались: последние его версии не поддерживают симуляцию конвейера (pipeline simulation), а версия 2.8 (последняя с этой функцией) вылетала с ошибкой на тестовой машине на базе того же K8. Сбор статистики от счётчиков производительности ничего внятного не дал.
Ситуация осложняется тем, что официальный учебник по оптимизации (), судя по всему, неверно указывает задержку команды SHUFPS для K8 (стр. 324): 4 такта с примечанием 1, гласящим, что младшая половина результата доступна тактом ранее. Но все независимые тесты показывают не 3+1 такта, а 2+1. Впрочем, с задержкой 4 вариант с MOVHLPS и в теории, и на практике даст 10 тактов, зато уже версия с MOVLHPS окажется на такт дольше рассчитанного. Интересно, что у K10 и K12 (где 128-битные векторные тракты с теми же задержками почти всех ФУ) SHUFPS ожидаемо 1-моповая, но требует трёх тактов, а не двух — т. е. как пишут в учебнике. Либо «почти все ФУ» не включают перестановщик, либо учебник прав, а все независимые тесты, включая AIDA64 (бывший Everest; см. строку 814) — нет.
Зачем мы так обильно ворошим «старые раны» прошлых архитектур? Ведь можно посмотреть в новый учебник, где, наверное, ошибок нет… Однако впервые в своей практике AMD для нового ЦП (более того — разработанного с нуля) такое руководство не выпустила. И это притом, что новые версии некоторых компиляторов стараниями компании уже умеют оптимизировать для Bobcat, но программистам и аналитикам эти тонкости почему-то знать не положено. Если сравнить с активно документируемой работой Intel по программной адаптации и оптимизации под Atom разных ОС и программ — получится небо и земля.
Приходится использовать имеющиеся данные для ближайшей похожей архитектуры (K8), но они, оказывается, неточны — и это после стольких лет её использования, когда все ошибки к версии 3.06 учебника можно было исправить. Не смотря на все догадки, объяснить, почему вариант теста с MOVHLPS работает на такт дольше, не получается. А теперь представьте — каково оптимизировать под Bobcat программистам, сталкивающимся с куда более сложными случаями, да ещё и с глючащими инструментами?.. Впрочем, начнём с малого: если у особо дотошных и любопытных читателей найдётся время погрызть гранит загадки лишних тактов — добро пожаловать на форум с идеями и результатами.
А пока вернёмся к самому ЦП. Если ещё раз взглянуть на нашу таблицу таймингов и сравнить их с конкурентами, то окажется, что бо́льшая часть ФУ у Bobcat лучше, чем у Atom, кроме операций перестановки и векторного сложения-вычитания SP-чисел (что не удивительно, учитывая ширину векторного тракта). Целочисленный умножитель имеет пропуск 1 для краткого 32-битного умножения, но 2, когда надо записать полные 64 бита результата в пару 32-битных регистров. Это потому, что на запись старшей половины уходит второй моп такой версии умножения, что типично для большинства ЦП, т. к. мопы имеют лишь 1 регистр-приёмник (без учёта ). Векторный целый умножитель работает за рекордные 2 такта для 64-битных векторов, хотя у старого K6-2 такой уже был.
Вещественный сумматор работает за 3 такта, что на 2 быстрее, чем у Atom, но на 1 меньше рекордного сумматора Nano. А вот блок MUL — это целая история. Дело в том, что в феврале 2009 г. инженеры AMD опубликовали , посвящённую вещественным умножителям, одновременно энергоэффективным, компактным и не очень медленным — как раз, как надо любой мобильной архитектуре. Результаты смоделированных там таймингов точно совпали с реальными замерами вещественного умножителя в Bobcat. Для сравнения с другими ЦП они представлены в таблице рядом (в том же формате, что и выше) для скалярного (S…) и векторного (P…) умножений трёх точностей — SP, DP и EP (x87, только скаляры).
ЦП
SS
SD
EP
PS
PD
K14
2/1
4/2
5/3
2+/2
4++/4
Atom
4/1
5/2
4+/2
9/9
Nano
3/1
4/2
3/1
4/2
K8
4/1
4+/2
K10
4/1
Core 2, i
4/1
5/1
4/1
5/1
Core i 2
5/1
Как же у AMD получились рекордно низкие тайминги для SP и нормальные для DP (в ущерб EP-умножению, которым логично пожертвовали в виде трёх тактов пропуска), хотя умножитель в 2,5 раза меньше по площади и потреблению, чем его аналог из K8, сделанный тем же техпроцессом? Для начала вспомним (или изучим ), что согласно стандарту IEEE-754 о двоичном представлении вещественных чисел 32-, 64- и 80-битные точности имеют 23-, 52- и 64-битные мантиссы, которые и требуется умножать; экспоненты же обрабатываются простым блоком вроде целого сумматора. Правда, SP- и DP-числам нужно добавить отсутствующий в хранимых мантиссах бит целой части, всегда равный 1 — кроме редких денормальных чисел. (Кстати, в Bobcat штраф за обработку их, а также недополнений — 150–200 тактов.) Кроме того, внутренняя точность должна быть выше, поэтому реальная разрядность умножителя на все точности — 76 бит. И т. к. он должен быть сколько-нибудь быстрым, его делают матричной схемой. Матрица состоит из 7 многобитных сумматоров, соединённых древовидной сетью в 3 яруса.
Если требуется полноконвейерный умножитель даже для EP, то нам нужна матрица на 76×76 бит — как раз, как в K7–K12. Для мобильных ЦП это слишком масштабно, прожорливо, а главное — не нужно: бо́льшая часть вещественной нагрузки от мобильных программ — в SP-числах, которым достаточно массива в 27×27 бит. Но EP-точность всё же нужна (хоть с какой-то скоростью), да и SP-умножения бывают не только скалярные. Поэтому AMD предложила сделать массив прямоугольным — 76×27 бит. Это не ново: ЦП Cyrix (кто помнит это слово?..) когда-то имели матрицу 17×69, ещё меньшую по площади, но со слишком большим ущербом для скорости — даже SP-умножения полноконвейерными не сделаешь.
«Сырые» (неокруглённые) результаты прохода аргументов через матрицу умножетеля для разных точностей.
Внимательный Читатель задаст вопрос: а как же с DP- и EP-точностями, которым не хватит размера матрицы для полноконвейерного умножения? Для этого аргументы такой точности проходят через матрицу итеративно, получая за каждый проход очередные 27 бит результата. Для DP чисел требуется 2 прохода, а для EP — 3, что и отражено в пропуске команд. На округление тратится 1 такт для SP и 2 для DP и EP, причём округлитель может работать одновременно со следующим умножением, так что пропуск не увеличивается на время округления. Ширины матрицы хватит для двух SP-умножений за такт, что также видно в таймингах, но уже с отрицательной стороны: если бы таких прямоугольных умножителей было бы два, то их хватило бы для полноконвейерного исполнения MULPS и полуконвейерного — MULPD (как в Nano).
Зато SP-умножение впервые получилось 2-тактным, что даже быстрее сложения, а это разрушает доселе незыблемый постулат о том, что сложение быстрее умножения, т. к. проще и требует меньше аппаратных ресурсов. Причём в Bobcat это особенно странно, учитывая, что округлитель для умножителя по сложности эквивалентен сумматору и срабатывает за 1–2 такта. Конечно, такое устройство умножителя подойдёт лишь для частот до 2–2,5 ГГц; иначе на экономной версии 40-нанометрового техпроцесса сигнал не успеет пройти матрицу за 1 такт. Странно, что то же устройство не использовано в целом скалярном умножителе, не требующем округления, но работающем за 3 такта (для версии 32×32 бита). При этом все виды целого векторного умножения (в т. ч. 32×32, а также с попарным сложением произведений) исполняются за 2 такта.
Кстати, эта же группа авторов ещё ранее (аж в декабре 2007 г.) написала работу , где придуман модифицированный алгоритм Голдшмидта (GS-2), основанный на вышеописанном умножителе и делящий на 25–37% быстрее прежних. Любопытно, что в этой работе задержки собственно умножения для SD и EP оказались на такт меньше указанных в поздней работе, но «в железо» эта версия почему-то не попала. Впрочем, в реально ядер и деление оказалось на 3 такта медленнее версии GS-2, хотя всё ещё быстрый — 19 тактов для EP (8 бит/такт, 9 тактов подготовки и обработки).
Интересный момент связан с векторным вещественным делением: для DP оно равно 34 тактам, что ровно вдвое больше скалярной версии, а для DIVPS — 38, что менее чем втрое больше DIVSS (13). Т. к. деление полностью неконвейерно, у DIVPS можно было ожидать 13×4=52 такта, но 14 тактов загадочно экономятся. Возможно, ширины умножителя хватает не только для пары SP-умножений, но и для частичной параллелизации пары SP-делений. Аналогично с векторным извлечением корней.
По идее, для экономии площади делитель должен быть один и исполнять скалярное целое деление, задействуя межтрактные шлюзы для передачи аргументов и результата (как в Atom и Nano). Целое деление сравнимо по сложности (не требует нормализации, но надо получить не только частное, но и остаток), но из-за шлюзов окажется чуть медленнее вещественного. Однако в Bobcat оно аж в 2–4 раза дольше — 1 бит/такт и 17–23 такта на остальное. Это наводит на мысль об отдельном целом делителе (скорее всего, надстроенным над умножителем), что подтверждается и тем, что целое деление тоже декодируется в 1 моп, а межтрактные передачи потребовали бы ещё 2. И зачем потратили лишнее место на такого уродца, если оказывается вдвое быстрее (!) преобразовать целое в вещественное (11 тактов), поделить в FPU (17 для DP) и преобразовать обратно (ещё 11)?..
Из правила о тотальной 64-битности исполнительных ресурсов есть намёк на исключение. Две команды S*LDQ, сдвигающие 128 бит влево или вправо, исполняются за такт на двух 64-битных сдвигателях — это получится, лишь если они умеют объединяться в общее 128-битное ФУ. Для сдвигателей это не намного сложнее, чем объединение двух одинаковых арифметических ФУ (в т. ч. АЛУ), хотя и эти команды требуют двух мопов. Но это не помогло команде PALIGNR для вырезания 16 из 32 байт, слеплённых из двух источников — она часто используется не только в обработке векторов, но и в компиляторной реализации функции memcpy Си-подобных языков для копирования блока памяти. В Bobcat она требует 20 мопов и исполняется аж 19 тактов задержки и 12 пропуска. Это может замедлить даже целочисленный скалярный код, сделанный современным компилятором.
Обмен с памятью даже 32- и 64-битных команд FPU (т. е. векторных целых из набора MMX и вещественных скалярных из SSE) на 2 такта медленнее скалярных целых из-за дополнительных задержек на межтрактные пересылки. Ещё один такт добавляется, если аргументы 128-битные. Проще говоря, векторы на 2–3 такта дальше от кэша, чем РОНы, что на такт больше разницы у Atom. Куда хуже то, очевидные цифры пропуска (8 байт/такт) соблюдаются лишь для чтений; запись 4- или 8-байтового компонента вектора почему-то полуконвейерна, а пропуск всего xmm — и вовсе 3. Таким образом, максимальный темп записи из векторного тракта — 16:3=5,(3) байт/такт. У Atom же чтение или запись 16-байтовыми происходит каждый такт. Уже одно это может подорвать производительность любого векторного и/или вещественного кода.
Смешивание мопов с разным временем исполнения на одном порту практически не вносит никаких задержек, что намекает на возможность завершения более 2 мопов/такт. Частичный доступ к регистрам устроен просто: его вообще нет — любой 64-битный физический регистр адресуется целиком и зависит от предыдущих команд всеми частями, в т. ч. и неиспользуемыми читающей его командой. Частичный доступ к флагам также отсутствует, но это почти не замедляет 2-путное исполнение. Единственное естественное исключение — половины регистров xmm, хранимые и адресуемые отдельно по причине узости РФ и ФУ.
Почти все обнуляющие идиомы распознаются как разрывающие ложную зависимость по регистрам, однако исполнять их всё же требуется (диспетчер в Intel Sandy Bride умеет «исполнять» их на стадии переименования, не загружая планировщик и ФУ, однако это уже «высший пилотаж»). Полный их список: *XOR*, (P)SUB*, SBB (результат зависит лишь от флага переноса), *CMP* и PANDN (звёздочками указаны переменные части названий команд). А вот «вещественная логика» типа ANDNP* и единичные идиомы не распознаются, причём первый случай особенно странен, т. к. ANDNP* почти ничем не отличаются от «целой логики» PANDN.
Подсистема памяти
LSU и другая логика
Блок для компактного ЦП силён качествами, но не количествами. Он, как и подключенный к нему кэш , 2-, но каждый порт — специализированный: 1 чтение и 1 запись. Это вполне ожидаемо, хотя один из портов вполне можно было сделать универсальным, чтобы иметь возможность совершать 2 чтения за такт. Это особенно полезно в свете главного недостатка: ширина портов — всего 8 байт. Даже при наличии единственного AGU для чтений (хотя очевидно, что никакого специального «AGU для чтений» быть не может — оба AGU одинаковы), его бы хватило для обработки одной 16-байтовой пересылки за такт (для чего, впрочем, также требуется расширить шину до FPU), но единственный 8-байтовый порт чтения выполнит её за 2 такта. Ещё одно «бессмысленное и беспощадное» (для производительности) 64-битное упорство.
Впрочем, есть чем его скрасить. Главное достоинство LSU — реализация , что ещё недавно было достижением лишь настольных ЦП Intel. Atom, конечно, «курит в сторонке», но даже куда более сложный Nano реализует далеко не все тонкости. Bobcat умеет перетасовывать чтения и записи во всех случаях, которые не нарушают порядок записей. Очереди чтения и записи вмещают 26 и 22 команд. По утверждению AMD, есть даже предсказатель коллизий адресов чтений с пока не известным адресом записи, чем пока хвастали лишь «большие» ЦП Intel. Буфер удержания допускает до 8 , в течение которых кэш L1D будет обслуживаться.
Механизм работает ожидаемо: если последующее чтение умещается в уже размещённой в LSU записи (даже если данные ещё не попали в кэш), то его можно досрочно завершить — если обе операции не пересекают 16-байтовую границу. Впрочем, совокупная задержка такой пары оказывается большой: не менее 8 тактов для РОНов и 11 для векторных регистров. В случае пересечения 16 байт дополнительный штраф составит 4–11 тактов (это именно для STLF — явные загрузки быстрее). В отличие от предыдущих ЦП AMD, Bobcat позволяет исполнять команды прямо указанного как невыровненный доступа (MOVUPD) также быстро, как и явно выровненные (например, MOVAPD) — штраф последует, только если пересылаемое слово действительно пересекает 16 байт.
Внимательный Читатель сразу заметит, что хотя LSU принимает мопы с 8 байтами, гранулярность работы STLF — 16 байт, т. е. очереди LSU имеют 16-байтовые ячейки. Это также подтверждается задержкой невыровненного доступа: он имеет 3 такта штрафа при пересечении именно 16-байтовой границы (требуется сделать ещё одно обращение к кэшу). Кстати, дополнительных задержек при пересечении строк (64 байта) и страниц (4 КБ) нет, хотя в других ЦП они присутствуют почти повсеместно.
Дополнительное доказательство, что LSU соединяется с L1D 16-байтовыми портами, заключается в скорости исполнения команд типа PUSHA (сохранение всех РОНов в стеке) и POPA (загрузка их из стека) — 8–9 тактов, в т. ч. в 64-битном режиме с 16 РОНами. Очевидно, такое возможно лишь при переносе из РФ в кэш и обратно по два 8-байтовых регистра за такт, что недоступно для отдельных команд чтения или записи. Более того, «строковые» команды, оперирующие линейными массивами, достигают максимума лишь 6,5 байт/такт (из при записи в L1D и 10,1 (из 16 — в сумме на чтение + запись) при копировании. (Правда, даже это на треть быстрее, чем у Atom, но на треть медленнее, чем у Nano.) А команды MASKMOV* для выборочной записи байтов из векторного регистра напрямую в память (минуя кэш) и вовсе исполняются до 3000 (!) тактов, но это уже явная недоработка аппаратного дизайна, залатанная микрокодом (по 4 мопа на каждый байт!). Впрочем, то же число мопов и для настольных ЦП AMD, но там эти команды исполняются максимум за 26 тактов. Atom же требует 7 тактов, а Nano — 1–2…
Предзагрузчик отслеживает до 8 потоков данных единственным и очевидным алгоритмом: после 2-го промаха адреса́ команды и её промахов поступают в очередь предзагрузки, где для них вычисляется шаг. Далее для каждого потока 1–4 слова подгружаются в L1D и/или очередь загрузки (безо всяких дополнительных буферов). Просто и вполне эффективно.
Кэши и TLB
Параметр
L1I
L1D
L2
Размер
32 КБ
512 КБ
Ассоциативность
2
8
16
Размер строки
64 байта
Задержка
3 такта
20 тактов
Число портов
1
2
1
Разрядность портов
32 байта
16 байт
64 байт?
Частота
Частота ядра
½ частоты ядра
Политика работы
Почти
Только чтение
Доступность
Местное ядро
2-путная L1I может привести к вытеснению не столь уж старого кода, часто прыгающего по неблизким адресам. Странно, почему AMD не использовала 8 путей и в этом кэше, учитывая, что всё в ядре разработано с нуля, и не требуется тащить «вечные 2 пути» со времён первых Athlon, как для настольных ядер. Буфер промахов в L1I содержит лишь 2 адреса, но при 1-поточном исполнении в ядре больше и не надо.
Как и в Atom, для экономии из набора считывается только сработавший путь. Интересно, что для L1I помимо штатных есть и микротеги, которые читаются до обращения в TLB. Учитывая, что для экономии обращение в TLB происходит, только если страница изменилась относительно предыдущего запроса, можно предположить, что микротег это та часть обычного тега, которая остаётся после вырезания старшей части адреса (свыше 12 бит, составляющих смещение в странице). В любом случае, даже при обращении в TLB задержка считывания составит 3 такта.
Ниже в таблице показаны описания трёх стадий конвейеров чтения (они же — стадии 1–3 и 12–14 общего конвейера для L1I и L1D), расписанных с точностью до полутактов («a» и «b»). Для L1D описан наиболее распространённый случай, когда базовый адрес сегмента равен 0. В крайне редких случаях, когда это не так, для сложения адреса из AGU с базовым используется дополнительная стадия между «1b» и «2a».
Чтение из L1I
Стадия
Чтение из L1D
?
1a
12a
Генерация адреса в AGU.
Чтение микротега.
1b
12b
Запись в очередь чтения LSU.
Проверка в LSU.
Проверка в TLB.
2a
13a
Проверка в TLB и тегах.
Выборка набора.
Проверка в тегах.
Выборка набора.
2b
13b
Сравнение адресов.
Сравнение адресов.
Чтение строки в наборе.
3a
14a
Чтение строки в наборе.
Передача в буфер
предекодера и запись.
3b
14b
Запись в очередь записи LSU
и в исполнительный тракт.
Как ни странно, в L1D обнаружение промаха происходит не на втором такте (после сравнения физических адресов), а на третьем. Далее идёт перенаправление запроса в (на что тратится аж 3 такта), там в течение двойного такта читаются теги, потом ещё один двойной тратится на чтение выбранной строки. Она делится, скорее всего, на 4 16-байтовых слова, которые аж 6 тактов (разумеется, конвейерных) передаются обратно в 14-й такт основного конвейера. Там происходит запись в L1D, и только ещё через такт данные оказываются доступны для ФУ.
Впрочем, как показано в таблице, замеренная задержка оказалась даже не 17 тактов (из которых, как видно, бо́льшая часть просто необъяснима), а все 20. Причиной этого может оказаться излишнее стремление сэкономить ватты: перезапуск промахнувшейся в L1D команды (которая при обращении к L2 продолжает находится в очереди LSU) происходит не сразу после заполнения нужной строки в L1D, а когда команда, как пишут, «имеет высокий шанс завершиться». Очевидно, что если строка уже прочитана из L2, то команда точно завершится. Или в Bobcat ей надо выждать ещё несколько тактов «для надёжности»?..
Кэши и все защищены битами . Выглядит логично, вспоминая совсем не серверную направленность (где требуется высокая надёжность и отказоустойчивость), низкие частоты (опять же, бо́льшая надёжность) и экономию энергии (логика коррекции ошибок требует свои милливатты, даже когда исправлять ничего не надо). Но почему тогда кэш L2 всё же корректируется через ? Если бы он питался пониженным напряжением — тогда вопрос был бы снят, но в таком виде это кажется излишеством. Впрочем, вспоминая, что у Atom всё также, предположение такое: для L2 используются особо экономные транзисторы, которые, в обмен на свою энергоэффективность, не очень хорошо переносят проседание питания при записи в соседние ячейки и изредка могут портить «свои» данные. О видах транзисторов мы узнаем чуть ниже…
В списке возможных запросов к L2 указаны загадочные «вытеснения атрибутов» из L1I. Что это за атрибуты, которые надо сохранять в L2? Разметка длин команд нигде не кэшируется (как в предыдущих ЦП AMD); адреса́ и, тем более, содержимое вытесняемых строк передавать в L2 тоже не надо. Возможно, в L2 сохраняется часть информации из BTB (опять же, как в предыдущих ЦП), причём для этого подойдут как раз те самые биты ECC, избыточные для неизменной информации (т. е. кода). Кстати, «почти включающая» политика работы означает, что в редких случаях (отключение редкоиспользуемых банков, совпадение адресов при обработке внешних запросов протокола ) из L2 могут вытесняться данные или код с сохранением их копий в L1 — для этих строк политика оказывается .
Ещё одна странность L2 — его половинная частота (только битовые массивы; контроллер работает на полной частоте). В принципе, для экономии это допустимо, т. к. за «свой» такт L2 считывает вчетверо больше, чем требуется запрашивающему кэшу L1, хотя официальные 17 и замеренные 20 тактов задержки были бы на 2 меньше при полной частоте. Но, судя по тестам, кэша L2 ограничивает шина до L1 (работающая на полной частоте) — до позорных 3–4 байт/такт (и по чтениям, и по записям). Возможно, тесты неверны, но ПС памяти ещё меньше — около четверти от теоретического пика при 1-поточном доступе и половина при 2-поточном. Более того, переход с DDR-1066 на DDR-1333 почти не даёт ускорения (по крайней мере, при работе x86-ядер), а значит фатальный затык где-то ближе к ядру. Даже Atom по этим параметрам едва достижим…
Кстати, если уж экономить на частоте, то первым кандидатом оказывается L1I: 32 байт/такт хватит и 4-поточному конвейеру (как в Bulldozer), а уж 2-поточный запросто обойдётся 16 байтами за такт или 32 за два. (Да, декодеры могут обрабатывать до 22 байт/такт, но для сглаживания перед ними есть буфер.) Более того, предсказатель переходов всё равно делает прогноз каждый второй такт. Правда, задержку тогда придётся поднять до ближайшего большего чётного числа — т. е. до 4 тактов, что на 1 увеличит штраф при фальш-предсказании (до 14 тактов).
Параметр
TLB L1I
TLB L1D
TLB L2D
Размер страницы
4 КБ
2/4 МБ
4 КБ
2/4 МБ
4 КБ
2/4 МБ
Число страниц
512
8
40
8
512
64
Ассоциативность
(2, 4, 8)?
40
8
4
Задержка
1 такт, учтена в задержке к кэшу
≈7 тактов
Число портов
1
2
1
Политика работы
Скорее всего, включающая
(тут он зовётся TWE — table walk engine, движок проходки таблиц) ожидаемо имеет кэш верхних ярусов трансляции («директории страниц») неизвестного, но, как всегда, небольшого (32?) размера. Он также поддерживает «быстрое индексирование для виртуализации» (более известное как «вложенные таблицы страниц»), ускоряющее переключения между виртуальными ОС. Кроме того, поддерживаются и никому тут не нужные «сверхбольшие» гигабайтовые страницы, но лишь номинально — в TLB они вносятся разбитыми на страницы по 2 МБ (разумеется, не на все 512, а лишь по запрошенным адресам). Такое упрощение очевидно, учитывая, что физическая адресация ЦП — 36 бит, т. е. рассчитана «всего» на 64 ГБ, которых, по мнению AMD, «хватит всем». Зато это, как сказано выше, это позволяет хранить в TLB (помимо атрибутов) лишь 36−12=24 бита базового физического адреса страницы.
Внеядро
1-канальный ИКП рассчитан на использование до двух модулей памяти DDR3(L) на частотах до 1066 или 1333 МГц. Как и в Llano, ГП соединён 512-битной полнодуплексной шиной до собственного КП (на схеме выше он иерархически находится в пределах общего ИКП), не проверяющего когерентность для адресов, выделенных видеопамяти (до 512 МБ из ОЗУ). Для обращения к памяти без пробуждения или отвлечения x86-ядер ГП умеет сам посылать DMA-запросы к ИКП. В предыдущих компактных решениях ИКП был встроен в ЦП, а ГП — в северный мост, соединённый с процессором шиной . По мнению AMD, размещение ИКП и ГП на одном уменьшает суммарное потребление системы на 1 Вт, задержку доступа к графической памяти — на 40%, а ПСП увеличивается на 17%.
Описание архитектуры ГП показывает, что для Bobcat взята самая слабая его версия, названная (в зависимости от ) HD 6250 (276 МГц), HD 6290 (276–400 МГц), HD 6310 (488–500 МГц) или HD 6320 (508–600 МГц). Первая пара нагружена на ИКП с частотой 1066 МГц, а вторая — 1333. Во всех версиях — по 80 графических ФУ, 8 блоков TMU и 4 растеризатора. Производительность определяется пословицей «мал, да удал»: при 492 МГц (до недавнего времени это была максимальная частота ГП среди моделей этого ЦП) 3D-движок выдаёт в секунду 78,7 SP-гигафлопа (x86-ядра на 1,6 ГГц выжимают лишь по 6,4), 123 мегатреугольника, 3,9 гигатекселя и 2 гигапикселя. Что значат все эти загадочные цифры и насколько они круты — смотрите и спрашивайте в видеоразделе нашего сайта.
В отличие от настольных серий HD 6000, встроенный ГП обновил свой аппаратный видеодекодер UVD до версии 3 (как и в ЦП Llano) и теперь поддерживает H.264, VC-1, MPEG-2 и -4, DivX и Xvid. Имеются 2 цифровых выхода (поддерживающих протоколы HDMI, DVI и DisplayPort), 1 LVDS (для встроенного в прибор ЖК-экрана) и 1 VGA. (Общее число работающих экранов — не более двух.) Поддерживаются стандарты DirectX 11, OpenGL 4.1 и OpenCL 1.1 (этот как раз и позволяет добавлять графические гигафлопы к «обычным» — но с трудом и не всегда), а также технология Dual Graphics (бывшая Hybrid CrossfireX) для «слияния» работы встроенного ГП с внешним, подключенным через PCIe.
Контроллер PCIe 2.0 имеет 2 4-полосных порта, к одному из которых подключается обычный разъём для периферии (в т. ч. для внешней видеокарты), а ко второму — южный мост. Все ядра, ИКП и контроллеры соединены шиной CCI (common core interface, общий интерфейс ядер), являющейся несколько переделанной версией PCIe. AMD называет её очень эффективной, однако судя по ПСП, звучит сомнительно… Тем не менее, «с высоты» мы видим компактную версию Llano, сокращённую не качественно, а лишь количественно.
Часть 2: Экономия и авторазгон. Кристалл (Параметры и блоки, Транзисторы, Ядро). Антураж (Модели, Соперники, Чипсеты). Перспективы (Обломы, Что делать, и кто виноват нам поможет?). Выводы и пожелания. Источники. →
Процессоры Intel Core третьего поколения уже давно были готовы порадовать своими технологическими новшествами пользователей, но ввиду некоторых причин, а в частности, из-за отсутствия должной конкуренции, анонс Ivy Bridge был отложен. Ни для кого не секрет, что коробочные версии этих 22-нм чипов уже начали поступать в магазины и даже оказались в руках у оверклокеров. К слову, многие энтузиасты пока сходятся во мнении, что процессоры Ivy Bridge не будут лучше разгоняться на воздухе, чем Sandy Bridge. Да, при использовании системы фазового перехода можно будет взять 6 ГГц, но разгон до 7 ГГц гарантирован исключительно «под азотом».
Китайское зеркало ресурса VR-Zone уточняет схему анонса долгожданных процессов.
23-го апреля будет снят запрет на публикации обзоров и соответственно состоится сам анонс CPU Ivy Bridge. С 29-го апреля в магазинах можно будет официально купить коробочные версии Core i7 и Core i5 третьего поколения.
Некоторые особо удачливые ребята уже отбирают для своих тестовых стендов модели Core i7-3770K.
Общеизвестно, что в компьютерной индустрии всё очень быстро меняется. Один технологический лидер сменяет другого, и такие процессы проходят порой столь стремительно, что люди даже не успевают заметить и запомнить надолго всё произошедшее. Например, кто сейчас, кроме редких активных пользователей смартфонов с Windows Mobile, хоть иногда вспоминает эту операционную систему? А на чьих чипах была основана основная масса КПК, появившихся в начале этого века?
Конечно, заядлые энтузиасты помнят эти решения и знают ответ, но рынок ушёл дальше, и теперь Windows Phone не является доминирующей мобильной операционной системой, да о ARM ядрах от Marvell теперь мало кто знает (хотя они до сих пор применяются, к примеру, в телефонах BlackBerry). Суть в том, что любой из рынков через пару-тройку лет может выглядеть уже совершенно иначе, чем сейчас, с другими лидерами и аутсайдерами, совсем недавно бывшими среди первых. В качестве ещё одного примера можно обратить внимание на рынок мобильных телефонов, где не так давно явным лидером была компания Nokia, но где она теперь?
Вот и на рынке систем-на-чипе для мобильных устройств всё может измениться столь же быстро. Например, сейчас ведущим поставщиком таких решений является компания Qualcomm, да и многие другие известные компании, а вот Intel на нём практически не представлена. Но всем известно, что эта компания может добиться очень многого на любом рынке, если всерьёз примется за него, так как у них есть и ресурсы и (что ещё важнее) технологические возможности, отсутствующие у других поставщиков.
До недавнего времени x86-процессоры было трудно назвать достаточно энергоэффективными для таких ультрамобильных устройств, как смартфоны. Да, у Intel были попытки выхода на этот рынок, оказавшиеся неудачными. Но главное, что мобильные системы-на-чипе (SoC) будут оставаться одним из наиболее важных и привлекательных рынков в ближайшие несколько лет, и Intel сделает всё, чтобы стать значимым игроком на нём. А возможно и его лидером, хотя сейчас в это пока что не слишком верится.
На рынке систем-на-чипе для смартфонов и планшетов сейчас представлены: Tegra от NVIDIA, OMAP от Texas Instruments, Snapdragon от Qualcomm, Exynos от Samsung и SoC от Apple. Последние недоступны для сторонних производителей, но весьма широко распространёны в собственных изделиях этой компании. Большинство современные мобильных SoC схожи. Чаще всего производители покупают лицензию на ARM-ядро вроде Cortex-A9 или Cortex-A15, а также их же графическое ядро Mali или аналог от PowerVR, объединяют ARM-ядро с графическим, добавляя различные блоки (обработки изображений, кодирования и декодирования видео, интерфейсы ввода-вывода и т.д.) — вот и всё.
Но не совсем. Не все SoC спроектированы таким образом. Ведь ARM — это лишь набор инструкций, и совершенно необязательно делать ядро точно таким же, что и у всех, можно усовершенствовать его или вовсе сделать своё, но использующее систему команд ARM. Например, компания Qualcomm в Scorpion и новой архитектуре Krait сделала вычислительные ядра на основе собственной архитектуры, не используя наработок компании ARM. И NVIDIA вскоре также сделает то же самое в своём Project Denver – ARM-совместимом процессоре собственной архитектуры.
Как видите, уже в одном только вычислительном ядре есть отличия, а ведь блоков в SoC намного больше. Чего только стоит видеоядро — их на рынке предлагается много, и все они имеют разные характеристики. Но чаще всего видеоядро компании сами не проектируют, этим занимается разве что NVIDIA в своих Tegra, и некоторые другие компании. Но и в этих ядрах ещё не все отличия, есть и другие факторы: шина памяти, её пропускная способность, характеристики кэш-памяти и т.д.
Сейчас трудно предсказать, какая компания сможет лучше выполнить свою работу на рынке мобильных систем-на-чипе в течение следующих нескольких лет. Однако мы можем предположить, что преимущество будет иметь команда разработчиков, у которой есть наибольший опыт по проектированию различных чипов и преимущества для их производства. Например, у Intel есть и то и другое, и очень сильные команды разработчиков и собственные заводы по производству чипов. Да и с ресурсами у них всё в порядке, и опыта достаточно. Так почему бы им не попробовать стать лидерами мобильного рынка?
Преимущества компании Intel
Естественно, что в конкуренции с системами на базе ARM у Intel есть свои преимущества. На мобильном рынке Intel идёт встречным курсом по отношению к компаниям, проектирующим ARM-процессоры. У них разные задачи, Intel нужно снизить энергопотребление их высокопроизводительных CPU, а производителям ARM-систем необходимо повысить производительность их вычислительных ядер, отличающихся весьма низким потреблением энергии.
Вполне вероятно, что повысить энергоэффективность уже имеющихся высокопроизводительных ядер x86-архитектуры будет несколько проще, чем повысить скорость вычислений в небольших ARM-ядрах. Ведь в процессе усложнения процессорных архитектур, компаниям, проектирующим CPU ядра на базе ARM, ещё только предстоит пройти тот же путь, который для Intel уже остался позади.
В следующем поколении ARM-процессоров от Qualcomm и ARM их вычислительные ядра должны значительно усложниться, для лучшего параллелизма исполнения и увеличения эффективности использования ресурсов CPU. Положение ARM тут проще, так как эта компания уже имеет опыт проектирования ядра Cortex-A9 с полностью внеочередным исполнением команд (OoO — out-of-order). Но даже при том, что вычислительное ядро Intel Atom не менялось несколько лет, при прочих равных условиях этот процессор с in-order архитектурой всё равно оказывается производительнее любых конкурентов на базе ARM. А требования к производительности мобильных систем растут, и многолетний опыт Intel по повышению производительности и эффективности x86-архитектуры может быть реализован в будущих модификациях Atom.
А вот компаниям ARM, Qualcomm и другим в ближайшие годы придётся вкладывать значительные ресурсы в дело увеличения производительности CPU. Процессоры архитектуры x86 прошли аналогичный путь ещё несколько лет назад, и если временно не затрагивать вопрос энергопотребления, уже сейчас нет никаких сомнений в том, что Intel может предложить более производительные процессоры, по сравнению с CPU на базе архитектуры ARM.
Это же касается и пропускной способности и задержек доступа к памяти. Почти все современные SoC на базе ARM имеют посредственную пропускную способность. И лишь в следующих решениях от компании ARM, TI и Qualcomm предполагается использование высокопроизводительных шин памяти. А вот та же линейка Tegra от компании NVIDIA не имеет достаточно быстрой шины памяти и в том числе поэтому порой уступает конкурентам по производительности, имея отличные вычислительные возможности.
У NVIDIA есть большой опыт работы с контроллерами памяти, просто они пока не уделяли пристального внимания шине памяти в Tegra. Зато Intel всегда уделяла достаточно внимания для повышения производительности в целом, в том числе и подсистемы памяти. Что прекрасно видно при сравнении производительности подсистемы памяти Atom и мобильных SoC в некоторых синтетических тестах — ПСП и задержки доступа у решения Intel гораздо лучше. Им сейчас нужно заниматься снижением энергопотребления, а не наращиванием производительности, с которой и так всё в порядке.
Итак, с производительностью более-менее понятно, тут у Intel и опыт и ресурсы есть. Что касается поддержки беспроводных сетей, то у них пока нет опыта работы в сетях 3G/LTE, зато с WiFi всё теоретически должно быть в порядке, так как беспроводными сетями по этой технологии они занимаются давно. Ну а для мобильных сетей они приобрели Infineon Wireless, получив опытный коллектив с разработками оборудования для сетей 3G и LTE. Кроме этого, у них теперь есть и Silicon Hive, занимающаяся решениями по обработке цифровых сигналов, а также производитель антивирусного ПО McAfee, да и в целом — преимущество Intel по «программной» части (компиляторам и библиотекам) оспорить трудно.
И пусть в беспроводных технологиях до этого времени пока что лидировала компания Qualcomm, то в случае сетей LTE её преимущество уже не столь заметно. Кроме Intel и Qualcomm, достаточно сильным игроком теперь стала компания NVIDIA, которая приобрела компанию Icera – производителя чипсетов мобильной связи. Да и такие компании как Samsung, NTT DoCoMo и Fujitsu также разрабатывают аналогичные продукты. Так что в данном случае Intel выходит на рынок гораздо лучше подготовленной, чем это было раньше.
Энергоэффективность и технологический процесс
И тут мы подходим к вопросу, который мы временно отложили из рассмотрения. Это вопрос энергоэффективности и низкого потребления энергии, обязательных для ультрамобильных устройств вроде смартфонов. И пока что системы-на-чипе на базе ARM тут оставляли Intel Atom далеко позади. И это — главная причина, по которой ARM сейчас доминирует на рынке мобильных процессоров.
До недавних пор Intel не могла предоставить рынку достаточно энергоэффективную систему-на-чипе. Ведь одной производительности мало, мобильное устройство должно уметь проработать достаточно времени, чтобы оставаться полезным его владельцу. Поэтому мобильная SoC должна потреблять мало энергии в режиме ожидания, да и при работе с вычислительной нагрузкой аппетит не должен быть слишком нескромным.
Первая информация о Moorestown — системе на чипе от Intel, ориентированной на мобильные устройства, появилась в 2007 году. В следующие годы Intel показывала на IDF прототипы устройств на Moorestown, а в 2009-2010 даже были анонсированы готовые решения от некоторых производителей. К сожалению, тогда дальше этого дело не пошло и наверняка во многом из-за слишком высокого потребления энергии той системой.
Но теперь, с анонсом платформы под кодовым названием Medfield, компания Intel показала, что у неё есть наработки, позволяющие приблизиться по энергоэффективности к существующим решениям на базе ARM. Производители систем на ARM действительно смогли добиться очень низкого энергопотребления от своих систем и до появления Medfield эти компании явно превосходили по этому параметру ранние решения Intel для рынка смартфонов. Но всё же, через несколько лет после появления первых процессоров Atom, компания Intel смогла создать систему-на-чипе, которая вполне способна составить конкуренцию для существующих аналогичных решений на основе ARM.
Но мы не зря подчеркнули слово «существующих». На данный момент, Medfield сравним с ARM решениями разве что нынешнего поколения, уже какое-то время продающегося в виде готовых смартфонов и планшетов на розничном рынке. А для оценки конкурентоспособности Medfield нужно учитывать ещё и следующее поколение таких систем. Которое, скорее всего, будет всё же несколько лучше по энергоэффективности.
Но не стоит снова списывать Intel со счетов. У этой компании в собственности есть, пожалуй, лучшие заводы в отрасли, что позволило ей успешно конкурировать с компанией AMD даже в не самые удачные для себя периоды времени. Системы-на-чипе платформы Medfield сейчас производятся по 32 нм технологическому процессу с использованием high-k, который отличается весьма низкими утечками, и в том числе поэтому Atom смог подобраться, а то и превзойти существующие ARM-решения, производящиеся по 40/45 нм техпроцессам.
Компания Intel разделила свой техпроцесс на процесс низкого потребления (low power) и высокопроизводительный (high performance) несколько лет назад, и Medfield как раз использует «малопотребляющий» 32 нм LP техпроцесс. Intel приводит цифру в 10 раз меньших токов утечек, по сравнению с лучшими из 45 нм производств. По сравнению с предыдущим решением Moorestown, новый Medfield потребляет на 43% меньше энергии или способен работать на 37% большей частоте при том же уровне потребления. С техпроцессами других компаний его сравнить заметно сложнее, но похоже, что 32 нм LP на заводе Intel куда ближе к 28 нм LP, чем к 40 или 45 нм на тех же TSMC или Samsung.
Ну а следующий шаг Intel – переход на 22 нм техпроцесс с использованием так называемых 3D-транзисторов (3D Fin Field Effect Transistor). Этот переход должен дать значительное преимущество при работе чипов на низком напряжении, и 22 нм чипы будут примерно наполовину более энергоэффективными, чем 32 нм. Влияние этого перехода можно будет скоро оценить по процессорам Ivy Bridge для настольных ПК, а для мобильных систем он будет ещё важнее — ведь вопрос энергопотребления для них самый главный.
И если компания Intel продолжит улучшать своё производство такими темпами и дальше, то она будет опережать своих конкурентов по технологиям производства на несколько месяцев, что даст ей значительное преимущество. При большей плотности транзисторов, более совершенный техпроцесс даст Intel дополнительные возможности по снижению энергопотребления и повышению энергоэффективности.
Ведь производители систем-на-чипе на ARM не имеют собственных производств (кроме Samsung, разве что) и соревнуются в том, чтобы обеспечить выпуск SoC на лучшем техпроцессе. Кроме Intel и Samsung, все остальные компании зависят от внешних разработок таких компаний как TSMC и GlobalFoundries. Кстати, Samsung также не прочь предоставить своё производство другим разработчикам микросхем.
Все эти компании отстают от Intel по темпам модернизации своего производства. Так, если Intel поставляет чипы с диэлектриками high-k уже несколько лет, то GlobalFoundries не производила коммерческих поставок чипов с использованием этой технологии вплоть до прошлого года. Да и выход годных чипов, произведённых по этой технологии у них не столь высок, как планировалось. У Intel же есть богатый опыт изготовления чипов с применением диэлектриков high-k: Penryn, Nehalem и Sandy Bridge, а после перехода всех производителей на 28 нм, Intel уже перейдёт на 22 нм и в очередной раз извлечёт явную выгоду по производительности и энергоэффективности.
Графические ядра в мобильных системах
В последние годы среди решений мобильной графики можно было отметить два видеоядра: PowerVR и Adreno от компании Qualcomm. Интересно, что их корни исходят из очень старых решений прошлого века, разработанных тогда для настольных ПК с архитектурой x86. Imagination Technologies (в то время она называлась VideoLogic) разработала тогда несколько видеочипов для настольных ПК, которые использовали оригинальную систему 3D-рендеринга и производились на производстве компании NEC.
PowerVR стали первыми распространенными на рынке видеочипами, использующими технологию отложенного (deferred) текстурирования, когда текстурируются только видимые полигоны, а перекрытые другими полигонами области отбрасываются. В то время использовались в основном классические графические архитектуры, и по сравнению с ними, технология PowerVR позволяет увеличить эффективность использования шины памяти, повысив эффективную скорость заполнения (филлрейт).
Но из-за многочисленных проблем с драйверами, а также низкой производительностью в некоторых условиях, продукция PowerVR в мире ПК тогда провалилась и компания покинула рынок высокопроизводительной графики. Зато для продуктов с низким потреблением энергии и высокими требованиями к эффективному использованию пропускной способности памяти их архитектура подошла отлично!
Кроме того, в дальнейшем PowerVR перестала сама выпускать чипы, занимаясь только разработкой и продавая лицензии на свои ядра — как это делала ARM. Это позволило сконцентрировать внимание компании не на производственных проблемах, а на архитектурных особенностях PowerVR. С тех пор оригинальная архитектура применяется в различных процессорах (в том числе служила и основой некоторых видеоядер, интегрированных в процессоры Intel), но особенно широкое распространение она получила именно в качестве мобильной графики.
Компания Qualcomm и её графические решения Adreno являются вторыми по важности игроками на этом рынке. Qualcomm в своё время выкупила технологию Adreno у компании AMD, которая, в свою очередь, приобрела Adreno вместе с ATI. А уж ATI получила технологию, которая вошла в линейку продуктов Imageon, после покупки широко известной в узких кругах компании BitBoys. История которой заслуживает отдельной статьи, к слову. В случае Qualcomm нас интересует скорее то, что основной костяк программистов BitBoys позднее покинул эту Qualcomm, основав свою компанию SIRU Innovations Oy, и теперь не совсем понятно, что будет с развитием собственной мобильной графики в Qualcomm.
Так что получается, кроме PowerVR больше и нет ничего? Пока что позиции Qualcomm вполне сильны — у них есть Adreno 225, который будет реализован в платформе Krait. Это очень мощное решение, которое явно быстрее, чем лидер своего времени PowerVR SGX 543MP2. Ну и оба этих решения явно быстрее видеоядра NVIDIA Tegra 3, графическая архитектура которого, к сожалению, уже изрядно устарела. И если Intel вряд ли сможет использовать в своих SoC видеоядра Adreno и Tegra, то PowerVR всегда остаётся для них отличным вариантом, тем более, что у них есть акции этой компании. И ещё посмотрим, что там финны из SIRU родят.
Платформа Medfield
Как мы уже писали, компания Intel ранее уже предпринимала попытку выхода на рынок ультрамобильных устройств со своей платформой Moorestown. К сожалению, устройств на его базе в продажу в итоге не поступило, да и анонсирован толком был лишь один смартфон от компании LG, так и не увидевший свет. В отличие от Moorestown, платформа Medfield предлагается не просто в виде компонентов для смартфонов и планшетов, но существует и в виде устройства референсного дизайна, который можно брать за основу своих разработок. Новая платформа уже получила поддержку нескольких производителей, таких как Motorola и Lenovo. Они анонсировали сделки с Intel, включающие выпуск смартфонов и планшетов, а Lenovo уже даже показала K800 — модель смартфона для китайского рынка.
Ещё в сентябре прошлого года компания Intel показывала на IDF смартфон и планшет на базе Medfield, работающий под управлением Android 2.3 и 3.x, соответственно. Именно тогда Intel и Google объявили о начале совместной работы по оптимизации Android для мобильных процессоров Intel Atom. Поддержка Google очень важна для Intel, пока что слабо представленной на рынке мобильных устройств, а совместные усилия компаний призваны ускорить её выход на рынок SoC для смартфонов и планшетов.
В декабре Intel сообщила о готовности Android 4.0 для устройств, основанных на системе-на-чипе Medfield. О простоте этой адаптации говорит тот факт, что запустить Android 4.0 на Medfield удалось в течение суток после публикации компанией Google исходного текста ОС новой версии. Драйверы для планшетов и смартфонов на базе Medfield уже предложены производителям оборудования, но Intel продолжает сотрудничать с производителями устройств, помогая оптимизировать систему для их продуктов на базе мобильных систем Atom.
Все компоненты Medfield находятся на одном кристалле, в отличие от предыдущей платформы, которая содержала две микросхемы: процессор и системный концентратор Langwell. Эволюцию ультрамобильных платформ Intel в общих чертах хорошо видно на схеме:
Итак, основой Medfield является одно ядро CPU, максимальная тактовая частота которого в турборежиме достигает 1,6 ГГц. Intel утверждает, что одноядерная конфигурация CPU была выбрана сознательно, так как большинство приложений пока что всё равно не умеет использовать более чем одно вычислительное ядро. Тем не менее, в следующем году должны выйти на рынок смартфоны, основанные на двухъядерном Atom. Вероятно именно тогда, по мнению Intel, должны вдруг появиться и многопоточные приложения.
При меньшем размере единого 32 нм чипа и сниженном потреблении энергии, а также большей производительности CPU ядра, Medfield обеспечивает и поддержку памяти типа LPDDR2 с вдвое большей пропускной способностью, а также улучшенные возможности по обработке видеоданных и статичных изображений. Для последней задачи в Medfield используются разработки компании Silicon Hive, которая специализируется на технологиях параллельных вычислений для систем-на-чипе. Эта компания в 2007 была выделена из состава Philips Electronics, а в марте прошлого года она куплена компанией Intel.
Более подробная схема Medfield показывает изменения по сравнению с Moorestown. Голубым цветом выделены те блоки, что уже были в предыдущем чипе, зелёным — изменения с тех пор, а появившиеся в Medfield новые блоки имеют оранжевую заливку:
Как видите, немного изменилось CPU ядро, контроллер дисплея и поддержка камер. А вот новых блоков в Medfield ещё больше, ведь теперь он стал полноценной системой-на-чипе, в состав которой входит быстрое видеоядро, блоки видеокодирования и декодирования, обработки изображений и звука, контроллер LPDDR2 памяти, встроенная модемная часть и другие контроллеры, которые в Moorestown были в отдельном чипе Langwell.
Вместо двух чипов общей площадью 386 мм² все блоки поместили в один чип площадью 144 мм² (включая 1 гигабайт LPDDR2 памяти), что в 2,7 раза меньше. При этом упаковка чипов уменьшилась в размерах с 2200 мм² до 600 мм² — более чем втрое. Ещё одно важное отличие в том, что состав нового SoC Medfield включает 1 ГБ оперативной памяти типа LPDDR2, в отличие от своего предшественника, не имеющего начиповой памяти.
Хотя Intel не даёт размер самого основного кристалла (144 мм² — это весь чип, да ещё и с памятью) но для Atom Z2460 его площадь находится примерно между Tegra 2 и Tegra 3 от NVIDIA, то есть между 90 и 49 мм². Для одного CPU и видеоядра PowerVR SGX 540 на 32 нм это не так уж мало, учитывая пять CPU ядер в Tegra 3 и несколько более производительный GPU, а также 40 нм техпроцесс. Конечно, те же системы-на-чипе от Apple имеют большую площадь, но они и основаны на двух- или четырёхъядерных видеосистемах SGX 543 MP2 или SGX 543 MP4 и имеют по два ядра Cortex-A9.
Появление мобильных устройств на платформе Intel Medfield с ОС Android ожидается в текущем году, и первые их них были показаны на январской выставке CES 2012. Так, на выставке был показан прототип смартфона Lenovo K800, который должен поступить в продажу одним из первых. Ещё одним серийным аппаратом на платформе Medfield должен стать смартфон Orange London, а в дальнейшем появятся и другие изделия с Android 2.3, 3.x или 4.0 в качестве ОС, причём выбор версии остаётся за производителем устройства. По оценке самой Intel, массовые продажи таких устройств начнутся в начале лета.
Улучшенное вычислительное ядро
Medfield — это название платформы, кодовое имя Penwell носит конкретная модель SoC, а ядро CPU внутри него называется Saltwell. Само по себе оно практически такое же, что и ядро Bonnell в первом процессоре Intel Atom, правда в нём всё же сделали несколько изменений, направленных на увеличение производительности и снижение потребления энергии.
Архитектура Intel Atom была анонсирована уже около пяти лет назад, и она почти не изменилась с тех пор, так что вы можете прочитать материалы многолетней давности и понять, что за ядро помещено внутрь Medfield. Это всё та же in-order архитектура, имеющая поддержку технологии виртуальной многоядерности Hyper-Threading и способная одновременно исполнять до двух команд за такт.
Это довольно простое ядро, в котором нет выделенных целочисленных блоков умножения, они используют те же аппаратные блоки, что и вычисления с плавающей запятой. Для поддержки Hyper-Threading некоторые из блоков (вроде файла регистров) продублированы, но количество исполнительных блоков в целом не слишком велико. Целочисленный конвейер Atom имеет 16 стадий, что вдвое больше, чем у Cortex-A9. Такой длинный конвейер в мобильном процессоре Intel применяется, чтобы добиться приемлемого энергопотребления.
Подход компании Intel к построению мобильного ядра Atom в итоге оказался оправданным, так как в тестах производительности даже одно ядро Saltwell вполне справляется с двухъядерными аналогами на базе Cortex-A9. Похоже, что хотя архитектурно разница между ядрами Atom и Cortex-A9 не так уж велика, но некоторые умные архитектурные решения в мобильном ядре Intel дают ему преимущество.
Вероятно, Intel права в том, что хотя сама по себе операционная система Android неплохо распараллелена, большинство распространённых приложений для неё на данный момент не могут по-максимуму воспользоваться преимуществом двух и более вычислительных ядер, уже имеющихся в SoC, использующих архитектуру ARM. Возможно, при работе на высокой частоте и с загрузкой двух ядер Cortex-A9 соответствующие системы-на-чипе и смогут встать на один уровень с Medfield по скорости, но такое использование пока что имеет мало отношения к реальности и является искусственным.
Но ведь системы на Cortex-A9 уже довольно давно производятся, и на смену им скоро должны прийти SoC уже с Cortex-A15 ядрами. И когда это произойдёт, без значительных архитектурных изменений в Atom у Intel уже могут появиться некоторые проблемы. Ведь Cortex-A15 — это значительно более сложное и современное ядро, также out-of-order, как и A9, но заметно более производительное (по оценкам ARM, до 40% быстрее при равных условиях). Скорее всего, системы-на-чипе на базе Cortex-A15 ядер смогут превзойти Medfield в его текущем виде. Да и Krait от Qualcomm тоже должен быть примерно на уровне Cortex-A15, так что текущее преимущество одноядерного Medfield над двухъядерными ARM может улетучиться уже довольно скоро.
Но пока что это преимущество есть, и давайте посмотрим, что сделано в Saltwell, чтобы улучшить его конкурентоспособность. С точки зрения производительности, изменений в нём минимум. Выполнены только минорные твики, вроде повышения скорости копирования данных из/в памяти, улучшения в предсказателе переходов и т.п. Можно отметить и поддержку начиповой 1 ГБ LPDDR2 памяти, работающей на частоте 400 МГц, которая дала двойной прирост пропускной способности, по сравнению с предыдущим решением.
Очень многое в Saltwell сделано для улучшения энергоэффективности. Как и в других моделях Atom, ядро имеет кэш-память второго уровня объёмом 512 КБ, но есть ещё отдельная статическая память со своей линией питания. В этой памяти хранится состояние CPU и данные из кэш-памяти при погружении самого вычислительного ядра в режим низкого потребления энергии, что улучшает его итоговые показатели энергоэффективности.
Ещё более интересна технология Intel Burst Performance (BPT), динамически увеличивающая производительность при необходимости. Аналогичные решения с турбо-частотами сейчас применяются повсеместно, у многих производителей есть схожие технологии. BPT может кратковременно увеличить рабочую частоту CPU ядра до установленного предела, если при этом оно не выходит за рамки определённого энергопотребления.
Универсальное вычислительное ядро Medfield работает в нескольких режимах, отличающихся рабочей частотой и режимами питания. Его частота эффективно масштабируется в широком диапазоне частот, от режима простоя C6 и режима малой нагрузки с низкой частотой (low frequency mode — LFM) до режима с высокой нагрузкой и частотой (high freq mode — HFM) и режима пиковых нагрузок с максимально возможной частотой для CPU.
Самый низкий уровень потребления Saltwell показывает в режиме простоя C6, в нём ядро и L2 кэш-память отключены от питания (power gated) и их состояние сохранено в начиповой статической памяти. Поэтому общий уровень потребления энергии в режиме C6 близок к нулю. Сама по себе технология, названная Intel Smart Idle (Intel SIT) не нова, компания уже ранее делала подобную функциональность в Nehalem, например.
В активном режиме процессорное ядро способно работать на частотах от 100 до 1600 МГц с шагом в 100 МГц. Причём, частота 1,6 ГГц является турбо-частотой и не может поддерживаться длительное время, точно как Turbo Boost в настольных процессорах Sandy Bridge. Максимальная частота, на которой возможна длительная работа, в случае первой модели платформы Medfield равна 1,3 ГГц, но довольно часто она поднимается выше этого предела.
По всей видимости, выход годных чипов Atom Z2460, использующих 32 нм LP техпроцесс, в дальнейшем улучшился, и теперь максимальный предел турбо-частоты для них был поднят до планки в 2 ГГц, при сохранении максимальной «обычной» частоты в 1,3 ГГц. Вероятно, можно ожидать дальнейшего увеличения частот и для других моделей, но лишь в турборежиме, а в обычном же частота всё равно будет ограничена уровнем потребления энергии.
Видеоядро и обработка видеоданных
Вместо видеоядра PowerVR SGX 535, известного по Moorestown и Lincroft, в состав систем-на-чипе платформы Medfield вошла более совершенная версия GPU — модель SGX 540. И хотя показатель скорости заполнения (филлрейта) у этих видеоядер одинаковый, но треугольников и пикселей обновленное видеоядро способно обрабатывать больше. Его геометрическая производительность выросла с 31 миллионов треугольников в секунду до 40 миллионов, а пиксельные шейдеры способны выполняться до двух раз быстрее.
Видеоядро PowerVR SGX 540 известно нам по нескольким системам-на-чипе, таким как TI OMAP 4460, разве что в чипе от Texas Instruments оно работает на несколько меньшей частоте, чем в первом чипе платформы Medfield. Используемый в Atom Z2460 графический процессор работает на частоте в 400 МГц, из графических API поддерживаются OpenGL ES 2.0 и OpenVG 1.1, так что тут тоже нет ничего нового.
Похоже, что применение не самой новой модели GPU от PowerVR объясняется тем, что Intel выводит на рынок свои мобильные SoC несколько позже ранее планируемого срока. И к счастью, в будущей двухъядерной версии Medfield установлено уже гораздо более мощное видеоядро PowerVR SGX 543MP2.
Для вывода изображения чипами Medfield поддерживается уже три дисплея: два внутренних и один внешний (HDMI), вместо одного внутреннего и одного внешнего у Moorestown. Поддерживается порт HDMI 1.3a с HDCP 1.2, максимальное разрешение встроенных экранов до 1280×1024 (при 18-бит на цвет и 60 Гц), а внешнего — до 1920×1080 при 30 Гц. К слову, такого разрешения внутреннего дисплея уже сейчас может быть недостаточно для планшетов, особенно с учётом появления на рынке моделей с разрешением, превышающим FullHD, которое системой-на-чипе от Intel просто не поддерживается.
Зато, кроме обычной проводной передачи изображения, Medfield поддерживает беспроводную передачу картинки по технологии Intel Wireless Display или коротко — WiDi. Она позволяет передавать изображение и звук с мобильного устройства на экран телевизора или монитора по WiFi. Конечно, для передачи по WiFi приходится на лету сжимать изображение, если это не уже сжатый видеопоток Blu-ray, и качество в итоге будет несколько хуже чем при «проводном» подключении. Плюс к этому, хотя поддерживается разрешение вплоть до 1920×1080, но при частоте кадров лишь 30 FPS. То есть, WiDi хорошо подойдёт не для всех видов занятий, но для многих типов развлечений, вроде кино и неспешных игр — вполне.
С телефона на экран можно выводить всё, что угодно, вместе с двухканальным звуком в формате 48 кГц LPCM. Естественно, для этого придётся приобрести специальный WiDi-сертифицированный приёмник для приёма сигнала и вывода его по HDMI на устройство вывода изображения, ведь большинство из них пока не имеют встроенной поддержки WiDi. Поддержка этой технологии есть в последних версиях операционной системы Android, можно использовать второй монитор как клон основного или растягивать рабочий стол на два устройства вывода.
Но чтобы вывести на экран какой-то видеоролик, нужно сначала его декодировать. А по нашим многочисленным практическим материалам вы знаете, что у многих SoC в реальном применении возникают проблемы с поддержкой аппаратного декодирования разных форматов. Достаточно привести в пример устройства на базе NVIDIA Tegra 2, которые не всегда в состоянии аппаратно декодировать видеоданные в некоторых форматах.
В Medfield аппаратная поддержка по кодированию и декодированию видеоданных была улучшена — благодаря включению в состав SoC блоков обработки видеоданных от Imagination Technologies: блока аппаратного декодирования VDX385 и видеокодирования VDE285, в нём появилась полноценная поддержка Full HD. Если Moorestown умел ускорять декодирование одного потока видео в формате 1080p и кодирование в разрешении лишь 720p, то Medfield умеет кодировать в 1080p, а декодирует два потока 1080p одновременно.
Системой на чипе Intel Medfield поддерживается аппаратное декодирование следующих форматов видео: H.264 профилей Baseline (уровень L3), Main и High (L4.2, до 1080p при 60 FPS), MPEG4 Simple profile (L3), Advanced simple profile (L5), VC1 Simple (Medium), Main (High), Advanced (L4 до 1080p при 60 FPS), WMV9 Simple (Medium) и Main (High), а также H.263 Baseline (уровень L70). Заявлена поддержка декодирования видеоданных с битрейтом вплоть до 50 Мбит/с, поддерживается обработка двух каналов в формате FullHD, что будет полезно для стереорежима и при проведении видеоконференций.
Аппаратное кодирование видеоданных системой-на-чипе Medfield возможно в следующие форматы: H.264 профиль Baseline с битрейтом до 20 Мбит/с и разрешением до 720p и 1080p при 30 FPS, MPEG4 профиль Simple с битрейтом до 10 Мбит/с и разрешением до 720p при 30 FPS, а также H.263 профиль Baseline с битрейтом до 8 Мбит/с и разрешением до 720×240 при 60 FPS или 720×288 при 50 FPS. Это хоть и довольно неплохой уровень для современной системы-на-чипе, но ничего сверхъестественного в такой поддержке нет.
Поддержка камер и обработка изображений
Для мобильных устройств очень важно иметь хорошую поддержку фото- и видеосъёмки на встроенные камеры, да ещё с их продвинутой обработкой. И у Medfield эта поддержка улучшена — если предшествующий Moorestown поддерживал камеры с размером сенсора до 5 мегапикселей, то новый SoC умеет обрабатывать данные с 16-24-мегапиксельной основной камеры (при условии установки таких сенсоров производителями) и 2-мегапиксельной дополнительной. Для основного датчика изображения используется интерфейс MIPI CSI x4, для дополнительного — MIPI CSI x1. Этого более чем достаточно, так как фронтальные камеры обычно имеют не более двух мегапикселей и используются лишь для видеоконференций и телефонии.
Для Medfield декларируются некоторые программные и аппаратные возможности, улучшающие поддержку фото- и видеосъёмки, такие как качественное шумоподавление, поддержка высокой частоты захвата кадров, позволяющая добиться высокой скорости серийной съёмки, а также качественная стабилизация по двум осям при фото- и видеосъёмке. Естественно, что автофокусировка, автоэкспозиция и автоматический баланс белого также поддерживаются.
Максимальная производительность основной фотокамеры при обработке данных с 16-мегапиксельного сенсора составляет 15 кадров в секунду, а для видео возможны захват и запись изображения в формате до FullHD при 30 FPS или 720p при 60 FPS. Но если такой видеозаписью нас уже не особо удивишь, то возможность серийной съёмки со скоростью в 15 FPS довольно редка для столь компактных устройств.
Такая скорость позволяет поймать любой момент, который слишком скоротечен, чтобы успеть вовремя нажать кнопку камеры лишь один раз. К сожалению, скорость в 15 кадров в секунду поддерживается лишь для 10 последовательных кадров, зато из них можно будет выбрать наиболее удачный снимок в полном разрешении (см. иллюстрацию).
За большинство отмеченных функциональных возможностей в системе-на-чипе отвечает программируемый процессор обработки изображений (Imaging Signal Processor). Именно он занимается шумоподавлением, стабилизацией изображения, обработкой кадров серийной съёмки, автоматическим балансом белого, распознаванием лиц, цифровым увеличением, коррекцией хроматических аберраций и т.д.
Компания Intel в своём мобильном чипе использует процессор обработки изображений с производительностью до 240 мегапикселей в секунду. По заявлениям компании, его возможности находятся на одном уровне с процессорами зеркальных фотокамер начального уровня. И в это вполне можно поверить, так как далеко не каждая «зеркалка» способна производить серийную съёмку на скорости 15 кадров в секунду, да и видео с 60 FPS не все фотокамеры умеют снимать. Но откуда у чипа такие продвинутые возможности, если Intel не занималась ранее обработкой изображений? Мы уже упоминали выше по тексту о приобретённой ими компании Silicon Hive — именно их разработки и используются в процессоре обработки изображений в Medfield.
Модели Atom для ультрамобильных устройств
Всего на данный момент планируется выпустить три модели SoC на основе Atom: Z2000 для недорогих устройств, Z2460 для смартфонов и Z2580 более высокого уровня, отличающийся двухъядерным CPU и GPU. Все они производятся или будут производиться с применением 32 нм техпроцесса с High-K/metal gate и отличаются друг от друга как количеством и частотой вычислительных устройств, так и их возможностями.
32 нм LP
32 нм LP
32 нм LP
Кол-во CPU, ядер/потоков
1/1
1/2
2/4
1,0
1,3
1,3
Турбо-частота CPU, ГГц
—
1,6-2,0
1,8
PowerVR SGX 540
PowerVR SGX 540
PowerVR SGX 544MP2
320
400
533
двухканальная LPDDR2
двухканальная LPDDR2
двухканальная LPDDR2
2013 г.
середина 2012 г.
2013 г.
Для нас сегодня наиболее интересен Atom Z2460, который даст жизнь первым массовым x86-смартфонам. Как мы уже отметили выше, он основан на одном ядре Saltwell с поддержкой Hyper-Threading и его максимальная турбо-частота составляет 1,6-2 ГГц. Применяется двухканальный интерфейс памяти LPDDR2, а видеоядро PowerVR SGX 540 работает на частоте 400 МГц. Данное решение имеет в своём составе радиочасть Intel XMM 6260, обладающее поддержкой HSPA+, но не LTE.
Модель Atom Z2580 — это верхняя модель линейки, по производительности она более чем вдвое превосходит Atom Z2460, и содержит улучшенный модуль связи с поддержкой не только 3G и 2G, но и LTE. Базовая тактовая частота двух ядер CPU с поддержкой Hyper-Threading (два ядра, четыре потока) составляет 1,3 ГГц, а турбо-частота может достигать отметки 1,8 ГГц.
Рабочая частота двухъядерного видеоядра PowerVR SGX 544MP2 в этой модели равна 533 МГц, что серьёзно усилит 3D-производительность по сравнению с Z2460. SGX 544 схож с моделью SGX 543, используемой в Apple A5 (на нём основаны iPad 2 и iPhone 4S), из изменений можно отметить лишь поддержку Direct3D 9.3. При частоте GPU в 533 МГц этот SoC по 3D-производительности будет до двух раз быстрее, чем SGX 543MP2 в Apple A5. Всё было бы хорошо, но система-на-чипе A5X уже сейчас имеет четырёхъядерное PowerVR SGX 543MP видеоядро, которое ещё быстрее.
Платформа Z2580 включает улучшенный радиоблок Intel XMM 7160 LTE, который является модернизированной версией XMM 7060 с добавлением поддержки стандарта 3GPP Release 9 от соответствующего консорциума, разрабатывающего спецификации мобильной телефонии. Это решение поддерживает множество стандартов мобильной связи: 2G, 3G, LTE, HSPA+, UMTS. Данный чип уже начал производиться, но готовые продукты на его основе появятся лишь в первом полугодии следующего года.
Для использования в бюджетных моделях телефонов предлагается младшая модель Intel Atom Z2000, в состав которой входит одно ядро CPU, работающее на частоте 1,0 ГГц и не имеющее ни поддержки виртуальной многопроцессорности, ни работы на повышенной турбо-частоте. Это недорогое решение должно конкурировать с недорогими системами-на-чипе на базе вычислительных ядер с архитектурой ARM.
Модель Z2000 имеет в своём составе видеоядро SGX 540, работающее на частоте 320 МГц (вместо 400 МГц у средней модели Medfield), а возможности по кодированию видеоданных ограничены разрешением 1280×720 (720p), хотя декодирование 1080p всё же поддерживается. Модель имеет радиочасть Intel XMM 6265 с поддержкой HSPA+ и двух SIM-карт, а появление готовых продуктов на базе этой системы ожидается в конце этого или начале следующего года.
Как видите, на базе Medfield планируется выпускать не только дорогие устройства. Так, смартфон ZTE на системе-на-чипе Intel Atom Z2000, специально созданной для использования в бюджетных устройствах, будет стоить порядка $160. Интересно, что все модели Medfield имеют свои референсные дизайны от Intel. Например, референсный дизайн устройства на Atom Z2000 имеет иной форм-фактор, по сравнению с эталонными устройствами на Z2460 и Z2580, что вполне естественно, так как они нацелены на совершенно разные сегменты рынка. И хотя большинство крупных производителей всегда делает свой дизайн для мобильных устройств, референсные продукты могут выпускаться мобильными операторами под своими марками, что и произойдёт в случае Atom Z2460.
Референсный дизайн смартфона на Atom Z2460
Референсными дизайнами смартфонов для своих SoC компания Intel занялась не просто так, ведь это сильно помогает в продвижении устройства на рынок, даже если отдельные производители и не испытывают должного энтузиазма по их использованию. История эталонных устройств тесно связана с Майком Беллом (Mike Bell), ранее работавшим в Apple и Palm, под предводительством которого и были созданы референсные устройства на базе Medfield.
Предоставление референсного дизайна помогает производителям, снижая затраты на разработку и сокращая сроки проектирования, ровно так же, как это происходит с системными платами, например. Много назад Intel начала конструировать и снабжать производителей системных плат референсными дизайнами плат на основе своих чипсетов. А те модифицировали эталонный дизайн под свои нужды, внося изменения, которые добавляли платам оригинальности. Кроме уменьшения сроков выхода товара на рынок, такая стратегия приводит и к тому, что производители конкретных изделий не занимаются одинаковыми для всех задачами, а делают только то, что отличает их решения друг от друга.
Эталонная платформа на базе Atom Z2460 делает ровно то же самое для смартфонов на основе этой системы-на-чипе от Intel. Компания предоставляет партнёрам добротную и стабильную конструкцию смартфона, этим самым сокращая для них сроки разработки аппаратной части. И у производителей остаётся больше времени на другие цели, в том числе визуальное дизайн-решение, разработку программного обеспечения и др.
Существует несколько прототипов телефонов на базе Medfield, но выбранный в итоге вариант оказался настолько качественным, что вполне может продаваться под разными торговыми марками, как это давно делается с множеством других высокотехнологичных продуктов (да и в сфере производства мобильных телефонов распространено). Intel привлекла все необходимые ресурсы для того, чтобы не просто вывести саму по себе платформу Medfield на рынок, но и изготовить очень неплохие референсные смартфоны на базе чипов Atom, которые могут продаваться сторонним компаниям для продажи под своими торговыми марками.
Как мы уже отметили выше, так как модемная часть у этой системы Intel XMM 6260, она поддерживает HSPA+, но не LTE. Интересно, что за WiFi-связь в прототипе отвечает контроллер от Texas Instruments, так как у подразделения компании Intel, занимающегося беспроводной связью, пока что нет готового решения с достаточно низким энергопотреблением для применения в смартфонах. Но в будущем они, конечно же, появятся.
Референсная платформа Medfield, , доступна для партнёров компании Intel и они её уже используют. Даже оригинальные модели, вроде Lenovo K800, основаны на модифицированной версии референсного дизайна от Intel, не говоря уже о просто маркированных операторских телефонах от европейской Orange и индийской Lava. И это далеко не всё, довольно скоро можно ожидать появления и других моделей на базе новой системы-на-чипе от Intel.
Совместимость ПО и двоичная трансляция
Одним из важнейших вопросов выхода Medfield на рынок смартфонов с системой Android является вопрос совместимости. Ведь большинство устройств с Android имеет CPU ядра с ARM-архитектурой, и не все приложения легко запустятся на x86 без модификаций. Хотя с появлением Android 4.0 многое изменилось, появились устройства и на процессорах с архитектурой MIPS, например. Но их пользователи сразу ощутили их неполноценность, так как некоторые из наиболее распространённых приложений (к примеру, игр) просто не запускались на этих мобильных устройствах.
Немудрено, что Intel занялась этим вопросом весьма плотно. Ещё на IDF 2011 компании Intel и Google сообщили о начале сотрудничества по оптимизации операционной системы Android для смартфонов на базе x86-архитектуры. Сама по себе ОС не является проблемным местом, так как «родная» поддержка x86 уже появилась в версии Android 4.0, также известной под названием «Ice Cream Sandwich». Совместная работа компаний заключается в оптимизации основных приложений под x86 и портировании существующего ПО, использующего NDK.
Также Intel разработала специальное ПО для управления питанием, специфическое для их аппаратного обеспечения. Но в компании занимаются не только оптимизацией кода Android под свои системы, но и исправляют в нём общие ошибки, предоставляя информацию об изменениях в Android Open Source Project (AOSP), занимающуюся общим развитием данной операционной системы. Этими своими действиями Intel помогает улучшить ОС даже для платформ, основанных на ARM.
Но проблема не в операционной системе, ведь все версии Android теперь будут выпускаться и для ARM и для x86. Основная проблема — в несовместимости некоторых приложений. Причём, уже существующих, выпущенных до выхода x86-архитектур на рынок смартфонов, так как разрабатываемое с нуля ПО уже может и должно разрабатываться одновременно для разных процессорных архитектур.
Большинство существующих Android-приложений используют виртуальную машину Dalvik (сами приложения пишутся на Java, но используется байт-код другого формата), и им вовсе не нужна определённая архитектура CPU для запуска. Но некоторые из распространённых приложений и игр используют Android Native Development Kit (NDK) — пакет библиотек для разработки приложений на С++, необходимый при разработке критичного к производительности кода.
Основная проблема с совместимостью проявляется, если приложение специально написано для ARM и использует «родной» код для этой архитектуры. Обычно такими приложениями являются требовательные к скорости CPU игры и некоторые другие типы софта. Большинство Dalvik-приложений работают на Intel Atom без каких-либо изменений, но «native» приложения, использующие NDK, нуждаются в перекомпиляции для запуска на x86-совместимых системах, а некоторые из таких приложений и вовсе потребуют дополнительных трудозатрат на портирование кода. Но и тут не о чем волноваться, Intel активно работает со всеми крупными разработчиками приложений для того, чтобы портировать их продукцию на x86-архитектуру.
Для того, чтобы доказать потенциальным пользователям x86-смартфонов жизнеспособность своих идей, Intel показала работу одного из самых важных мобильных приложений на своём смартфоне — игру Angry Birds. Она как раз использует особенности ARM-процессоров и в обычных условиях не работает на CPU других архитектур. Можно не сомневаться в том, что Intel сделает всё, чтобы абсолютное большинство Android-приложений работало на их изделиях, даже те, которые изначально были скомпилированы для другой процессорной архитектуры.
По оценкам Intel примерно 75% всех Android-приложений в магазине Google Play (бывший Market) не используют специфического кода для ARM и теоретически должны работать на x86 без проблем. А вот оставшаяся четверть приложений и является основной проблемой совместимости. Так каким образом Intel сделала так, что всё работает «из коробки», что называется? Ведь пример недорогих устройств на базе MIPS-систем с недостаточной совместимостью довольно свеж, и вряд ли кто-то захочет повторить сей печальный опыт. А ждать оптимизации всех приложений под x86 от самих разработчиков ПО можно очень долго.
Для таких программ в Intel решили использовать двоичную (бинарную) трансляцию кода. Совместная работа со специалистами из Google позволила добиться того, что даже родные для ARM приложения на смартфонах с Intel Atom запускаются и работают без необходимости их портирования. Динамическая двоичная трансляция позволяет большинству NDK приложений запускаться на Medfield и обеспечивает достаточную для нормального использования производительность.
Детали и возможности двоичной трансляции Intel не особо раскрывает, но можно предположить, что транслятор динамически перехватывает ARM код и транслирует его в x86 прямо «на лету», как говорится. При этом в Intel понимают, что 100%-ной совместимости им вряд ли удастся добиться. Предполагается, что при помощи двоичной трансляции доля совместимых приложений ко времени выхода устройств на рынок вырастет до 90%. Конечно, динамическая трансляция сама по себе медленнее выполнения «родного» для CPU кода, но компания Intel настроена довольно оптимистично, а нам остаётся лишь поверить и (по возможности) проверить.
Интересно, что в магазине Google Play на x86-смартфонах должны быть доступны все приложения, как и на ARM-устройствах. Обычно, на мобильных устройствах с CPU другой архитектуры, не имеющей возможности двоичной трансляции, некоторые из приложений недоступны для скачивания и установки. Но в случае продуктов на базе Intel Medfield, к моменту появления их на рынке, большинство приложений (в том числе и использующие ARM-код) будет работать на них как на ARM-устройствах.
Производительность и потребление энергии
Большое значение высокой производительности CPU и GPU для современных смартфонов вряд ли кто будет отрицать, но ещё более важны технологии энергосбережения и, в результате, высокая энергоэффективность и время автономной работы. Ведь мало кого устроит телефон, который не может «прожить» без подключения к электросети хотя бы один день. Это подтверждается запросами пользователей, которые больше всего хотят именно увеличения времени автономной работы:
Сейчас ведь как раз и получается, что большинство смартфонов при более-менее активном использовании (но без крайностей, ибо активный веб-сёрфинг по 3G или 3D-игра могут посадить батарею за несколько часов) способны автономно отработать лишь 1-2 суток. Соответственно, одним из главных требований пользователей к телефонам является продолжительность работы от батареи. И это — важнейшая задача всех производителей, они все стараются если не увеличить это время, то хотя бы не уменьшить.
Что сейчас можно сказать по вопросам производительности и потреблению энергии у Medfield, если финальных продуктов у нас ещё нет? Практические сравнения ещё впереди, а для начала рассмотрим данные от самой компании Intel. Они дают диаграммы без цифр и конкретных моделей смартфонов конкурентов, в выбранных ими самими бенчмарках и условиях использования:
Конечно, это сравнение неполноценно уже хотя бы потому, что оно проведено заинтересованной стороной, да и использовались в нём уже продающиеся некоторое время на рынке Android-телефоны, а продукты на Medfield только-только начнут свой путь. Тем не менее, отметим, что если верить этим цифрам, то референсное устройство на базе Atom Z2460 показывает лучшую производительность и при этом потребляет меньше энергии, чем большинство сравниваемых смартфонов-инкогнито.
Не будем подвергать сомнению высокие результаты решения Intel в таких тестах, как SunSpider и BrowserMark, ведь они действительно сильны, как показали . Откуда взялась такая разница? Обычно большие приросты в этих тестах получаются при оптимизации Интернет-браузеров, а не при использовании более мощных систем-на-чипе. Сама Intel утверждает, что преимуществ у их решения несколько.
Например, хотя ядра Cortex-A9 сами по себе довольно высокопроизводительны, но во многих задачах их скорость ограничена производительностью медленного интерфейса памяти. И Atom имеет преимущество в случае промахов при чтении из кэш-памяти, быстрее «доставая» необходимые для вычислений данные. Но если дело лишь в этом, то скорый выход SoC на базе Cortex-A15, вполне возможно, сможет изменить ситуацию. Но пока что в таких тестах выигрывает Medfield. Хотя его тестам вполне может помогать турборежим, ведь в бенчмарках CPU ядро может ускоряться до 1,6 ГГц на короткое время, и тут сложно определить, архитектурное преимущество по ПСП перед ARM сказалось или просто более высокая частота Atom и однопоточная природа тестов.
Производительность видеоядра PowerVR SGX 540 в других тестах не настолько хороша, как нарисовано на графике GLBench 2.1. В других GPU тестах его производительность превосходит результаты разве что устаревших систем или SoC, имеющих аналогичные видеоядра от PowerVR, но работающие на более низкой частоте. Например, в TI OMAP 4460 видеоядро работает на 300 МГц, а в Medfield на 400 МГц, поэтому победителем в этой паре станет понятно чьё решение.
Если же сравнивать с другими системами, то более современные GPU вроде Mali 400 MP или Adreno 220 гораздо быстрее решения в Medfield, не говоря уже о четырёхъядерном PowerVR SGX 543 MP4. Сравнивать с видеоядром NVIDIA Tegra сложнее, эта традиционная 3D-архитектура в некоторых мобильных тестах весьма сильна, но в других — серьёзно проигрывает. Вообще, нужно сказать, что качественных 3D-тестов для Android очень мало, все они довольно спорные и общепринятого аналога «настольного» 3DMark явно не хватает.
В рассуждениях о производительности мобильных SoC, предназначенных для смартфонов, нет никакого смысла без учёта данных о потреблении электроэнергии. И тут у Intel есть чем порадовать потенциальных покупателей, Medfield действительно выглядит вполне конкурентоспособно. Пока что у нас есть лишь данные от самой компании, но они впечатляют.
Потребление новой системы-на-чипе компании Intel в разных условиях сравнительно низкое. Само по себе одно ядро CPU платформы Medfield на частоте 100 МГц потребляет около 50 мВт, на 600 МГц — 175 мВт, на 1,3 ГГц — 500 мВт, и на максимальных 1,6 ГГц — до 750 мВт. В режиме простоя для всего чипа общая цифра потребления не превышает 20 мВт, при передаче голосовых данных по 3G сети чип потребляет до 750 мВт, а в режиме веб-сёрфинга около 1 Вт.
Что даже чуть меньше, чем 1,2-1,3 Вт у нынешних топовых смартфонов, вроде Samsung Galaxy S II или Apple iPhone 4S, в этих же условиях. Да и большинство других систем-на-чипе, основанных на ARM-ядрах, потребляют при такой же нагрузке где-то порядка 1 Вт, так что по потреблению CPU части Medfield явно смог удержаться на хорошем уровне. Хорошем, но всё же нынешнем — по сравнению с SoC других производителей, выполненных с применением 40/45 нм техпроцессов. Что будет дальше — только время покажет. Скорее всего, будущие ARM-чипы для смартфонов будут потреблять максимально те же 1-1,5 Вт, но станут заметно производительнее по CPU и GPU частям.
Если перейти к более привычной для нас оценке времени работы от одного заряда батареи, то цифры от Intel таковы: до 10 суток в режиме ожидания, до 48 часов проигрывания музыки и порядка 4-5 часов проигрывания видеоролика высокого разрешения или веб-сёрфинга. Это весьма значительное улучшение для x86-систем, и за снижение требований по питанию нужно благодарить высокую интеграцию новой системы-на-чипе, ведь вся функциональность чипсета для предыдущих моделей Atom была интегрирована в один компактный чип, произведённый по современным технологиям.
«Виновата» в высокой энергоэффективности Medfield и продвинутая система управления питанием, о которой мы уже рассказывали выше. Блоки, находящиеся в режиме простоя, отключаются от питания и почти ничего не потребляют. Ведь при прослушивании музыки вам не нужен дисплей или CPU, работающий на высокой частоте, а в режиме простоя так и вообще нужно лишь поддерживать связь с базовыми станциями мобильной сети, а всё остальное можно отключить. И очень похоже, что Intel смогла догнать системы на базе ARM по энергоэффективности, за что её можно только похвалить.
Сражение между Intel и компаниями, использующими ARM-архитектуру, уже началось. Все они стараются отвоевать рынки, занятые соперниками. Intel целится на мобильный рынок с новыми системами-на-чипе Atom, а ARM с лицензиатами планирует вторгнуться на рынок, где царствует Intel — на настольные и мобильные компьютеры и серверы. И постепенно это сражение становится всё более жарким. Так, после волны успеха планшетов, основанных на чипах с ARM-архитектурой, пришла мода на так называемые ультрабуки, куда ставятся уже более мощные решения от Intel — тут компания чувствует себя на своём поле. Ну и со смартфонами у них уже есть некоторые успехи — пока что в виде соглашений с компаниями Motorola и Lenovo, которые собираются выпускать смартфоны и планшеты на основе новых моделей Atom, рассмотренных в статье.
С другой стороны, компания HP и некоторые другие объявили о намерении использовать чипы с архитектурой ARM в своих серверах в 2012 году. Планируется, что такие серверы будут дешевле и затрат на их работу и обслуживание (электроэнергия, охлаждение) будет меньше. Для применения в серверах будут полезны и будущие 64-битные решения, запланированные компанией ARM. А Qualcomm так и вовсе договаривается с производителями мобильных ПК о производстве тонких и лёгких ноутбуков под управлением Windows 8, имеющих в основе четырёхъядерные системы-на-чипе Snapdragon S4.
То есть, на всех рынках стратегии указанных компаний явно перекрещиваются и идут друг против друга, а выиграют в итоге далеко не все. Скорее всего, нас ожидает не самый спокойный этап развития, когда преимущество будет иметь то одна компания, то другая. В любом случае, в сегменте высокопроизводительных настольных и мобильных CPU дела компании Intel сейчас кажутся непоколебимыми, а с выходом Medfield они делают неплохую заявку и в «смартфонном» и «планшетном» сегментах, не говоря уже о решениях будущего, когда начнёт сказываться технологическое преимущество компании. Надеемся, что покупателям от активной борьбы будет только польза — ведь в условиях жёсткой конкуренции обычно и прогресс быстрее и цены ниже.
Анонсированные решения компании Intel на базе платформы Medfield можно считать более серьёзной попыткой выхода на рынок смартфонов, по сравнению с предыдущим решением Moorestown. Пристальное внимание к этому рынку понятно, ведь смартфоны становятся чуть ли не самыми важными вычислительными устройствами для большого количества пользователей. ПК или ноутбук не всегда поносишь с собой, а смартфон обычно лежит в кармане или сумочке. Но на рынке телефонов смартфоны до сих пор не заняли доминирующей позиции, в 2009 году лишь 17% рынка телефонов США занимали умные телефоны, а в 2011 уже около половины. И этот рост продолжается.
Выпуском Medfield компания Intel наконец-то сделала то, что сможет помочь ей выйти на рынок ультрамобильных систем. После нескольких лет разговоров о том, что они вот-вот выпустят продукты для смартфонов, Intel наконец-то выпустила действительно конкурентоспособный продукт. Да ещё и в виде устройства референсного дизайна, которое серьёзно поможет в деле продвижения x86-совместимых систем-на-чипе. Более того, теперь у Intel есть два сильных партнёра по выпуску мобильных устройств, которые планируют разработку и выпуск смартфонов и планшетов на базе «смартфонных» моделей Intel Atom. Основной поток анонсов и выходов на рынок ещё впереди, но уже сейчас понятно, что успех Medfield на рынке явно превзойдёт «успех» Moorestown.
Причины этого потенциального успеха просты — одно то, что Medfield оказался довольно производительной системой-на-чипе, уже решает многое. И если бы эта платформа вышла на рынок на полгода-год раньше, то она просто стала бы лучшей на рынке и завоевала бы большую его часть. Но даже сейчас одноядерный Atom Z2460 обеспечивает высокую производительность CPU ядра, которая в нескольких общепризнанных тестах выше, чем у продающихся сейчас конкурентов. Хотя производительность GPU части не настолько высока, как у некоторых конкурентов вроде Adreno 220 и Apple A5X, но она вполне конкурентоспособна и достаточна для большинства нынешних смартфонов. Кроме того, модель Z2580 с двухъядерным видеоядром PowerVR SGX 544MP2, работающим на более высокой частоте, вскоре решит и эту проблему.
Но не только производительностью выделяется платформа Medfield и модель Atom Z2460, в частности. Оказалось, что слухи о проблемах с высоким потреблением вычислительных ядер архитектуры x86 изрядно преувеличены. В случае первой модели Medfield, она показывает отличную энергоэффективность. И если потребления энергии конечных устройств мы ещё не знаем, то сама по себе система-на-чипе получилась у Intel достаточно экономичной для применения в смартфонах.
Конечно, благодарить за это нужно не только проведённую работу по повышению энергоэффективности самой SoC и её составных частей, но и более тонкий технологический процесс, по сравнению с конкурирующими чипами. Но раз у Intel есть такое преимущество, то почему бы его не использовать? Более того, именно за счёт указанных в статье преимуществ компании Intel, есть веские основания предполагать, что платформа Medfield и Atom Z2460 станут для компании лишь начальной точкой для отличного старта на рынке смартфонов.
Уже сейчас у Intel получился неплохой чип, который не просто доступен для партнёров в чистом виде, но и предлагается в виде неплохо проработанного устройства референсного дизайна, что ещё может привести к интересным последствиям на рынке. Ведь если мобильные операторы будут продавать референсные телефоны такой мощной компании под своими марками, то они вполне смогут завоевать приличную часть рынка.
Но расслабляться Intel точно рано, ведь одно дело — сравнивать решение с ARM-системами, которые уже несколько месяцев продаются, а совсем другое дело будет, когда выйдут многоядерные системы-на-чипе на основе современных вычислительных ядер Cortex-A15, а также с более мощными GPU-ядрами от других производителей мобильных SoC. Нам с вами остаётся лишь наблюдать за этой борьбой за наши кошельки — и можно быть на 100% уверенным, что она будет интересной!
директором по маркетингу Intel в регионе EMEA (Европа, Ближний Восток, Африка)
iXBT.com: Я хотел бы начать наш разговор с особенностей реализации маркетинговых стратегий в Intel. Существуют определенные различия по проведению маркетинговых инициатив в секторе B2B и B2C, и необходимо придерживаться определенных правил. Не могли бы вы рассказать подробней об этом? Каким образом Intel работает в этой сфере, являясь компанией сектора B2B? Каким образом вы пытаетесь привлечь новых конечных пользователей?
Жиль Пеле: Основное различие заключается в том, что для бизнес-сегмента технологии имеют большее значение. Руководители ИТ-департаментов уделяют большое внимание тому, какие конкретные преимущества та или иная технология привносит в их корпоративную инфраструктуру, будь то повышение качества управления или защиты. Профессионалы имеют четкое представление о предлагаемых на рынке технологиях, и им не нужно рассказывать о каких-либо абстрактных цифрах.
Что касается рынка конечных пользователей, то здесь основная сложность заключается в том, что это очень широкий сегмент. Персональные компьютеры получили широкое распространение по всему миру. Так, например, в России 42% населения страны имеют доступ к сети Интернет. Это довольно впечатляющая цифра. И именно поэтому покупателям необходимо на доступном для них языке рассказывать о преимуществах предлагаемой продукции. Это довольно сложная задача — необходимо поставить себя на место этих людей, чтобы узнать, что их интересует, что им нравится, и как наши разработки могут помочь им в повседневной жизни. Для бизнес-сектора этого не требуется. Профессионалы оценивают новые продукты с точки зрения их реальных преимуществ, а конечные пользователи придерживаются эмоционального подхода.
iXBT.com: Каких соображений придерживалась Intel при попытке создания экоситемы для каждой своей инициативы? У меня сложилось впечатление, что этот подход используется при реализации всех инициатив Intel. Это ближе сектору B2B или B2C?
Жиль Пеле: Причина, по которой Intel всегда стремилась создавать экосистемы для всей продукции, применима как для сектора B2B, так и для сектора B2C. Мы производим память, микропроцессоры, выходим на региональный уровень, и это является подтверждением того, что процессор является наиболее важным компонентом любого ПК. Компьютерная платформа может быть успешна только тогда, когда ее окружают другие платформы. И именно поэтому уже на протяжении многих лет Intel не ограничивается только производством процессоров. Мы работаем над созданием наборов микросхем, современных интерфейсов. Первым проектом стала разработка интерфейса Ethernet. Мы разработали его совместно с Xerox. Затем последовали проекты, связанные с USB, беспроводными сетями, интерфейсом PCI Express. И мы также всегда уделяли большое внимание разработке программных продуктов. Это особенно актуально для России, с учетом нашей большой команды программных разработчиков — российский офис корпорации насчитывает порядка 1000 специалистов, и многие из них работают в Нижнем Новгороде. В результате, современные технологии всегда дополняют микропроцессоры. Это является необходимым условием для развития рынка, как рынка аппаратной, так и программной продукции. Поэтому мы постоянно работаем над оптимизацией наших компиляторов, мы создаем инструменты для отладки приложений. Это очень масштабный процесс. Конечным пользователям нужны готовые решения, а не отдельные процессоры или системные платы. Это все равно, что создать новый автомобиль с отличным двигателем, у которого не будет ни кузова, ни колес. Он никому не нужен будет. Вот почему Intel уделяет особое внимание созданию экосистемы для того, чтобы предложить на рынке уже готовое решение.
iXBT.com: Возвращаясь к вашему сравнению компьютера и автомобиля. Как, по-вашему, это стоит того? Наверняка, заводу по производству авиационных двигателей трудно давать рекомендации авиационным компаниям. Что вы думаете об этом с учетом специфики Intel?
Жиль Пеле: В данной ситуации другого выхода нет. Любой клиент, частный или корпоративный, нуждается в готовом решении, и маловероятно, что конечный заказчик будет самостоятельно заниматься его интеграцией. Развитие рынка привело к тому, что ИТ-отрасль отказалась от вертикальных решений, и клиентам сейчас предлагаются полностью готовые компьютеры с уже предустановленным программным обеспечением. Большой объем продаж и широкая распространенность ПК определяются тем, что сейчас предлагаются стандартные решения, которые хорошо работают при совместном использовании. Поэтому современные компьютерные технологии сейчас доступны практически каждому.
iXBT.com: Не могли бы вы рассказать о различиях при реализации маркетинговых программ в глобальном масштабе и в отдельных регионах, например, в Европе или в России? Существуют какие-либо особенности, или все программы реализуются через головной офис?
Жиль Пеле: Существуют определенные преимущества при проведении согласованных программ на мировом уровне. Любая программа связана с фиксированными расходами, производственными расходами и прочими затратами. Если у вас есть универсальные программы, то вы сможете стабильно добиваться высоких результатов, улучшая их, исходя из местного опыта, и распространяя на разные страны. Однако необходимо не забывать, что все эти инициативы должны быть адаптированы для конкретного региона — необходимо учитывать местные культурные особенности, программы должны реализовываться на местном языке, и все материалы по программам должны быть переведены. Если взять, к примеру, российский рынок, то он отличается своими большими масштабами. На российском рынке присутствуют местные «игроки», которые оказывают очень сильное влияние на рынок, и это нетипично для других европейских стран. В любом случае, необходимо действовать с учетом специфики. Можно внедрять программы, которые хорошо зарекомендовали себя в других странах, и, при этом, адаптировать их под местные условия. Более того, даже программы, разработанные в России, могут успешно использоваться в качестве образцов для реализации аналогичных инициатив по всему миру.
iXBT.com: Вы не могли бы подробнее рассказать об этом? Как это может быть реализовано на практике? Как можно взять какую-либо региональную программу и перенести ее, например, в Китай или Бразилию?
Жиль Пеле: В России мы реализуем программу IT Galaxy, опыт которой мы в данный момент переносим в европейские страны. В частности, мы реализовали подобный проект в Великобритании. Мы извлекаем выгоду из того опыта, который мы получили в России, и переносим его в другие страны. Важно определить сильные стороны проекта и адаптировать его в соответствии с местными особенностями. И нам, по крайней мере на данный момент, удается сделать это.
iXBT.com: С учетом российской специфики, какие преимущества вы могли бы назвать при создании экосистемы, привлечении партнеров и при реализации совместных маркетинговых программ с местными OEM-компаниями, ритейлерами?
Жиль Пеле: В отношении России я мог бы назвать две особенности. Касательно маркетинговых программ, я считаю, что различные виды онлайновых проектов пользуются большой популярностью в России. Как я уже говорил, мы реализовали целый ряд программ, разработанных нашей российской командой, которые оказались весьма успешными. Другой отличительной особенностью является то, что на рынке присутствуют очень сильные компании, которые занимаются разработкой программного обеспечения, розничной торговлей и предоставлением услуг. Они способны предложить уникальные продукты, которые пользуются особой популярностью на рынке, и это очень важно для успешного развития рынка в целом.
iXBT.com: Каковы, на ваш взгляд, перспективы маркетингового сотрудничества с интернет-провайдерами или сотовыми операторами?
Жиль Пеле: По-настоящему комплексное решение включает в себя аппаратную платформу, программные продукты и услуги. Программное обеспечение позволяет «вдохнуть жизнь» в аппаратную платформу. Оно расширяет функциональные возможности подобного рода разработок. Если подняться выше на один уровень, то можно говорить о поставщиках услуг, и мы предлагаем экосистеме, включая поставщиков услуг и розничные сети, возможности для развития и предложения конечным пользователям комплексных решений.
iXBT.com: В чем различие в позиционировании мобильных ПК под торговой маркой Ultrabook и ноутбуков Apple MacBook Air? Существуют какие-либо различия в отношении форм-фактора, аппаратной «начинки», программного обеспечения?
Жиль Пеле: Эти новые устройства имеют очень привлекательный форм-фактор. Они обеспечивают более высокую скорость работы и быстродействие для конечных пользователей. Продукция компании Apple всегда была в авангарде высокотехнологичных разработок. Однако, весьма важно то, что новые мобильные ПК будут предлагаться несколькими производителями. Основное преимущество заключается в том, что на рынке будут предложены самые разные решения, которые будут иметь свои уникальные отличия, и от этого, в конечном итоге, выиграют только конечные пользователи. Также предполагается, что со временем в новых ноутбуках будут реализованы новые функциональные возможности. В результате, на рынке появится целое семейство мобильных ПК под торговой маркой Ultrabook, которые будут развиваться для того, чтобы предоставить новые возможности пользователям для работы и развлечений.
iXBT.com: Что вы можете сказать о будущем развития этой концепции? Какие перспективы вы с ней связываете?
Жиль Пеле: В конечном счете, все сводится к повышению удобства использования компьютеров для конечных пользователей. Важно реализовать в ноутбуках функциональные возможности, которые будут наиболее полно соответствовать моделям их использования реальными людьми. Мы будем прилагать все усилия для того, чтобы удовлетворить потребности пользователей.
iXBT.com: Стоит ли в ближайшем будущем ожидать некоторую конвергенцию мобильных ПК под торговой маркой Ultrabook, планшетных ПК и iPad?
Жиль Пеле: Эти устройства значительно отличаются друг от друга. Если главной отличительной особенностью планшетных ПК является отсутствие клавиатуры, то ноутбуки под торговой маркой Ultrabook не только поддерживают все возможности полноценного мобильного ПК, но и обеспечивают простоту использования и портативность, свойственную планшетным устройствам. Не стоит забывать, что в новой операционной системе Windows 8 будет реализована поддержка технологии сенсорного управления и ввода данных, что сделает использование ноутбуков под торговой маркой Ultrabook еще удобней.
iXBT.com: Если вспомнить последние заявления Intel о разработке смартфонов и новых соглашениях с Orange и другими компаниями, почему потребовалось так много времени, чтобы приступить к практической разработке в сфере мобильных устройств? Достаточно вспомнить прошлые заявления о разработке мобильной платформы Intel, которые не получили логического развития. Видимо, именно поэтому Intel была вынуждена с «чистого листа» приступить к разработке новой платформы, которая соответствовала бы современным требованиям индустрии. Что вы думаете по этому вопросу? Каковы перспективы развития этого направления?
Жиль Пеле: Это новый для нас рынок и достаточно сложный в плане выхода на него. Для того чтобы добиться успеха необходимо разработать полноценную платформу, форм-фактор, базовый вариант дизайна устройства, включая программное обеспечение, операционную систему и приложения. На все это уходит достаточно много времени. Мобильная отрасль развивалась в течение достаточно длительного времени, и для того, чтобы выйти на этот рынок, необходимо предложить по-настоящему революционную разработку. Нам это удалось — мы разработали собственную платформу, которая получила высокие оценки со стороны мобильных операторов. У нас есть конкурентоспособное решение, которое мы будем развивать дальше. Основной вопрос — это вопрос времени.
iXBT.com: Насколько высоко вы оцениваете потенциал разработок компании ARM? Имеет ли Intel достаточно ресурсов для успешной конкурентной борьбы на рынке смартфонов? Вы ограничитесь использованием только преимуществ вашей производственной технологии или предложите какие-либо уникальные разработки, которые позволят выделить вашу продукцию на рынке?
Жиль Пеле: Мы будем использовать наши сильные стороны. Мы демонстрируем достаточно высокие результаты в различных секторах и сейчас выходим на рынок смартфонов, предлагая востребованное решение. В нашем распоряжении имеются ведущие в отрасли полупроводниковые технологии и мощные производственные ресурсы. Это и есть наши преимущества, которые мы будем реализовывать на новых рынках. Еще одним нашим преимуществом является способность к дифференциации нашей продукции, что мы хорошо продемонстрировали в сегменте персональных компьютеров, и мы распространим наш опыт на другие рынки.
iXBT.com: Это подразумевает разработку новых производственных технологий?
Жиль Пеле: Мы по-прежнему продолжаем развивать наши производственные технологии. Сейчас для массового производства продукции мы используем 22-нанометровую технологию, и регулярно публикуем информацию о наших новых разработках. Мы являемся лидером в области полупроводниковых технологий, и у нас есть все необходимые ресурсы для сохранения наших позиций.
iXBT.com: Существует точка зрения, согласно которой процессоры достигли так называемой «точки невозврата». Другими словами, современные процессоры уже достаточно мощные для решения всех необходимых задач. Что вы думаете по этому поводу? Каковы дальнейшие перспективы развития?
Жиль Пеле: В отрасли сейчас существуют две точки зрения. Согласно одной из них, технологии производства процессоров достигли своего максимума и не смогут развиваться в будущем. Согласно другой точке зрения, процессоры обеспечивают высокий уровень производительности, достаточный для обработки любых вычислительных нагрузок. Однако конечным пользователям нужно все больше и больше ресурсов для обработки постоянно увеличивающегося объема данных. Учитывая современные модели использования ПК, по-прежнему существует потребность в дополнительных вычислительных ресурсах. Я считаю, что потребность в более мощных процессорах сохранится и в ближайшем будущем.
iXBT.com: Многие люди полагают, что мобильным устройствам необязательно быть достаточно мощными, так как существуют облачные технологии, которые осуществляют обработку данных за пределами самих устройств. Другие считают, что это неправильный подход, и устройства должны быть сами по себе достаточно мощными. Что вы думаете поэтому поводу?
Жиль Пеле: В настоящий момент происходит активная децентрализация вычислительных ресурсов. Несомненно, размещение ресурсов в облачных инфраструктурах имеет смыл, но только при условии, что имеется неограниченный канал для передачи данных, а такого канала в данный момент мы не наблюдаем. Поэтому потребность в наличии локальных ресурсов сохраняется. Кроме того, остается нерешенным вопрос с задержкой в передачи данных. По мере того, как все больше данных будет перемещаться в облачные среды, для этих сред потребуется больше ресурсов. Однако потребность в локальных вычислительных ресурсах не исчезнет.
iXBT.com: Возвращаясь к разговору о технологиях ARM… Как вы думаете, развитие процессоров ARM повлияет на стратегию Intel по выходу на рынок смартфонов и планшетных ПК? Они постоянно увеличивают количество активных ядер в своих процессорах, в то время как Intel старается сделать свои разработки более энергоэффективными.
Жиль Пеле: Мы привыкли к конкурентной борьбе. В настоящий момент мы выходим на рынок, где разработки ARM занимают ведущие позиции. Я твердо уверен в конкурентоспособности нашей архитектуры, и в том, что мы сможем предоставить необходимый уровень производительности для того, чтобы удовлетворить потребности конечных пользователей. Для пользователей важно удобство использования, а не количество ядер в процессоре.
iXBT.com: При выходе на рынок смартфонов, будет ли Intel использовать новый подход к построению экосистемы? Он будет отличаться от стратегии ARM?
Жиль Пеле: Я полностью уверен, что мы сможем построить надежную экосистему, и это подтверждает наш опыт разработок в сфере ПК. Мы продемонстрировали нашу способность предлагать на рынке комплексные решения. Я не думаю, что нам стоит сравнивать себя с конкурентами.
iXBT.com: Вы по-прежнему будете интегрировать графические системы в существующие платформы? Насколько ваши решения будут отличаться от разработок, скажем, NVIDIA или ATI, если мы говорим о ноутбуках под торговой маркой Ultrabook? Не стоит забывать о геймерах и профессиональных дизайнерах, которым нужны достаточно мощные графические системы.
Жиль Пеле: Мы по-прежнему развиваем функциональные возможности наших интегрированных графических решений и продолжим это делать в будущем для того, чтобы удовлетворить потребности большинства пользователей. Экстремальным геймерам действительно нужны мощные дискретные графические карты, но это лишь небольшой сегмент рынка графических решений, в то время как мы нацелены на массовую аудиторию пользователей и не планируем выходить на рынок решений профессионального уровня.
iXBT.com: Не могли бы вы подробней рассказать о научных лабораториях Intel? В настоящий момент ваша научно-исследовательская инфраструктура активно развивается по всей Европе. Также вы реализуете отдельный проект в Санкт-Петербурге. Каковы основные цели этих инициатив?
Жиль Пеле:Intel — это высокотехнологичная компания, которая обладает современными научно-исследовательскими ресурсами. С одной стороны, в Европе сильно развита система образования. В европейских странах, в частности в России, много талантливых ученых, и мы хотели бы использовать их потенциал для развития нашей компании. С другой стороны, эти страны также получают преимущества за счет прихода ведущей ИТ-компании, которая будет инвестировать в инфраструктуру и создавать новые рабочие места. Это взаимовыгодное сотрудничество для обеих сторон.
iXBT.com: В СМИ активно муссируются слухи о том, что Intel планирует внести значительные изменения в свои образовательные программы, в частности в программу Intel World Ahead. Не могли бы вы прокомментировать эти высказывания?
Жиль Пеле: Мы очень большое внимание уделяем вопросам развития образовательных программ. Эти инициативы — часть стратегии Intel. Современные компьютерные технологии — это неотъемлемая часть процесса образования, поэтому это направление настолько важно для нас.
iXBT.com: Как подобные инициативы соотносятся с инициативами Intel в социальных сетях? Каких политик придерживается Intel при работе с социальными СМИ?
Жиль Пеле: Политика заключается в том, чтобы продвигать наш бренд в сети Интернет и через другие онлайн-ресурсы. Кроме того, мы призываем наших сотрудников принимать активное участие в социальных СМИ для популяризации нашего бренда.
iXBT.com: Не считаете ли вы, что постоянно увеличивающаяся активность всех крупнейших мировых компаний, не только Intel, в социальных сетях отражает современную ситуацию со СМИ, которые больше не рассматриваются как, своего рода, источник дохода, а как источник критики?
Жиль Пеле: Да, социальные СМИ призывают компании к диалогу. Иногда, с их стороны звучит критика, но в этом нет ничего страшного. Таким образом в настоящий момент развивается общение, и мы должны быть открыты для диалога.
iXBT.com: Вам удобней общаться с более широкой аудиторией или с отдельными читателями, будь то в сети Интернет или в печатных изданиях?
Жиль Пеле: Это вопрос не удобства. Вопрос заключается в том, какой диалог необходимо поддерживать, чтобы он оказался наиболее адекватным.
iXBT.com: Не могли бы вы в нескольких словах рассказать о маркетинговых инициативах Intel в России и странах СНГ?
Жиль Пеле: Наша команда, которая занимается маркетингом, и которой я руковожу, использует все возможности для продвижения маркетинговых инициатив, будь то международные или локальные проекты. Это наиболее эффективный подход для капитализации имеющихся активов и дифференциации инициатив. Наше российское подразделение активно реализует различные онлайн-проекты, которые оказываются весьма успешными, и я очень рад результатам работы нашей команды.
iXBT.com: Как вы оцениваете позиции Intel в России? Они по-прежнему достаточно прочные, как в 90-х годах?
Жиль Пеле: Да, у нас действительно очень сильные позиции, учитывая, что целевая аудитория значительно расширилась. Мы не можем общаться с нашими потенциальными клиентами, как в 90-х, так как тогда ПК были доступны немногим. Сейчас все по-другому, и аудитория также изменилась, но мы по-прежнему занимаем достаточно прочные позиции в России.
Благодарим Михаила Рыбакова (Intel) за помощь в организации интервью
Процессорные линейки «потребительского класса» за время CeBIT не претерпели существенных изменений (а о начале поставок нового семейства Intel Xeon E5-1600/2600 мы уже ), тем не менее, кое-что любопытное на тему платформы на выставке обнаружилось. И достойно краткого обзора. Но сначала пару слов надо сказать о представительстве российских компаний на выставке. Поскольку каждый раз забываю это сделать, а потом приходят гневные письма.
Собственно, много слов и не потребуется. Поскольку единственный по-настоящему глобально известный и действительно конкурентоспособный бренд из России, регулярно принимающий участие в CeBIT — обозначен на фото. Разработчик антивирусного ПО и комплексных систем безопасности в этом году, хотя и имел стенд поменьше размером, чем в прошлом, но жизнь вокруг все равно кипела. Это радует.
А в самом «железячном» павильоне довольно неожиданно было обнаружить стенд московской компании-дистрибутора 3Logic. Причем идея представительства, судя по всему, состояла не столько в «вербовке» новых партнеров из числа еще не представленных на российском рынке производителей комплектующих, сколько в более амбициозной задаче: выходе на европейский рынок с ODM-продукцией Foxconn и Pegatron, чьи интересы эта компания представляет. Что ж, можно только пожелать успехов!
И переходим к платформе. Если говорить о новинках, которые уже поступают в продажу или вот-вот поступят (то есть реальный, не бумажный, анонс), это, конечно же, видеокарты всех ведущих производителей на среднебюджетных моделях процессоров AMD Radeon HD 7700/7800. Как известно, AMD значительно опережает своего конкурента по темпам выпуска нового поколения видеокарт на техпроцессе 28 нм . И вслед за топовыми моделями, которые уже успели обосноваться на рынке, сейчас обновления готовы и в среднем, и массовом сегменте.
Поскольку на нашем сайте уже был опубликован серии Radeon HD 7750/7770, поэтому не будем повторяться, а настоятельно рекомендуем его к прочтению всем интересующимся 3D-графикой. Что касается серии HD 7800, она выйдет чуть позже, но также в течении марта, и будет адресована требовательным геймерам, которым не по карману топовые модели, однако хочется иметь настройки качества в играх поближе к максимальным. В отношении представленной на фото линейки Gigabyte забавно отметить, что класс карты «обозначен» количеством вентиляторов: от одного — в скромной HD 7770 до трех — в разогнанной HD 7870. Разумеется, малошумная работа обещана и в максимальной конфигурации (иначе зачем вообще заниматься разработкой оригинального дизайна для вентилятора?).
У компании AFOX также готова модель на процессоре AMD Radeon HD 7850, и не одна. Как мы уже в новостях, будет еще и однослотовая.
Любопытный трансформируемый дизайн кулера представила для своих карт компания MSI. В данном случае два вентилятора установлены один на другой по центру.
А это таже самая карта, только подвижный дефлектор сдвинут к «хвостовой» части карты, а второй вентилятор поставлен спереди. Тут вероятно сам пользователь в зависимости от степени разгона процессора или памяти может оценить и решить, какой вариант будет более эффективен в конкретном случае.
И, наконец, топовая модель в исполнении MSI. Как заявлено, максимальный разгон достигается не только благодаря фирменному кулеру и конструкции стабилизатора напряжения, а также использованием элитных компонентов.
Но и специальному модулю, устанавливаемому на обратную сторону печатной платы напротив процессора. Что там внутри, выяснить пока не удалось, вероятно, в тестах будет видно, оправдано ли такое увеличение габаритов в «нестандартную» сторону.
В какие-то незапамятные времена, компания Sapphire первой начала делать карты с пассивным охлаждением, оснащенные при этом достаточно серьезными процессорами. Как видим, традиция продолжается!
Вторым «трендом» нынешнего CeBIT стала ожидаемая демонстрация плат на чипсетах семейства Z77/75 под новые процессоры на ядре Ivy Bridge, которые готовятся к выпуску позже. Мы уже публиковали фотографии плат ASUS, ASRock, ECS и других в новостях, поэтому не буду повторяться. Тем более, что сама эта платформа ориентируется на массовый сегмент и каких-то сногсшибательных новаций не содержит. Тем не менее, дорогие платы на Z77 тоже, конечно, будут. К примеру, на топовой плате Gigabyte можно отметить наличие 4 графических портов, поддерживается как CrossFire (до 4 карт), так и SLI (до 3 карт). На плате, согласно спецификации, установлен «4-ядерный» аудиопроцессор Creative.
В сегменте плат подешевле большие надежды компания Gigabyte возлагает на чипсет Z75. Это объясняется тем, что по функциональности этот чипсет ближе к Z77, а цена его не намного выше, чем Z71. Всего линейка плат Gigabyte на Z77/Z75 будет включать более десятка моделей. Необходимость такого разнообразия (неочевидная для домашних пользователей и даже для коммерческих потребителей) заключается, судя по всему, в желании конкурировать за государственные тендеры. Именно там требования к оснащению плат бывают весьма причудливыми.
Это намерение становится еще более очевидным, если посмотреть на линейку плат на бюджетном H61, также с поддержкой новых процессоров. К примеру, на этой модели не только наличествует три PCI-слота, но имеется даже LPT-порт, который не просто распаян на плате, но даже выведен на заднюю панель.
Впрочем, и компания MSI не очень отстает в деле сохранения компьютерной старины, в данном случае 3 порта PCI имеется на достаточно дорогой по оснащению модели на Z77.
На стенде Biostar обратила на себя внимание microATX-версия. Если не принимать во внимание вычурную форму радиаторов, плата очень практичная. Но для тех, кто ориентируется на сборку компьютера из новых компонентов, старые интерфейсы тут представлены по минимуму.
У компании Shuttle готов традиционного формата баребон на Z77.
Из интересного для платформы AMD, обратила на себя внимание линейка Mini-ITX-плат компании Giada (производителя компонентов для встраиваемых решений). Например, вот такая на чипсете A75. Есть и очень похожая по оснащению модель с встроенным процессором из E-серии.
А компания ASUS, которая на этот раз не стала устраивать собственный стенд, отметилась моделью F1A75-I Deluxe на стенде, где были представлены награды Taiwan Excellence Award 2012.
Идем дальше, и остановимся на пару минут у стендов производителей блоков питания. Чтобы зафиксировать две тенденции. Во-первых, растет класс энергоэффективных блоков, прошедших тестирование на соответствие «платиновому» стандарту. Как мы помним, в прошлом году, это были единичные экземпляры. Тем более, если говорить о моделях столь высокой мощности. КПД равный 94%, который заявляет для своей 1500-ваттной модели компания Enermax, это практически рекордный результат.
Второе наблюдение: продолжают потихоньку расти мощности топовых моделей. Хотя, казалось бы, рациональное объяснение этому найти сложно, ведь компоненты самих ПК становятся экономичнее. Но вопросы престижа и возможно интересы самых радикальных игролюбов способствуют наращиванию мощности за пределы одной лошадиной силы. У компании High Power такая модель получила «серебрянный» ярлычок, что, впрочем, тоже неплохо.
На стенде FSP внимание привлекли более практичные модели. В частности, в серии Aurum 92+, обозначенная в названии эффективность (92%), соответствует платиновому сертификату. Мощность модели, представленной на фото, вполне ходовая — 650 Вт.
Последовательные сторонники бесшумных компьютеров, наверняка, обратят внимание на серию Aurum Xilenser. Жаль, правда, что эффективность этих блоков дотягивает лишь до «золотого» сертификата, хотя именно в режиме пассивного охлаждения критичной становится собственная экономичность.
О платформе, пожалуй, достаточно, а в следующей части поговорим о заслуживающей внимания «всякой-всячине», оригинальных устройствах, привлекших внимание на стендах разных компаний.
Дополнительно
Мои закладки
Новости
Новости
Теги
Сейчас в форуме
Сейчас в форуме
Samsung GALAXY Tab 10.1 P7500 32GB - всего за 27270 р. , Доставка на дом!
www.sotmarket.ru
Продаем товары для детей, для дома, бытовая техника и электроника, выгодно
torgwin.ru
Полезные советы и информацию от специалистов Вы найдете на сайте
cleverbuyer.ru
Профессиональная фотосъемка Вашего путешествия или отпуска в любой стране!
· lenaking.com
Следуйте простым указаниям опытных сетевиков. Заходите и получите подарок!
www.mlmprg.ru
Планшеты NextPAD и аксессуары, гарантия 1 год, дилеры по всей России
OS X 10.8 Mountain Lion: «тик-так» Apple в действии
Выпуск предварительной версии новой операционной системы для Mac стал для многих довольно неожиданным. С момента выпуска Mac OS X 10.7 Lion прошло всего полгода, и если основываться на датах выпуска предыдущих версий операционной системы, то предварительную версию OS X 10.8 можно было ожидать, скорее, в феврале 2013 года.
Одновременно с выпуском первой предварительной версии OS X 10.8 компания сообщила о переводе операционной системы на годичный цикл разработки. Также Apple, похоже, решила применить в разработке своей настольной операционной системы стратегию, схожую со знаменитой «тик-так» Intel: в один год («тик») Apple выпускает новую версию с существенно возросшей функциональностью, а следующий релиз («так») посвящается внутренней и внешней «полировке» операционной системы.
Косвенным свидетельством этого может служить и название новой операционной системы — Mountain Lion (горный лев, или кугуар). Можно предположить, что при выборе названия новой системы в Apple решили оставить в нём слово Lion, чтобы подчеркнуть её близость к 10.7 Lion. Во время представления Snow Leopard компания сделала акцент на том, что эта операционная система являлась качественным, а не функциональным улучшением Leopard. Сейчас Apple в своём пресс-релизе отдельно на этом не останавливалась, однако пристальное рассмотрение Mountain Lion приводит к выводу, что новая операционная система является, в первую очередь, следующей ступенькой в развитии идей, заложенных в Lion — унификации с iOS и интеграции с iCloud. Однако обо всём по порядку.
По состоянию на момент выпуска первой предварительной версии основные компоненты оболочки Mountain Lion — файловый менеджер Finder, система управления окнами и рабочими пространствами Mission Control — почти не изменились.
При тщательном изучении Finder какие-то изменения найти, конечно, можно, но они совсем незначительны. Например, теперь остановить копирование папки можно с помощью значка в виде крестика, отображаемого на целевом объекте.
Навигация вперёд/назад с помощью двухпальцевого горизонтального жеста, как это реализовано в Safari, в окнах Finder по-прежнему отсутствует.
Небольшое дополнение получил LaunchPad — дебютировавший в Mac OS X 10.7 компонент для быстрого запуска приложений, позаимствованный у iOS. Теперь Launchpad обзавёлся строкой поиска.
Необходимость наличия этой строки вызывает сомнение, особенно если учесть наличие общесистемной службы поиска Spotlight, которая и без Launchpad в течение многих лет вполне успешно справляется с поиском приложений по набранному фрагменту названия. Появление этой строки поиска выглядит немного странно, так как обвешивание продуктов лишней, дублирующейся функциональностью не вписывается в стиль Apple последних лет. Впрочем, можно допустить, что у Apple есть определённые планы оптимизации системного поиска информации, и новый элемент Launchpad — часть этого плана.
Dashboard в OS X 10.8 получил обновлённый механизм добавления виджетов, который теперь тоже похож на Launchpad — с такой же строкой поиска и возможностью создания папок для группировки похожих по назначению виджетов.
С момента дебюта в Mac OS X 10.4 Tiger виджеты Dashboard располагались на полупрозрачном слое поверх рабочего стола, однако в Mac OS X 10.7 Lion одновременно с появлением системы управления окнами Mission Control виджеты Dashboard были перенесены на отдельное пространство, которое всегда остаётся крайним слева. Это справедливо и для OS X 10.8, хотя возможность возвращения первоначального режима с полупрозрачным слоем по-прежнему доступна в системных настройках.
Отметим также, что несмотря на бурное развитие Mac App Store, при нажатии кнопки «Прочие виджеты…» пользователям по-прежнему предлагается загружать их в виде файлов с веб-сайта компании. Вполне возможно, к выпуску финальной версии Mountain Lion Apple сделает процесс получения виджетов Dashboard более удобным и современным.
«Заметки» и «Напоминания» (Notes и Reminders)
Продолжая унифицировать приёмы решения одних и тех же задач в iOS и OS X, в Mountain Lion Apple изменила принципы хранения и управления персональной информацией. В OS X 10.8 календари, напоминания, заметки и контакты хранятся в отдельных одноимённых приложениях — точно так же, как и в мобильной операционной системе.
Новые приложения «Заметки» и «Напоминания» внешне и функционально повторяют свои iOS-аналоги, а iCal и Address Book, внешне и функционально унифицированные с iOS-аналогами несколько лет назад, теперь получили соответствующие новые названия — «Календарь» и «Контакты». Заметки, создаваемые в одноимённом приложении, могут содержать текст с форматированием, изображениями, гиперссылками и др.
На рабочем столе OS X все эти четыре приложения, имеющие «игрушечный» интерфейс, выглядят довольно неестественно, претендуя на роль нарушителей принципов минимализма и главенства интуитивности, свойственных продуктам Apple последних лет. Вполне возможно, их появление в OS X в таком виде является для Apple одним из инструментов для поддержания эффекта «гало iOS» — роста продаж Mac за счёт быстрорастущей армии владельцев iPhone и iPad.
Создав для хранения заметок и напоминаний отдельные приложения, Apple убрала подобные функции из приложений Mail и «Календарь», которые теперь отвечают лишь за свои профильные задачи — работу с электронной почтой и ведение календарей.
Для соблюдения формальности отметим, что заметки, напоминания, календари и контакты по желанию пользователя синхронизируются через облако iCloud с другими устройствами, работающими под управлением iOS и OS X при использовании одного и того же идентификатора Apple ID.
«Центр уведомлений»
Ещё одно заимствование из iOS — «Центр уведомлений». Этот новый для OS X компонент позволяет собирать в одном месте сообщения, отправляемые пользователю различными приложениями. Выдвижная панель «Центра уведомлений» отображается в правой части экрана.
Вызвать её можно одним из двух способов — с помощью трекпэда или из строки меню. Для вызова с трекпэда используется горизонтальный жест двумя пальцами от правого края поверхности. Отметим, что Apple впервые использовала Multitouch-жест, для которого важно, в какой области трекпэда он совершён.
Иконка вызова «Центра уведомлений» в строке меню заняла почётное самое правое место, потеснив предыдущего фаворита — лупу Spotlight. Теперь после установки OS X по умолчанию в правой части строки меню находится уже целых восемь значков, а если к ним добавить ещё значки приложений, установленных пользователями, то становится очевидным, что «удлинение» пропорций мониторов в данном случае пришлось весьма кстати.
Модификация этой области интерфейса OS X — одна из задач Apple на будущее, а пока можно надеяться, что новый «Центр уведомлений» сможет компании как-то в этом помочь.
Функциональность «Центра уведомлений» повторяет широко известное приложение Growl, которое ранее распространялось как продукт с открытым кодом, а теперь продаётся в Mac App Store за 2 доллара.
При появлении нового уведомления от какого-либо приложения (обладающего поддержкой «Центра уведомлений») оно отображается во всплывающем сообщении, после чего перемещается в панель «Центра». Эта панель предоставляет пользователю потенциальную возможность быть в курсе всех важных аспектов работы различных служб и приложений. Взаимодействие с «Центром уведомлений» входит в список стандартных вызовов API OS X 10.8, но доступно оно лишь для тех приложений, которые будут распространяться через онлайновый магазин Apple Mac App Store. Центр уведомлений обеспечивает достаточную гибкость: так, например, в почтовом клиенте Mail можно отобрать группу наиболее важных партнёров по переписке (VIP), и отображать в панели уведомлений лишь те письма, которые получены от них, не загромождая её лишней информацией.
В панели «Уведомления» в «Системных настройках» OS X 10.8 пользователь может выбрать для каждого приложения, взаимодействующего с «Центром», свой стиль всплывающих уведомлений:
вариант «Нет» — уведомления от выбранного приложения отображаются только в панели «Центра уведомлений», без всплывающих сообщений;
баннеры появляются в правом верхнем углу экрана и исчезают автоматически;
предупреждения остаются на экране до тех пор, пока пользователь не закроет их вручную.
Кроме того, для каждого приложения можно выбрать максимальное количество уведомлений в панели «Центра», разрешить или запретить отображение наклейки с количеством уведомлений поверх иконки приложения в доке, а также активировать звуковой сигнал при появлении нового уведомления.
«Сообщения» — iMessage на Mac
В течение последних нескольких лет в Сети то и дело появлялись слухи о скором выпуске iChat для мобильных устройств, работающих под управлением iOS, но получилось всё наоборот. За это время пользователи iPhone стали участниками эволюции коммуникационного ПО: простое приложение Text, используемое для работы с SMS, превратилось в «Сообщения» с поддержкой iMessage (текстовые сообщения с возможностью вставки статических изображений и видео) и дополнилось видеоконференциями FaceTime, которые уже успели дебютировать на Mac в составе Mac OS X 10.7 Lion. В новой операционной системе OS X 10.8 iChat уступит место новому приложению с названием в iOS-стиле — «Сообщения», которое объединяет в себе поддержку iMessage и прежних протоколов — AIM, Yahoo, Google Talk и Jabber.
«Сообщения» автоматически синхронизируют переписку между всеми устройствами пользователя: начав диалог на Mac, можно продолжить его в дороге, используя iPhone или iPad.
Приложение поддерживает многопользовательский чат, сообщает о доставке, прочтении сообщения собеседником, а также о том, что последний набирает ответное сообщение.
Кроме того, «Сообщения» имеют интеграцию с FaceTime: окна переписки с собеседниками, имеющими возможность проведения видеочата, обладают соответствующей иконкой.
Вполне возможно, в будущем Apple интегрирует поддержку FaceTime в само приложение «Сообщения».
В качестве идентификатора пользователя iMessage на компьютере Mac используется Apple ID. Если вы используете в «Сообщениях» в iPhone в качестве идентификатора iMessage и номер телефона, и Apple ID, то те сообщения iMessage, которые будут отправлены на ваш номер телефона, будут доступны лишь на iPhone, в то время как сообщения, отправленные в адрес вашего Apple ID, можно будет увидеть и на iPhone, и на Mac.
Для отправки сообщения достаточно начать набирать в адресной строке имя контакта, и приложение предложит все возможные варианты отправки сообщений — адреса электронной почты, номера телефонов и идентификаторы IM-сервисов, которые записаны в карточке собеседника в «Контактах».
Одновременно с выпуском предварительной версии Mountain Lion компания выпустила бета-версию приложения «Сообщения» для Mac OS X 10.7 Lion, поэтому пользователи Mac могут попробовать отправлять и получать сообщения iMessage уже сейчас. Компания предупредила, что с выходом финальной версии OS X Mountain Lion срок действия бета-версии «Сообщений» для Lion закончится, и выпуск финальной версии этого приложения для Lion не планируется.
Несмотря на то, что Apple сообщила о том, что с помощью iMessage отправлено уже несколько десятков миллиардов сообщений, в настоящее время iMessage всё ещё находится в начале пути, конечной целью которого является унификация доступа к собеседнику вне зависимости от использования устройств и идентификаторов.
Облачный сервис iCloud разрабатывался Apple одновременно с созданием Mac OS X Lion, в настоящее время он проходит обкатку в щадящем режиме: сделав сервис бесплатным, Apple существенно сократила его функциональность по сравнению с предшественником, MobileMe. По словам Стива Джобса, iCloud станет краеугольным камнем всей стратегии Apple в течение следующих десяти лет. В настоящее время компания занимается подготовкой к строительству новых центров обработки данных, несмотря на то, что с момента открытия одного из них, стоимостью около миллиарда долларов, прошло всего около года.
С выпуском Mountain Lion значение iCloud для пользователей Mac существенно возрастёт. По замыслу Apple, в будущем, чтобы получить доступ ко всей своей информации на новом Mac, пользователю достаточно будет ввести лишь свой идентификатор Apple ID, и все данные будут загружены из облака. В Mountain Lion сделан большой шаг к этой цели: с помощью iCloud синхронизируется электронная почта, контакты, календари, сообщения iMessage, FaceTime, заметки, напоминания, информация Game Center, приложения Mac App Store, закладки Safari, а также документы и данные различных приложений. Используя iCloud пользователь сможет получить доступ ко всем своим документам на всех Mac и iOS-устройствах, где будет введён его Apple ID.
C момента запуска iCloud поддерживает облачное хранилище для документов офисных приложений iWork, а теперь в Apple решили, что настала очередь наделить подобной функциональностью и другие приложения, в том числе и сторонние. Увидеть, как это будет работать, можно на примере новых версий текстового редактора TextEdit и Preview из состава Mountain Lion. В новой версии операционной системы диалоговые окна открытия и сохранения документов получили, пожалуй, самое революционное изменение с самого момента появления компьютеров Mac в середине 80-х годов прошлого века. По замыслу Apple, теперь по умолчанию документы должны храниться не в папках на локальном диске, а в облачном хранилище iCloud, поэтому окно открытия документа теперь имеет два режима: iCloud и «На моём Mac».
В привычном режиме «На моём Mac» осуществляется работа с документами в иерархической файловой системе (к слову, Apple наконец-то реализовала возможность переименования файлов непосредственно в окне открытия/сохранения файлов, имеющуюся в Windows уже полтора десятка лет).
В режиме iCloud, который является основным, окно выглядит в iOS-стиле: «суконный» фон, квадратные иконки, возможность создания папок перетягиванием документов друг на друга.
Несмотря на большую схожесть этого механизма с другими облачными хранилищами (например, с тем же iDisk, который входил в состав MobileMe), в нынешней реализации Apple есть существенное отличие: в iCloud документы жёстко привязаны к приложению, в котором они созданы, и не могут быть открыты или модифицированы другими приложениями. Такой подход радикально повышает уровень безопасности данных, однако при этом теряется гибкость работы с документами, что может стать поводом для критики со стороны определённой части пользователей.
Safari 5.2 — почти 6.0
В состав первой предварительной версии OS X 10.8 вошла новая версия штатного веб-браузера Apple Safari 5.2, которая, несмотря на неизменность старшей цифры версии, получила множество усовершенствований.
Существенные изменения внесены в интерфейс браузера. В соответствии с современными браузерными традициями адресная строка и строка поиска объединены в единое поле для поиска. Пользователю достаточно начать набирать в нём поисковую фразу или адрес веб-сайта, и браузер предложит все подходящие варианты от поисковых систем, из истории просмотра и из локальных закладок.
В адресной строке теперь не отображается название протокола http://, а доменное имя текущего сайта выделено чёрным цветом. Благодаря этому пользователи смогут более эффективно определять доменное имя сайта, страница которого открыта в браузере в данный момент, что станет ещё одним барьером на пути фишинга.
Активация режима Reader теперь осуществляется не из адресной строки, а с помощью отдельной кнопки, которая подсвечивается синим цветом, когда этот режим доступен.
Не увидим мы в адресной строке теперь и кнопку RSS — Apple решила исключить функциональность RSS из браузера (и, к слову, из почтового клиента Mail тоже; собирается ли компания выпустить отдельное приложение для этих целей или просто посчитала RSS бесперспективной технологией, пока неизвестно).
Вкладки в новой версии браузера не имеют фиксированной ширины, пропорционально разделяя между собой всю ширину окна. Например, при открытии двух вкладок каждая из них будет иметь ширину в половину окна.
По словам Apple, открытые вкладки Safari будут синхронизироваться с iCloud: начав просмотр веб-страниц на одном Mac, можно будет продолжить на другом Mac или iOS-устройстве.
В окне настроек Safari появился новый браузер паролей, позволяющий просматривать и удалять сохранённые пароли к различным веб-сайтам. Такая возможность может пригодиться в том случае, когда пользователь не может вспомнить пароль, который он вводил на том или ином сайте. Немного странным выглядит то, что, в отличие от системной «Связки ключей» (Keychain), браузер паролей в Safari не требует авторизации для отображения паролей на экране. Поэтому следует помнить, что если вы предоставите кому-либо возможность попользоваться вашим компьютером, ваши пароли могут запросто быть просмотрены вашим гостем. Вполне возможно, к моменту релиза операционной системы Apple устранит эту досадную недоработку.
В Safari 5.2 также появились дополнительные элементы обеспечения безопасности: новые опции разрешения/блокировки файлов cookie, возможность отправки веб-сайтам требования не следить за серфингом пользователя (хотя, конечно, большинство веб-сайтов подобные требования не обрабатываю вообще), а также возможность отключения подсказок поисковых систем.
Новая версия браузера позволяет веб-сайтам взаимодействовать с «Центром уведомлений» OS X. Пользователь может самостоятельно выбрать веб-сайты, которые получат доступ к этой функции.
Существенно возросла производительность браузера: по результатам различных тестов, Safari 5.2 в OS X 10.8 отображает страницы в 1,5—2,5 раза быстрее, чем Safari 5.1.3 в Mac OS X 10.7.3, хотя этого всё равно недостаточно, чтобы догнать нынешнего безоговорочного лидера — Google Chrome.
Ещё одним новшеством Safari стала кнопка «Отправить» (Share), которая в конфигурации по умолчанию располагается на панели инструментов между кнопками навигации и адресной строкой. О ней мы поговорим в следующем разделе.
За знакомой всем владельцам iPhone новой кнопкой на панели инструментов Safari прячется функция Share Sheets, предоставляющая возможность быстрой отправки или публикации информации в сервисы, подходящие по контексту. В Mountain Lion эта кнопка встречается во многих приложениях, в том числе в Safari, «Просмотре» (Preview), «Контактах» и даже в стандартном диалоговом окне открытия файла, которое используют сторонние приложения. Нажав на эту кнопку, пользователь получает возможность опубликовать или передать файл с помощью подходящих сервисов.
Для того, чтобы пользоваться возможностью отправки информации с помощью Share Sheets, пользователю необходимо внести информацию о своих учётных записях в панели «Почта, адрес и календари» в «Системных настройках».
Отметим отсутствие в этом списке служб YouTube и Facebook, отложив рассуждения о возможных причинах такого решения для более удобного случая.
Итак, в Safari кнопка Share Sheets предлагает добавить текущий URL в закладки, в список для чтения, отправить по электронной почте, через «Сообщения» или в Twitter. При просмотре изображения с помощью Quick Look кнопка Share Sheets позволит отправить его по электронной почте, через «Сообщения», в Twitter или во Flickr. Если же в Quick Look открыто видео, то возможность отправки в Twitter не предлагается, а Flickr заменяется на Vimeo.
По некоторым данным, в составе SDK для Mountain Lion Apple предлагает разработчикам возможность создания собственных плагинов для Share Sheets, поэтому можно ожидать, что публикация информации во все популярные сервисы будет доступна если не усилиями Apple и самих этих сервисов, то стараниями сторонних разработчиков.
Mac App Store и Gatekeeper
Несмотря на то, что само приложение Mac App Store в Mountain Lion какими-то революционными нововведениями не отметилось, многие изменения в новой версии операционной системы демонстрируют, что именно этот компонент компания видит в будущем на центральном месте платформы.
Самым заметным новшеством в Mac App Store стала интеграция в это приложение функции обновления операционной системы и приложений Apple, за которые ранее отвечала отдельная утилита Software Update.
Отметим, что для получения обновлений операционной системы вход в Mac App Store с идентификатором Apple ID не требуется.
Ещё одной новинкой Mountain Lion станет функция Apps in the Cloud («Приложения в облаке»): приложения, загруженные из App Store, автоматически (и бесплатно) доступны на всех других компьютерах Mac, на которых используется тот же самый идентификатор Apple ID. Таким образом, при приобретении приложения на домашнем iMac, пользователь автоматически получит его в своё распоряжение на своём ноутбуке. Соответственно, если предположить, что в будущем Mac App Store для большинства пользователей станет эксклюзивным источником приложений, то в типичном случае при создании новой учётной записи (например, на новом компьютере) пользователю будет достаточно просто ввести свой Apple ID, и из облака будут загружены не только информация и документы, но и приобретённые ранее приложения. Только представьте себе ситуацию из недалёкого будущего: при выходе из строя жёсткого диска достаточно заменить его на новый, ввести Apple ID, и компьютер автоматически загрузит и установит операционную систему (напомним, эта функция уже успешно работает в последних моделях Mac), приложения и все документы. Фантастика.
Если в Lion приложение Mac App Store было дебютантом, которому нужно было завоевать симпатии пользователей, то в OS X 10.8 роль этого компонента более агрессивна. Новые шаги Apple практически не оставляют типичному разработчику выбора, загоняя его в Mac App Store методом кнута и пряника. Так, «пряники», о которых мы говорили ранее, — совместимость с «Центром уведомлений», хранение документов в iCloud, синхронизация приложений из облака — доступны только для тех приложений, которые распространяются через Mac App Store. В роли «кнута» для разработчиков можно рассматривать новую функцию OS X 10.8 Gatekeeper, которая призвана защитить пользователей от вредоносного ПО.
В Mac OS X 10.7 Lion при первом запуске загруженного приложения операционная система предупреждает пользователя о том, что запуск незнакомого ПО несёт угрозу безопасности данных. В OS X 10.8 Mountain Lion эта функция получила дальнейшее развитие. В «Системных настройках» (точнее, в панели «Защита и безопасность») можно выбрать один из трёх вариантов политики в отношении сторонних приложений:
запуск приложений только из Mac App Store;
запуск приложений только из Mac App Store и от идентифицированных разработчиков (включено по умолчанию);
запуск приложений из любого источника.
Чтобы стать «идентифицированным», разработчику необходимо зарегистрироваться на сайте Apple (с ежегодной оплатой лицензии), получить сертификат и подписывать свои приложения электронной подписью. В отличие от случая с Mac App Store, Apple не проводит проверку таких приложений, однако очевидно, что потенциально они намного безопаснее «обычных». По словам компании, такие приложения потенциально менее подвержены заражению, так как модификация их кода невозможна без разрушения цифровой подписи. Кроме того, при обнаружении вредоносного кода в подписанных приложениях Apple может отозвать у разработчика лицензию, и с этого момента его приложения на всех компьютерах Mac со стандартными установками безопасности больше работать не будут.
Таким образом, предварительная версия OS X 10.8 Mountain Lion демонстрирует, что Apple направляет в русло Mac App Store и функции, ранее обеспечиваемые другими компонентами операционной системы, и сторонние приложения. Вполне можно ожидать, что в скором будущем в Mac App Store можно будет увидеть и виджеты из Dashboard, а со временем, возможно, Apple объединит все клиентские части своих онлайновых магазинов в одно приложение, предоставив iTunes возможность сконцентрироваться на своём первоначальном предназначении.
Другие новшества
Game Center, игровой сервис, дебютировавший в iOS 4, в OS X 10.8 теперь приходит и на Mac. Сервис Game Center стал одним из ключевых факторов бурного развития iOS как игровой платформы, и поэтому неудивительно, что в Apple решили перенести успешный опыт в этой области на платформу Mac, которая в течение многих лет для геймеров была, прямо скажем, абсолютно непривлекательной.
Разработчики игр для Mac получат все возможности Game Center: централизованную систему для многопользовательских игр, возможность голосового чата в играх и др. Стоит отметить, что Game Center обеспечивает прозрачное взаимодействие между платформами: пользователи iPhone, iPad и Mac смогут играть друг с другом без проблем.
AirPlay Mirroring — функция беспроводной передачи изображения на приставку Apple TV для отображения на экране телевизора. Впервые она также дебютировала в iOS 4, а теперь приходит на Mac. C выпуском новой модели Apple TV разрешение изображения достигает 1080p, поэтому приставку теперь вполне можно рассматривать ещё и в качестве беспроводного дисплейного адаптера для компьютеров Mac.
Изменения коснулись и некоторых других компонентов системы: так, клиент удалённого подключения к рабочему столу Remote Desktop обзавёлся поддержкой IP V6, а его менее функциональная альтернатива Screen Sharing теперь позволяет перетаскивать файлы между удалённым и локальным рабочим столом с помощью указателя мыши.
С чем прощаемся на этот раз?
В последнее время каждая новая версия OS X отсекает поддержку некоторых старых технологий. Например, Mac OS X 10.6 Snow Leopard стал первой операционной системой Mac OS X, которая не работала на процессорах Power PC, а в момент выпуска Mac OS X 10.7 Lion произошло расставание с целым букетом — процессорами Core Duo и Core Solo, встроенной поддержкой Adobe Flash и Java, транслятором PowerPC-кода Rosetta, распространением системы на DVD и некоторыми другими, менее заметными технологиями.
Mountain Lion не поддерживает работу на Mac с графическими адаптерами Intel GMA 950 и x3100, ATI x1600 и некоторыми другими. Это вычёркивает из списков совместимых систем все белые и чёрные пластиковые MacBook в оригинальном корпусе, все Mac mini старше начала 2009 года, первую модель MacBook Air и модели iMac старше 2008 года.
Mountain Lion не будет поддерживать 32-битные расширения ядра (kernel extensions, kext) — все разработчики, не сделавшие этого ранее, должны обеспечить свои продукты 64-разрядными драйверами.
Кроме того, по словам Apple, существенно сокращена поддержка вызовов API Carbon Core. Carbon — фреймворк, созданный полтора десятка лет назад в качестве временной меры для обеспечения совместимости приложений Mac OS 9 с Mac OS X, и вряд ли тогда кто-то в Apple мог подумать, что разработчики не переведут свои продукты на «родные» фреймворки Mac OS X и в 2012 году. Сейчас Apple предлагает разработчикам вместо Carbon использовать Cocoa и вызовы других фреймворков — Core Foundation, Foundation, GCD (Grand Central Dispatch) и Disk Arbitration. Интересно, станут ли такие решительные действия Apple стимулом для Adobe и Microsoft привести, наконец, свои приложения к виду, который сможет использовать все преимущества OS X?
Несмотря на обилие новшеств, Montain Lion претендует на заслуженное звание «так»: большинство новинок OS X 10.8 является либо эволюционным развитием предыдущих функций и идей, либо пришли из iOS. Тем не менее перевод разработки OS X в режим ежегодного выпуска новых версий, вполне возможно, в конечном итоге сделает доводку и функциональное насыщение операционной системы ещё более быстрым, чем предыдущая практика более редких, но радикальных обновлений. Впрочем, до лета ещё далеко, и вполне возможно, Apple приберегла несколько сюрпризов OS X Mountain Lion на более поздний срок.
Дополнительно
ВИКТОРИНА
Какой слоган у PS Vita?
Мои закладки
Новости
Новости
Теги
Сейчас в форуме
Сейчас в форуме
жить легко и радостно, играючи исполнять свои желания! Обучающий курс.
pavel-kolesov.ru
Как выбрать ноутбук ? Каталог моделей, сравнения цен, обзоры и отзывы.
www.toplaps.ru
Продажа по выгодным ценам, бытовая техника, телефоны, электроника
torgwin.ru
Информационный обозреватель техники Apple.Новости, советы, обзоры...
app.in.ua
Заказ и доставка товаров из китайских интернет магазинов и аукционов
liveshoppings.ru
Сотни товаров для дома на продажу, техника, электроника, телефоны
Несмотря на последние утверждения о задержке с массовыми поставками мобильных процессоров Intel Ivy Bridge ориентировочно до июня, по крайней мере, некоторые модели ноутбуков на их основе должны быть анонсированы уже в скором времени. Лишним доказательством этому может служить появление в каталоге американского ритейлера J&R пока не представленного лэптопа под названием SamsungNP700Z7C-S01US Nike, “сердцем” которого является четырехъядерный чип Core i7-3615QM с тактовой частотой 2,3 ГГц и встроенной графикой Intel HD 4000, уже упоминавшийся нами в новостях.
Наличие в SamsungNP700Z7C-S01US Nike столь мощного CPU говорит о высоком классе данного мобильного компьютера, что подтверждает и 17,3-дюймовый дисплей с LED-подсветкой и разрешением 1920 x 1080 пикселей, а также 8 ГБ оперативной памяти DDR3 и жесткий диск емкостью 1 ТБ, дополненный 8 ГБ флеш-памяти для кэширования файлов. Кроме того, в характеристики ноутбука входит пишущий DVD-привод, мультиформатный кардридер и веб-камера на 1,3 Мп плюс модуль Wi-Fi 802.11 b/g/n и аккумулятор с 8 ячейками. Появление новинки с предустановленной 64-битной версией Windows 7 Home Premium в продаже обещано “в скором времени”, а ее цена равняется $1499,99.
Различные слухи сообщают, что Intel запустит настольные и мобильные чипы Ivy Bridge уже 2 апреля, а в рознице процессоры появятся 8 апреля. Семейство Ivy Bridge будет состоять из 2- и 4-ядерных моделей, причём первые будут задержаны до конца второго квартала, что позволит производителям распродать запасы устройств на базе устаревших процессоров Sandy Bridge.
Флагманским процессором станет 4-ядерный чип IntelCore i7-3770K со 128 Кбайт кеш-памяти L1 (4x32 Кбайт), 1 Мбайт кеш-памяти L2 (4x256 Кбайт) и 8 Мбайт распределённой кеш-памяти L3. Рабочая частота процессора составляет 3,5 ГГц, то есть она аналогична продукту предыдущего поколения Core i7-2700K. Если смотреть на отличия между Sandy Bridge и Ivy Bridge, то в отношении CPU мало что изменилось, фокус больше смещён на графику, которая стала заметно быстрее.
Если же говорить о перспективности нового 22-нм чипа с точки зрения разгона, то сообщается, что образцы чипов Core i7-3770K могут быть разогнаны с 3,5 ГГц до внушительных 7,06 ГГц. Такой результат был достигнут путём увеличения напряжения до 1,889 В, коэффициента умножения до 63x и шины до частоты 112,11 МГц при использовании сухого льда. Думается, процессор будет пользоваться немалой популярностью среди энтузиастов при стоимости на уровне $350.