Publish Ad

Обзор процессора Core i9-11900K: лидерство в игровой производительности возвращается к Intel

Обзор процессора Core i9-11900K: лидерство в игровой производительности возвращается к Intel

Статьи
7. Jun 2021
152 просмотров
Обзор процессора Core i9-11900K: лидерство в игровой производительности возвращается к Intel

Многие с нетерпением ждали сегодняшнего дня в надежде, что на рынке настольных процессоров развернётся новое сражение. Ведь прошлое Intel проиграла – выход AMD Ryzen, построенных на микроархитектуре Zen 3, побил все козыри процессоров Core, за исключением разве что цены. За несколько успешных итераций AMD уверенно обошла конкурента по производительности. Что совсем неудивительно, ведь Intel, борясь с производственными и управленческими проблемами, кажется, совсем позабыла о необходимости обновления микроархитектуры. В результате настольные процессоры Core год за годом продолжали эксплуатировать дизайн Skylake, наращивая лишь тактовые частоты и количество вычислительных ядер, чего для успешной конкуренции в течение шести лет подряд оказалось недостаточно.

И вот, наконец, у Intel появляется что-то новенькое – чипы с кодовым именем Rocket Lake. Однако не стоит воспринимать их как некую «новую надежду». Несмотря на то, что в них действительно используется новая архитектура, новая она лишь для десктопного сегмента. Так что новинки выступают скорее посланием от микропроцессорного гиганта, что, дескать, есть ещё порох в пороховницах. Настоящая же революция с решениями Intel должна будет случиться лишь в начале следующего года, когда на рынок придут процессоры с кодовым именем Alder Lake. А пока – лишь небольшая разминка.

На первый взгляд может показаться, что Rocket Lake появился в результате крайне тяжёлых родов. Но на самом деле это вряд ли так: разработка этого чипа по меркам процессорного рынка прошла довольно быстро, да и вряд ли какие-то трудности могли возникнуть в принципе. Ведь мы говорим о процессоре, выпускаемом по обкатанному годами техпроцессу и построенному отнюдь не на новой микроархитектуре. Появление Rocket Lake только сейчас, а, скажем, не год назад связано скорее с тем, что Intel поздно взялась за его разработку. Компания до последнего самонадеянно верила в свой 10-нм техпроцесс и не предполагала, что ей потребуется ещё одно поколение 14-нм чипов для десктопов. Поэтому «план Б» в лице Rocket Lake лёг на стол разработчиков заметно позже, чем к нему стоило бы обратиться.

Несмотря на то, что пользователи десктопов ничего подобного ещё не видели, Rocket Lake не следует считать инновационным продуктом. Это — очередное переиздание прошлых трудов. Просто теперь вместо ядер Skylake шестилетней давности разработчики Intel перетащили в десктопный процессор микроархитектуру из более свежего мобильного процессора Ice Lake всего-то полуторагодичной давности. Правда, перенесена она в несколько искажённом виде – для Rocket Lake её портировали на 14-нм техпроцесс, потому что «родная» для неё 10-нм технология пока всё ещё не позволяет изготавливать крупные полупроводниковые кристаллы в необходимых количествах и с должным уровнем качества.

Впрочем, старый техпроцесс в конечном итоге – не такая большая проблема, если сам процессор при этом предлагает передовую производительность и умеренное энергопотребление за приемлемую цену. В этом обзоре мы и посмотрим, соблюдены ли все эти условия и насколько сработал у Intel её «план Б». Можно ли, наконец, считать, что на смену Comet Lake пришли какие-то заслуживающие внимания процессоры нового поколения. А заодно ответим и на более интригующий вопрос о том, остаются ли Ryzen на базе микроархитектуры Zen 3 самыми быстродействующими процессорами для настольных систем, или же выход Rocket Lake снова всё меняет.

Rocket Lake и 14-нм техпроцесс

Процессоры с кодовым именем Rocket Lake относятся к 11-му поколению Core, и это – действительно полноценное поколение, а не такое, к которому хочется прибавить приставку «квази». Изменения здесь коснулись и вычислительных, и графического ядер, и даже встроенного северного моста и не затронули разве только техпроцесс. Причём перемены во всех аспектах обещаны очень значительные: в момент анонса Rocket Lake компания Intel сообщила о росте показателя IPC (удельной производительности на такт) на 19 % и об увеличении скорости встроенного графического ядра на 50 %, не говоря уже о поддержке более скоростных вариантов внешних интерфейсов и об очередном повышении рабочих частот.

В то же время Rocket Lake – всё-таки не новаторский продукт, это скорее 14-нм версия имеющихся у Intel процессоров для мобильного сегмента, которые в настоящее время производятся по 10-нм техпроцессу. Лежащие в основе вычислительной части Rocket Lake ядра с названием Cypress Cove – это 14-нм адаптация ядер Sunny Cove, используемых в Ice Lake. У Intel, кстати, есть и более совершенные мобильные ядра – Willow Cove, которые лежат в основе Tiger Lake, но в Rocket Lake перенесли более старый вариант 10-нм дизайна. Зато графическая часть новых десктопных процессоров построена на новейшей архитектуре Xe, родственной с архитектурой встроенного GPU из Tiger Lake. Правда, не обошлось без жестокой резекции — графика в Rocket Lake по сравнению с мобильными предложениями обладает в разы меньшим числом исполнительных устройств.

Вряд ли кто-то станет спорить, что появление Rocket Lake – огромный шаг вперёд для десктопных процессоров Intel, ведь никаких глубинных изменений в них не происходило уже очень давно. И почти наверняка вся критика в адрес Rocket Lake будет так или иначе связана с 14-нм технологией производства – это их самое очевидное уязвимое место, от которого неотвратимо веет достаточно далёким по меркам полупроводникового рынка  прошлым.

Возразить тут особо нечего. Данные технологические нормы были впервые введены в обиход микропроцессорным гигантом в далёком 2014 году с выпуском чипов Broadwell. Кстати, некоторое замедление в скорости смены техпроцессов у Intel намечалось уже тогда: пришествие Broadwell произошло примерно на год позже изначально запланированного срока. Ну а потом всё пошло совсем наперекосяк. Если до Broadwell периодичность смены техпроцессов и процессорных архитектур определялась чётко соблюдаемым правилом «тик-так», то в 2015 году c выходом Skylake оно сначала видоизменилось до варианта «процесс—архитектура—оптимизация», а потом и вовсе переросло в многолетнюю оптимизацию-переоптимизацию.

Впрочем,  успехи, достигнутые Intel за последние годы в совершенствовании 14-нм техпроцесса, отрицать невозможно. За время, пока этот техпроцесс остаётся в строю и применяется для выпуска процессоров для настольных ПК, он был улучшен несколько раз (скорее всего, четыре, но точно уже вряд ли кто-то упомнит). И факт состоит в том, что сегодняшний 14-нм процесс по сравнению с его первой версией обеспечивает более чем 20-процентное улучшение производительности в пересчете на транзистор. В процессе эволюции технологии Intel изменила структуру FinFET-транзисторов, перешла на новые библиотеки и непрерывно выполняла тонкую статистическую подстройку оборудования, в результате чего предельные частоты настольных 14-нм процессоров выросли с четырёх до пяти c лишним гигагерц.

Хотя 10-нм технология уже широко применяется Intel в процессорах для мобильного сегмента, Rocket Lake — это очередной 14-нм продукт. Но, по всей видимости, уже последний. На его примере отлично видно, что применять такую технологию дальше уже совершенно невозможно. И дело не столько в энергопотреблении и устанавливаемых им ограничениях по частотам, сколько в том, что «крупные» транзисторы банально не дают наращивать сложность ядер. Микроархитектурные улучшения делают 14-нм ядра слишком громоздкими, именно поэтому в Rocket Lake максимум восемь ядер – больше в процессор стандартного форм-фактора LGA1200 банально не влезает.

Проиллюстрировать это проще простого, достаточно поместить рядом кристалл восьмиядерного Rocket Lake и десятиядерного Comet Lake.

Rocket Lake рядом с предшественником кажется настоящим гигантом — ещё бы, ведь его площадь выросла примерно на треть и составляет теперь 276 мм2. Intel, к сожалению, не раскрывает точный полупроводниковый бюджет своих актуальных чипов, называя лишь приблизительный ориентир — 6 млрд транзисторов. Но зато с высокой точностью можно оценить, что те же ядра в составе мобильных процессоров Ice Lake, выполненных по 10-нм техпроцессу, занимают вдвое меньшую площадь. А это значит, что, если бы для Rocket Lake получилось приспособить современный 10-нм техпроцесс, он вполне мог бы быть и 16-ядерником.

Разросся в Rocket Lake и встроенный GPU. На кристалле Comet Lake графика занимала примерно 21 % площади, а в Rocket Lake на встроенный графический ускоритель Xe отведено уже 25 % площади ядра.

Микроархитектура Cypress Cove

Увеличение размеров процессорных ядер, естественно, случилось не на пустом месте. Это – результат существенных переделок, которые воплотились в микроархитектуре Cypress Cove, лежащей в основе Rocket Lake. Несмотря на то, что она, как и родственная микроархитектура Sunny Cove, разработана не с чистого листа, а представляет собой дальнейшее развитие Skylake, список изменений довольно длинный, и некоторые из них очень значительны. Собственно, обещанное Intel увеличение удельной производительности на такт на 19 % берётся явно не из воздуха.

Микроархитектура Cypress Cove отличается от Skylake расширением параллельной обработки инструкций, уменьшением внутренних простоев за счёт увеличения объёмов кешей и буферов и поддержкой новых наборов векторных инструкций. Во входной части конвейера Cypress Cove улучшения затронули алгоритмы предварительной выборки и предсказания ветвлений, которые были перебалансированы с прицелом на нагрузки, свойственные ПК. Вместе с тем был увеличен кеш микроопераций, объём которого вырос с 1500 до 2250 записей. Кроме того, теперь он получил возможность выдавать в очередь на исполнение по шесть микроопераций за такт, в то время как обычные декодеры в Cypress Cove работают с тем же темпом, что и ранее, – по пять микроопераций за такт.

Далее, более чем в полтора раза была продлена очередь переупорядочивания инструкций, что должно поспособствовать более эффективной загрузке исполнительных устройств. Этой же цели служит увеличение числа станций резервирования, где инструкции готовятся для исполнения, с двух до четырёх с одновременным выделением в отдельные очереди всех операций, связанных с работой с данными.

Исполнительный домен Cypress Cove получил два дополнительных порта, что сделало возможным отправлять на исполнение по десять микроопераций за такт вместо восьми в микроархитектуре Skylake. Правда, набор вычислительных устройств структурно почти не изменился, а дополнительные порты задействованы главным образом под обработку команд, связанных с загрузкой и сохранением данных. Но в итоге в Cypress Cove стало на один блок генерации адресов и на один блок сохранения данных  больше, и в конечном итоге это конвертируется в удвоение пропускной способности L1-кеша данных при записи, который к тому же в новых ядрах вырос в объёме по сравнению со Skylake в полтора раза – с 32 до 48 Кбайт.

Также ядра Cypress Cove получили и вдвое больший L2-кеш – теперь он имеет объём не 256, а 512 Кбайт и удвоенную восьмиканальную ассоциативность. Попутно на треть возрос объём и L2 TLB – теперь в этой таблице может сохраняться 2048 записей. Правда, увеличение объёмов кеш-памяти сопряжено с ростом латентности, поэтому положительный эффект данного изменения будет заметен не всегда. Для иллюстрации перебалансировки подсистемы кеш-памяти мы построили график, на котором поместили практически измеренную латентность кеша и памяти у восьмиядерных процессоров Rocket Lake, Comet Lake и Vermeer (Zen 3) при работе с блоками данных разного размера.

И действительно, увеличение кеш-памяти в Rocket Lake на каждом уровне привело к увеличению латентностей. Латентность L1-кеша выросла с 4 до 5 тактов, L2-кеша – с 12 до 13 тактов, а заодно и L3-кеша – с 55 до 58 тактов. В то же время приходится констатировать, что по скорости работы подсистемы кеш-памяти процессоры Rocket Lake проигрывают представителям семейства Zen 3, которые обладают заметно более вместительными кешами.

Одним из ключевых нововведений в Rocket Lake стало появление поддержки 512-битных векторных команд AVX-512, и в первую очередь подмножества AVX512 VNNI, направленного на ускорение работы нейронных сетей и алгоритмов глубокого обучения. Серверные и мобильные процессоры Intel уже давно получили совместимость с AVX512 VNNI, а теперь такие инструкции наконец-то добрались до настольного сегмента. И хотя количество реальных программ, которые способны получить выигрыш от AVX-512, исчисляется единицами, среди них уже начали появляться реально полезные обычным пользователям инструменты. В качестве примера можно привести программные продукты Topaz AI, CyberLink или Magix Vegas Pro для обработки видео – они работают на процессорах с поддержкой AVX-512 несоизмеримо лучше.

Для того чтобы оценить, как в целом повлияли на удельную производительность все перечисленные усовершенствования, мы прогнали на восьмиядерных процессорах Rocket Lake, Comet Lake и Vermeer (Zen 3) набор микротестов из пакета AIDA64. Для наглядности все три процессора были приведены к единой тактовой частоте 4,5 ГГц.

Результаты хорошо показывают, что произошло. Мощное ускорение новая микроархитектура Intel демонстрирует там, где есть поддержка инструкций AVX-512, в остальных же ситуациях прирост довольно сдержанный. Некоторые алгоритмы при этом вообще не получают выигрыша, и похоже, что главный драйвер роста производительности в новых процессорах – устранение узких мест при работе с данными. Если же сравнивать Rocket Lake с Zen 3, то на данный момент микроархитектура AMD с точки зрения удельной производительности продолжает смотреться интереснее. Заметное превосходство Rocket Lake наблюдается либо в криптографических задачах, либо в тесте PhotoWorxx, который завязан на скорость подсистемы памяти.

Как уже было сказано выше, ядра, архитектурно аналогичные Cypress Cove, можно встретить не только в Rocket Lake, но и в мобильных процессорах Ice Lake. Но это не всё: в ближайшие дни будет объявлено и ещё об одной разновидности 10-нм процессоров с ядрами Sunny Cove – серверных Ice Lake-SP. Таким образом, в конечном итоге микроархитектура Sunny/Cypress Cove станет столь же распространённым явлением, что и, например, Skylake. А значит, разработчики наверняка будут охотно оптимизировать под неё программное обеспечение.

Графическое ядро Xe-LP

С появлением Rocket Lake в настольные процессоры впервые пришла новейшая графическая архитектура Intel Xe, которая до сих пор успела обосноваться лишь в последнем поколении мобильных процессоров Tiger Lake. В сложившейся ситуации тотального отсутствия в продаже графических карт производительная встроенная графика в десктопном процессоре оказалась бы весьма кстати. Но не стоит возлагать на встроенный GPU большие надежды: в Rocket Lake он в первую очередь нацелен не на геймеров, а на бизнес-пользователей, которые мало интересуются 3D-производительностью. Поэтому встроенный в Rocket Lake графический ускоритель как минимум втрое хуже встроенной графики мобильных процессоров Tiger Lake, а значит, имеет очень слабую производительность. Именно по этой причине графика в Rocket Lake официально называется UHD Graphics 750, а не как в Tiger Lake – Iris Xe Graphics.

Главная задача, которую должен решать встроенный в Rocket Lake ускоритель Intel Xe, — это вывод изображения на монитор и аппаратное ускорение кодирования и декодирования видео в современных форматах. В этом отношении Rocket Lake есть чем похвастать по сравнению с предшественниками: он поддерживает интерфейсы HDMI 2.0b и DisplayPort 1.4а и может выводить изображение на три монитора с разрешением 4K60 одновременно. Что касается декодирования, то Intel добавила в медиадвижок совместимость с 12-битными форматами HEVC и VP9, а также с 10-битным AV1. В то же время технология QuickSync теперь позволяет ко всему прочему аппаратно ускорять кодирование 8-битного AVC, а также 10-битного HEVC и VP9.

С точки же зрения 3D-возможностей всё довольно прозаично. Число исполнительных устройств в графическом ядре Rocket Lake составляет 32, и это в полтора раза больше, чем было в десктопных процессорах предыдущих поколений. Именно поэтому сама Intel и говорит о 50-процентном росте скорости графики по сравнению со Skylake. Впрочем, это не самая точная оценка. Дело в том, что в графике Xe исполнительные устройства получили архитектурные изменения и более высокую вычислительную мощность. В новой версии GPU каждый исполнительный блок имеет в своём составе по десять ALU, в то время как ранее число ALU ограничивалось восемью.

Для оценки 3D-производительности графического ядра UHD Graphics 750 из процессоров Rocket Lake мы провели несколько игровых тестов и сравнили его производительность со скоростью ядра UHD Graphics 630 из процессоров Comet Lake и RX Vega 8 из процессоров Picasso/Renoir.

Результаты говорят сами за себя. Графика в Rocket Lake стала на 40-50 % производительнее, чем было в процессорах прошлого поколения, но толку от этого почти никакого. Это всё равно крайне низкая производительность для того, чтобы её можно было использовать для запуска сколько-нибудь современных игр. Бюджетный гибридный процессор AMD Ryzen 3 3200G с графикой RX Vega 8 может предложить как минимум вдвое более высокое быстродействие в 3D и является куда лучшим вариантом для непритязательных геймеров.

Новый двухрежимный контроллер памяти

Есть в Rocket Lake ещё один элемент, который перекочевал в эти процессоры из 10-нм мобильных чипов, — контроллер памяти. И это — довольно неожиданное обновление, так как, казалось бы, контроллер памяти в Skylake был отточен до предела. Однако пространство для улучшений нашлось, и в контроллере памяти Rocket Lake появилась, с одной стороны, официальная поддержка DDR4-3200 SDRAM, а с другой – два различных режима памяти: Gear 1 и Gear 2.

Первый режим, Gear 1, аналогичен тому, как DDR4 SDRAM работала в процессорах Intel раньше, – в нём контроллер памяти и сама память работают на одинаковой частоте (1:1). В режиме Gear 2 память работает на частоте, удвоенной относительно частоты контроллера (1:2). В мобильных процессорах это требовалось для поддержки высокочастотной LPDDR4, а в Rocket Lake такой режим может оказаться полезен при использовании ов

Комментарии

Комментарии к статье не добавлены

Добавить комментарий

Для добавления комментария необходимо войти в систему. Войти