Алгоритм - Учебный центр

Версия сайта для слабовидящих
Заполните форму ниже! Мы вам перезвоним!

Нажав на кнопку "Отправить", Я даю своё согласие на автоматизированную обработку указанной информации, распространяющейся на осуществление всех действий с ней, включая сбор, передачу по сетям связи общего назначения, накопление, хранение, обновление, изменение, использование, обезличивание, блокирование, уничтожение и обработку посредством внесения в электронную базу данных, систематизации, включения в списки и отчетные формы.


Модификации графического ядра Skylake.

Модификации графического ядра Skylake.

Встроенные GPU берут на себя всё новые функции, такие как параллельные вычисления или кодирование и декодирование мультимедийного контента. Графическое ядро Skylake Intel относит к следующему, девятому поколению, но GPU, реализованный в Skylake, как и его предшественники, сохранил традиционный модульный дизайн. Мы вновь имеем дело с целым семейством решений разного класса: на базе имеющихся «строительных блоков» нового поколения Intel может собирать кардинально различающиеся по уровню производительности GPU. Масштабируемость в Skylake возросла не только по максимальной производительности, но и по числу доступных вариантов графического ядра.

Графическое ядро Skylake может быть построено на базе одного или нескольких модулей, каждый из которых обычно включает в себя по три секции. Секции объединяют по восемь исполнительных устройств, на которые ложится основная часть обработки графических данных, а также содержат базовые блоки для работы с памятью и текстурные семплеры. Помимо исполнительных устройств, сгруппированных в модули, графическое ядро содержит и внемодульную часть, отвечающую за фиксированные геометрические преобразования и отдельные мультимедийные функции.

На самом верхнем уровне иерархии графическое ядро Skylake очень похоже на ядро, реализованное в Broadwell, но нетрудно найти и весьма заметные изменения. Внемодульная часть вынесена теперь в отдельный энергетический домен, что позволяет задавать ей частоту и отправлять её в сон отдельно от исполнительных устройств. Например, при работе с технологией Quick Sync, которая реализуется как раз силами внемодульных блоков, основная часть GPU может быть отключена от линий питания в целях снижения энергопотребления. Кроме того, независимое управление частотой внемодульной части позволяет лучше подстраивать её производительность под конкретные нужды модулей графического ядра.

Графическое ядро Broadwell могло основываться лишь на одном или двух модулях, получая в своё распоряжение 24 или 48 исполнительных устройств (для энергоэффективных и бюджетных процессоров мог использоваться один модуль с отключенными секциями, что давало меньшее, чем 24, число исполнительных устройств), а в Skylake может применяться от одного до трёх модулей.

Благодаря этому в дополнение к привычным конфигурациям GT1/GT2/GT3 в семействе процессоров Skylake будет доступно ещё более мощное ядро GT4, которое получит 72 исполнительных устройства.

Пиковая производительность самих исполнительных устройств в Skylake не изменилась – каждое такое устройство может выполнять до 16-ти 32-битных операций за такт. При этом оно способно исполнять 7 вычислительных потоков одновременно и имеет 128 32-байтовых регистров общего назначения.

Варианты ядра GT3 и GT4 могут быть дополнительно усилены eDRAM-буфером объёмом 64 или 128 Мбайт соответственно, что даёт модификации GT3e и GT4e. Процессоры Broadwell комплектовались лишь одним вариантом eDRAM – объёмом 128 Мбайт. В Skylake же этот дополнительный буфер не только изменил алгоритм работы, став «кешем на стороне памяти», но и приобрёл некоторую гибкость конфигурации. Однако его исполнение останется старым – он будет представлен отдельным 22-нм кристаллом, монтируемым на процессорную плату по соседству с основным чипом.

Появление в составе Skylake урезанного чипа eDRAM с ёмкостью 64 Мбайт должно расширить сферу применения графики GT3e. Процессоры Broadwell и Haswell, оснащённые дополнительным буфером, имели высокую стоимость и предназначались исключительно для производительных ноутбуков и настольных систем. Меньший кристалл eDRAM должен дать жизнь более доступным вариантам Skylake с мощным GPU, которые смогут найти применение, например, в ультрабуках.

Графическое ядро Skyklake пока будет существовать в шести различных модификациях, которые получат числовые индексы из пятисотой серии:

  • HD Graphics 510 – GT1: один модуль, 12 исполнительных устройств;

  • HD Graphics 515 – GT1.5: один модуль, 18 исполнительных устройств;

  • HD Graphics 530 – GT2: один модуль, 24 исполнительных устройства;

  • HD Graphics 535 – GT3: два модуля, 48 исполнительных устройств;

  • Iris Graphics 540 – GT3e: два модуля, 48 исполнительных устройств и 64-Мбайт eDRAM-буфер;

  • Iris Pro Graphics 580 – GT4e: три модуля, 72 исполнительных устройства и 128-Мбайт eDRAM-буфер.

Наращивая мощность графического ядра, Intel проявила большую заботу и о том, чтобы для его нужд хватало пропускной способности памяти даже в конфигурациях, лишённых дополнительной eDRAM-памяти. С одной стороны, в Skylake обновился контроллер памяти, и теперь он способен работать с DDR4 SDRAM, частота и пропускная способность которой заметно выше, чем у DDR3 SDRAM. С другой стороны, в GPU появилось новая технология Lossless Render Target Compression («направленное на рендеринг сжатие без потерь»). Её суть заключается в том, что все данные, пересылаемые между GPU и системной памятью, которая одновременно является и видеопамятью, предварительно сжимаются, разгружая таким образом полосу пропускания. Применённый алгоритм использует компрессию без потерь, при этом степень сжатия данных может достигать двукратного размера. Несмотря на то, что всякая компрессия требует задействования дополнительных вычислительных ресурсов, инженеры Intel утверждают, что внедрение технологии Lossless Render Target Compression увеличивает быстродействие интегрированного GPU в реальных играх на величину от 3 до 11 процентов.

В графическом ядре размеры собственной кеш-памяти в каждом модуле GPU были увеличены с 512 до 768 Кбайт. Благодаря этому, а также путём оптимизации архитектуры модулей разработчики смогли добиться почти двукратного улучшения скорости заполнения, что дало возможность не только поднять быстродействие GPU при включении полноэкранного сглаживания, но и добавить в число поддерживаемых режимов 16x MSAA.

Одним из основных ориентиров для встроенной в интеловский процессор графики давно выступает полноценная поддержка 4K-разрешений. В графическом ядре Skylake поддерживается вывод 4K-изображения с частотой развёртки 60 Гц через DisplayPort 1.2 или Embedded DisplayPort 1.3, с частотой 24 Гц – через HDMI 1.4 и с частотой 30 Гц – по технологии Intel Wireless Display или по беспроводному протоколу Miracast. Но в Skylake к этому перечню добавилась и частичная поддержка HDMI 2.0, через который доступны 4K-разрешения с частотой развертки 60 Гц (для реализации этой возможности нужен дополнительный адаптер DisplayPort ↔ HDMI 2.0). Но зато передача сигнала HDMI 2.0 возможна в том числе и по интерфейсу Thunderbolt 3 в системах, имеющих соответствующий контроллер. Так же как и раньше, GPU процессоров Skylake способен обеспечить вывод изображения на три экрана одновременно.

С ростом популярности новых форматов видео графическое ядро Skylake расширило возможности по его аппаратному кодированию и декодированию. Теперь средствами движка Quick Sync стало можно кодировать и декодировать контент в формате H.265/HEVC с 8-битной глубиной цвета, а с привлечением исполнительных устройств GPU – декодировать H.265/HEVC-видео и с 10-битным представлением цвета. К этому добавилась и полностью аппаратная поддержка кодирования в форматах JPEG и MJPEG.

В графике Skylake девятого поколения сделаны существенные изменения и в части поддерживаемых графических API. На данный момент в GPU новых процессоров есть совместимость с DirectX 12, OpenGL 4.4 и OpenCL 2.0, а позднее, по мере совершенствования графического драйвера, к этому списку добавятся будущие версии OpenCL 2.x и OpenGL 5.x, а также поддержка низкоуровневого фреймворка Vulkan. В новом GPU реализована полноценная когерентность памяти с процессором, что делает Skylake самым настоящим APU – его графическое и вычислительные ядра могут одновременно работать над одной и той же задачей, используя общие данные.

В графическом ядре Skylake, работая на частоте 1,15 ГГц, один модуль GPU обеспечивает пиковое быстродействие на уровне 442 Гфлопс. Это значит, что GT4-версии графического ядра Skylake будут обладать теоретическим быстродействием порядка 1,15 Тфлорс, что значительно превышает возможности любой существовавшей до сих пор интегрированной графики, и приближается к показателям таких дискретных видеоускорителей, как GeForce GTX 750 или GeForce GTX 950M (с 2010 года производительность интеловской графики возросла в 27 раз).

Очень большая часть нововведений в микроархитектуре Skylake призвана увеличить энергоэффективность и производительность вариаций этого дизайна, нацеленных на экономичные ультрапортативные и мобильные применения. И нет никаких сомнений в том, что благодаря Skylake ультрабуки и планшеты станут ещё быстрее, ещё легче и ещё автономнее. Теперь мы сможем увидеть полноценные мобильные игровые системы с интегрированной графикой, которые будут способны соперничать по 3D-производительности с ноутбуками, в которых применяется дискретная видеокарта.

 


Лицензия