Алгоритм - Учебный центр

Версия сайта для слабовидящих
Заполните форму ниже! Мы вам перезвоним!

Нажав на кнопку "Отправить", Я даю своё согласие на автоматизированную обработку указанной информации, распространяющейся на осуществление всех действий с ней, включая сбор, передачу по сетям связи общего назначения, накопление, хранение, обновление, изменение, использование, обезличивание, блокирование, уничтожение и обработку посредством внесения в электронную базу данных, систематизации, включения в списки и отчетные формы.


Графические ядра GT1/GT2/GT3/GT4/еDRAM.

Графические ядра GT1/GT2/GT3/GT4/еDRAM.

Одным из основных нововведений в микроархитектуре процессоров Haswell было новое графическое ядро c поддержкой DirectX 11.1, OpenCL 1.2 и OpenGL 4.0. Но самое главное, что графическое ядро в микроархитектуре Haswell стало масштабируемым. Появились варианты графического ядра с кодовыми названиями GT3, GT2 и GT1. Ядро GT1 имело минимальную производительность, а GT3 — максимальную. В графическом ядре GT3 появился второй вычислительный блок, за счет чего удвоилось количество блоков растеризации, пиксельных конвейеров, вычислительных ядер и сэмплеров и GT3 вдвое производительнее GT2.

Ядро GT3 содержит 40 исполнительных блоков, 160 вычислительных ядер и четыре текстурных блока. Графическое ядро Intel GT3 превосходит своего предшественника (Intel HD Graphics 4000) по уровню производительности. Кроме того, ядро GT3 имеет более высокую производительность благодаря интеграции памяти EDRAM (в ядре GT3e) в упаковку процессора. Ядро GT2 содержит 20 исполнительных блоков, 80 вычислительных ядер и два текстурных модуля, а ядро GT1 — только 10 исполнительных блоков, 40 вычислительных ядер и один текстурный модуль. Сами исполнительные блоки имеют по четыре вычислительных ядра наподобие тех, что используются в архитектуре AMD VLIW4.

Еще одно нововведение заключается в том, что при работе с памятью применяется технология Instant Access, которая позволяет вычислительным ядрам процессора и графическому ядру напрямую обращаться к оперативной памяти. В предыдущих версиях графического ядра вычислительные ядра процессора и графическое ядро тоже работали с общей оперативной памятью, но при этом память делилась на две области с динамически изменяемыми размерами. Одна из них отводилась для графического ядра, а другая — для вычислительных ядер процессора. Однако получить одновременный доступ к одному и тому же участку памяти графическое ядро и вычислительные ядра процессора не могли. И в случае, если графическому процессору требовались те же данные, что использовались вычислительным ядром процессора, ему приходилось копировать этот участок памяти. Это приводило к росту задержек, а кроме того, возникала проблема отслеживания когерентности данных.

Технология InstantAccess позволяет драйверу графического ядра ставить указатель на положение определенного участка в области памяти графического ядра, к которой вычислительному ядру процессора необходимо напрямую получить доступ. При этом вычислительное ядро процессора будет работать с этой областью памяти напрямую, без создания копии, а после выполнения необходимых действий область памяти будет возвращена в распоряжение графического ядра.

Семейство новых графических ядер GT1, GT2 и GT3 обладает улучшенными возможностями и по кодированию-декодированию видеоданных. Поддерживается аппаратное декодирование форматов H.264/MPEG-4 AVC, VC-1, MPEG-2, MPEG-2 HD, Motion JPEG, DivX с разрешением вплоть до 4096х2304 пикселов. Графическое ядро способно одновременно декодировать несколько видеопотоков 1080p и воспроизводить видео 2160p без подтормаживания и пропуска кадров.

Появился и специальный блок улучшения качества видео, который называется Video Quality Engine и отвечает за шумоподавление, цветокоррекцию, деинтерлейсинг, адаптивное изменение контраста и т.д. Также новые графические ядра поддерживают функции стабилизации изображения, преобразования частоты кадров и расширенной гаммы.

Кроме того, графическое ядро в процессоре Haswell обеспечивало подключение до трех мониторов одновременно. Поддерживаются порты Display Port 1.2 с разрешениями до 3840х2160 и частотой 60 Гц, HDMI c разрешением до 4096х2304 и частотой 24 Гц (при максимальном разрешении), а также порт DVI.

Ядро GT3е имеет интегрированную в упаковку процессора память еDRAM (eDRAM - англ. embedded DRAM - встраиваемая DRAM). еDRAM — это память на основе конденсаторов, как правило встраиваемая в тот же самый чип или в ту же самую систему, что и основной ASIC или процессор, в отличие от памяти SRAM на основе транзисторов, обычно используемой для кэшей и от внешних модулей DRAM.

eDRAM Crystalwell объемом 128 МБ играла роль кэш-памяти четвертого уровня. Кэш подобного объема был у Haswell, но лишь в топовых моделях. При этом eDRAM может использоваться и графическим ядром, и вычислительными ядрами процессора при обработке больших объемов данных — например, текстур. По заявлению производителя, Crystalwell обеспечивает пиковую пропускную способность на уровне 51,2 Гбайт/с в каждую сторону (102,4 Гбайт/с суммарно). Согласно тестам, проведенным 3Dnews.ru, латентность основанного на eDRAM L4-кэша составляет 55 тактов, а пропускная способность — примерно вдвое выше по сравнению с двухканальной DDR3-1866 SDRAM. eDRAM Crystalwell позволяла процессору преодолеть относительные ограничения низкой пропускной способности системной памяти и показать лучшее быстродействие в задачах по обработке HD-видео и в математических операциях.

Далее в архитектуре Skylake была реализована новая, полностью когерентная структура встроенной eDRAM (или Memory Side Cache), способная кэшировать любые данные, включая варианты "некэшируемой памяти", без необходимости очистки для поддержания когерентности, и доступной для использования устройствами ввода-вывода и формирования выходного видеосигнала. Помимо этого графическая подсистема для достижения оптимальной производительности может выбрать режим кэширования определённых данных только в eDRAM без использования кэш-памяти L3. В отличие от предыдущей архитектуры, где примерно четверть кэш-памяти L3 использовалась для доступа к eDRAM, и при этом eDRAM не имела возможности прямого взаимодействия с остальной системой.

В архитектуре Skylake контроллер eDRAM переместился в модуль системного агента, освободив таким образом порядка 512 Кбайт ёмкости кэша L3 и одновременно с этим облегчив доступ другим компонентам ядра к данным в eDRAM. Отныне Memory Side Cache (eDRAM) могла взаимодействовать с основной системной памятью напрямую, обеспечивая таким образом обновление экрана без необходимости вывода остальных компонентов процессора из ждущего режима.

В процессорах Broadwell и Skylake появилось графическоеядро Iris Pro Graphics 580 (GT4e). Графическое ядро Iris Pro Graphics 580 (GT4e) содержит: 72 исполнительных устройства, 128 (256) Мбайт eDRAM, производительность до 1152 ГФлопс на частоте 1 ГГц (a ядро GT3 содержит 40 исполнительных блоков). Новое графическое ядро GT4e, которое имеет 72 потоковых процессора, обеспечивает вычислительную производительность более 1,1 Тфлопс (триллиона операций с плавающей точкой в секунду) в зависимости от тактовой частоты. Графический процессор Iris Pro Graphics 580 имеет обновлённый мультимедийный движок, который поддерживает аппаратное декодирование и кодирование Ultra HD-видео с использованием кодеков HEVC и VP9.

Современные графические ядра, применяемые в процессорах Broadwell и Skylake и относящиеся к классам Iris и Iris Pro предлагают вполне достаточную для массовых игровых систем производительность. Конечно, здесь имеется в первую очередь способность интеловской интегрированной графики нормально работать в казуальных и несложных в графическом плане сетевых играх (за последние пять лет производительность интегрированной графики выросла в 30 раз).

Современные интеловские графические ядра способны предложить весьма впечатляющую теоретическую производительность. GPU, реализованный в Skylake, как и его предшественники, сохранил традиционный модульный дизайн. Таким образом, мы вновь имеем дело с целым семейством решений разного класса: на базе, имеющихся строительных блоков нового поколения, Intel может собирать кардинально различающиеся по уровню производительности GPU. Подобная масштабируемость сама по себе новинкой не является, но в Skylake возросла не только максимальная производительность, но и число доступных вариантов графического ядра. Так, графическое ядро Skylake может быть построено на базе одного или нескольких модулей, каждый из которых обычно включает в себя по три секции. Секции объединяют по восемь исполнительных устройств, на которые ложится основная часть обработки графических данных, а также содержат базовые блоки для работы с памятью и текстурные семплеры. Помимо исполнительных устройств, сгруппированных в модули, графическое ядро содержит и внемодульную часть, отвечающую за фиксированные геометрические преобразования и отдельные мультимедийные функции. Варианты ядра GT4 могут быть дополнительно усилены eDRAM-буфером объёмом до 128 Мбайт. В Skylake этот дополнительный буфер не только изменил алгоритм работы, став «кешем на стороне памяти», но и приобрёл некоторую гибкость конфигурации.

Наращивая мощность графического ядра, Intel проявила большую заботу и о том, чтобы для его нужд хватало пропускной способности памяти. В Skylake обновился контроллер памяти, и теперь он способен работать с DDR4 SDRAM, частота и пропускная способность которой заметно выше, чем у DDR3 SDRAM.

С другой стороны, в GPU появилось новая технология Lossless Render Target Compression (направленная на рендеринг сжатие без потерь). Её суть заключается в том, что все данные, пересылаемые между GPU и системной памятью, которая одновременно является и видеопамятью, предварительно сжимаются, разгружая таким образом полосу пропускания. Применённый алгоритм использует компрессию без потерь, при этом степень сжатия данных может достигать двукратного размера. Несмотря на то, что всякая компрессия требует задействования дополнительных вычислительных ресурсов, инженеры Intel утверждают, что внедрение технологии Lossless Render Target Compression увеличивает быстродействие интегрированного GPU в реальных играх на величину от 3 до 11 процентов.

В графике Skylake были сделаны существенные изменения в части поддерживаемых графических API. В GPU этих процессоров есть совместимость с DirectX 12, OpenGL 4.4 и OpenCL 2.0, а позднее, по мере совершенствования графического драйвера, к этому списку добавились и следующие версии OpenCL, а также поддержка низкоуровневого фреймворка Vulkan. В новом GPU реализована полноценная когерентность памяти с процессором, что делало Skylake самым настоящим APU – его графическое и вычислительные ядра могли одновременно работать над одной и той же задачей, используя общие данные.

 

 

 

 

 


Лицензия