Алгоритм - Учебный центр

Версия сайта для слабовидящих
Заполните форму ниже! Мы вам перезвоним!

Нажав на кнопку "Отправить", Я даю своё согласие на автоматизированную обработку указанной информации, распространяющейся на осуществление всех действий с ней, включая сбор, передачу по сетям связи общего назначения, накопление, хранение, обновление, изменение, использование, обезличивание, блокирование, уничтожение и обработку посредством внесения в электронную базу данных, систематизации, включения в списки и отчетные формы.


Модульный дизайн (графическое ядро GT4, GT4e).

Модульный дизайн (графическое ядро GT4, GT4e).

Графическое ядро GT4, GT4e (Iris Pro Graphics 580) появилось в процессорах Broadwell и Skylake. В графике процессоров Skylake были сделаны и существенные изменения ив части поддерживаемых графических API. В GPU этих новых процессоров уже была совместимость с DirectX 12, OpenGL 4.4 и OpenCL 2.0, а позднее, по мере совершенствования графического драйвера, к этому списку добавились и следующие версии OpenCL 2.x и OpenGL 5.x, а также поддержка низкоуровневого фреймворка Vulkan. Кроме того, новых GPU была реализована и полноценная когерентность памяти с процессором, что сделало Skylake самым настоящим APU – его графическое и вычислительные ядра могут одновременно работать над одной и той же задачей, используя общие данные.

Графическое ядро GT4e содержало: 72 исполнительных устройства, 128 Мбайт eDRAM, производительность до 1152 ГФлопс на частоте 1 ГГц. Вычислительная производительность Iris Pro Graphics 580 составляет более 1,1 Тфлопс (триллиона операций с плавающей точкой в секунду) в зависимости от тактовой частоты. Графический процессор Iris Pro Graphics 580 имеет обновлённый мультимедийный движок, который поддерживает аппаратное декодирование и кодирование Ultra HD-видео с использованием кодеков HEVC и VP9. Современные графические ядра, применяемые в процессорах Broadwell и Skylake и относящиеся к классам Iris и Iris Pro предлагают вполне достаточную для массовых игровых систем производительность. Конечно, здесь имеется в первую очередь способность интеловской интегрированной графики нормально работать в казуальных и несложных в графическом плане сетевых играх. За последние несколько лет производительность интегрированной графики выросла в 30 раз. Новые графические ядра уже были способны предложить весьма впечатляющую теоретическую производительность.

GPU, реализованный в Skylake, как и его предшественники, тоже сохранил традиционный модульный дизайн. Таким образом, мы вновь имеем дело с целым семейством решений разного класса: на базе имеющихся строительных блоков нового поколения Intel может собирать кардинально различающиеся по уровню производительности GPU. Подобная масштабируемость сама по себе новинкой не является, но в Skylake возросла не только максимальная производительность, но и число доступных вариантов графического ядра. Графическое ядро Skylake может быть построено на базе одного или нескольких модулей, каждый из которых обычно включает в себя по три секции. Секции объединяют по восемь исполнительных устройств, на которые ложится основная часть обработки графических данных, а также содержат базовые блоки для работы с памятью и текстурные семплеры. Помимо исполнительных устройств, сгруппированных в модули, графическое ядро содержит и внемодульную часть, отвечающую за фиксированные геометрические преобразования и отдельные мультимедийные функции.

Варианты ядра GT4 могут быть дополнительно усилены eDRAM-буфером объёмом до 128 Мбайт и более. В Skylake этот дополнительный буфер не только изменил алгоритм работы, став «кешем на стороне памяти», но и приобрёл некоторую гибкость конфигурации.

Наращивая мощность графического ядра, Intel проявила большую заботу и о том, чтобы для его нужд хватало пропускной способности памяти. В Skylake обновился контроллер памяти, и теперь он был уже способен работать с DDR4 SDRAM, частота и пропускная способность которой была заметно выше, чем у DDR3 SDRAM. С другой стороны, в GPU появилось новая технология Lossless Render Target Compression (направленное на рендеринг сжатие без потерь). Её суть заключается в том, что все данные, пересылаемые между GPU и системной памятью, которая одновременно является и видеопамятью, предварительно сжимаются, разгружая таким образом полосу пропускания. Применённый алгоритм использует компрессию без потерь, при этом степень сжатия данных может достигать двукратного размера. Несмотря на то, что всякая компрессия требует задействования дополнительных вычислительных ресурсов, инженеры Intel утверждают, что внедрение технологии Lossless Render Target Compression увеличивает быстродействие интегрированного GPU в реальных играх на величину от 3 до 11 процентов. 


Лицензия