Алгоритм - Учебный центр

Версия сайта для слабовидящих
Заполните форму ниже! Мы вам перезвоним!

Нажав на кнопку "Отправить", Я даю своё согласие на автоматизированную обработку указанной информации, распространяющейся на осуществление всех действий с ней, включая сбор, передачу по сетям связи общего назначения, накопление, хранение, обновление, изменение, использование, обезличивание, блокирование, уничтожение и обработку посредством внесения в электронную базу данных, систематизации, включения в списки и отчетные формы.


NVIDIA . Архитектура Turing.

NVIDIA . Архитектура Turing.

В августе 2018 года NVIDIA представила новую графическую архитектуру Turing и первые три продукта, которые будут её использовать. NVIDIA вначале представила профессиональные ускорители Quadro для рабочих станций. Представители нового семейства Quadro RTX — 8000, 6000 и 5000 — это самые быстрые видеокарты NVIDIA для рабочих станций, и они должны были выйти на рынок в последнем квартале этого года.

Архитектура Turing представляет собой эволюцию Volta, которая взяла всё, что сделало чип GV100 столь быстрым, и развила эти новшества. Для пользователей, занимающихся профессиональной визуализацией (ProViz), главная новость заключалась в том, что карты поддерживают аппаратное ускорение трассировки лучей благодаря сочетанию новых ядер NVIDIA RT и тензорных ядер из Volta. Связку этих вычислительных блоков можно использовать для ускорения трассировки лучей, а затем задействовать дополнительные уловки постобработки, чтобы сократить объём работы, необходимой для создания фотореалистичного изображения.

Новые графические процессоры и основанные на них карты Quadro также были первыми продуктами NVIDIA, которые получили видеопамять стандарта GDDR6 (до 48 Гбайт, т. е. вдвое больше, чем в Quadro P6000) и одновременно значительно увеличили полосу пропускания. NVIDIA также включила поддержку собственной технологии межсетевого когерентного соединения NVLink, который позволит устанавливать карты Quadro RTX парами и обмениваться буферной памятью кадров. NVLink не так хорош, как локальная видеопамять, но с пропускной способностью в 100 Гбайт/с между двумя картами в несколько раз превосходит показатели интерфейса PCIe 3.0.

Новые решения NVIDIA очень сильно нацелены на отрасль визуальных эффектов (например, производство фильмов и телесериалов), так как последние являются одними из самых требовательных заказчиков с точки зрения производительности и обладают крупными финансами. Конечно, NVIDIA никогда не была чужда этому рынку, но с появлением аппаратного ускорения трассировки лучей её продукты становятся ещё более востребованными в области CG.

NVIDIA активно трудится, чтобы предоставить потенциальным клиентам и готовое ПО, умеющее задействовать преимущества её новых GPU и технологии RTX. Хотя речь шла только о первых шагах в этой области, компания уже тогда заручилась поддержкой таких влиятельных компаний, как Autodesk, Adobe, Chaos Group, Dassault Systèmes и, конечно же, Epic Games (среди прочих), чтобы поддержать технологию аппаратной трассировки лучей в том или ином виде.

В начале состоялся анонс трёх карт. Флагманские Quadro RTX 8000 и RTX 6000 почти не отличались друг от друга: обе обеспечивают одинаковую мощность и пропускную способность памяти благодаря комбинации 4608 ядер CUDA, 576 тензорных ядер и памяти GDDR6. Разница между ними заключалась в том, что RTX 8000 оснащается 48 Гбайт памяти (24 чипа GDDR6 14 Гбит/с, 384-бит шина), в то время как RTX 6000 наделена 24 Гбайт. Максимальная производительность в вычислениях с плавающей запятой была заявлена на уровне 16 терафлопс (видимо, 32 терафлопс для операций половинной точности) и 10 миллиардов лучей в секунду в режиме трассировки.

Вместе с этими монстрами NVIDIA предложила также более дешёвый ускоритель Quadro RTX 5000, наделённый 3702 ядрами CUDA, 384 тензорными ядрами и 16 Гбайт памяти GDDR6 (14 Гбит/с, 256-бит шина). Теоретическая производительность решения в вычислениях с плавающей запятой не сообщалась, но карта была способна обрабатывать до 6 миллиардов лучей в секунду в режиме трассировки.

NVIDIA сообщила, что на всех картах имеется 4 выхода DisplayPort 1.4 и разъём формата USB-C с поддержкой VirtualLink. Недавно введённый стандарт VirtualLink позволял по одному кабелю переносить всё видео, данные и питание, необходимые для шлемов виртуальной реальности и подключать гарнитуры напрямую к видеокарте, чтобы минимизировать задержки и избавиться от лишних шнуров. В то время не было совместимых с VirtualLink шлемов, но Oculus, Valve и Microsoft заявили о поддержке стандарта, так что это было лишь вопросом времени.

Энергопотребление ускорителей семейства Quadro RTX планировалось менее 250 Вт. Новые карты Quadro RTX вышли в последнем квартале этого года, а цены были весьма высокими: $2300 за RTX 5000, $6300 за RTX 6000 и, наконец, впечатляющие $10000 за флагманский ускоритель RTX 8000.

По словам производителей, архитектура Turing стала самым большим прорывом со времен изобретения GPU CUDA в 2006 году. Архитектура Turing оснащена специальными процессорами для трассировки лучей, которые называются RT-ядра. Они ускоряют расчеты движения света и звука в 3D-среде до 10 GigaRays в секунду. Как отмечает NVIDIA, Turing ускоряет трассировку лучей до 25 раз по сравнению с предыдущим поколением Pascal, а GPU-ноды справляются с финальным рендерингом при наложении эффектов в фильмах в 30 раз быстрее, чем ноды на базе GPU.

Архитектура Turing также располагает тензорными ядрами — процессорами, которые ускоряют обучение глубоких сетей и инференс, обеспечивая до 500 трлн тензорных операций в секунду. Turing впервые получила новые RT-ядра для ускорения трассировки лучей и новые тензорные ядра для инференса, что позволяет производить трассировку лучей в реальном времени.

Инференс – это та задача, для выполнения которой необходимы обученные нейронные сети. Так как новые данные поступают в систему в виде изображений, речи, поисковых запросов по изображениям, именно инференс позволяет находить ответы и давать рекомендации, что лежит в основе большинства сервисов искусственного интеллекта. Сервер, оснащенный одним Tesla GPU, обеспечивает в 27 раз более высокую производительность в задачах инференса по сравнению с сервером на основе CPU, что приводит к значительному снижению затрат на инфраструктуру дата-центра.

Ключевой особенностью новинок, как подсказывает название, является высокая производительность при трассировке лучей в реальном времени, обеспечиваемая за счёт специализированных RT-ядер. По оценкам самой компании, с данной задачей адаптеры на новой архитектуре справляются в 25 раз лучше, нежели их предшественники из семейства Pascal.

NVIDIA представила свои первые продукты на базе архитектуры Turing. Ими стали видеокарты NVIDIA Quadro RTX 8000, Quadro RTX 6000 и Quadro RTX 5000, предназначенные для дизайнеров и художников в разных областях промышленности.

Все три описанные выше профессиональные видеокарты имели двухслотовое исполнение и охлаждаются силами воздушного кулера с одним центробежным вентилятором. На торце карт помимо четырёх видеовыходов DisplayPort 1.4 также присутствует один USB Type-C, к которому можно будет подключать новые VR-гарнитуры, совместимые с VirtualLink. Видеокарты Quadro на базе Turing появились на рынке по цене 10 000, 6 300 и 2 300 долларов, соответственно.  

 


Лицензия