Алгоритм - Учебный центр

Версия сайта для слабовидящих
Заполните форму ниже! Мы вам перезвоним!

Нажав на кнопку "Отправить", Я даю своё согласие на автоматизированную обработку указанной информации, распространяющейся на осуществление всех действий с ней, включая сбор, передачу по сетям связи общего назначения, накопление, хранение, обновление, изменение, использование, обезличивание, блокирование, уничтожение и обработку посредством внесения в электронную базу данных, систематизации, включения в списки и отчетные формы.


Информация о развитии cемейства процессоров GeForce 8800 (типичные представители).

Информация о развитии семейства процессоров GeForce 8800 (типичные представители).

В составе семейства GeForce 8800 были два процессора: GeForce 8800 GTX и урезанный вариант GeForce 8800 GTS (все видеокарты на основе этих графических процессоров, которые можно было встретить на рынке под логотипами разных компаний, на самом деле являлись референсными видеокартами NVIDIA и ничем кроме коробки и, возможно, комплектации не отличались друг от друга). Стоимость видеокарты на GPU NVIDIA GeForce 8800 GTX составляла 599 долл., а видеокарты на GPU NVIDIA GeForce 8800 GTS - 499 долл. Графические процессоры семейства GeForce 8800 были выполнены еще по 90-нанометровому техпроцессу. При этом топовая модель NVIDIA GeForce 8800 GTX имела 681 млн. транзисторов. Все процессоры семейства GeForce 8800 производились компанией TSMC. Разница между процессорами GeForce 8800 GTX и GeForce 8800 GTS заключается в числе унифицированных потоковых процессоров (SP), тактовой частоте работы SP и графического ядра, а также в разрядности шины памяти, частоте работы памяти и объеме поддерживаемой памяти. Так, GPU GeForce 8800 GTX имеет 128 унифицированных потоковых процессоров, а GeForce 8800 GTX - только 96. При этом тактовая частота SP в GeForce 8800 GTX составляет 1350 МГц, а в GeForce 8800 GTS - 1200 МГц. Тактовая частота остальных блоков (кэш, модули текстурирования и т.д.) процессора GeForce 8800 GTX равна 575 МГц, а процессора GeForce 8800 GTS - 500 МГц.

Референсная видеокарта на базе процессора GeForce 8800 GTX имела 768 Мбайт видеопамяти GDDR3. При этом ширина шины памяти составляла 384 бит, а частота работы памяти - 1800 МГц. Соответственно пиковая пропускная способность шины памяти равна 86,4 Гбайт/с.

Референсная видеокарта на базе процессора GeForce 8800 GTS имела 640 Мбайт видеопамяти GDDR3. При этом ширина шины памяти составляла 320 бит, а частота работы памяти - 1600 МГц. Соответственно, пиковая пропускная способность шины памяти была равна 64 Гбайт/с. Все остальные технические характеристики и функциональные возможности видеокарт на процессорах GeForce 8800 GTX и GeForce 8800 GTS совпадали.

Графические процессоры семейства GeForce 8800 были самыми производительными игровыми графическими процессорами. Но далеко не все их потенциальные возможности можно было сразу реализовать. Так, эти процессоры поддерживали спецификацию API DirectX 10, которая тогда еще официально не была объявлена. Кроме того, не было и игр, совместимых с DirectX 10. Ну а поскольку раскрыть все потенциальные возможности видеокарт на базе процессоров семейства GeForce 8800 можно было только при использовании приложений DirectX 10, то понятно, что эти карты были ориентированы на будущее.

В то же время ориентация графических карт на базе процессоров нового поколения на приложения DirectX 10 вовсе не означает, что они не были совместимы с приложениями DirectX 9 и вообще с любыми играми. Видеокарта на графическом процессоре GeForce 8800 GTX позволяла в то время получить рекордный уровень производительности, недоступный для видеокарт на базе процессоров ATI и для видеокарт на базе процессоров NVIDIA предыдущего поколения.

Анонс новых игровых решений был осуществлен в августе 2018 г. в Кельне на игровой выставке Gamescom 2018. Nvidia назвала её новые игровые видеокарты, и новые профессиональные ускорители Quadro. Всего было анонсировано три модели: Quadro RTX 5000, Quadro RTX 6000 и Quadro RTX 8000. В данном сегменте Nvidia перешла к аббревиатуре RTX в обозначении своих устройств. Все новинки основаны на архитектуре Turing. Известно, что площадь новых GPU составляет 754 мм2, а количество транзисторов достигает 18,6 млрд. При этом у старшей из карт 4608 ядер CUDA. Напомним, GPU GV100 имеет площадь 815 мм2, содержит 21,1 млрд. транзисторов и включает 5376 ядер CUDA (CUDA – это архитектура параллельных вычислений от NVIDIA, позволяющая существенно увеличить вычислительную производительность благодаря использованию GPU - графических процессоров).

Архитектура Turing (Nvidia) оснащена специальными процессорами для трассировки лучей – ядрами RT. Они ускоряют расчеты перемещения света и звука в 3D-средах до 10 миллиардов лучей в секунду. Turing позволяет осуществлять трассировку лучей в реальном времени в 25 раз быстрее по сравнению с предыдущим поколением GPU Pascal, а финальный рендеринг эффектов в фильмах на GPU в 30 раз быстрее, чем на CPU.

По словам производителей, архитектура Turing стала самым большим прорывом со времен изобретения GPU CUDA в 2006 году (специальные процессоры - ядра RT для трассировки лучей, тензорные ядра для инференса). Архитектура Turing оснащена специальными процессорами для трассировки лучей, которые называются RT-ядра. Они ускоряют расчеты движения света и звука в 3D-среде до 10 GigaRays в секунду.

Архитектура Turing располагает тензорными ядрами - процессорами, которые ускоряют обучение глубоких сетей и инференс, обеспечивая до 500 трлн. тензорных операций в секунду. Turing впервые получила новые RT-ядра для ускорения трассировки лучей и новые тензорные ядра для инференса, что позволяет производить трассировку лучей в реальном времени.

Инференс – это та задача, для выполнения которой необходимы обученные нейронные сети. Так как новые данные поступают в систему в виде изображений, речи, поисковых запросов по изображениям, именно инференс позволяет находить ответы и давать рекомендации, что лежит в основе большинства сервисов искусственного интеллекта. Сервер, оснащенный одним Tesla GPU, обеспечивал в 27 раз более высокую производительность в задачах инференса по сравнению с сервером на основе CPU, что приводит к значительному снижению затрат на инфраструктуру дата-центра.

Ключевой особенностью новинок, как подсказывает название, является высокая производительность при трассировке лучей в реальном времени, обеспечиваемая за счёт специализированных RT-ядер. По оценкам самой компании, с данной задачей адаптеры на новой архитектуре справляются в 25 раз лучше, нежели их предшественники из семейства Pascal.

Microsoft представила стандарт Microsoft DirectX Raytracing (DXR), который стал частью DirectX 12, а NVIDIA на его базе анонсировала собственную реализацию (оптимизированную под ускорители с архитектурой Volta) - технологию GameWorks RTX (технологию трассировки лучей в реальном времени - Nvidia RTX).

Для осуществления возможности расчета трассировки лучей на остальных видеокартах Microsoft предлагает так называемый режим совместимости DXR, который был реализован с помощью компонента DirectCompute. Интерфейс программирования приложений DirectCompute предназначен для выполнения вычислений общего назначения на графических процессорах и является частью API DirectX. DXR - это расширение программного интерфейса DirectX 12 новым компонентом DirectX Raytracing API (DXR). Благодаря данным технологиям разработчики смогут применять трассировку лучей в реальном времени для создания реалистичных графических эффектов в играх (Raytracing - трассировка лучей).


Лицензия