Система квадро: quattro — Википедия – легендарный полный привод Audi. Описание и принцип работы

Преимущества профессиональной графики NVIDIA Quadro при работе с САПР приложениями

Дмитрий Чехлов. Автор многочисленных публикаций, посвященных компьютерной графике и 3D-технологиям, автор книги «Визуализация в Autodesk Maya: mental ray renderer», художник по освещению и затенению, технический специалист в области компьютерной визуализации, Активист Autodesk Community, Autodesk Certified Professional, участник программ Autodesk Developer Network и NVIDIA Partner Network.

Мой персональный блог: http://dimson3d.blogspot.ru/
Мой блог на RENDER.RU: http://render.ru/blog/dimson3d

Профессиональными графическими ускорителями NVIDIA Quadro я пользуюсь более 10 лет. Мне приходилось использовать самые разнообразные инструменты и возможности, реализованные в данных решениях, от простого отображения видовых окон проекций, до визуализации и вычислений на GPU с применением архитектуры NVIDIA CUDA. Довольно часто мне приходится отвечать на вопрос, в чем разница между игровой графикой и профессиональной. В этой статье я расскажу о преимуществах профессиональной графики при работе с профессиональными приложениями. Речь пойдет не о производительности, а о поддержке специфических функций, востребованных в приложениях САПР и для создания мультимедийного контента. Я провел исследование возможностей графических ядер таких популярных САПР, как Autodesk Inventor, SolidWorks, T-Flex CAD, КОМПАС 3D, Autodesk Maya , Autodesk 3ds Max и CATIA. Так же данная статья включает демонстрацию и описание возможностей доступных только для профессиональных графических ускорителей, таких как инструментарий NVIDIA WMI, nView Desktop Management, технология NVIDIA Mosaic и поддержка Multi-GPU.

Поддержка высоких уровней сглаживания

Наше знакомство с возможностями профессиональной графики и сравнение с возможностями игровой графики мы начнем с поддержки высокого сглаживания краев геометрии и линий. В отличие от игровых приложений, где высокое качество сглаживания может увеличить время визуализации кадра в профессиональных приложениях решается иная задача – качество выводимого изображения. Чем выше качество сглаживания линий и краев геометрии, тем легче анализировать модель или чертеж, определять детали и элементы сборок, и многое другое. Наиболее часто используется метод multisampling antialiasing. Он достаточно прост и доступен в библиотеках всех графических API. Однако для повышения качества сглаживания и устранения «ступенчатости» в гранях и линиях может потребоваться применение не только базовых методик сглаживания, но также и расширенных алгоритмов, позволяющих улучшать качество изображения.

Драйверы профессиональных карт Quadro предоставляют возможность выбирать в панели управления высокий уровень сглаживания – до 64х. На практике это дает существенно лучшее восприятие множества линий и границ объектов в сцене. На игровых видеокартах GeForce такие уровни сглаживания просто недоступны. На рисунке ниже приведен скриншот NVIDIA Control Panel для графических ускорителей GeForce и Quadro с активным режимом сглаживания

Override any application settings.
Здесь я хочу сделать небольшую ремарку. Поддержка сглаживания 64x может быть недоступна только в ряде некоторых графических ядер современных приложений. Многие разработчики стараются самостоятельно реализовать сглаживание линий и геометрии независимо от управления данной функцией со стороны драйвера.

Рис. 1-1. Драйвер GPU NVIDIA Quadro предоставляет возможность выбора более высокого качества сглаживания граней объектов и линий, по сравнению с драйвером для GPU NVIDIA GeForce.

В отличие от игровых графических ускорителей, в профессиональных ускорителях реализованы улучшенные методики обработки геометрии. Это позволяет значительно увеличить производительность в процессе воспроизведения анимации и загрузить в память все необходимые данные.[1]

Фильтрация текстурных карт играет важную роль, это актуально при работе над игровыми приложениями и при разработке аппаратных шейдеров, для Open GL или DirectX. Но для того, чтобы обрабатывать большое количество текстурных карт и реализовывать поддержку карт с высоким разрешением (до 16K), необходим другой подход при работе с графической памятью.

Использование графической памяти

Память графического ускорителя играет важную роль в обеспечении высокой производительности. Это один из ключевых показателей возможностей GPU. Такие возможности графических ядер, как кэширование геометрии и запись данных напрямую в графическую память, при достаточном объеме предоставляет гибкие возможности для воспроизведения анимации и интерактивного перемещения в сложных сценах без снижения производительности. Большие объемы памяти особенно важны в работе с GPU-ускоренными движками визуализации и такими технологиями, как Alembic, и интерактивными приложениями для презентационной визуализации (напр. Autodesk VRED).

Важной функцией при работе с памятью является её очистка для последующих задач или оптимальное использование для хранения данных. В профессиональных графических ускорителях память используется более равномерно, чем в игровых решениях. Это обусловлено максимально сбалансированной работой программного обеспечения и драйвера GPU, а также возможностям очистки памяти реализованной в нем.
В зависимости от проектов объем данных может варьироваться, а в ряде случаев может быть колоссален по определению, профессиональные карты традиционно оснащаются большим объемом памяти. Только среди профессиональных ускорителей есть возможность использовать до 24 Гб памяти, которые помогают работать с текстурами, моделями, данными любой сложности и хранить их, не опираясь на создание резервного кэша.
Мы провели тест на использование памяти профессиональными GPU. Основная его задача заключалась в отслеживании использования графической памяти в процессе моделирования трехмерной геометрии.
В процессе загрузки сцены и текстурных карт графическое ядро приложения старается полностью использовать память. В большинстве случаев 2 — 4 Гб графической памяти достаточно для работы над моделями средней сложности. С другой стороны, когда сцена содержит больше объектов и текстур, требования к объемам и возможностям памяти возрастают и могут потребоваться объемы в 8, 12 и более Гб, а так же повышаются требования к её рациональному использованию.
Рисунок ниже демонстрирует пример того, какой объем памяти используется при загрузке модели в пакете Autodesk Maya 2016. Так как в драйвере выбрано автоматическое распределение ресурсов GPU, графическое ядро программы отдало приоритет GPU с большим объемом памяти.

Рис. 2-1. Пример работы графического ядра приложения с GPU NVIDIA Quadro. И пример использования памяти при активизации режима отображения текстурных карт.

На диаграмме в Performance Monitor вы можете видеть, какой объем памяти требуется для хранения модели вагона. Поскольку отображение текстурных карт не активно, используется 1/3 объема графической памяти. Когда активизируется режим отображения текстурных карт, все используемые в сцене и в шейдерах модели текстуры будут загружены в память графического процессора. Но в отличие от игровых графических процессоров, память профессиональных графических процессоров используется более рационально. Когда данные не нужны, они будут выгружены из памяти и загружены обратно только тогда, когда это необходимо. Если же выполняется копирование геометрии и модели, нет необходимости в создании дубликатов данных в графической памяти, легче создать взаимосвязанные образцы и использовать их. Обратите внимание, что объем памяти немного меняется, увеличиваясь, а затем доходит до прежнего уровня. При этом, в сцене содержится больше объектов и экземпляров текстурных карт.

Рис. 2-2. Пример использования памяти при создании дубликатов геометрии и шейдеров с текстурами.

Оптимизация работы памяти на профессиональных графических ускорителях достигается за счет оптимизации графических ядер на основе расширений API OpenGL и Direct3D.

Управление рабочими столами

Одним из серьезных недостатков игровой графики является отсутствие функций для создания и управления рабочими столами. Обычно это решается с помощью реализованных в ОС функций или сторонних решений. Это накладывает множество ограничений. Но пользователи профессиональных ускорителей не имеют таких ограничений и могут использовать как функционал от NVIDIA, так и предоставляемые операционной системой функции. Таким образом, можно выполнять огромное количество комбинаций рабочих пространств на любой вкус. В отличие от игровых решений, профессиональные карты Quadro предоставляют инструменты для управления рабочими столами и их конфигурациями. nView Desktop Management входит в состав дистрибутива драйвера и программного обеспечения NVIDIA Quadro и предоставляет пользователям необходимый функционал для настройки рабочего пространства и распределения множества приложений между несколькими рабочими столами.

Рис. 3-1. Пример применения

nView Desktop Management для управления тремя рабочими столами.

Рабочие столы могут быть разбиты с помощью сетки, в каждую ячейку которой может быть помещено окно всего приложения или его отдельный диалог. На практике это очень удобно, особенно при работе с многооконными приложениями, где требуется организовать множество диалогов или буферов кадров. На рисунке ниже приведен пример организации нескольких окон с помощью разбивки по сетке.

Рис. 3-2. Пример применения функции Guideline Editor для распределения диалоговых окон приложений.

Еще одна полезная функция — привязка к границам экрана. В отличие от стандартной реализации в операционных системах Windows и Linux. Благодаря инструментарию nView Desktop Management, вы можете настроить определение границ экрана и действие окон приложения в процессе операций с ними.

Рис. 3-3. Функции Windows Manager позволяют пользователю лучше управлять окнами приложений.

Инструменты мониторинга и конфигурации

Так как графические ускорители NVIDIA Quadro ориентированы на профессиональных и корпоративных пользователей, разработчики NVIDIA предусмотрели специальный набор инструментов NVIDIA WMI (Windows Management Instrumentation) и специальный инструмент NVIDIA SMI для мониторинга загруженности графических процессоров, памяти и контроля температурного режима. Инструментарий NVIDIA WMI входит в дистрибутив драйвера для NVIDIA Quadro и доступен наряду с nView Desktop Management. Рисунок 4-1 наглядно демонстрирует компоненты установки драйверов NVIDIA GeForce и NVIDIA Quadro.

Рис. 4-1. Компоненты установки драйверов

GPU NVIDIA для линейки GeForce и линейки Quadro.

После установки драйвера с компонентами NVIDIA WMI, вы можете использовать все возможности мониторинга с помощью Microsoft Management Console и Performance Monitor. А если в ваши задачи входит администрирование нескольких удаленных компьютеров, подключение к ним и сбор данных произойдет гораздо быстрее, если использовать возможности локальной сети.

Рис. 4-2. Инструментарий Microsoft Management Console с оснасткой Performance Monitor и добавленными счетчиками NVIDIA GPU (NVIDIA WMI).

На рисунке выше приведен пример мониторинга производительности графических процессоров с помощью MMC, куда могут быть добавлены счетчики с помощью соответствующего диалога.

Также, в отличие от игровых видеокарт, в профессиональных GPU реализована возможность конфигурации под определенные задачи. Например, на одном из установленных в системе GPU вам необходимо выполнять только вычисления с помощью NVIDIA CUDA, а на другом/других, вам необходимо и вычислять и работать с графикой. Для распределения нагрузки вы можете использовать утилиту NVIDIA SMI, доступную как для Windows, так и Linux и выполнить соответствующую конфигурацию GPU. Данная утилита также доступна и для некоторых моделей игровых графических ускорителей, к ним относятся модели выпускаемые под брендом GTX Titan. Но функционал в данном случае будет сильно ограничен.

Рис. 4-3. Утилита NVIDIA SMI отображающая информацию о загрузке графических процессоров.

Конфигурация для работы с несколькими GPU

При возрастающем объеме данных, содержащихся в комплексных моделях, для достижения высокой скорости визуализации необходимо применение производительных GPU.

В драйвере NVIDIA Quadro доступна большая группа настроек — «Workstation», с помощью которой выполняется конфигурация GPU. При конфигурации вы можете выбирать, какой из доступных GPU будет использоваться для работы только с графикой, а какой для работы с графикой и вычислений. В драйвере для игровых графических ускорителей вы можете выбирать только графический процессор для вычислений в CUDA-приложениях. Что существенно ограничивает пользователя в конфигурации.

Рис. 5-1. Выбор GPU для визуализации виртуального пространства в OpenGL приложении, выбор GPU для вычислений в CUDA приложении и глобальная конфигурация параметров рабочей станции.

Рассмотрим наглядный пример настройки графических процессоров для распределения задач между вычислениями и визуализацией окон проекций на примере Autodesk 3ds Max и NVIDIA iray renderer. По умолчанию, 3ds Max и Iray используют все доступные графические процессоры. Обычно тот GPU, который используется операционной системой, будет не активен в Iray, а сам 3ds Max использует его для визуализации виртуального пространства. С другой стороны, если выполнить соответствующую конфигурацию драйвера, тот GPU, который не будет активен, не будет отображаться в списке доступных для визуализации в Iray устройств.

Рис. 5-2. Пример параметров NVIDIA Iray, когда все GPU могут быть использованы для вычислений и когда для вычислений может быть использованы устройства глобально определенные драйвером.

Рассматриваемое условие доступно для всех приложений, требующих распределения нагрузки между несколькими графическими процессорами. Это могут быть САПР, использующие графический процессор для ускорения вычислений и для визуализации, это могут быть мультидисплейные системы, когда множество дисплеев отображают информацию, а дополнительные графические процессоры выполняют вычисления в CUDA или OpenCL приложениях.

Несколько примеров реализации функций в САПР с GPU NVIDIA Quadro

В процессе исследования и написания данной статьи мною и моими коллегами было протестировано и изучено несколько известных и доступных пакетов САПР, использующих графическое ядро на основе библиотек Open GL, а так же их возможности, использующие технологии OpenCL и NVIDIA CUDA.
Основной упор мы делали на качестве изображения и производительности графического ядра при визуализации параметрической модели в виртуальном пространстве, использование ресурсов графических процессоров и выполнении вычислений общего назначения.

Производительность зависит не только от графики

Производительность такого программного обеспечения, как САПР, зависит от множества факторов. Результат выполняемых пользователем операций, вычисляется центральным процессором, а повторное вычисление всей модели может потребовать времени. Графические ускорители выполняют задачи связанные с визуализацией векторных данных параметрической модели, полученной в процессе вычислений с помощью центрального процессора и хранимой в оперативной памяти. С другой стороны, графический ускоритель может ускорить процесс вычислений в хорошо распараллеливаемых алгоритмах с помощью NVIDIA CUDA или OpenCL. Помимо этого, на протяжении нескольких лет компанией NVIDIA и её партнерами по консорциуму Khronos Group ведется разработка расширений для Open GL, позволяющих выполнять оптимизацию производительности приложений. Многие профессиональные графические приложения и их ядра начинают использовать возможности этих расширений для увеличения производительности.
Ключевая идея заключается в минимизации простоя в процессе вычислений, выполняемых на CPU и передаваемых GPU для визуализации. По своей сути, графический процессор не будет ожидать данные, которые к нему поступают после вычислений на CPU, и промежуток времени, в который GPU бездействует, будет заполнен определенными задачами, например вычислениями.

Рис. 6-1. Пример распределения задач между множеством потоков в процессе обработки сцены.

На рисунке 6-1 приведен пример профилирования сцены Autodesk Maya в процессе воспроизведения анимации. Каждый из голубых блоков — задачи, связанные с визуализацией силами Viewport 2.0, а каждый из блоков коричневого цвета — вычисление определенного элемента сцены с помощью CPU. В то время, когда выполняются вычисления в процессе трансформации и деформации объектов, графическое ядро программы выполняет визуализацию получаемых от CPU и данных. Из этого следует значительное повышение производительности в визуализации и вычислениях всей системы в целом. Когда мы снимаем с CPU лишние задачи по вычислениям, его возможности можно использовать для решения последовательных задач, но в то же время, хорошо распараллеливаемые и графические задачи выполняются на GPU. Таким образом, мы получаем прирост производительности графического ядра и приложения в целом.

КОМПАС-3D

Одним из удачных примеров реализации поддержки возможностей графических ускорителей и программного обеспечения NVIDIA Quadro является машиностроительная САПР — КОМПАС-3D. В отличие от конкурирующих решений, разработчики из компании АСКОН, совместно со специалистами компании NVIDIA, реализовали прямую поддержку функций драйвера NVIDIA Quadro.

Рис. 6-2. Пример отображения модели в виртуальном пространстве пакета КОМПАС-3D V16 на GPU NVIDIA GeForce и NVIDIA Quadro.

Рисунок 6-2 наглядно демонстрирует поддержку высокого уровня сглаживания, настраиваемого с помощью драйвера NVIDIA Quadro. При этом используемая плоскость отсечки также визуализируется с помощью графического ускорителя. В отличие от других решений, все параметры и контроль качества выполняется с помощью панели управления драйвером, а не через интерфейс приложения. В самом же приложении вы можете выбрать, будет ли использовано аппаратное ускорение или нет.

T-FLEX CAD

Еще один хороший пример использования технологий компании NVIDIA и возможностей профессиональной графики Quadro, является пакет T-FLEX CAD. Он также использует возможности спецификаций Open GL и драйвера NVIDIA Quadro, но обладает дополнительным функционалом — поддержкой визуализации трассировки лучей с использованием технологии NVIDIA OptiX.

Рис. 6-3. Параметры графической подсистемы пакета TFLEX CAD.

В отличие от пакета КОМПАС-3D, пакет T-FLEX CAD обладает глобальными настройками графической подсистемы в самом приложении и предоставляет пользователю возможность управлять качеством сглаживания и выполнять базовую оптимизацию производительности.

Рис. 6-4. Пример визуализации с помощью NVIDIA OptiX в T-FLEX CAD.

Библиотека OptiX позволяет выполнять трассировку лучей в режиме реального времени и обеспечивает разработчиков необходимыми спецификациями для разработки шейдеров материалов и источников света, а также инструментами интеграции с API OpenGL и Direct3D.

Важным достоинством работы с такими приложениями как КОМПАС-3D и T-FLEX CAD является поддержка OpenGL, это важное условие при работе с Multi-GPU конфигурациями. Вы можете распределить каждое из приложений на выделенный GPU с помощью драйвера NVIDIA Quadro и выполнять все необходимые вычисления и работу со сценами в каждом из приложений. Это удобно, когда необходимо готовить проект в нескольких приложениях и передавать данные из одного приложения в другое.

SOLIDWORKS

Пакет SolidWorks предоставляет своим пользователям богатый функционал. Его графическое ядро также оптимизировано для работы с профессиональными графическими ускорителями. Одной из важнейших функций для создания высококачественных образов напрямую в SolidWorks является функционал, заложенный в RealView.

Рис. 6-5. С помощью SolidWorks RealView вы можете создавать высококачественные иллюстрации с помощью OpenGL и аппаратных шейдеров.

Графическое ядро SolidWorks позволяет формировать высококачественные образы с высокой детализацией и такими эффектами, как штриховка и контурные линии. Для увеличения реализма модели, вы можете активизировать вычисление эффекта Ambient Occlusion. Данный эффект отлично визуализируется современными профессиональными графическими ускорителями и может быть применен на сложных сборках с большим количеством деталей.

При использовании профессиональных ускорителей NVIDIA Quadro пользователям SolidWorks доступны все основные возможности графического ядра и высококачественного затенения.[2]

SOLIDWORKS Visualize

Для высококачественной визуализации изображений и анимации в пакет программ SolidWorks входят два продукта SolidWorks Visualize Standard и SolidWorks Visualize Professional. Эти продукты используют возможности ядра NVIDIA iRay для фотореалистичной визуализации создаваемых моделей.
Ядро NVIDIA iRay может работать в двух режимах, высококачественном фотореалистичном режиме (Unbiased mode) и в упрощенном режиме, основанном на простой трассировке лучей (Biased mode).

Рис. 6-6. Пакет SolidWorks Visualize позволяет выполнять фотореалистичную визуализацию изображений с применением возможностей графических ускорителей.

Благодаря поддержке возможностей распределения нагрузки в задачах между различными GPU высокую производительность в SolidWorks Visualize помогают обеспечивать multi-gpu конфигурации с NVIDIA Quadro и NVIDIA Tesla. Вы можете выполнять отображение сцены в OpenGL на графическом ускорителе NVIDIA Quadro, а визуализацию сцены с высоким качеством и реалистичными освещением и материалами можете выполнять силами специализированных вычислителей NVIDIA Tesla. Это помогает распределить нагрузку и добиться высокой производительности в интерактивной навигации. Все управление графическими ускорителями может быть осуществлено с помощью драйвера для NVIDIA Quadro и NVIDIA Tesla.

CATIA LiveRendering

Система интерактивной и фотореалистичной визуализации CATIA LiveRendering также основана на технологии NVIDIA iRay. С ее помощью вы можете выполнять визуализацию изображений и моделей, создаваемых с помощью системы CATIA и предоставлять полученные образы клиентам.

Рис. 6-7. Система визуализации CATIA LiveRendering на основе NVIDIA iRay.

Как и весь комплекс CATIA, решение LiveRendering является отдельным элементом, но интенсивно связанным со всей системой в целом. Для обеспечения высокой производительности и комфорта в работе с множеством приложений и решений комплекса, необходимо обратиться к профессиональным решениям, позволяющим выполнять визуализацию виртуального пространства и вычисления на GPU без перерасхода ресурсов.

Решение LiveRendering может быть использовано совместно с NVIDIA Quadro и программно-аппаратной платформой NVIDIA Quadro VCA, позволяя увеличивать производительность в работе над комплексными и сложными моделями.

Autodesk 3ds Max

Пакет Autodesk 3ds Max является одним из лидирующих инструментов для создания компьютерной графики и анимации, а так же для высококачественной визуализации. Приложение использует множество технологий для достижения оптимальной производительности как при визуализации сцен в видовых окнах проекций, так и в вычислениях общего назначения. Разработчики компании Autodesk, совместно с NVIDIA реализовали поддержку ключевых возможностей DirectX и поддержку современных графических процессоров, интеграцию NVIDIA PhysX и его компонентов, а также поддержку вычислений общего назначения для тесселяции геометрии с помощью OpenSubdiv.

Рис. 6-8. Autodesk 3ds Max 2016 с выбранным в качестве текущей системы визуализации NVIDIA Iray.

Компания NVIDIA ведет разработку комплексных решений для фотореалистичной визуализации и технологий, позволяющих использовать обширные возможности GPU для ускорения вычислений. Системы визуализации NVIDIA iRay, NVIDIA mental ray и язык описания материалов NVIDIA MDL, интегрированные в Autodesk 3ds Max, благодаря применению совместно с графическими ускорителями NVIDIA Quadro и NVIDIA Tesla, представляют комплексную платформу для визуализации в режиме Active Shade и окончательной высококачественной визуализации.
Пользователи V-Ray и Octane Renderer также по достоинству оценят возможности ускорения вычислений в процессе визуализации. В каждом из представленных ядер визуализации реализована поддержка Multi-GPU конфигураций систем. Программное обеспечение рабочих станций с несколькими GPU NVIDIA Quadro или NVIDIA Tesla может быть сконфигурировано для использования, одного, нескольких или всех графических процессоров, доступных в системе. А благодаря драйверу и программному обеспечению NVIDIA Quadro, пользователю предоставляется возможность оптимально использовать память графического процессора для хранения данных и вычислений.

Autodesk Maya

Система 3D моделирования и анимации Autodesk Maya по праву считается одним из лидирующих в индустрии M&E решений для создания высококачественной фотореалистичной анимации и визуальных эффектов. С помощью открытых форматов данных и мощнейшей системе макропрограммирования на основе Maya Embedded Language и Python, пакет получил признание среди многих профессиональных художников и технических директоров студий. Графическое ядро Maya может использовать одно из двух графических API – Open GL или DirectX, что позволяет использовать её как на платформе Windows, так и на платформах macOS и Linux.

Рис. 6-9. Графическое ядро Viewport 2.0 позволяет работать как со сложными моделями, так и текстурами с большим разрешением, а также предоставляет возможность использовать базовые методы затенения и визуализации.

Ядро Viewport 2.0 является многопоточным графическим ядром, использующим возможности систем с многоядерными процессорами и несколькими GPU (Multi-GPU). Графические ускорители NVIDIA Quadro и NVIDIA Tesla могут быть использованы для визуализации и работы с комплексными сценами, содержащими большое количество геометрии и текстуры в большом разрешении, а также обеспечивают высокое качество сглаживания и эффектов Bump Mapping, Tessellation и Ambient Occlusion.
Графические ускорители в Maya играют важную роль, они могут быть использованы не только для отображения виртуального пространства сцены, но и для ускорения работы ядра программы, обрабатывающего как геометрию и ее тесселяцию, так и деформеры, используемые для ускорения процессов вычислений трансформации геометрии в сцене.

На приведенном выше видео представлен пример использования GPU для ускорения обработки сцены в процессе воспроизведения анимации. Прирост скорости воспроизведения анимации обеспечивается оптимизацией деформеров и ядра программы для многопоточных вычислений. В процессе просмотра обратите внимание на изменяющееся значение Frame Rate, в зависимости от того, какой режим выбран DG, Serial, Serial + GPU Override, Parallel и Parallel + GPU Override.
Как и в случае с 3ds Max, пользователи могут использовать все возможности графических ускорителей для увеличения производительности в процессе визуализации с помощью таких движков визуализации, как NVIDIA mental ray, V-Ray, NVIDIA iRay for Maya, V-Ray RT, Octane Renderer и других.

Приложения Adobe Creative Cloud

Практически все ключевые приложения, входящие в пакет Adobe Creative Cloud предоставляют поддержку современных технологий, реализованных в графических ускорителях, линейки Quadro. Известный пакет Adobe Photoshop СС использует возможности графических ускорителей для того что-бы обеспечивать высокую производительность в визуализации холста и работу таких инструментов, как Hand tool, Rotate canvas tool, Zoom tool и обеспечивает визуализацию трехмерного пространства в процессе работы с 3D моделями.

Рис. 6-10. Графический ускоритель используется для увеличения производительности инструмента Rotate canvas в Adobe Photoshop CC.

Пользователи, использующие профессиональные дисплеи с поддержкой отображения цветов 10-bit канал (30-bit display), при использовании графических ускорителей NVIDIA Quadro могут использовать возможности данных GPU для отображения 30-bit цветов, что существенно увеличивает качество визуализации изображений, содержащих большое количество градиентов и требующих высокую точность цветопередачи. Это актуально, в процессе работы с научными и медицинскими изображениями, получаемыми с помощью компьютерной томографии и других высокоточных приборов.

Рис. 6-11. C NVIDIA Quadro, вы можете использовать все возможности графического ядра Adobe Photoshop CC.

Многие из фильтров в Adobe Photoshop поддерживают возможности вычислений с помощью GPU с применением Open CL. Такой подход позволяет значительно увеличить производительность в обработке изображений с большим разрешением и содержащими множество слоев.

Редактор векторной графики Adobe Illustrator CC включает в своем арсенале возможности для ускорения обработки и вычислений векторных форм, с помощью набора расширений NVIDIA Path Rendering доступных для OpenGL. Данный подход позволяет увеличить производительность обработки сложных векторных иллюстраций ядром Adobe Illustrator в несколько раз и обеспечивает высокое качество отображения векторных форм.

Индустрия кинематографа и современного телевидения уже давно перешагнула за рамки формата Full HD, современные фильмы снимаются с помощью камер, поддерживающих разрешения кадра 4K и 5K. Это накладывает определенные требования к рабочим станциям и возможностям графической подсистемы для обработки материала с таким разрешением и примененными к нему эффектами. Пакет нелинейного монтажа Adobe Premiere Pro CC использует возможности графических ускорителей для увеличения производительности воспроизведения видео, обработки эффектов и переходов.

Ядро Adobe Mercury Playback Engine предоставляет возможность использовать возможности GPU для ускорения вычислений. Пользователи могут использовать возможности данного ядра, не ограничиваясь только одним пакетом Premiere Pro, они доступны и в Adobe Photoshop CC и Adobe Media Encoder CC, когда вы выполняете сборку и экспорт видео.

При использовании GPU с большими объемами памяти, достигается значительное увеличение производительности в воспроизведении видео высокого разрешения с эффектами и масками в режиме реального времени.
Пакет Adobe After Effects CC также использует возможности GPU для ускорения вычислений. Помимо того, что в данном пакете используется OpenGL для отображения пространства композиции, так и для визуализации трехмерных композиций, освещения, 3D объектов и материалов, используются возможности библиотеки NVIDIA OptiX.

ПРОДОЛЖЕНИЕ>>

Профессиональные видеокарты NVIDIA Quadro P4000 и P2000: обзор и тестирование

Введение


Совсем недавно мы опубликовали обзор Quadro P6000 и Quadro P5000 – флагманских представителей свежего семейства видеокарт NVIDIA для рабочих станций, которые были анонсированы в середине прошлого года. В нём говорилось о том, что NVIDIA обновляет линейки профессиональных видеоускорителей ступенчато, и выпуск основанных на архитектуре Pascal карт Quadro среднего уровня может состояться не слишком скоро. Однако реальность оказалась несколько иной, и в прошлом месяце линейка Quadro претерпела достаточно серьёзные изменения. NVIDIA решила одним махом обновить все свои профессиональные карты среднего и нижнего сегментов, и перевести их со старых архитектур Kepler и Maxwell на наиболее современную основу поколения Pascal. Кроме того, компания добавила в линейку продуктов не имеющий аналогов среди предшественников бескомпромиссный акселератор высокого уровня Quadro GP100, который, в отличие от всех остальных своих собратьев, получил сразу всё самое лучшее, что можно было собрать на современном технологическом этапе: чип GP100 «Big Pascal», HBM2-память и высокую производительность при работе с вещественными числами 64-битной разрядности.

Image
Безусловно, такое событие не может быть обойдено нашим вниманием, и по мере возможностей мы будем знакомить наших читателей с тем, как видоизменилась линейка графических карт NVIDIA для рабочих станций после произошедших анонсов. Например сегодня, во втором материале, посвящённом видеокартам Quadro PXXXX, мы посмотрим на показатели производительности видеокарт с ценой в диапазоне от $500 до $1000 – именно такие предложения пользуются наибольшей популярностью среди пользователей инженерных пакетов для 3D-моделирования и автоматизированного проектирования. В этот ценовой интервал попадают две новинки: видеокарты Quadro P4000 и Quadro P2000. Ещё более дешёвые Quadro P1000, P600 и P400, как и Quadro GP100, пока останутся за кадром.

Подробнее о NVIDIA Quadro P4000 и P2000


Детально о том, какие новые возможности архитектура Pascal может принести в профессиональные ускорители, мы уже говорили. Это отнюдь не одно только увеличение производительности, ставшее возможным благодаря внедрению при производстве графических процессоров современного технологического процесса с 16-нм нормами, который в свою очередь позволил производителю нарастить частоты GPU и добавить некоторое количество дополнительных CUDA-ядер. Чипы Pascal дают новым Quadro и новые возможности. Так, теперь благодаря поддержке DisplayPort 1.4 они могут работать с 5K-мониторами (с частотой вертикальной синхронизации 60 Гц), а также обладают технологией Simultaneous Multi-Projection (SMP), полезной для построения сцен в виртуальной реальности.

Тем не менее, новые Quadro PXXXX чётко замещают собой предшественников из серий MXXXX и KXXXX, отправляя старые модели в категорию устаревших. За несколько последних лет NVIDIA смогла выработать сбалансированную матрицу продуктов, поэтому добавление каких-либо моделей с непривычным сочетанием цен, возможностей и TDP вряд ли имеет смысл. Иными словами, к Quadro P4000 и P2000 прежде всего стоит относиться к осовремененным альтернативам Quadro M4000 и M2000.


Старшая профессиональная карта для среднего сегмента, Quadro P4000, основывается на урезанном чипе GP104, который в полной версии применяется в более дорогой карте для рабочих станций, P5000. Из 20 потоковых мультипроцессоров, которыми располагает этот чип изначально, в P4000 активировано лишь 14. В результате, Quadro P4000 нельзя назвать профессиональным аналогом GeForce GTX 1070: игровая карта располагает большими вычислительными ресурсами. Однако для своих профессиональных ускорителей NVIDIA придерживается иных принципов формирования линейки, и Quadro P4000 – вполне уравновешенное по характеристикам предложение.

Image
Дело в том, что сокращение вычислительных ресурсов внутри графического процессора позволило NVIDIA создать заметно более энергоэффективную карту: Quadro P4000 выполнена в однослотовом дизайне, а для подключения к ней дополнительного питания используется всего один шестиконтактный разъём. При этом кулер, который NVIDIA сделала для Quadro P4000, – это уникальное решение для рабочих станций. В игровых картах подобных однослотовых систем охлаждения с радиальным вентилятором и выхлопом горячего воздуха за пределы компьютера попросту не бывает.

Тем не менее, Quadro P4000 обладает достаточно высоким уровнем быстродействия. Значительный рост тактовой частоты по сравнению с M4000 вкупе с добавлением некоторого числа дополнительных CUDA-процессоров делает P4000 примерно вдвое более производительным профессиональным акселератором по сравнению с предшественником. И даже более того, при сопоставлении новой и предшествующей линеек Quadro оказывается, что по вычислительной производительности P4000 почти на четверть превосходит и M5000.

Image
Столь существенный прогресс в быстродействии и поддержка технологии SMP позволяют NVIDIA классифицировать Quadro P4000 в качестве решения, подходящего для разработки в области виртуальной реальности. Однако нужно иметь в виду, что P4000 – это младшая карта из числа вариантов, годящихся для такой роли.

Несмотря на значительный по сравнению с M4000 рост скоростных характеристик, Quadro P4000 может похвастать весьма умеренными тепловыми характеристиками. Расчётное тепловыделение платы составляет всего лишь 105 Вт, и это на 15 Вт ниже расчётного тепловыделения Quadro M4000. Таким образом, с точки зрения удельной производительности на каждый затраченный ватт P4000 лучше своей предшественницы более чем в 2,3 раза. Именно поэтому модернизация рабочих станций с переходом от M4000 к новой P4000 может иметь немалый смысл.

Image
Подобно Quadro M5000 и M4000, P4000 несёт на себе 8 Гбайт GDDR5 SDRAM. В флагманских профессиональных ускорителях NVIDIA взяла курс на увеличение объёмов памяти, однако эта тенденция обошла P4000 стороной. Ширина шины памяти осталась 256-битной, но благодаря росту рабочей частоты чипов пропускная способность GDDR5 SDRAM по сравнению с M4000 существенно увеличилась. ECC у профессиональных карт классом ниже P5000 не поддерживается.

Поскольку Quadro P4000 – видеокарта с однослотовым дизайном, на ней имеется лишь четыре выхода DisplayPort 1.4, к которым можно подключать как 4K-мониторы (4096 x 2160) с частотой вертикальной синхронизации 120 Гц, так и 60-герцовые 5K-мониторы (5120 x 2880). Одной картой поддерживается до четырёх таких мониторов одновременно. Однако с применением двух дополнительных плат Quadro Sync II из восьми Quadro P4000 можно собрать единый массив, который сможет выводить информацию на объединённую «стену», составленную из 32 мониторов.

Image
Пришедшая на смену Quadro M2000 новинка с индексом P2000 – заметно более простое по сравнению с P4000 решение. Поэтому нет ничего удивительного в том, что эта карта не только имеет однослотовый дизайн, но и оснащена существенно более простой и короткой системой охлаждения, не закрывающей всю поверхность платы. Кроме того, P2000 не требует для своей работы подключения дополнительного питания: всю необходимую энергию она забирает из слота PCI Express.

Image
Впрочем, в производительном кулере и мощном электропитании Quadro P2000 и не нуждается, ведь в её основе лежит чип GP106, а не GP104. В игровом сегменте такой процессор применяется в видеокартах класса GeForce GTX 1060, но в Quadro P2000 он ещё и дополнительно урезан. Из 1280 доступных CUDA-ядер в P2000 доступно только 1024. Тем не менее, по сравнению с предшественниками производительность Quadro P2000 смотрится всё равно весьма впечатляюще. Оставаясь в рамках того же самого 75-ваттного теплового пакета, новинка не только на 66 процентов быстрее Quadro M2000, но и на 15 процентов превосходит в вычислительной производительности M4000.

Image
Возможности чипа GP106 в P2000 сокращены не только в части расчётных ресурсов. В профессиональной видеокарте NVIDIA отключила также один из шести каналов памяти, в результате чего ширина шины памяти снизилась до 160 бит, а объём поддерживаемой памяти принял крайне непривычную величину 5 Гбайт, что, впрочем, на 1 Гбайт больше, чем устанавливалось в M2000. К тому же, раньше видеокарты такого класса имели 128-битную шину, поэтому пропускная способность памяти в итоге заметно выросла.

Image
Подобно P4000, ускоритель Quadro P2000 снабжается четырьмя портами DisplayPort 1.4, которые имеют ровно такие же свойства, как и у старшей карты.

Image
Стоит отметить, что различия между новыми Quadro P2000 и P4000 не ограничиваются лишь производительностью, энергоэффективностью и объёмом памяти. Поддерживает SLI, совместима с модулем Quadro Sync II и оснащена стерео-разъёмом только более быстродействующая и дорогая Quadro P4000. Quadro P2000 же ничего из этого списка своим обладателям предложить не сможет и потому выступает заметно более простым графическим 3D-акселератором для систем автоматизированного проектирования и трёхмерного моделирования.

Стоимость Quadro P4000 прогнозируется на уровне $800, Quadro P2000 же, судя по имеющимся данным, будет стоить в районе $500. Поступление карт в продажу ожидается в ближайшее время.

Как мы тестировали


Тестирование профессиональных видеокарт мы выполняли, используя в качестве платформы рабочую станцию, основанную на восьмиядерном процессоре Intel Core i7-6900K с архитектурой Broadwell-E, разогнанном до частоты 4,0 ГГц. Также, в составе тестовой платформы использовалась материнская плата на чипсете Intel X99 и 32 Гбайт скоростной четырёхканальной памяти стандарта DDR4-2666 SDRAM. Вместе с профессиональными видеокартами, относящимися к поколению Pascal, в сравнении приняли участие флагманские карты предыдущего поколения.

Таким образом, для тестов было задействовано следующее оборудование:

Процессор: Intel Core i7-6900K на частоте 4,0 ГГц (Broadwell-E, 8 ядер + HT, 20 Мбайт L3).
Процессорный кулер: Noctua NH-D15.
Материнская плата: ASUS X99-Deluxe (LGA2011-v3, Intel X99).
Память: 4 × 8 Гбайт DDR4-2666 SDRAM, 15-15-15-35 (2 x Patriot Viper 4 PV416G300C6K).
Видеокарты:

NVIDIA Quadro P5000;
NVIDIA Quadro P4000;
NVIDIA Quadro P2000;
NVIDIA Quadro M5000;
NVIDIA Quadro M4000;
NVIDIA Quadro M2000.

Дисковая подсистема: Kingston HyperX Savage 480 GB (SHSS37A/480G).
Блок питания: Corsair RM850i (80 Plus Gold, 850 Вт).

Тестирование проводилось в операционных системах Windows 7 Professional SP1 x64 и Microsoft Windows 10 Enterprise Build 10240.

Использовавшиеся версии драйверов:

Intel Chipset Driver 10.1.2.80;
Intel Management Engine Interface Driver 11.0.0.1172;
Intel Turbo Boost Max Driver Version 1.0.1.9;
NVIDIA Quadro Driver Release 376.84.

Тестирование видеокарт происходило в разрешениях 1920 × 1200 и 3840 × 2160 с отключенным параметром Vsync. Использование сразу двух вариантов разрешения обусловлено тем, что современные профессиональные ускорители среднего ценового диапазона широко применяются в рабочих станциях, работающих с различными мониторами. Хотя устойчивая тенденция к переходу к 4K-разрешениям вовсю прослеживается и в сфере профессиональной графики, многие инженеры пока продолжают пользоваться старыми FullHD-мониторами. Поэтому сегодняшнее тестирование было выполнено по расширенной схеме, с учётом интересов всех групп пользователей.

Для тестирования производительности в CAD/CAM-пакетах Autodesk 3ds max, Autodesk Maya, Dassault Systèmes SolidWorks и в PTC Creo использовались тесты, специально разработанные корпорацией Standard Performance Evaluation Corporation (SPEC). Для оценки скорости работы в Autodesk AutoCAD использовался тест Cadalyst Systems Benchmark. Кроме того, для прочих аспектов производительности применялись некоторые синтетические тесты: Futuremark 3DMark 2.3.3663, Luxmark 3.1 и Compubench CL 1.5 Desktop Edition.

Производительность в CAD/CAM-пакетах



SPECviewperf 12.1

При тестировании профессиональных видеоускорителей первым делом мы всегда обращаемся к синтетическому тесту SPECviewperf, который за время своего существования занял место индустриального стандарта при первичной оценке производительности высокопроизводительных рабочих графических станций. Моделируя типовую нагрузку, этот тест показывает «чистую геометрическую» производительность ускорителей при работе через OpenGL и DirectX, которая определяется как аппаратными особенностями, так и качеством оптимизации драйверов. Принцип работы этого теста заключается в передаче графическому драйверу заранее сформированных трасс – последовательностей команд, задающих визуализацию сложных моделей, характерных для тех или иных профессиональных приложений.

Встроенные в SPECviewperf используемой нами двенадцатой версии скрипты воссоздают деятельность пользователя в окнах проекции в следующих профессиональных приложениях (в скобках приводятся названия соответствующих тестов): 3ds max 2016 (3dsmax-05), CATIA V6 R2012 (catia-04), Creo 2 (creo-01), Energy – абстрактный программный пакет для геологоразведки месторождений нефти и газа (energy-01), Maya 2013 (maya-04), Medical – проприетарное программное обеспечение для объёмного рендеринга изображений, формируемыми KT и МРТ сканерами (medical-01), Showcase 2013 (showcase-01), Siemens NX 8.0 (snx-02), Solidworks 2013 SP1 (sw-03). Результатом тестов выступает частота кадров при работе с теми или иными моделями. Тест выполнялся в разрешениях 1920 × 1200 и 3840 × 2160.

Полусинтетический SPECviewperf очень убедительно сообщает о преимуществах архитектуры Pascal. Ещё когда мы тестировали флагманские профессиональные карты нового поколения, было очень хорошо заметно, что на этот раз NVIDIA совершила гораздо больший, чем обычно, шаг в сторону наращивания производительности. А в среднем сегменте это проявляется ещё очевиднее.

В частности, сравнительно недорогая Quadro P4000 не просто достаёт до уровня карты прошлого поколения, стоящей на ступеньку выше, как это происходило при смене семейств раньше. Она поднимается гораздо выше и обеспечивает очень заметное преимущество даже на фоне Quadro M5000. Аналогичным образом проявляет себя и Quadro P2000. Производительность этого ускорителя попадает в промежуток между M4000 и M5000. В итоге, произошедшее обновление линейки Quadro в какой-то мере можно назвать революционным. Дело в том, что благодаря внедрению архитектуры Pascal карт уровня P2000 и P4000 теперь может хватать для работы в системах автоматизированного проектирования и трёхмерного моделирования даже в 4K-разрешении.

Autodesk 3ds Max 2015

Тестирование в одном из популярнейших пакетов трёхмерного моделирования мы выполняли при помощи теста SPEC, который объединяет в себе 48 различных подтестов, направленных на комплексные измерения скорости моделирования, интерактивной графики и визуальных эффектов. Используемая нами версия этого бенчмарка работает с 3ds max 2015 SP4. Это – достаточно свежая версия пакета, а значит, в тесте задействуются новые шейдеры DirectX 11, векторные карты, новый движок визуализации окон проекции Nitrous и многие другие современные динамические и визуальные эффекты. Тесты проводились трижды: в разрешении 1920 × 1200 с использованием сглаживания 8x и без него, а также в разрешении 3840 × 2160 без сглаживания.

Image
Результаты показательны. На диаграмме нетрудно усмотреть подтверждение тезиса о том, что Quadro P4000 обеспечивает производительность лучше, чем M5000, а Quadro P2000 легко обходит M4000. Но гораздо интереснее другое наблюдение: видеокарты уровня выше P4000 сегодня не имеет смысла использовать в системах, работающих в FullHD разрешении, по крайней мере в 3ds max. Например, Quadro P5000 в таком разрешении выдаёт практически аналогичную производительность, как и более дешёвые GPU. А это значит, что системы с флагманскими профессиональными видеокартами должны комплектоваться современными мониторами или же многодисплейными массивами системами, собранными по технологии NVIDIA Mosaic.

Более подробные данные о скорости работы новинок при различных аспектах нагрузки можно получить на следующих диаграммах.


Autodesk AutoCAD 2016

Ещё одно популярное приложение для трёхмерного проектирования, работающее через интерфейс DirectX – это AutoCAD. Нагрузка на ускорители, создаваемая этим пакетом, не слишком велика, и с работой в нём прекрасно справляются даже игровые графические карты, но, тем не менее, разница в производительности решений разного уровня вполне заметна и особенно отчётливо проявляется при повышении разрешения. Для проверки производительности в AutoCAD мы использовали тест Cadalyst Systems Benchmark, который был проведён как в стандартном разрешении 1920 × 1200, так и с 4K-монитором в разрешении 3840 × 2160.

Image
Производительность профессиональных видеокарт в AutoCAD 2016 различается не столь сильно, особенно в FullHD-разрешении. Здесь гораздо большее значение имеет мощность центрального процессора, а для визуализации процесса проектирования вполне можно обойтись и видеокартой уровня Quadro P2000.

Однако это всё же не совсем так. Дело в том, что некоторые режимы отображения 3D-моделей всё-таки создают заметную графическую нагрузку. Например, наибольшими аппетитами выделяются каркасный и реалистичный режимы (Wireframe и Realistic). Именно ради них и имеет смысл отдавать предпочтение новым профессиональным видеокартам поколения Pascal, которые могут обеспечить более высокую плавность и точность отображения.

Image

Image
Впрочем, всё сказанное о производительности в AutoCAD относится в первую очередь к работе в 4K-разрешении. А для FullHD-мониторов видеокарты старше Quadro M4000 и P2000 совершенно избыточны.

PTC Creo Parametric 3.0

Система автоматизированного проектирования Creo – очень популярный инженерный инструмент, являющийся наследником пакета Pro/Engineer. Используемый нами бенчмарк разработки SPEC оперирует несколькими различными моделями, которые раскрывают разные аспекты производительности пакета Creo, в том числе и новые возможности, введённые в третьей версии этого программного обеспечения. Например, тест активирует порядко-независимую модель прозрачности поверхностей (Order Independent Transparency), методику SSAO (преграждение окружающего света в экранном пространстве), усовершенствованные материалы и рельефное текстурирование. Тесты проводились в двух разрешениях: 1920 × 1200 и 3840 × 2160.

Image
И вновь знакомая картина. Если вы планируете пользоваться FullHD-монитором, то выбирать карты мощнее Quadro P2000 смысла нет. Зато в 4K-разрешении мощные ускорители проявляют себя очень достойно. P4000 оказывается на 15 процентов быстрее, чем M5000 и на 51 процент – чем M4000. Не ударяет в грязь лицом и P2000. Эта видеокарта на 66 процентов обгоняет M2000 и заметно опережает даже M4000, обеспечивая примерно 19-процентное превосходство над ней. Столь убедительные результаты, показанные профессиональными ускорителями поколения Pascal, во многом обусловлены технологической продвинутостью пакета PTC Creo. Его графический движок не стесняется прибегать к задействованию теней и отражений, по-разному визуализирует различные классы материалов, использует карты рельефа и поддерживает HDR-изображения. Иными словами, пакет Creo совместно с современными видеокартами семейства Pascal способен создавать действительно реалистичную рабочую среду, что даёт инженерам возможность получать полное представление о внешнем виде деталей в реальном мире.

Кроме того, не стоит забывать, что различные режимы отображения моделей в окнах проекции создают разнородную нагрузку, и в каких-то случаях более мощные профессиональные ускорители могут сыграть куда более значимую роль, чем показано на диаграмме с интегральным результатом теста. Для того, чтобы убедиться в этом, давайте посмотрим на производительность новинок в Creo Parametric 3.0 более подробно.

Сильнее всего преимущество видеокарт нового поколения проявляется при включении реалистичных визуальных эффектов: затенения и отражений. Также определённую нагрузку создаёт и удаление невидимых линий. В этих случаях старшие карты линейки Quadro последнего поколения предложат наилучший уровень быстродействия.

Autodesk Maya 2016

Популярный редактор трёхмерной графики Maya 2016 – это хороший пример профессионального приложения, использующего интерфейс OpenGL. Причём, графический движок Viewport 2.0 в последних версиях Maya наконец-то переведён на современную версию OpenGL 4.x, в то время как в старых версиях использовался OpenGL 2.x. Именно поэтому для Maya стало важным использовать современные профессиональные видеокарты, драйверы которых полноценно поддерживают этот API. Для тестирования производительности мы воспользовались бенчмарком разработки SPEC, который был адаптирован к современной версии Maya и 4K-разрешению.

Image
Относительная усреднённая производительность карт Quadro разных поколений различается не слишком сильно, однако привычные соотношения результатов прослеживаются и тут. Quadro P4000 уверенно обходит субфлагмана прошлого поколения, а Quadro P2000 предлагает увеличение быстродействия не только по сравнению с M2000, но и с M4000.

Если же заняться анализом результатов более подробно, то можно получить следующую картину.

Обратите внимание, общая картина производительности в Maya сильно отличается от того, что наблюдалось в большинстве других пакетов. Здесь более мощные графические карты могут продемонстрировать свой потенциал не только в 4K-разрешениях. Даже при установке сравнительно невысокого по современным меркам разрешения 1920 × 1200 многие режимы окон проекции лучше работают на видеокартах с большим количеством CUDA-ядер. А это значит, что для Maya вопрос правильного подбора профессионального ускорителя может быть очень важен.

Solidworks 2015

SolidWorks — это распространённый программный комплекс САПР для автоматизации работ промышленного предприятия на этапах конструкторской и технологической подготовки производства. Используемый нами бенчмарк SPEC для этого пакета использует объёмные модели со сложностью до 4,75 миллионов треугольников и использует три новых эффекта отображения RealView, Ambient Occlusion и Shadows в сочетании с базовыми стилями: с затенением и с затенением с видимыми кромками. Кроме того, в тесте используется порядко-независимая прозрачность и полноэкранное сглаживание. Тесты проводились в разрешении 1920 × 1200 с полноэкранным сглаживанием и без него, и в разрешении 3840 × 2160 без сглаживания.

Image
SolidWorks оказывается ещё одним инженерным приложением, чувствительным к производительности GPU. Если смотреть на результаты, полученные в 4K-разрешении, то Quadro P2000, например, способна предложить 30-процентное увеличение быстродействия по сравнению с Quadro M2000, а Quadro P4000 по сравнению с M4000 обеспечивает улучшение интегрального скоростного показателя на 27 процентов. Столь впечатляющий прогресс закономерен. Профессиональные карты поколения Pascal не только получили на 66 и 100 процентов более высокую вычислительную производительность по сравнению со своими предшественниками серии Maxwell, но и располагают более скоростной подсистемой памяти, пропускная способность которой на текущем витке развития возросла на 25-33 процента.

Всё перечисленные новые возможности могут быть весьма кстати именно в SolidWorks, так как эта САПР поддерживает сложные визуальные стили.

До недавних пор профессиональные инженеры предпочитали при работе в SolidWorks режим отображения Shaded with Edges. Для современных ускорителей он не представляет большой проблемы: и Quadro P2000, и Quadro P4000 могут обеспечить в нём максимальную производительность, ограниченную лишь мощностью центрального процессора, особенно если речь идёт о работе в FullHD-разрешении. Однако по-настоящему преимущество новинок проявляется совсем не в этом. Гораздо важнее, что новые видеокарты семейства Pascal, относящиеся к среднему классу, способны сделать комфортной работу и в более сложных и наглядных режимах отображения моделей в окнах проекции. Например, режим RealView добавляет реалистичные материалы и поддерживает отражения среды и тени, а Ambient Occlusion дополнительно улучшает реалистичность затенения и помогает лучше выделять формы деталей.

Включение RealView и Ambient Occlusion накладывает серьёзную нагрузку на GPU, поэтому в этом случае производительные ускорители действительно необходимы. Особенно хорошо это видно на последних диаграммах с результатами при активации Ambient Occlusion. Видеокарты поколения Pascal выступают здесь значительно убедительнее по сравнению с предшественницами. Quadro P2000 опережает не только M2000, но и M4000, а Quadro P4000 оказывается способной на соперничество с флагманами прошлого поколения.

Вычислительная производительность


Профессиональные графические карты могут использоваться и при финальном рендеринге. Многие алгоритмы рендеринга свободно переносятся на параллельные процессоры GPU, и за счёт этого получают возможность более эффективного исполнения. NVIDIA, например, даже развивает собственную технологию фотореалистичного рендеринга NVIDIA Iray. Но для целей тестирования мы пользуемся другим движком для построения фотореалистичных изображений методом трассировки лучей, использующим мощности графических карт через универсальный программный интерфейс OpenCL, – LuxRender. LuxRender имитирует распространение света в реальности при помощи специальных алгоритмов и существует в версиях для следующего специализированного ПО: Blender, 3dsmax, SketchUp, C4D, XSI, Poser и др.

Для измерения скорости работы LuxRender мы воспользовались тестовым приложением LuxMark 3.1 и двумя сценами: Newmann TLM-102 SE средней сложности и Hotel Lobby с высокой сложностью.

Image

Image
Особенностью профессиональных графических карт NVIDIA последних поколений, в том числе и Pascal, выступает их невысокая вычислительная производительность при работе с числами двойной точности. Фактически, производительность FP32- и FP64-операций для GPU класса Quadro PXXXX соотносится как 1:32, из-за чего, например, такие акселераторы плохо подходят для сложных научных расчётов (это не касается Quadro GP100). Однако для работы в системах трёхмерного моделирования и автоматизированного проектирования это не страшно – в них нужны лишь операции одинарной точности. Это же касается и финального рендеринга. В итоге, в тесте LuxMark новые карты Quadro демонстрируют существенно возросшую производительность по сравнению со своими предшественницами – в полном соответствии с увеличением теоретических показателей Тфлопс.

Другим тестом, на базе которого мы делали выводы о вычислительной производительности, стал кроссплатформенный CompuBench CL. Он способен оценить вычислительную скорость графических процессоров при разной нагрузке, например, при физической симуляции частиц или поверхности жидкости, либо при распознавании лиц.

Здесь вычисления с двойной точностью также не используются. И мы вновь видим, что новое поколение карт Quadro работает заметно быстрее старого.

Производительность в игровом 3D


По традиции тестирование производительности профессиональных видеокарт мы завершаем, приводя их результаты в игровом тесте Futuremark 3DMark. Как нередко отмечается, у профессиональных карт обычно существуют геймерские прообразы. Сегодня же ситуация такова, что, хотя Quadro P4000 и P2000 и основываются на чипах GP104 и GP106, прямых аналогов среди игровых видеокарт у них нет. А потому тестирование производительности в 3DMark Fire Strike Ultra и представляет особый интерес: оно позволяет понять, на каком уровне находится DirectX-производительность рассмотренных решений.

Image
Результат Quadro P4000 заведомо ниже, чем у GeForce GTX 1070 и примерно соответствует показателям Radeon R9 Fury. В то же время Quadro P2000 заметно проигрывает GeForce GTX 1060 и приближается скорее к GeForce GTX 1050 Ti, что совершенно неудивительно, учитывая архитектурные особенности. Однако стоит иметь в виду, что применение игровых ускорителей в профессиональных задачах не позволит получить производительность уровня Quadro. Дело в том, что видеокарты, специально предназначенные для работы в системах автоматизированного проектирования и трёхмерного моделирования, имеют специальные оптимизации для обработки высокополигональных 3D-сцен со сложной геометрией, и это очень убедительно проявляется на практике.

Энергопотребление


Обновление профессиональных графических карт с внедрением архитектуры Pascal проведено таким образом, чтобы пользователи имели возможность заменить старые ускорители Quadro на новые без внесения каких-то изменений в систему питания или охлаждения. То есть, Quadro P4000 и P2000 номинально потребляют электроэнергии и выделяют тепла не более своих предшественников, а их габариты такие же, как у соответствующих карт поколения Maxwell.

Для того, чтобы проверить ситуацию с энергетическими и тепловыми характеристиками на практике, мы измерили фактический уровень энергопотребления полных систем (без монитора), оснащённых различными профессиональными видеокартами. Используемый нами в тестовой системе новый цифровой блок питания Corsair RM850i позволяет осуществлять мониторинг потребляемой и выдаваемой электрической мощности, чем мы и воспользовались для практических измерений. То есть, на следующем ниже графике приводится полное потребление систем, измеренное «после» блока питания и представляющее собой сумму энергопотребления всех задействованных в системе компонентов. КПД самого блока питания в данном случае не учитывается. Нагрузка для определения пикового потребления создавалась тестом FurMark 1.18.2, запущенным в режиме «Burn» в окне с разрешением 1280х720. Такой вариант нагрузки хорош тем, что он, как и большинство профессиональных приложений, использует API OpenGL.

Image
Новые карты чётко вписываются в установленные рамки. Потребление Quadro P2000 при максимальной нагрузке почти не отличается от потребления Quadro M2000, а Quadro P4000 даже немного экономичнее, чем Quadro M4000. Что, собственно, полностью подтверждает заявленные спецификации, в которых говорится, что P2000 и M2000 схожи по потреблению, а P4000 экономичнее предшественницы на 15 Вт.

Отдельно стоит сказать и о том, что применённые на средних картах поколения Pascal системы охлаждения отлично справляются со своей работой несмотря на достаточно скромные габариты. Процессоры GP104 и GP106 выпускаются с применением современного техпроцесса с 16-нм нормами, поэтому нагреваются они совсем не сильно. Даже при предельной нагрузке температура чипа GPU у Quadro P4000 и P2000 не выходит за пределы 80-85 градусов, а максимальная скорость вращения вентиляторов в обоих случаях составляет порядка 2500 оборотов в минуту. И это значит, что новые видеокарты заведомо не смогут причинить своим пользователям никакого акустического дискомфорта.

Выводы


Итак, профессиональные графические карты на базе архитектуры Maxwell стали, наконец, вчерашним днём. У всех карт серии Quadro MXXXX теперь есть достойные последователи с более новой архитектурой Pascal. Причём, на этот раз NVIDIA удалось сделать очень серьёзный шаг вперёд, который перевёл решения на базе Maxwell в категорию устаревших продуктов не только по формальным признакам. Производительность новых Quadro PXXXX действительно впечатляет. Так, любая из двух рассмотренных нами в обзоре средних карт нового поколения, P4000 и P2000, не только опережает свою прямую предшественницу, но и обгоняет карту прошлого поколения уровнем выше. А это значит, что быстродействие, которое раньше было свойственно лишь наиболее дорогим высокопроизводительным рабочим станциям, сегодня доступно по гораздо более низкой стоимости – в среднем ценовом сегменте.

Впрочем, эти же тесты показали, что столь высокая производительность требуется далеко не всегда. Нагрузку, которая способна загрузить хотя бы карты уровня Quadro P4000 и P2000, создают далеко не все приложения, особенно если речь идёт о работе в FullHD, а не 4K-разрешениях. С другой стороны, инженерных пакетов, которые достойны видеоускорителей такого класса, не так уж и мало, и здесь в качестве примеров можно привести достаточно солидный список, включающий SolidWorks, Creo, Catia, Maya, 3ds max и проч. Многие средства проектирования и моделирования постепенно приходят к необходимости использования в окнах проекции улучшенных эффектов визуализации. Дополнительная реалистичность становится всё более востребована, так как она позволяет сделать работу инженера более комфортной и продуктивной. Ускорители класса Quadro P4000 и P2000 хорошо подходят для таких случаев: как мы видели, с ними включение затенений и отражений в окнах проекции не приводит к падению производительности до недопустимых уровней. И это значит, что для профессиональной работы в современных системах автоматизированного проектирования и трёхмерного моделирования они способны стать весьма достойным вариантом.

При этом стоит подчеркнуть, что если говорить о видеокартах именно для САПР, то во многих случаях предложения уровня Quadro P6000 и P5000 на сегодня являются избыточными. Об этом мы говорили в нашем прошлом обзоре, и можем повторить это снова. Quadro P4000 и P2000 же хороши тем, что при таких применениях они предлагают вполне адекватную скорость по сравнительно невысокой цене. И вполне вероятно, что благодаря данному сочетанию качеств именно эти видеокарты станут одним из самых популярных выборов среди профессиональных инженеров. Кроме того, Quadro P4000 выступает младшей профессиональной видеокартой NVIDIA, которая подходит для работы с виртуальной реальностью, что открывает перед ней дополнительные горизонты.

Официальным производителем и поставщиком профессиональных видеокарт NVIDIA Quadro в Россию является компания PNY Technologies.


Металлочерепица Quadro Profi — фото и описание в каталоге Grand Line на официальном сайте

Устойчивость к климату Выдерживает сильные ветровые нагрузки, резкие температурные перепады. Идеально подходит для эксплуатации в условиях отечественного климата. Отлично выдерживает воздействие дождя, снега и других атмосферных явлений. Устойчива к резким перепадам температур. Отличается морозостойкостью. Не подвергается коррозии и гниению, вызванными воздействием атмосферных осадков. Устойчива к ультрафиолету. Выдерживает сильные ветровые нагрузки. Материал устойчив к воздействию атмосферных осадков. Отличается надежной защитой от образования конденсата и перегрева во время перепадов температур. Не боится воздействия воды и снега. Отличается максимальной устойчивостью к климатическим воздействиям: температурные перепады, ультрафиолет, осадки, ветровые нагрузки. Не боится коррозии. Сложность монтажа Для монтажа достаточно иметь инструкцию по монтажу, хорошо подготовленную поверхность, инструменты и комплектующие. Такой монтаж обойдется недорого. Требуется специальное оборудование и инструменты. Отличается удобством и простотой монтажных работ. Монтаж можно провести самостоятельно. Отличается быстрым монтажом, простотой крепления и фиксации к настилу. Не требует использования специального оборудования. Монтаж может производиться самостоятельно. Монтажные работы должны выполняться высококвалифицированными мастерами. Монтаж производится только квалифицированными мастерами, имеющими необходимый опыт и инструменты.

Клапан инфильтрации воздуха КИВ Квадро

 

• Новый приточный клапан КИВ Квадро (KIV Quadro) служит для притока свежего наружного воздуха в помещения в системах вентиляции, преимущественно с принудительной вытяжкой.

• Новый приточный клапан КИВ Квадро (KIV Quadro) является самостоятельным приточным вентиляционным шумоглушащим устройством и не предназначен для установки в оконные конструкции. Это позволяет устанавливать приточный клапан практически на любых объектах, не затрагивая конструкцию окон и не влияя на теплотехнические, звукоизоляционные и другие характеристики оконных конструкций.

• По сравнению с проветривателями
и оконными клапанами приточный клапан КИВ Квадро имеет ряд преимуществ: 
• не нарушает конструкции стеклопакета
• не усложняет установку окон и не увеличивает их стоимость
• может устанавливаться в любое время, даже после ремонта
• возможна поэтапная установка приточного клапана КИВ Квадро
• не ухудшает внешний вид окна
• приточный клапан не загромождает светопрозрачные поверхности
• может располагаться в любом месте наружной стены
• можно устанавливать в помещениях вообще не имеющих окон.
Приточный клапан представляет собой пластиковую трубу наружным диаметром 133 мм и длиной до 1м, которая вставляется в наружную стену здания, подрезается по толщине стены и с уличной стороны закрывается литой алюминиевой решеткой с сеткой. В трубе приточного клапана располагается теплошумоизоляция. Внутри помещения ставится белый пластиковый оголовок с фильтром и заслонкой. Можно сказать, что приточный клапан КИВ Квадро представляет собой модернизированную форточку. Наружная решетка приточного клапана с сеткой задерживает листву, тополиный пух, насекомых.
 Теплошумоизоляция приточного клапана предотвращает «расползание» холода в толще стены и снижает уличный шум. Фильтр очищает воздух, а заслонка в оголовке приточного клапана позволяет регулировать количество поступающего воздуха.

Акустические характеристики приточного клапана КИВ Квадро.

Исследования проводились при открытой заслонке в оголовке приточного клапана. Снижение уровня белого шума ?L, дБа составляет 38,9 на расстоянии 0,1 м и 53,3 на расстоянии 2м от приточного клапана КИВ Квадро. Снижение уровня эталонного транспортного шума ?L, дБа составляет 36,6 на расстоянии 0,1 м и 48,6 на расстоянии 2м от приточного клапана КИВ Квадро.

Конструкция и размеры приточного клапана КИВ Квадро.

Наружная решетка приточного клапана КИВ Квадро

• Наружная решетка приточного клапана предназначена для защиты от насекомых, тополиного пуха, листвы и пр. Представляет собой круглую литую алюминиевую решетку с наклонными жалюзи, предотвращающими попадание атмосферных осадков внутрь трубы приточного клапана. С внутренней стороны решетки установлена мелкая противомоскитная сетка.

Пластиковый канал (труба) и теплошумоизоляция приточного клапана КИВ Квадро.


• Пластиковый канал (труба) приточного клапана предназначен
для прохода воздуха от наружной решетки к внутреннему оголовку.

Внутри трубы располагается теплошумоизоляция, выполняющая две функции:
1. Предотвращение «расползания холода» от пластикового канала к внутренней поверхности стены
2. Поглощение шумов, проходящих через канал. При установке приточных клапанов КИВ Квадро в жилых комнатах, теплошумоизоляция поглощает большую часть уличных шумов, попадающих в пластиковый канал. При установке в котельной загородного дома, теплошумоизоляция поглощает шумы работающего котла и сохраняет тишину около дома.
• Стандартная длина пластикового канала приточного клапана 400, 500, 600 и 1000 мм. Канал может быть подрезан в зависимости от толщины стены, в которую он устанавливается.
Стандартная длина теплошумоизоляции приточного клапана 312 мм. Если длина канала позволяет, то возможно увеличение длины теплошумоизоляции, что дополнительно улучшит шумопоглощающие свойства.
• При монтаже приточного клапана КИВ Квадро теплошумоизоляцию следует располагать с внутренней стороны стены вплотную к оголовку КИВ Квадро (60 мм от края канала).

Внутренний оголовок приточного клапана КИВ Квадро.

• Внутренний оголовок приточного клапана КИВ Квадро предназначен для распределения и регулирования потока воздуха. Он изготовлен из белого ударопрочного АБС пластика, стойкого к перепадам температур и ультрафиолетовому излучению.
• Внутренний оголовок приточного клапана состоит из:
• внутренней части с заслонкой, уплотнительным кольцом и теплоизолирующей прокладкой
• узла регулировки
• фильтра моющегося
• крышки оголовка
• регулирующей ручки
Внутренняя часть оголовка плотно вставляется в пластиковый канал и через уплотнительную прокладку шурупами крепится к стене. Узел регулировки позволяет открывать и закрывать заслонку при помощи ручки или шнура.
Фильтр класса EU3 (G3) представляет собой пористый моющийся синтетический материал, эффективно очищающий поступающий воздух от пыли. Крышка оголовка приточного клапана имеет шкалу, показывающую степень открытия заслонки.

               

Минимальное проветривание при помощи приточного клапана КИВ Квадро.

• Необходимость в минимальном проветривании может возникнуть при длительном отсутствии людей в помещениях, чтобы исключить «застойный дух». В лопастях заслонки имеются заглушки, которые можно удалить. В этом случае при закрытии заслонки будет обеспечено минимальное проветривание.

 

Перейти в предыдущий подраздел: Клапан КИВ 125

 

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *