NVIDIA представила новый усовершенствованный алгоритм ReSTIR, который увеличивает производительность Path Tracing в 2–3 раза, прокладывая путь для игр следующего поколения.
Трассировка лучей — это круто, но Path Tracing круче, и NVIDIA ускоряет PT в 3 раза с помощью новых алгоритмов ReSTIR
ПК-игры стремительно переходят на Path Tracing как средство достижения визуальной точности следующего поколения. Подобно Ray Tracing, именно NVIDIA проложила путь для Path Tracing на ПК. Однако, как и Ray Tracing на ранних этапах, Path Tracing сталкивается с проблемой — требованием более мощного оборудования. Как мы видели на примере нескольких игр с PT, даже такие мощные карты, как громоздкая RTX 5090, выдают лишь 30–40 FPS и требуют значительной поддержки в виде апскейлинга DLSS и генерации кадров для обеспечения играбельной частоты кадров.
То же самое произошло с Ray Tracing, который появился на ПК первым, а теперь прилично работает на современном оборудовании. Даже консоли начали активно внедрять RT, хотя эта функция в основном ограничена пресетами качества, работающими на частоте 30 FPS (или в редких случаях 60 FPS).

С учетом вышесказанного, NVIDIA, будучи пионером в области визуальной графики на ПК, теперь готова вывести Path Tracing на новый уровень. В новой исследовательской работе NVIDIA под названием “ReSTIR PT Enhanced: Algorithmic Advances for Faster and More Robust ReSTIR Path Tracing” компания предлагает новый набор алгоритмов пространственно-временной передискретизации ReSTIR, которые могут обеспечить прирост производительности в 2–3 раза, устраняя при этом визуальные аномалии, присущие текущим методам RT/PT.

Решение NVIDIA для Path Tracing заявлено как близкое к “Production Ready” и вдвое снижает стоимость пространственного повторного использования. Усовершенствованные алгоритмы ReSTIR PT также обеспечивают улучшенную производительность и качество благодаря оптимизациям, которые унифицируют прямое и глобальное освещение, используя существующие методы для уменьшения шума цвета и шума дисокклюзии. Полный список улучшений включает:
- Сокращение вдвое затрат на сдвиг карт при пространственном повторном использовании за счет выбора обратных соседей
- Новые пороговые значения области трассировки лучей, адаптирующиеся к сцене и материалам
- Уменьшение артефактов корреляции с помощью карт дублирования выборок
- Улучшение качества и стоимости за счет унификации ReSTIR для прямого и косвенного света
- Другие оптимизации, повышающие производительность и надежность за счет уменьшения шума цвета и дисокклюзии

В Таблице 1 показана производительность наших методов, где каждая строка добавляет новую функцию/оптимизацию поверх базового кода, опубликованного Lin et al. [2022]. Сначала мы измеряем ускорение, полученное от наших методов снижения затрат, которые обеспечивают среднее ускорение в 2,74 раза в четырех протестированных сценах. Эти сцены были выбраны так, чтобы отразить диапазон сложности геометрии и материалов. Результаты по отдельным сценам приведены в дополнительных материалах.
Чтобы дать более глубокое представление о влиянии наших низкоуровневых оптимизаций GPU, мы профилировали сцену Opera House с помощью NSight Graphics. Данные профилировщика показывают, что оптимизации в Разделе 6.2.1–6.2.3 уменьшают расхождение потоков и повышают эффективность вычислений на GPU. В частности:
- Загрузка SM-варпов увеличивается с 22,4% до 31,1%
- Активные потоки на варп увеличиваются с 15,3 до 19,9
- Задержка варпа уменьшается с 347 тыс. до 241 тыс. циклов
Все это происходит без изменения поведения сэмплера. Применение русской рулетки (Раздел 6.2.4) дополнительно улучшает эти показатели до:
- Загрузка 34,9%
- 20,6 активных потоков на варп
- Задержка 82 тыс. циклов
Наш метод также уменьшает объем памяти по сравнению с базовым вариантом за счет двух изменений: сжатия резервуара ReSTIR PT и унификации резервуаров для прямого и косвенного освещения. Поскольку каждый проход ReSTIR требует два набора резервуаров для поддержки временного повторного использования, эти изменения уменьшают объем памяти на пиксель с 2 × (88 + 16) байт в базовой реализации (которая использует 16-байтовые резервуары для ReSTIR DI) до 2 × 64 байт. При разрешении рендеринга 1920×1080 это снижает потребление памяти с 431 МБ до 265 МБ.
Результаты оптимизации GPU по сравнению с Lin et al. [2022]
Приятно видеть, что NVIDIA улучшает производительность Path Tracing. Эта технология стала актуальной с момента выхода графических процессоров RTX 40 и RTX 50. Но, двигаясь дальше, NVIDIA хочет использовать техники нейронного рендеринга и алгоритмы ИИ для дальнейшей тонкой настройки производительности своего игрового оборудования с целью ускорения визуальных возможностей следующего поколения.
Всегда имейте в виду, что редакции могут придерживаться предвзятых взглядов в освещении новостей.
Автор – Hassan Mujtaba




