Intel раскрыла архитектуру графического процессора Xe2 Battlemage
Хотя предыдущие слухи о возможных задержках или даже полной отмене архитектуры графических процессоров Intel следующего поколения теперь кажутся необоснованными, похоже, что Battlemage не будет запущен одновременно в версиях GPU и iGPU.
Intel планирует сначала представить версию с низким энергопотреблением с процессорами Lunar Lake, а затем выпустить версии для настольных ПК и HPC. Таким образом, Intel продемонстрировала лишь приблизительный прирост производительности iGPU в чипах Lunar Lake.
Используя архитектуру графического процессора Xe2 Battlemage, Intel стремится обеспечить более высокий уровень использования, улучшенное распределение работы и снижение затрат на программные драйверы.
Когда дело доходит до повышения производительности по сравнению с Xe Alchemist, Intel обещает улучшение вызовов отрисовки в 12,5 раз, лучшую диспетчеризацию вычислений в 7 раз, диспетчеризацию сетчатых шейдеров в 4,1 раза, и это только самые большие выгоды.
Тем не менее аспекты, которые оказывают большее влияние на общую производительность, такие как обработка вершин, тесселяция, треугольники лучей и трассировка лучей, улучшены максимум в 2 раза.
Каждое ядро Xe2 оснащено 8 512-битными векторными процессорами, 8 2048-битными процессорами XMX, поддержкой 64b атомарных операций и 192 КБ общего кэша L1 / SLM. Подобно Xe Alchemist, Xe2 Battlemage хорошо масштабируется и будет иметь определенное количество ядер в зависимости от стека продуктов.
Например, iGPU Lunar Lake будут иметь до 8 ядер Xe2 с 64 векторными движками, 2 геометрическими конвейерами, 8 сэмплерами, 4 пиксельными серверами, 8 блоками трассировки лучей и 8 МБ кэш-памяти второго уровня.
Intel обновила все векторные процессоры с помощью собственных ALU SIMD16, которые также поддерживают операции SIMD32, а расширения Xe Matrix поддерживают INT2, INT4, INT8. Операции FP16 и BF16.
Скорость обработки операций FP16 увеличена до 2048 операций в секунду/такт, а скорость INT8 может достигать 4096 операций в секунду/такт.
Чтобы уменьшить задержку и улучшить аппаратное и программное обеспечение (ПО) установления связи, Intel представляет фрагменты рендеринга в качестве основных блоков механизма рендеринга. Эти фрагменты также масштабируемы, их можно объединять и оптимизировать в зависимости от типа графического процессора.
Кроме того, были улучшены модули трассировки лучей: теперь они включают 3 конвейера обхода, 18 прямоугольных пересечений и 2 треугольных пересечения.
Intel ожидает, что iGPU Xe2 на процессорах Lunar Lake будут на 50% быстрее, чем модели Xe Alchemist на Meteor Lake. Ещё одно улучшение связано с новым Display Engine, поддерживающим eDisplayPort 1.5, который повысит энергоэффективность и улучшит возможности адаптивной синхронизации с уменьшением дрожания на дисплеях ноутбуков.
Кроме того, Intel обновляет медиа-движок с помощью выделенного кэша объемом 8 МБ, что должно повысить энергоэффективность при рабочих нагрузках кодирования, а также представляет поддержку нового стандарта VVC (универсальное кодирование видео), обеспечивающего качество AV1 при уменьшении размера файла на 10%.
Ранее ГЛАС сообщал: Microsoft намерена отключить по умолчанию функцию Recall в Windows 11.