Брендан Грег (Brendan Gregg), один из разработчиков системы динамической отладки DTrace, ныне работающий в Intel и развивающий средства для анализа производительности на базе eBPF в ядре Linux, объявил об открытии исходного кода инструментария iaprof (AI Flame Graphs). Инструментарий предназначен для анализа информации о производительности GPU Intel и её наглядной визуализации. Код написан на языке Си и открыт под лицензией Apache 2.0.
Из аппаратных платформ поддерживаются графические карты Intel Arc на базе микроархитектуры Battlemage (серия “B”), GPU для датацентров серии “Max” и различные графические карты Intel Xe2, среди прочего на базе iGPU Lunar Lake. В системе требуется наличие ядра Linux со свежими драйверами для GPU Intel (для Intel Battlemage требуется ядро 6.15 и драйвер Xe, а для Intel Max Series достаточно ядра 5.15 и драйвер i915). Ядро Linux должно быть собрано со специфичными для драйверов Intel интерфейсами EU Stall и EU Debug.
В собираемых профилях отражаются задержки в работе исполнительных блоков (Execution Unit), состояние CPU и информация о ядрах GPU. Собираемые сведения позволяют связать метрики производительности GPU с кодом, выполняемым на CPU. На практике инструментарий удобно использовать для анализа производительности компьютерных игр и AI-приложений, активно использующих GPU, сопоставляя нагрузку на GPU с выполнением на CPU компонентов ядра ОС, runtime-библиотек и AI-фреймворков.
Результаты профилирования могут быть сохранены в формате SVG для интерактивного анализа в браузере (пример), используя цветные диаграммы “FlameGraph” и карты “FlameScope” с
выделением цветом проблемных мест. Графики интерактивные и позволяют увеличивать детализацию до кадров стека и выполняемых инструкций GPU, просматривать подробности и выполнять операции поиска.
