Herramienta de optimización de parámetros de lanzamiento y perfiles del kernel de GPU
Seed: kernel_sources, test_inputs, profiling_hooks; example: sweep block/grid sizes and memory tiling configsADVERTISEMENT - IN-ARTICLE
Guía de Implementación
Implemente herramientas para barrer los parámetros de lanzamiento del kernel y las configuraciones de memoria, recopilar métricas de ocupación, rendimiento y pérdida de caché, y recomendar conjuntos de parámetros óptimos para el hardware de destino.Automatice las ejecuciones de creación de perfiles y agregue resultados para los ingenieros que optimizan las cargas de trabajo de GPU o los canales de sombreado.