Outil de profilage du noyau GPU et d'optimisation des paramètres de lancement
Seed: kernel_sources, test_inputs, profiling_hooks; example: sweep block/grid sizes and memory tiling configsADVERTISEMENT - IN-ARTICLE
Guide d'exécution
Implémentez des outils pour balayer les paramètres de lancement du noyau et les configurations de mémoire, collecter les métriques d'occupation, de débit et de manque de cache, et recommander des ensembles de paramètres optimaux pour le matériel cible.Automatisez les exécutions de profilage et regroupez les résultats pour les ingénieurs qui optimisent les charges de travail GPU ou les pipelines de shaders.