写CUDA到底难在哪?

2025-06-22 11:00:17

对GPU进行性能优化时,cudagraph是绕不开的话题。

不仅是GPU,大部分的xpu都会提供类似graph mode的优化,相比于每次分别由CPU进行kernel launch的eager mode,graph mode通常都会有较大性能提升,然而也经常容易出现各种各样的奇怪问题。

NVIDIA有一个简单的 博客 介绍,其中只使用了stream capture的形式来构造cudagraph,而且本质上就是多个kernel前后提交,根本无法展示cudagraph的复杂性。

本文尝试从底层原理出发,根据文档 和 …。

写CUDA到底难在哪?
广告位810*200
相关阅读
冬天也要穿胸罩吗?

冬天也要穿胸罩吗?

坦白局…你们的冬天真的都不穿内衣啊?是这样的,今天不小心碰到...

2025-06-21
为什么程序员独爱用Mac进行编程?

为什么程序员独爱用Mac进行编程?

ipadmini m4三千元内,我找不到比它个更适合编辑代码...

2025-06-21
中了一个亿  你会做什么?

中了一个亿 你会做什么?

缴税2000万,在镇上买一块地皮,起楼6层,做成镇上的图书馆...

2025-06-21
Rust重写Kafka有哪些优势?

Rust重写Kafka有哪些优势?

感觉 Rust 始终没有清晰的认清自己的位置 天天重写这个 ...

2025-06-21
为什么《绝区零》打磨了那么多细节的同时,却有一个灾难性的UI设计?

为什么《绝区零》打磨了那么多细节的同时,却有一个灾难性的UI设计?

先叠个甲,曾经的交互设计师一枚,同时也是ZZZ玩家。 ...

2025-06-21