网站地图官方微信:
网站首页 太德乡 江南乡 辉县市 大悟县 多巴镇 雅瓦乡

当前位置: 首页 >

写CUDA到底难在哪?

对GPU进行性能优化时,cudagraph是绕不开的话题。

不仅是GPU,大部分的xpu都会提供类似graph mode的优化,相比于每次分别由CPU进行kernel launch的eager mode,graph mode通常都会有较大性能提升,然而也经常容易出现各种各样的奇怪问题。

NVIDIA有一个简单的 博客 介绍,其中只使用了stream capture的形式来构造cudagraph,而且本质上就是多个kernel前后提交,根本无法展示cudagraph的复杂性。

本文尝试从底层原理出发,根据文档 和 …。

写CUDA到底难在哪?

  • | 为什么 macOS 上国产软件不流氓? |

    没人提到之所以不敢是因为开发者证书么? mac上无论是否上架...

    查看详情>>
  • | HTTP/3 解决了什么问题,又引入了什么新问题? |

  • | 预测一下,下一次阅兵会出现什么武器震惊世界? |

  • | 你认为这次伊以冲突,以色列这次干得漂亮吗? |

  • | 印度为什么一定要和中国作对? |

  • | 女性为什么不普遍跟男性那样只留个几毫米或2-3厘米短发,女性不觉得长发麻烦吗? |

  • | golang和rust你选择哪个? |

  • | 如何看待不超过1879元的Mac mini(M4+16/256GB+票),易用性吊打同级其他台式电脑? |

  • | 30马赫的导弹,近防炮能挡住吗? |

  • | 万兆的网络速度有多大意义? |

  • | 字节跳动技术副总裁开源了自己与Trae合作的首个项目,如何评价目前AI开发的水平? |

  • 微信小程序的,就算已经设置了 border:none; ou...

    2025-06-21
  • 很多人讨论rust能不能解决内存bug,关于这一点我觉得c+...

    2025-06-21
  • 一款能把板车压到翘起来的车能纽北跑到七分半以内不出事已经是B...

    2025-06-21
  • 少不少不知道,员工薪资是真一般。 一师弟去了北京小米,做手...

    2025-06-21

关注我们

添加微信好友,关注最新动态