这次回顾ECE408 Lecture 26,这次是最后一讲,课程回顾。

课程主页:

搬运视频:

ECE408回顾:

这个学期我们做了什么?

  • 基本计算模式;
    • 矩阵乘法、卷积、归约、扫描、直方图、稀疏表示;
  • 并行优化;
    • 线程、内存管理、合并、线程发散、任务管理、分析;
  • 编程系统;
    • CUDA, OpenACC,(OpenCL, DPC++, Hip, OpenMP)

批量同步模型促成成功

  • 在批量同步中,barrier分隔代码的时间区域。 交织/数据共享仅发生在区域内(称为phases);

GPU计算生态系统2021

自2007年推出以来,开发人员抽象级别一直在稳步上升,更多繁重的GPU工作由开发GPU的公司完成。

英伟达视角

AMD视角