

第一章、GPU简介
1.1、GPU 是什么?
1.2、为什么需要 GPU 等协处理器?
计算精度; 计算并行度; 计算延迟; 计算吞吐量; 并行进程之间的交互复杂度; 计算实时性要求;
1.3、GPU 还能干什么?
1.4、GPU 不适合干什么?
1)并行计算单元,数目从数个至数千个不等,完成“线程”计算;
优点1:消耗的资源最小; 缺点1:通过读写片上存储的方式传递数据,速度较慢; 缺点2:树根结点容易因通讯堵塞成为瓶颈,如图中红线和蓝线分别表示A计算节点向B,C向D传递数据,两个传递过程在根节点和二级共享节点交汇,当片上数据传递频繁时,树状拓扑NoC极易发生堵塞问题。
带有较多分支判断类的并行计算任务,典型任务如人机交互、电脑和环境交互中的逻辑判断计算等; 并行计算中带有较多串行成分,以及反馈算法的并行计算任务,典型例子如控制系统计算任务; 带有网状结构数据流的并行计算。典型案例为FFT(傅里叶分析)计算任务,CUDA中的FFT优化后可以提供相对CPU约10倍的提速,但当FFT长度超过某个门限后GPU的提升性能就发生下滑(资料来源:NV官网)。DSP芯片往往针对FFT的算法特性提供定制优化,没有GPU存在的问题,因此手机SoC中往往由DSP而不是GPU处理FFT这种网状大规模并行计算。
或者获取全店资料打包,后续免费获取全店所有新增和更新。
转载申明:转载本号文章请注明作者和来源,本号发布文章若存在版权等问题,请留言联系处理,谢谢。
推荐阅读
更多架构相关技术知识总结请参考“架构师全店铺技术资料打包”相关电子书(37本技术资料打包汇总详情可通过“阅读原文”获取)。
全店内容持续更新,现下单“架构师技术全店资料打包汇总(全)”,后续可享全店内容更新“免费”赠阅,价格仅收198元(原总价350元)。
温馨提示:
扫描二维码关注公众号,点击阅读原文链接获取“IT技术全店资料打包汇总(全)”电子书资料详情。
文章转载自架构师技术联盟,如果涉嫌侵权,请发送邮件至:contact@modb.pro进行举报,并提供相关证据,一经查实,墨天轮将立刻删除相关内容。
评论
相关阅读
玩转DeepSeek系列:使用OCI GPU快速部署推理模型
甲骨文云技术
99次阅读
2025-03-03 09:46:33
PX Deq: Execution Msg Oracle数据库并行执行等待事件详解
yuki
30次阅读
2025-03-20 14:47:48
深入理解 PostgreSQL Planner:简化扫描路径与查询计划
IvorySQL开源数据库社区
28次阅读
2025-03-24 09:42:55
Oracle优化-利用更多的资源
鲁鲁
28次阅读
2025-03-22 11:36:54
一键部署 GPU Kind 集群,体验 vLLM 极速推理
Se7en的架构笔记
21次阅读
2025-03-24 09:41:41
论文导读 | 基于GPU的子图匹配算法
图谱学苑
16次阅读
2025-03-03 09:52:25
PolarDB-PG 多级分区表静态裁剪与并行扫描
PolarDB
13次阅读
2025-03-19 11:20:45
【华为云MySQL技术专栏】MySQL的WriteSet并行复制介绍
GaussDB数据库
11次阅读
2025-03-18 10:46:22
不合理的限速会导致拥堵,不合理的监控设置带来的问题也不容小觑
白鳝的洞穴
2次阅读
2025-04-01 12:26:42
闲话 OB 多租户资源隔离技术
yangyidba
0次阅读
2025-03-31 10:00:48