两个大佬要在草原上“搞事情”

这个智算中心,取了个特文艺的名字
“扶摇”
这个“扶摇”的算力,可达600PFLOPS
以GPU为核心,专扛AI的活
用于自动驾驶模型训练
这在汽车界算得上顶格配置了
▼
这个智算中心,物理位置就在
阿里云乌兰察布新建数据中心园内
所以,此行目的,就是想去实地看看





大家为什么要在乌兰察布扎堆?
我个人觉得,有3大原因

1、天冷
从北京热腾腾的地界过去
一落地乌兰察布,立刻通体凉爽
即使大中午在太阳底下爆晒
也不会感觉到热
这种神奇的感觉
估计南方同学很难体会到
乌兰察布年平均气温只有4.3度
数据中心每年有近10个月时间
能够使用自然冷源制冷
PUE值年平均可达1.2左右,实现节能环保
所以,你看阿里云的数据中心
有的墙是四处透风的,没有玻璃,只有百叶窗
让风能“吹”到房子里去
风吹进来
有一个过滤冷空气的AHU风墙
完成杂质过滤后
把冷空气送入到后端的冷却循环系统中
这种模式
可实现全年超过80%时间全新风运行
年平均PUE小于1.2
所以说,天冷,有奇效
2、电便宜
数据中心是电老虎,只要一开动
那就是哗啦啦“吃电烧钱”
而乌兰察布的电费非常便宜
给到数据中心的电价
基本上算全国最优惠的电价了
同时,当地的电力配套保障非常给力
数据中心沿途,能看到一排排高压线杆
有人问,为啥电费能这么便宜?
乌兰察布清洁能源发电占比高达48%
比如,风能、光伏等
所以,随处可见大风车
没日没夜地转啊转...
3、政府重视算力产业
这次让我感触很深的是
就这么一个“技术范儿”的发布会
乌兰察布的市委书记和2位副市长
均亲临现场
↓

乌兰察布市委常委、副市长云鹏刚在智算中心启动仪式致辞中表示:“草原与自动驾驶、智算结缘,是乌兰察布以全国一体化算力网络国家枢纽节点建设为契机,推动形成的“东数西算”又一典型示范场景。”
当地政府对算力产业的强力支持态度
也给了落户企业极大的信心
正因为:战略对路、步伐敏捷
乌兰察布成为八大国家算力枢纽节点之一
26个数据中心项目成功落户
签约服务器规模达419万台,位居全国前列
看完乌兰察布的大外围环境
我们再回头看看这次主角

扶摇智算中心
很多人表示看不懂这张海报
↓
1、自动驾驶,为什么需要智算中心?
自动驾驶的核心是算法模型
一个成熟的算法模型被提炼出来
至少需要经过百PB级别的海量数据训练
训练的过程,就是消耗算力的过程
2、“扶摇”算力规模为600FLOPS
是什么意思?处于什么水平?
每秒可以完成60亿亿次浮点运算
3、“扶摇”和其它智算中心相比
有哪些技术优势?
首先,以更低成本实现更强算力
GPU资源利用率提高了3倍
采用优化后的AI框架
训练性能提升30%以上
网络延迟更低,存储IO更强
能对GPU资源进行细粒度切分、调度,将GPU资源虚拟化利用率提高3倍,支持更多人同时在线开发,效率提升十倍以上。在通讯层面,端对端通信延迟降低80%至2微秒。整体计算效率上,实现了算力的线性扩展。存储吞吐比业界20GB/s的普遍水准提升了40倍,数据传输能力相当于从送快递的微型面包车,换成了20多米长的40吨集装箱重卡。此外,阿里云机器学习平台PAI提供了模型训练部署、推理优化等AI工程化工具,比开源框架训练性能提升30%以上。
第二,能大幅提升训练速度
以小鹏汽车一个核心模型为例
过去需要7天才能完成一次训练
用“扶摇”可以让时间缩短至1小时内
提速了近170倍
最终,我们一行人如愿以偿
得以入场参观阿里云数据中心
我铆足了劲,准备一通拍拍拍
然后再盆友圈狠狠晒一晒
万万没想到
却遭遇史上最严苛安保检查
首先,数据中心安全专员
核实身份证原件与报备信息是否吻合
不会有一丝通融之处
核查无误后,才能下车
经过大门安检,好不容易踏入园区
进入机房主楼时
还会再次进行一轮严格安检
而且,在园区里全程不能拍照
会把手机封锁到一个专用袋子里
能正常使用、触屏、接听电话
如果拍照,就是模糊的
我好奇地试试拍照
结果出来是这样的
......
So,数据中心参观照片
此处无图
此处无图
此处无图
想想这些严苛的“骚操作”
我也特别能理解
毕竟,物理安全也是安全的一部分
阿里云各种安全措施无所不用其极
(物理安全、流程安全、管理安全、技术安全)
让数据中心坚如磐石无懈可击
So,我只能口述以下场景
就是非常现代化、宽敞、明亮、整洁
一排排机器刷刷刷地闪着灯
发出迷人的轰鸣声,像这样

关于「扶摇」智算中心的更多细节
可以戳戳下面的视频哦
▼