暂无图片
暂无图片
暂无图片
暂无图片
暂无图片

花钱买罪受的大冤种:逃离云计算妙瓦底

非法加冯 2025-01-14
85

昨天一用户来(免费)咨询,问我 PostgreSQL 分布式数据库扩展 Citus 有没有什么坑,Pigsty 支持不。我想好家伙都要上分布式数据库那你这数据量应该挺大了?

结果令人啼笑皆非,原来他并不是因为数据大到要冲破服务器柜门,而是又栽在了公有云  EBS 云盘 的“杀猪盘”套路里。


捂着钱包慌忙上分布式数据库

“Citus 分布式数据库坑多吗?Pigsty 支持不?” 前两天一个用户火急火燎地跑来咨询,开口就提“Citus”。我表面云淡风轻,心里却在暗自偷乐:都说要上分布式插件了,想必有着海量数据、疯狂QPS,一定是个狠角色?几百 TB 起步吧?

Citus 在 PostgreSQL 生态里确实名气不小,尤其被微软收购后,“Citus = 分布式 PostgreSQL”的印象更是深入人心。在 Azure 上还被包装成了 Cosmos Hyperscale PG,可以让 PG 原地升级成分布式数据库,一听就很酷炫。

一问具体指标,数据量 60 TB,用 TimescaleDB 扩展压缩后 14 TB;QPS 5K,每个Q 扫个 100 条数据 —— 嗨,“数据量不算小,吞吐量不算大”

 这种量级在 2015 年也许要分布式,但在单卡 64 TB 的 2025 年,随便来个万把块的 NVMe SSD 跑个原生 PG 不就轻松解决了?单机 PG 随便每秒百万点查点写更是不在话下 —— 那么用分布式是什么原因?磁盘装不下了吗?

用户说:“因为会有突发流量,我要扩容加个从库,需要好几天。”

这就让我有点不解了:14 T 数据,万兆网卡环境下一次同步备份也就四五个小时吧?用 2016 年的破旧硬件,我限速拖个 3 TB 的从库都用不了半小时。再说,加从库耗时跟网络带宽或 I/O 能力相关,就算用分布式,还是要做分区再平衡,怎么就能解决问题?


然后用户又说:“网络没问题,主要是磁盘成本太贵了:现在架构一主三从,一个从库就一份数据,总共四份“

这就更让我疑惑了 —— 这年头企业级大容量 NVMe SSD 已经便宜的跟白菜价一样了,合两百 ¥/ TB/年,有这十几 TB 数据和折腾 TimescaleDB,Citus 分布式的人力,没钱买硬盘?然后慢不是因为网络问题,那就是磁盘问题咯?这么慢的磁盘不会是 HDD 吧,能贵到哪里去?


因为用户都会拖从库了,数据量也挺大,都敢上分布式了,我已经默认他不是只会用云数据库,控制台点点点的菜鸟了。那磁盘成本太贵了又是什么鬼?难道说 …… 除非你买的是公有云厂商(或者还有Mac)里的 天价杀猪盘

果不其然,这位老哥说到:“我们现在用的 AWS 自建”。

嗨,一下破案了,又是一个花钱买罪受的杀猪盘受害用户。


让姿势走形的杀猪盘

深入聊后发现,他在云上存储的费用非常惊人,粗略估算每年高达 200 万,得到的却是一个拉 14 TB 从库都要花几天的乞丐盘 —— 换算下来吞吐也就不到 100 MB/s。Gen5 NVMe SSD 12 GB/s ,3M IOPS 的性能 可以把这种云上乞丐盘轰杀成渣,而只要百分之一不到的成本。

按照 AWS EBS io2 盘折后价,大约 1900 元 TB 月,14 TB 数据 × 4 份 × 12 个月,光存储就差不多一年 128 万;再加上 EC2 主机费用(通常云数据库存储/计算费用配比估算比例 2:1),每年 200 万往上走。更离谱的是,花这么多钱换来的,却是性能奇差无比的存储。“交了保护费还得挨打”,可不就是这么回事?

为了省这笔云盘费,他们宁可把业务架构改得七零八落,或让运维花几天时间加从库,把无底洞似的人力和时间成本都扔进去。最后甚至想靠分布式数据库来“自救”,以为这样能省点存储费。但结果呢?依然被“杀猪盘”牢牢锁死。每年烧 200 万,换来又慢又折腾的服务,还要自己额外承担把业务拆成拼图的成本。

追本溯源,这些需求是怎么来的?—— 不是因为业务或数据真的需要分布式,而是云上块存储价格昂贵、性能还差。这问题光靠换个“分布式数据库”或者用个 S3 存储数据库是治不了本的。要真正治本,得先问:为什么云上的块存储会这么离谱?

其实,在 公有云是不是杀猪盘? 中,早就告诉过你们答案。


花钱买罪受,别当云上大冤种

大型公有云厂商的核心套路无非是:用极便宜的小微实例和免费额度先把用户诱上云,再依托数据库等云 PaaS 技术壁垒,让用户规模化之后也“跑不掉”,只能留在云上持续出血,也就是所谓“杀猪盘”。

当然,肯定会有人会说:大厂都有 Serverless 或弹性存储的云数据库服务嘛,肯定是这位客户 用云的姿势不对。但实际上,去看看那些云数据库的荒谬定价(《云数据库是不是智商税》)吧,只会比纯用资源的价格更为震撼 —— 毕竟,PaaS 50% - 70% 的毛利可不是从天上掉下来的。

正如《下云奥德赛:是时候放弃云计算了吗?》中 DHH 所说:“在几个关键例子上,云的成本都极其高昂 —— 无论是大型物理机数据库、大型 NVMe 存储,或者只是最新最快的算力。租生产队的驴所花的钱是如此高昂,以至于几个月的租金就能与直接购买它的价格持平。在这种情况下,你应该直接直接把这头驴买下来!”

以及 “被锁死困在亚马逊的云里,在实验新东西(比如固态硬盘)时,不得不忍受高昂到荒诞的定价带来的羞辱,这已经构成对核心价值观无法容忍的侵犯”。我认为这一案例就是很典型的花钱买罪受 —— 花了每年两百万的巨款,得到的却是性能不堪入目的玩意。

而更关键地是,你以为云厂商会为你的业务负责到底吗?用户耗费巨款买到的,除了百倍加价租给你的硬件资源,基本就是《草台班子唱大戏,RDS翻车记》这个案例里提供的售后支持 —— 你以为可以把锅甩给云厂商就能高枕无忧?真出了事,回旋镖还得打在自己头上。


别让这种付费续集不断上映

只要具备自建 PG 的能力,把数据库搬回自建机房或换家不捆绑 PaaS 的平价云,哪怕在 AWS 上直接选自带 Host Storage 的实例,都能把成本降好几个档次。让我们做个小学三年级的算术:这类数据库实例放在云下,买几台托管物理机,一次性投入几十万、每年维护几万,五年甚至六七年都能用。


当然你要问搞不定怎么办?有很多专业 PostgreSQL 服务商能提供PG咨询与技术支持,比如我就只收个 15-40 万的咨询费,就能提供成熟且经过大规模实战验证的解决方案(业界惯例是 1-2 万 RMB vCPU每年)。 在这一例中,我可以保证用20~40万一次性的硬件投入彻底解决每年两百万天价账单,同时性能还能比云上的乞丐盘高出 N 倍不止。


即使你不得不在云上跑,我也强烈建议选择那些没有 PaaS 绑定的平价云 —— 在保留云端“弹性”这一核心优势的同时,却能把成本打到每月万把块。毕竟 Hetzner、Linode、DigitalOcean 都提供物美价廉(通常+15%毛利,很合理)的全托管专属服务器,价格足以让习惯了十倍百倍溢价的传统云计算妙瓦底用户瞠目结舌。

你觉得 AWS 会为这样的规格每月收你多少钱?

那么关键就变成:如何防范供应商锁定?当业务规模增长超出“云计算适用光谱”后,怎样灵活地重新迁移?



开源 RDS 解决下云关键难题

数据库是下云的关键卡点,微软 CEO 纳德拉说:你看到的这些 App 与应用不过都是数据库的漂亮封装而已 —— 所以根本问题在于:能否在自己的服务器上跑好 PostgreSQL?应该怎么样解决这个问题?

只要有数据库自建的能力,就能把所有云厂商当作纯资源供应商——哪家收保护费,就能立马迁到另一家,用极低成本保持真正的 “自主可控”。

我一直主张,云数据库能力应该民主化普及到所有用户,而不是只能从几个垄断的赛博封建领主以天价租赁。因此我做了开源版的 RDS for PostgreSQL:Pigsty,让你不依赖 DBA 专家,也能在物理机/虚拟机上一键拉起比 RDS 更强劲的 PostgreSQL,并充分利用新硬件的高性能、低成本。解决下云的关键卡点。

Pigsty 包含 PG 生态里独一无二的 351 个扩展插件远胜云上那些可怜的几十个阉割版插件,还提供免配置开箱即用的高可用架构与业内领先的监控系统。它已在互联网、金融、新能源、军工、制造业等行业广泛应用,目前在 OSSRANK 全球 PostgreSQL 生态开源榜单里排第 22 名,也是由中国人主导的开源项目中排名最靠前的


https://ossrank.com/cat/368-postgresql-extension-ecosystem?page=2

Pigsty 采用 AGPLv3 开源协议,但普通用户爱怎么折腾都没关系,我们不会对云厂商或数据库厂商之外的用户追究 AGPL 的问题。如果有人觉得“还是希望付费买个安心”,我们也提供明码标价的商业咨询服务兜底。—— 用公道的价格解决实际问题,不玩那些花里胡哨的“杀猪盘”套路。

真正的“弹性”从来都不是“把钱丢给云厂商,自己却一脸懵逼”,而是知道什么时候该花钱、怎么花钱。愿所有数据库用户都能别做大冤种,让自己的时间与金钱花费的更有意义。

云计算泥石流

点一个关注 ⭐️,精彩不迷路

亚马逊

Ahrefs不上云,省下四亿美元

云上黑暗森林:打爆云账单,只需要S3桶名

Redis不开源是“开源”之耻,更是公有云之耻

RDS阉掉了PostgreSQL的灵魂

扒皮对象存储:从降本到杀猪

重新拿回计算机硬件的红利

是时候放弃云计算了吗?

下云奥德赛

阿里云

阿里云:高可用容灾神话的破灭

阿里云故障预报:本次事故将持续至20年后?

阿里云新加坡可用区C故障,网传机房着火

草台班子唱大戏,阿里云RDS翻车记

阿里云又挂了,这次是光缆被挖断了?

云计算:菜就是一种原罪

taobao.com 证书过期

牙膏云?您可别吹捧云厂商了

罗永浩救不了牙膏云

迷失在阿里云的年轻人

剖析云算力成本,阿里云真的降价了吗?

从降本增笑到真的降本增效

阿里云周爆:云数据库管控又挂了

我们能从阿里云史诗级故障中学到什么

【阿里】云计算史诗级大翻车来了

阿里云的羊毛抓紧薅,五千的云服务器三百拿

云厂商眼中的客户:又穷又闲又缺爱 

腾讯云

腾讯真的走通云原生之路了吗? 

我们能从腾讯云故障复盘中学到什么?

云SLA是安慰剂还是厕纸合同?

腾讯云:颜面尽失的草台班子

【腾讯】云计算史诗级二翻车来了

垃圾腾讯云CDN:从入门到放弃

其他云

删库:Google云爆破了大基金的整个云账户

全球Windows蓝屏:甲乙双方都是草台班子

赛博菩萨Cloudflare圆桌访谈与问答录

吊打公有云的赛博佛祖 Cloudflare

这次轮到WPS崩了

我们能从网易云音乐故障中学到什么?

GitHub全站故障,又是数据库上翻的车?

DHH

先优化碳基BIO核,再优化硅基CPU核

单租户时代:SaaS范式转移

拒绝用复杂度自慰,下云也保稳定运行

是时候放弃云计算了吗?

下云奥德赛

DBA vs RDS

草台班子唱大戏,阿里云RDS翻车记

RDS阉掉了PostgreSQL的灵魂

DBA会被云淘汰吗?

驳《再论为什么你不应该招DBA》

范式转移:从云到本地优先

云数据库是不是杀猪盘

你怎么还在招聘DBA? 

云RDS:从删库到跑路


文章转载自非法加冯,如果涉嫌侵权,请发送邮件至:contact@modb.pro进行举报,并提供相关证据,一经查实,墨天轮将立刻删除相关内容。

评论