暂无图片
暂无图片
15
暂无图片
暂无图片
暂无图片

IBM收购数据库厂商DataStax:瞄准向量和AI搜索

深度数据云 6天前
199

2月25日,IBM宣布有意收购AI和数据解决方案提供商DataStax。该笔交易预计于2025年第二季度完成。据悉,DataStax在2022年6月的最新一轮融资中估值为16亿美元,目前已筹集3.426亿美元。DataStax拥有数百名付费客户,主要来自大型企业和技术驱动型组织。

DataStax以创建基于Apache Cassandra的数据库解决方案AstraDB和DataStax Enterprise,以及用于低代码AI应用开发的开源工具Langflow而闻名。这些技术预计将与IBM现有的产品形成互补,如混合开放数据湖仓watsonx.data集成AI开发平台watsonx.ai。

此举被外界认为是IBM增强其数据基础设施和生成式AI能力的战略举措。DataStax作为Apache Cassandra数据库的长期支持者,近年来已将业务范围扩展到流数据和生成式AI领域。

Apache Cassandra的起源与发展

Apache Cassandra最初于2008年由Facebook开发,满足其对高度可扩展、容错数据库的需求,用于存储用户生成的大数据。Facebook是当时大数据生态系统的主要参与者,其技术栈还包括Apache Hadoop、HBase和Hive等。  

Cassandra是一种宽列存储数据库,注重数据的可用性和可靠性,以牺牲数据一致性为代价,适合处理大规模分布式数据。  

2010年,Cassandra成为Apache软件基金会的顶级项目。同年,Jonathan Ellis和Matt Pfeil在德克萨斯州奥斯汀创立了Riptano公司,后更名为DataStax,专注于Cassandra的商业化和企业级支持。

DataStax的商业化历程

DataStax最初提供Apache Cassandra的企业版——DataStax Enterprise (DSE),并逐步吸引了包括联邦快递、Capital One和Verizon在内的财富500强客户。  

2014年,DataStax迁至加利福尼亚州圣克拉拉,并以8.3亿美元的估值筹集了1.06亿美元的风险投资,计划在2015年或2016年上市。  

由于MongoDB在NoSQL领域的主导地位,DataStax的IPO计划未能实现。随后,公司开始转型,推出更多创新产品和服务。

DataStax的技术创新与业务拓展

2020年5月,DataStax推出Astra DB,这是Cassandra的完全托管版本,运行在Kubernetes之上,旨在简化管理,为客户提供NoSQL数据库的可扩展性和可用性优势,同时免除管理责任。同年晚些时候,发布K8ssandra,这是Cassandra的开源版本,专为Kubernetes环境设计。  

2021年,DataStax推出Astra Streaming,基于Apache Pulsar的事件流平台,与Apache Kafka竞争,进一步拓展了DataStax在流数据领域的布局。  

2023年,DataStax收购AI初创公司Kaskada,并以Luna ML品牌开源其软件,专注于自动化繁琐的特征工程任务。在Astra DB中推出向量存储功能,增强生成式AI能力,使其成为构建检索增强生成(RAG)管道的关键工具,提升生成式AI应用中大型语言模型(LLM)输出的准确性。  

2024年,DataStax收购Langflow,进一步完善RAG解决方案。Langflow开发了一个用于构建RAG管道的开源框架。

IBM的收购逻辑与战略意图

IBM对DataStax的收购并非偶然,而是基于DataStax在非结构化数据管理方面的深厚积累。IBM数据和AI业务总经理Ritika Gunnar指出,非结构化数据是尚未开发的商业智能宝库,到2024年将占企业数据的93%。IBM计划将DataStax的技术与自身的WatsonX产品组合相结合,帮助客户更好地利用非结构化数据。此外,IBM还计划继续支持Apache Cassandra、Langflow、Apache Pulsar和OpenSearch等开源项目。

DataStax首席执行官Chet Kapoor表示,DataStax与IBM自2020年以来已在开源软件领域展开合作,包括在IBM OpenShift平台上部署DataStax产品。此次收购将使DataStax的技术与IBM的WatsonX.data平台深度融合,进一步推动向量和AI搜索技术的普及。Kapoor强调,DataStax尊重IBM在开源领域的领导力,并期待成为IBM开源生态的一部分。



相关推荐:


AI-ready Data Cloud技术系列

最后修改时间:2025-02-28 19:13:31
文章转载自深度数据云,如果涉嫌侵权,请发送邮件至:contact@modb.pro进行举报,并提供相关证据,一经查实,墨天轮将立刻删除相关内容。

评论