
研究范围定义
图:数据库市场趋势


02
实时数仓市场分析
市场定义:
实时数据仓库是一种能够对结构化或半结构化数据实时存储和计算的数据仓库。与传统数据仓库不同,实时数据仓库支持海量数据的近实时查询,适用于需要快速分析或决策的场景,如自助分析、在线报表等。
甲方终端用户:
企业 CTO、CIO、IT 部门负责人、科技部门负责人、大数据部门负责人、应用开发人员、数据库管理员
甲方核心需求:
大数据时代,数据正在发生质的变化,数据体量呈爆发式增长,数据类型也越来越丰富。同时,业务也在面临数字化转型,大量决策需要实时数据作为支撑,在线报表、自助分析等应用逐渐成为企业数字化经营的刚需。海量数据与业务实时化的趋势,对数据仓库的存取性能提出了更高的要求。
然而,传统数据仓库在大数据时代遇到了扩展性与响应速度的瓶颈,难以满足企业对海量数据实时存取的需求。例如,以 Teradata 为代表的数据库一体机,仅能够支持有限的数据规模,并且价格昂贵。以 Hadoop 为代表的大数据技术,虽然具备海量数据的存储能力,但是查询性能表现不足,而且其技术组件通常较为复杂,运维成本高。
针对传统数据仓库在实时场景上的能力欠缺,企业需要:
通过海量数据的实时查询与分析,支持数据挖掘与实时决策等场景。随着企业在经营管理中所产生的数据量呈指数级增长,企业希望数据仓库具备海量多源异构数据的处理能力。而且,随着业务对数据时效性的要求越来越高,实时决策需要通过分钟级的近实时数据作为依据。尤其在交互式分析中,会涉及到即席查询的能力,用户需要灵活自主地组合查询条件,从多个维度对海量数据进行探索分析。
高可用的数据服务。数据是一切数字化应用的基础,稳定可靠的数据服务是企业的基本诉求。另外,企业需要系统具备一定的机制来应对服务器故障、操作失误等异常场景,无需人工干预即可自动恢复。
此外,部分企业还希望:
数据安全获得保障。金融、央国企等客户出于法律法规监管,以及对客户隐私、商业信息或国家机密的重视,希望获得数据安全保障。因此具备一定安全机制与功能,防止内部或外部的信息泄露威胁,成为这些领域客户的诉求。
得到专业完善的服务。企业希望获得全面的技术支持和咨询服务,无论是关于运维管理、性能优化、安全管控还是其他方面,企业希望可以获得专业指导和建议,以便更好地解决问题和创造价值。
配备丰富的数据仓库工具。企业希望通过数据仓库相关工具,更加高效便捷地使用、管理数据库,尤其在数据导入与运维方面。在数据导入上,一些复杂的数据转换场景,需要借助 ETL/ELT 工具实现高效灵活的数据导入。在运维管理上,工具在自动化管理、数据安全和可视化监控等方面可以提供非常大的帮助。
在云上部署数据仓库。出于对性能、易用性、成本或安全性等因素的综合考量,部分企业选择在公有云、私有云或混合云上部署数据仓库,来满足海量数据处理对数据仓库弹性扩展的需求。
厂商能力要求:
厂商产品支持对多数据源实时读取。厂商产品提供实时数据导入,能够对多数据源,如事务型数据库、数据湖或数据流等,进行实时集成。在更理想的情况下,厂商产品支持数据联邦,在不需要对数据进行移动的前提下,对多源异构的数据进行读取,为上层分析与应用提供实时服务。 厂商产品提供高性能的数据存取,在复杂的查询分析场景下能够快速响应。在大数据量下,厂商产品提供适当的存储方式,支持高性能的数据读取。此外,在自助分析、在线报表等场景下,厂商产品要支持简单的点查询、复杂的多维查询以及即席查询等多种的查询分析。尤其在海量数据、多表关联的复杂计算场景下能够快速响应,满足用户实时分析与决策的需求。 具备对数据进行深入挖掘分析的技术能力。厂商需要具备多种数据分析技术,如大数据挖掘与分析技术用于统计分析、商业智能,知识图谱技术用于数据关联关系分析,机器学习、运筹优化等技术用于预测性分析、智能决策。
厂商提供产品周边工具。厂商提供的配套工具,支持产品的使用或运维需求。例如,ETL/ELT 工具支持高效地与数据湖或其他数据源进行连接传输,运维管理工具提供一定的监控与自动化管理能力。 提供专业可靠的服务。厂商要能够依据客户需求,提供前期咨询规划、项目实施与运维管理等方面的服务支持。并且配备专业的技术团队,在数据库运维管理、性能优化等方面提供可靠的指导与建议。 厂商产品具备数据安全保障机制与功能。厂商需要满足金融行业、央国企对数据安全的要求。例如,厂商产品需要具备用户身份验证和授权机制,限制敏感信息的访问权限;或者,使用数据加密技术对敏感数据进行加密存储,防止数据泄露;另外,安全审计、漏洞管理等能力,也可以更好地满足企业数据安全管理的需求。 厂商产品具备云原生特性。针对企业在云上部署数据仓库的需求,厂商产品具备云原生特性,能够发挥弹性、扩展性的优势,并且支持公有云、私有云或混合云部署。

厂商全景地图:
03
厂商评估:SelectDB
厂商介绍:
产品服务介绍:
SelectDB Enterprise 定位为私有化部署版本,可在 IDC、私有云/专有云 VPC 等客户环境部署,用于服务对数据安全更加敏感的金融、政务等行业客户。 SelectDB Cloud 定位为云原生版本,目前已上线阿里云、华为云、腾讯云和 AWS。
厂商评估:
SelectDB 产品基于 Apache Doris 开发,继承了其极速易用的优势,能够满足企业对实时报表与多维分析、用户画像与行为分析、数据湖联邦分析、日志存储与分析等典型场景的需求。
在此之上,产品层面,SelectDB 增加了企业级特性及配套工具,以支持企业对安全、便捷使用与运维等方面的诉求。服务层面,SelectDB 提供来自 Apache Doris 项目核心开发团队的技术服务,团队成员拥有丰富的数据仓库运维管理经验,以解决企业的后顾之忧。
从产品能力看,SelectDB 具备多数据源实时集成、存储、查询的能力,而且性能表现优秀。
在数据集成层面,SelectDB 能够快速接入来自关系型数据库、消息队列、流/批处理引擎等数据源的数据。同时,SelectDB 还提供了对关系型数据库、数据湖、云对象存储等联邦查询的能力,而无需迁移数据。
在向量化执行引擎、全新 CBO 查询优化器、Pipeline 执行引擎、智能物化视图等一系列查询加速的技术优化下,SelectDB 能够以毫秒级的响应时间返回海量数据下的查询结果,在点查询、实时报表、即席查询等不同负载下均能够满足企业对实时分析的需求。
从过往的落地案例看,SelectDB 分析性能能够有效提升企业实时数据分析的效率,并且简化技术栈。例如,某制造企业基于 SelectDB 构建了统一的实时数据仓库,摒弃了之前分别服务于在线实时报表和离线即席查询的两套数据架构,架构复杂性与运维成本大幅降低,所消耗的计算和存储资源降低达 70%,查询性能实现了近十倍的提升。
SelectDB 基于 Apache Doris 构建,产品内核稳定、高可用。Apache Doris 经历了严格的测试流程以及广大开源用户的大规模使用,在互联网、金融等行业有超过 2000+ 企业用户在生产环境中长期运行。与此同时,SelectDB 能够为企业提供 12-36 个月的长周期版本支持,以确保在系统功能快速迭代的同时稳定运行。
SelectDB 具备安全可控、运维与使用便捷等优势,满足企业对于数据仓库落地多方面能力诉求。
SelectDB 安全可控。在安全方面,SelectDB 在从产品架构上提供多种安全保护特性,包含资源隔离、认证鉴权、网络安全、数据保护、安全审计等;同时提供透明化的平台运营服务,客户可自助查看云资源安全策略、获取数仓访问审计日志、审核平台方线上操作视频记录等;此外,SelectDB 也认证了安全合规标准,确保数据安全和合规性,目前已获得等保三级、ISO/IEC 27001/27017/27018 等六项 ISO 认证,并通过了可信数据库的测评。
SelectDB兼容 MySQL 协议并配备周边工具,以此降低使用与运维门槛。围绕数据仓库的开发、运维和管理等过程,SelectDB 为产品均配备了一系列的可视化运维与开发工具,赋予用户全生命周期的运维管理能力,降低企业人员的使用门槛。此外,SelectDB 支持标准 SQL 并兼容 MySQL 协议,用户可以使用 MySQL 客户端、JDBC 标准协议以及各类 BI 产品来连接 SelectDB。
SelectDB 具备云原生的优势。基于云原生特性,SelectDB Cloud 实现了从部署到管理的全托管模式,支持分钟级别的平滑扩容和升级、分布式集群自管理等,降低集群日常运维压力。
在服务层面,SelectDB 提供来自 Apache Doris 核心开发团队的技术服务。SelectDB 搭建了专业的技术支持团队,能够做到 7*24 小时为企业用户提供服务。在团队组成上,SelectDB 是 Apache Doris 项目的主要研发团队之一,公司技术团队成员大多曾就职于大型互联网公司或公有云厂商,拥有丰富的数据库运维管理经验,能够为企业提供可靠的技术支持。
典型客户:
中国某大型汽车公司、某头部公募基金、某移动支付公司、某大型互联网数科公司、某银行消费金融
04
入选证书



