OCW 2023
Oracle 宣布将对 MySQL HeatWave 进行革新,包括支持向量存储、生成式 AI、新增数据库内机器学习功能、MySQL Autopilot 增强功能、新增 HeatWave Lakehouse 功能、支持 JavaScript、加速 JSON 查询以及支持新的分析运算符。目前在私有预览中,向量存储支持客户利用大型语言模型 (LLM) 的功能及专有数据,其准确性比仅使用公开数据进行训练的模型更高。通过生成式 AI 和向量存储功能,客户可以使用自然语言与 MySQL HeatWave 交互,并高效地在 HeatWave Lakehouse 中搜索各种格式的文档。

甲骨文公司首席企业架构师 Edward Screven 表示:“此次宣布推出的 MySQL HeatWave 增强功能,是我们在解决客户数据、分析和 AI 等紧迫问题的又一个重要里程碑。我们之前在 HeatWave 中添加了具有高性价比、自动化机器学习、湖仓一体和多云功能的实时分析。现在,向量存储和生成式 AI 为客户带来了强大的 LLM,客户可以用一种直观的方式来与企业中的数据交互,并获得业务所需的准确结果。”
为满足希望对各种数据类型和数据源执行分析、事务处理、机器学习和生成性 AI 的客户,MySQL HeatWave 中增加了额外的功能,适用于与 MySQL 兼容的工作负载和非 MySQL 工作负载。

生成式 AI 和向量存储
(私有预览)
向量存储以各种格式(如 PDF)摄取文档,并将其存储为通过编码器模型生成的嵌入。对于给定的用户查询,向量存储将对所存储的嵌入和嵌入式查询执行相似性搜索,识别相似度高的文档,然后这些文档将用于增强给 LLM 的提示,使其能够提供更符合情境的答案。

MySQL HeatWave AutoML
MySQL HeatWave 所提供的数据库内机器学习包含全自动化的训练模型管道。客户无需将数据迁移到单独的机器学习服务中,即可轻松、安全地将存储在 MySQL HeatWave 中的数据用于机器学习训练、推断和解释。具体新增功能如下:
HeatWaveLakehouse 支持
客户可以利用 HeatWave AutoML训练、推断和解释 MySQL 数据库的数据,以及现在才开始支持的对象存储的数据,并为机器学习提供更多的数据。
文本列支持
客户可以对文本列执行机器学习任务(包括异常检测、预测、分类、回归和推荐系统),进一步扩大HeatWave AutoML 的可用数据语料库。
增强型推荐系统
现在,HeatWave AutoML 支持贝叶斯个性化排序 (BPR),可以基于隐式反馈(如购买历史和浏览行为)和显式反馈(如评分、点赞)来生成个性化推荐方案。例如,分析人员可以预测用户可能会喜欢的商品、特定商品能够吸引的用户以及某个商品的评分。
训练进度监视器
客户现在可以使用 HeatWave AutoML 监视模型训练的进度,从而更好地管理资源。

MySQL Autopilot
MySQL Autopilot 是 MySQL HeatWave 的内置功能,使用机器学习驱动的自动化来提高性能和可扩展性,并且无需具备数据库调优的专业知识即可操作。该功能将学习如何执行查询,以改进未来查询的执行计划。MySQL Autopilot 新的增强功能包括:
MySQLAutopilot 索引
(限量发布)
帮助客户减少耗时的任务,包括为联机事务处理(OLTP)工作负载创建合适的索引,以及随着工作负载的不断变化而持续维护索引。MySQLAutopilot 可使用机器学习技术,根据各个应用工作负载进行预测,自动判断客户需要从表中创建或删除的索引,以此优化OLTP 吞吐量。此外,Autopilot 索引功能还可根据推荐的索引来预测预期的改进效果,不仅无需创建索引,也不会对用户的租户产生计算或存储成本。
自动压缩
帮助客户判断适合该列的压缩算法,加速数据压缩和解压,进而提高加载和查询性能。通过减少内存使用量,客户可以将成本降低多达25%。
自适应查询执行
帮助客户在查询开始执行后,优化查询的执行计划,将临时查询的性能提高多达25%。该功能使用部分查询中获取的信息,调整数据结构和系统资源,然后根据运行时实际的数据分布,单独优化每个HeatWave 节点的查询执行。
自动加载和卸载
Autopilot 可自动将应用工作负载中使用的列加载到 HeatWave,并自动卸载从未查询或很少查询的表。这有助于释放内存,降低客户的成本,并且无需手动执行此任务。

其他 MySQL HeatWave
增强功能
JavaScript支持
(限量发布)
客户可以在 JavaScript 中写入存储过程和函数,然后在MySQL HeatWave 中执行。有鉴于此,开发人员可以在 JavaScript 中编写丰富的应用逻辑,并通过在MySQL 数据库中执行程序来获得高性能。JavaScript应用的性能得以有效提升,因为数据无需从数据库迁移到客户端,并且代码可在GraalVM 运行时即时(JIT) 编译。
JSON加速
开发人员和数据库管理员(DBA)现在可以利用 HeatWave,对存储在 MySQL 数据库中的 JSON 文档进行实时分析,从而将查询速度提高几个数量级。
新的分析运算符
通过新支持的分析运算符(包括 CUBE、Hyper Log、Qualify 和Table 示例),客户可以将更多工作负载迁移到MySQL HeatWave。
批量摄取到MySQL HeatWave
在从 CSV 文件批量加载数据的同时,并行构建索引子树,帮助客户实现更高的数据摄取性能,从而可以更快地查询数据,这意味着能够更快地释放用于加载数据的系统资源,降低客户的成本。
NAND Research 首席分析师兼创始合伙人 Steve McDowell 表示:“MySQL HeatWave 工程团队显然正在加大 AI 和机器学习的创新力度。现在,客户不仅能够以全面自动化的方式,使用数据库和对象存储中的数据进行机器学习模型训练,还可以借助全新的 AI 和向量存储功能,以自然语言与 HeatWave 进行交互。相关的模型训练除了使用公开提供的数据外,也使用了企业自己的数据,让客户能够获得精准符合业务目的的答案。客户可以自由选择 LLM,而这一点凸显了 MySQL HeatWave 工程团队的开放式协作策略。”
MySQL HeatWave 可在一个 MySQL 数据库服务中提供事务处理、实时分析、机器学习、数据池查询和基于机器学习的自动化功能。作为 Oracle Distributed Cloud 策略的核心,MySQL HeatWave 在 OCI 和 Amazon Web Services 中原生提供,作为 Oracle Database Service for Azure 的一部分提供,以及通过 OCI Dedicated Region 在客户数据中心内提供。
*注:为免疑义,本新闻所用以下术语专指以下含义:
1. Oracle 专指 Oracle 境外公司而非甲骨文中国。
2. 相关 Cloud 或云术语均指代 Oracle 境外公司提供的云技术或其解决方案。



2023 甲骨文全球云大会盛大开启!

走进 OCW | Oracle Cloud Infrastructure 提供企业生成式 AI 服务

走进 OCW | Oracle 推出集成向量数据库

Oracle 正式发布 Java 21

评论

