
乐 / 知 / 乐 / 享 同 / 心 / 共 / 济
摘要
www.modb.pro
春风送来了2023年3月的墨天轮中国数据库流行度排行,本月共有260个数据库参与排名,在本月排行榜前三
中,OTO 组合已经连续四月稳健开局,TOP3 依次是 OceanBase、TiDB 和 openGauss ,且前三甲均为开源
数据库,这表明开源给数据库产品带来更多的活力,流行度也随之水涨船高。细观本月榜单前十,榜单前八的产
品地位较为稳固。排行榜第九至十名,GBase 凭借多年积淀反超 AnalyticDB 以第九名亮相。
SQL的历史可以追溯到1970年,IBM公司的Edgar Codd发表了将数据组成表格的应用原则(Codd's Relational
Algebra)。20世纪70年代末,Codd系统的雏形建成,并且诞生了结构化查询语言SQL,1979年ORACLE公司
首先提供商用SQL,IBM公司在DB2和SQL/DS数据库系统中也实现了SQL,从此大家开始广泛使用SQL与数据
库进行交互。SQL编程语言的语法由ISO/IEC SC 32作为ISO/IEC 9075的一部分定义和维护。该标准不是免费提
供的。尽管存在标准,但 SQL 代码在不同的数据库系统之间不经过调整不是完全可移植的。SQL已经在数据库
中得到了广泛的应用,并取得了重大进展。然而,其也面临着许多挑战:众厂商SQL不兼容、无法识别复杂的句
子和推理、当处理大规模数据时SQL查询性能下降等。
当前,大量信息存储在结构化和半结构化知识库中,对于这类数据的分析和获取需要通过SQL等编程语言与数据
库进行交互操作,但SQL的使用难度限制了非技术用户,给数据分析和使用带来了较高的门槛。人们迫切需要技
术或工具完成自然语言与数据库的交互,因此诞生了NL2SQL任务。早在20世纪中后期,人们就已经开始尝试通
过自然语言直接访问数据库中存储数据,但受技术水平限制发展缓慢。直到2015年AI的发展和自然语言处理的创
新,人们又重新关注这一领域。NL2SQL(Natural Language to SQL)是语义解析领域的一个子任务,顾名思义
是将自然语言转为SQL语句。目前主流Text-to-SQL数据集主要有 WikiSQL(Salesforce)、Spider(耶鲁大学
& Salesforce)、SParC(耶鲁大学 & Salesforce)。截至2023年3月,在三大公开数据集榜单前三名中,国内
模型占比50%。目前 NL2SQL 可以用在基于结构化知识的智能交互(问答)、搜索引擎的优化,但也面临着中
文数据集缺乏、查询意图转换SQL缺乏背景知识支撑、模型成熟度、私有化部署难等方面的挑战。
文档被以下合辑收录
评论