目录
产品简介
KBase数据库是同方知网拥有完全自主知识产权的,以管理海量非结构化数据对象为主,具备智能信息处理能力,以中文信息处理为特色的国产数据库管理系统。
KBase是同方知网集多年在数据库管理系统、智能信息处理、数字图书馆等领域的研发经验,历经20余年研制而成的。KBase同时支持搜索型数据库模型、向量数据库模型、原生NXD数据库模型以及RDF数据库模型,兼容标量数据、全文数据、向量数据的混合查询,为用户提供了全面而灵活的数据管理方案。
2024年7月1日消息,同方知网 KBase 已通过中国信通院搜索型数据库和向量数据库产品测试。
产品架构
KBase架构图
产品特点
1. 融合检索
KBase数据库以基于向量的相似检索、全文检索为核心特色功能,即支持简单的全文精确检索、模糊检索,也支持复杂的全文位置检索、截词检索、繁简统一,更支持类搜索引擎的一筐式相关查询。通过将向量索引和全文索引技术相结合,KBase研发了全文语义索引原型,为文献语义检索提供了新的思路。
2. 高性能高扩展
KBase支持多机分布式计算,管理数据的能力具备优越的可伸缩性。同时,KBase支持超大规模的集群,服务能力稳定可靠,可根据需要高效扩展。
3. 高安全性
KBase数据库强调安全性,支持帐号、权限管理和数据授权,用户需验证身份以保护数据安全。同时支持分布式集群、读写分离系统的安全加密帐号,采用多层次安全措施,提供可靠的数据保护。
4. 友好的查询语言KSQL
SQL是大家非常喜爱的一种数据库结构化查询语言,在KBase数据库中,为了使得全文检索更好的为用户所掌握使用,提供了一种类似SQL的查询语言KSQL,极大降低用户基于KBase开发应用的学习成本。
5. 丰富的数据类型
KBase不仅支持全文数据管理,同样支持传统关系型数据库的各种数值型数据类型,还支持向量、指纹等特色数据类型的管理。结合KBase智能中文信息处理平台的处理,利用向量,可以实现文本的相似计算,提供“以文找文”、“以图找图”、“文本复制”等检索功能。
应用场景
KBase数据库性能稳定、功能完善、检索准确高效,支持超大规模分布式集群计算、跨平台云部署,可以广泛应用于高校、公共图书馆、医院、科研院所、大型企业、党政机关等需要大规模信息管理和知识管理的领域。
- KBase支持强大丰富的全文搜索引擎,同时依托大规模分布式集群支撑着知网学术文献检索平台,文献日检索量数千万次。
- KBase的RDF模型实现了图数据库检索,可以提供高性能的论文引用关系计算,实现实时分析数亿文献多层引用关系。
- KBase支持指纹索引,可以实现海量论文片段级相似查找,为知网的学术不端检测等产品提供了重要的后台支撑。
- KBase支持向量数据库引擎,依托知网海量高质量文本语料数据以及同方知网华知大模型的生成能力,能够提供完整的检索增强生成解决方案,如知网AI学术研究助手。
- KBase深度整合了同方知网自主研发的超大规模分布式文件系统HFS,将文献检索与原文管理统一融入到一个系统平台之中。该系统支持了知网数量在百亿级别、总体容量达到PB级别的文件和数字对象的管理,为各业务系统提供了安全可靠的文献上传、下载以及在线浏览等多元化服务。
所属公司
同方知网数字出版技术股份有限公司(简称:同方知网)
相关资料
中国知网官网:https://www.cnki.net/