1 .一种基于多模态数据库的索引生成方法,其特征在于,包括:
获取用于构建数据库的多模态数据及查询数据;
对所述多模态数据中每种模态数据进行特征提取,得到每种模态下的数据向量;
基于所述查询数据,生成查询向量;
基于每种模态下的数据向量及所述查询向量,生成用于多模态数据的图索引,所述图
索引包括所述数据向量对应的数据节点、所述查询向量对应的查询节点、所述数据节点与
所述查询节点间的连接关系。
2 .如权利要求1所述的基于多模态数据库的索引生成方法,其特征在于,基于每种模态
下的数据向量及所述查询向量,生成用于多模态数据的图索引包括:
初始化图结构,其中将各个所述查询向量初始化为所述图结构中的各个查询节点,将
各个数据向量初始为所述图结构中的各个数据节点;
基于所述查询节点及所述数据节点,生成用于表示所述查询向量与所述数据向量间的
邻接关系,得到初始图索引中各个节点间的连接关系。
3 .如权利要求2所述的基于多模态数据库的索引生成方法,其特征在于,所述基于所述
查询节点及所述数据节点,生成用于表示所述查询向量与所述数据向量间的邻接关系,得
到所述图索引中各个节点间的连接关系包括:
对于所述查询节点,计算所述查询节点与各个数据节点间的第一距离值,得到多个第
一距离值,将所述第一距离值从小到大排序,从多个第一距离值中选取排在前第一预设数
量的第一目标距离,将所述第一目标距离对应的数据节点作为所述查询节点的邻居节点,
并生成从所述查询节点指向所述查询节点的邻居节点间的连接关系;
对于所述数据节点,计算所述数据节点与各个查询节点间的第二距离值,得到多个第
二距离值,从多个第二距离值中选取最小距离对应的查询节点作为所述数据节点的邻居节
点,并生成从所述数据节点指向所述数据节点间的连接关系。
4 .如权利要求2所述的基于多模态数据库的索引生成方法,其特征在于,基于每种模态
下的数据向量及所述查询向量,生成用于多模态数据的图索引还包括:
对所述初始图索引进行优化,得到所述图索引;
所述对所述初始图索引进行优化,得到所述图索引包括:
从所述初始图索引中搜索待优化节点,其中所述待优化节点包括以下至少一种:孤立
节点、分离子图中的节点;
在所述待优化节点为查询节点时,计算所述待优化节点与各个数据节点间的第三距离
值,得到多个第三距离值,从多个第三距离值中筛选第二预设数量的第三目标距离,将所述
第三目标距离对应的数据节点作为所述待优化节点的补充邻居节点,并生成从所述待优化
节点指向所述待优化节点的补充邻居节点的连接关系;
在所述待优化节点为数据节点时,计算所述待优化节点与各个查询节点间的第四距离
值,得到多个第四距离值,从多个第四距离值中筛选第三预设数量的第四目标距离,将所述
第四目标距离对应的查询节点作为所述待优化节点的补充邻居节点,并生成从所述待优化
节点指向所述待优化节点的补充邻居节点的连接关系。
5 .如权利要求4所述的基于多模态数据库的索引生成方法,其特征在于,所述方法还包
括:
权 利 要 求 书
1/3 页
2
相关文档
评论