向量数据库
|
第
1
期
|
从零开始学习
1
、向量数据库中的基本概念
1.1
什么是余弦
余弦函数是一种三角函数,在直角三角形中,某个锐角的余弦为:临边与斜边的比值,如
下图
cosA=b/c
。引申到任意三角形中,即余弦定理:
a
2
=b
2
+c
2
-2bc*cosA
,任意三角形的任
一边的平方等于其他两边的平方和减去这两边与夹角余弦乘积的两倍。该公式转换下,余
弦为:
cosA=( b
2
+c
2
- a
2
)/2bc
1.2
向量
万物皆向量,比如经常看到的地铁指示牌“前方
500
米”,就是一个向量,给出我们信息:
方向和大小。可以将向量表示在平面直角坐标系中:
这仅是一个二维向量,那么所谓的“向量数据”:由多个数值组成的序列,可以表示一个数
据量的大小和方向。通过
embedding
技术,图像、声音、文本可以表示为一个高维的向量。
比如一个图片可以转换成一个由像素值构成的向量。
注:简单来讲
embedding
是一种将高维数据转换成较低维的向量表示的技术。比如显示的
地理地形信息远超过三维,但是地图通过颜色和等高线等来最大化表现现实的地理信息。
评论