My Study: June 2026 Archives

June 2026 Archives

向量数据库与 Milvus：从原理到性能调优实践

By Cnangel on June 4, 2026 7:29 PM

随着大语言模型（LLM）和 AI 应用的爆发式增长，一种新型数据库悄然成为 AI 基础设施的核心组件----向量数据库（Vector Database）。

传统关系型数据库擅长精确匹配：WHERE name = 'Alice'。但面对以下场景时力不从心：

这类问题的本质是相似性搜索，而不是精确匹配。

AI 模型（如 BERT、CLIP、text-embedding-ada-002）可以将非结构化数据转化为高维浮点数向量，称为 Embedding：

 "今天天气真好" → [0.12, -0.87, 0.34, 0.91, ...]  # 768 维

语义相近的内容，其向量在空间中的距离也更近。相似性搜索就转化为了近似最近邻（ANN, Approximate Nearest Neighbor）搜索问题。

 原始数据 → Embedding 模型 → 向量 → 向量数据库存储 → ANN 查询 → Top-K 结果