扫码阅读
手机扫码阅读

向量数据库:抛弃数据库范式的代价?

71 2024-07-18

我们非常重视原创文章,为尊重知识产权并避免潜在的版权问题,我们在此提供文章的摘要供您初步了解。如果您想要查阅更为详尽的内容,访问作者的公众号页面获取完整文章。

查看原文:向量数据库:抛弃数据库范式的代价?
文章来源:
InfoQ
扫码关注公众号

向量数据库的现状与未来展望

作者栾小凡,Zilliz 合伙人 & 研发 VP,讨论了向量数据库(VectorDB)的现状及其与人工智能(AI)应用的关系。尽管向量数据库作为处理大模型相关应用的关键技术而备受关注,但栾小凡认为当前的向量数据库产品已偏离了最初的设计理念,并且在多个方面存在不足。

向量数据库的定义和问题

向量数据库是为管理向量形式的非结构化数据设计的,以支持机器学习算法提取的特征。其核心能力在于处理高维数据相似性,但目前的向量数据库产品在数据库理念、效率、复杂查询处理和功能完备性方面均存在问题。这些问题包括:

  • 放弃了重要的数据库范式和理念,如预定义 Schema、高级查询语言和基本数据库机制。
  • 实现方式并不高效,面临数据分片和索引创建的挑战。
  • 不能处理复杂的向量查询,如混合查询、标量和向量的组合查询。
  • 缺少现代数据库管理系统的关键功能,如离线加载、一致性、安全性和多租户支持。

向量数据库的未来

栾小凡对专有向量数据库的未来保持乐观。他认为,AI 原生应用开发者需要的是能够理解语义的搜索系统,而向量数据库正朝着这一方向发展。Milvus 2.4 版本将引入多向量混合查询和稀疏索引功能,支持 AIGC 应用。此外,Zilliz Cloud 即将推出的 Serverless tier 将支持千万级别的租户,并大幅降低成本。

结论

向量数据库虽然当前存在诸多不足,但它们在AI驱动的未来中仍有重要作用。栾小凡呼吁,应借鉴关系型数据库的经验,结合AI应用场景,发掘向量数据库的独特价值。他概括向量数据库为“以AI的方式理解数据,以数据库的方式访问数据”,并认为向量数据库正站在属于它的历史性机遇前。

想要了解更多内容?

查看原文:向量数据库:抛弃数据库范式的代价?
文章来源:
InfoQ
扫码关注公众号

为一线互联网公司核心技术人员提供优质内容。科技圈的观察者,前沿技术的传播者。

98 篇文章
浏览 13.8K
加入社区微信群
与行业大咖零距离交流学习
软件研发质量管理体系建设 白皮书上线