以图搜图和以文搜图是常见的 AI 搜索场景,例如电商平台中拍照片寻找相似商品,通过文字描述在相册中寻找照片等。它们都需要 AI 大模型将非结构化数据(图片或文字)映射成固定维度的向量(Embedding),并依赖一个稳定、高性能的向量库来存储和检索。
Hologres是阿里云自研的低成本、高性能、高可用实时数仓,在 AI 搜索场景提供如下能力:
高并发向量检索:支持HGraph向量索引,内置欧氏距离(Euclidean)、内积距离(InnerProduct)和余弦距离(Cosine)等向量距离计算方法,提供毫秒级向量检索能力。
高吞吐实时写入:支持实时写入和更新,写入即可见。线上新品图片、用户最新评论写入即可被检索。
分时/自动弹性:白天高峰自动扩容,夜间低峰自动缩容,成本随业务曲线动态调整。
一体化体验:一个系统一份数据支持多种类型的计算能力,除了向量检索,在 OLAP 查询、即席分析、在线服务上也有领先的性能表现。
本案例使用大模型将动物数据集映射为Embedding存储到Hologres中,借助Hologres的向量检索能力,实现端对端的以图搜图、以文搜图功能。
本文实践已集成至人工智能平台PAI Notebook Gallery,您可以通过交互式建模DSW快速完成该实践。详情请登录后参见基于 Hologres 实现以图搜图、以文搜图。
该文章对您有帮助吗?