ONE-PEACE多模态向量表征

更新时间: 2024-03-28 16:01:10

ONE-PEACE是一个通用的图文音多模态向量表征模型，支持将图像，语音等多模态数据高效转换成Embedding向量。在语义分割、音文检索、音频分类和视觉定位几个任务都达到了新SOTA表现，在视频分类、图像分类图文检索、以及多模态经典benchmark也都取得了比较领先的结果。

开发者可以通过以下链接，了解如何通过大模型服务平台调用ONE-PEACE多模态向量表征API。