分析器管理

更新时间:2025-02-27 09:57:36

OpenSearch-行业算法版提供了文本分析器、向量分析器和文本-自定义分析器三种分析器。

  • 分词是搜索引擎中一个基础但重要的组件,分词的结果直接影响搜索效果。由于业务场景的多样,同一个短语在不同的业务、不同的语境下,其语义可能会不一样,期望分词的结果也不一样。为此,OpenSearch除了提供面向通用领域的基础分析器外,还提供了面向特定领域的分析器,如面向电商领域的电商分析器等。具体详情请参见文本分析器

  • 向量分析器可以将复杂的数据转化为易于计算和分析的向量形式,并在此基础上提供高效的相似度计算、特征提取和语义理解能力。行业算法版内置了多维度、面向特定行业以及部分来自AI搜索开放平台的向量分析器,具体详情请参见向量分析器

  • 为了更好地满足用户的业务需求,OpenSearch可以让用户在系统提供的基础分析器的基础上,通过结合干预词条的形式创建自定义分析器。在应用的索引字段的分析器中选择使用相应的分析器,以达到干预索引和查询时分词结果,确保搜索结果的质量。具体详情请参见文本-自定义分析器