产品简介

自然语言处理(Natural Language Processing,简称NLP),是为各类企业及开发者提供的用于文本分析及挖掘的核心工具,旨在帮助用户高效的处理文本,已经广泛应用在电商、文娱、司法、公安、金融、医疗、电力等行业客户的多项业务中,取得了良好的效果。未来,自然语言处理还将为用户带来更多更有价值的服务。

阿里云自然语言处理包含以下子服务:

  • NLP基础服务,为用户提供包括分词、词性标注、命名实体、情感分析、中心词提取等自然语言处理基础服务,可用于智能问答、对话机器人、舆情分析、内容推荐、电商评价分析等场景中。

    温馨提示:NLP基础服务1.0已下线,请使用NLP基础服务2.0

  • NLP自学习平台,面向算法小白用户设计的NLP行业自适应标注、训练和服务平台,支持文本实体抽取、文本分类、关键短语抽取、情感分析、关系抽取、短文本匹配、商品评价解析算法能力的定制。

  • 企业智能搜索:以PaaS服务形式提供离线数据处理和搜索服务API。同时支持公有云、专有云、 基于云原生的基础架构下混合云 、私有化方式输出。从相关性到认知智能,将语义、知识融入搜索过程和结果,提供高效、高准确率的搜索服务产品。

一 NLP基础服务

多语言分词

提供智能分词服务,由专业的团队研发,保证对数据、模型的不断迭代更新。用户只需简单的调用相关API接口即可获取到所需结果。目前支持简体中文、英文及泰文。

词性标注

通过词性标注服务,用户可以快速的为每一个词附上对应的词性,结合分词服务,可以快速进行更深层次的文本挖掘处理,无需担心新词发现、歧义消除等问题。

命名实体

我们为您提供的命名实体服务,可以帮助您快速识别文本中的实体,进而挖掘各实体间的关系,是进行深度文本挖掘,知识库构建等常用自然语言处理领域里的必备工具。

情感分析

基于海量大数据研发,为有情感分析需求的产品提供服务。能够对短文本情感的正负向及中性进行分析,给出结果。在舆情监控、话题审核、口碑分析聚类等商业领域有广大的应用空间。

中心词提取

基于海量数据,使用电商标题中心词以及类目进行训练,通过给每个词计算一个相关性分数来衡量每个词与句子的相关性程度,进而识别并提取出句子的中心词。适用于提取电商搜索query、标题及其他类似短文本(一般小于25个词)的中心词。

智能文本分类

将用户输入的一段文本自动映射到具体的类目上,以帮助用户快速完成文本的分类,并针对文本中的关键标签进行识别和提取。支持平层类目体系或者以树状形式组织的层次类目体系,当前系统内置两种默认分类体系可直接使用:新闻资讯领域类目体系、电商领域类目体系。

文本信息抽取

当前提供的能力主要面向合同抽取领域,结合AI技术,通过自动阅读文档内容,将用户关心的关键核心信息进行提取,简化机械性和重复性的工作,协助企业完成文档审阅及录入工作。

商品评价解析

商品评价解析主要用于分析消费者反馈的评价、点评内容,同时也可以对类似微博的口语化、短文本进行分析。对于长篇幅的新闻篇章不适用。

二 NLP自学习平台

面向算法小白用户的NLP行业自适应标注、训练和服务平台。该产品支持文本实体抽取、文本分类、关键短语抽取、情感分析、关系抽取、短文本匹配、商品评价解析等NLP定制化算法能力,用户无需拥有丰富的算法背景,仅需标注或上传适量文档数据,即可通过平台获得优质的NLP算法模型。

三 企业智能搜索

阿里巴巴达摩院企业智能搜索,基于达摩院长期积累的自然语言处理技术,专注企业统一搜索场景,提供精准的多源异构搜索,以PaaS服务形式提供离线数据处理和搜索服务API。同时支持公有云、专有云、 基于云原生的基础架构下混合云 、私有化方式输出。产品基于自然语言处理、机器学习技术和企业内部知识库,从相关性到认知智能,将语义、知识融入搜索过程和结果,提供高效、高准确率的搜索服务产品,帮助用户搜得到、搜得全、搜得准。面向企业客户,提供交互式多轮对话搜索、通讯录搜索、地址搜索、文档搜索等能力。面向企业和大模型的交互场景,提供检索增强能力。