产品概述

什么是地址标准化

地址标准化是依托阿里云海量的地址语料库,以及超强的NLP算法实力所沉淀出的高性能及高准确率的标准地址算法服务。该地址算法服务能解决一地多名,地址解析,地址真伪辨别等多种问题,为企业,政府机关以及开发者提供地址数据清洗,地址标准化能力,使地址数据更好的为业务提供支持。

产品名

产品形态

计费方式

应用场景

地址标准化接口服务

算法API

后付费、资源包、包月

物流、电商、金融等行业地址解析

位置资产管理

一体化平台

资源包

客户营销、会员体系治理

地址标准化接口服务

地址标准化接口服务是一站式闭环地址数据处理和服务平台产品,依托阿里云海量的地址语料库,针对各行业业务系统所登记的地址数据,进行纠错、补全、归一、结构化、标签化等NLP处理清洗,实现地址库的标准化,并向上提供地址智能填写、地址搜索/联想、地址正/逆编码、地址围栏等地址服务。

功能接口

功能版本

服务类型

功能接口名

功能描述

基础服务

基础服务

地址抽取

从自然文本中抽取地址片段。

姓名抽取

从自然文本中抽取姓名片段

电话号码抽取

从自然文本中抽取电话号码片段。

行政区划解析

输入一整段的地址,识别出该地址所对应的行政区划及行政区划编码。

邮编识别

对输入地址,识别出其所对应的邮政编码,默认细化到区县级别。

高级服务

地址文本清洗

地址结构化

对地址片段进行结构化解析,识别省市区路等地址要素。

地址纠错

对用户输入省、市、区、街道等错误文本地址进行纠错。

地址补全

对输入地址缺失的行政区划以及路名路号进行补全。

门址标准化

对用户原始地址,包括缺省地址信息进行补全和纠错。

地址异常检测

对用户输入的地址进行检测,判断地址是否为合法地址,并且对地址书写规范性、完整性、是否存在事实错误等进行检查,并输出地址的异常类型。

高级服务

智能地址填写

物流面单信息提取

对物流信息中人名、地名、电话号码进行识别和提取。

地址搜索

输入地址文本相关信息,返回相关POI信息,支持设置搜索结果条数。

地址输入联想

输入地址文本,联想出相关地址信息。

高级服务

智能地址应用

多地址相似性判断

通过对两条输入地址文本,判断其是否为同一地址,并对其相似性进行打分,针对不同部分片段返回输入文本的最细粒度相同层级及两个地址的基于经纬度点的距离。

多源地址归一

将用户输入的地址信息,通过返回oneID作为其唯一的标识,使得来自不同来源的但指向同一物理存在地理位置的地点拥有相同的唯一ID ,从而实现多源地址数据的归一化。

高级服务

地址空间化

通用经纬度查询(POI级别)

对输入的地址文本做经纬度坐标查询,精确到POI;返回经纬度中包含GCJ02和WGS84两种坐标系。

坐标系转换

对输入的指定坐标系的经纬度坐标进行其他坐标系转换;目前支持的坐标系包括:GCJ02、WGS84、CGCS2000、BD09。

高精度经纬度查询(楼栋级别)

对用户输入的地址信息,返回用户地址所对应的高精度空间经纬度坐标的结果,相比通用经纬度精细度更高,适合需要高精度场景下空间服务。

高级服务

地址特征分析

地址类型识别

针对用户输入的地址信息,预测地址片段的POI信息,并且按照三级分类进行POI归类。

POI预测

输入地址信息,据行政区划、路名路号等信息预测其POI名。

高级服务

语音对话场景

语音地址输入识别

在语音场景下,针对语音识别转写后的地址相关信息,通过语音顺滑、地址抽取、地址纠错、地址补齐后,给用户输出标准化地址信息,解决语音对话场景下的地址识别应用,例如语音导航等。

对话上下文地址推理

在上下文语音对话场景,针对用户所输入的多轮对话,通过对话文字识别、上下文推理,识别出地址关联片段。通过对语音地址的顺滑、抽取、纠错、补齐等,及上下文推理补全,返回相关性top3的排序结果。

位置资产管理

位置资产管理 ,是为用户打造的一站式的位置资产管理的工具,通过快速的数据对接、方便的任务配置实现对线下位置的挖掘、归一和刻画,基于地理实体,帮用户建立人-地关系,货-地关系,店/企-地关系,并基于线下位置进行行业资产画像的沉淀。

业务流程

位置资产管理的业务流程及数据链路如图所示:先将各种来源的业务数据源,通过合适的接入方式完成导入和管理;然后依托阿里地址标准化引擎能力,对用户数据集进行治理、标准化;接下来通过阿里地址归一化引擎能力,对用户多源地名地址数据,进行归一匹配,构建基于位置数据的唯一信息标识Address OneID;最终通过OneID,来构建自有的数据的位置画像,达成数据分析和支撑数据应用的能力并支持数据下载。

image.png