AI面试

本文将为您提供一套全面的AI面试行业实践方案,帮助企业高效、准确地运用AI面试技术,提升招聘质量和效率。

背景介绍

在商业环境竞争激烈且节奏加快的背景下,传统面试方式因流程繁琐、主观性强、效率低下等问题难以满足企业快速发展的需求。相比之下,AI面试具有重要意义,能够快速筛选候选人,缩短招聘周期,提升效率和客观性,减少主观干扰,增强公平性,并通过多维度数据分析提高候选人与岗位的匹配度,为招聘决策提供可靠依据,助力企业在人才竞争中占据优势。

方案概览

image

AI面试流程主要涉及以下三个:

  • 面试前:

    • 电话通知候选人:制定清晰的候选人通知流程,告知候选人面试的时间、方式、注意事项等。提供详细的操作指引,帮助候选人熟悉 AI 面试系统的使用方法,确保面试顺利进行。

    • 面试题库设置:据不同岗位的职责、技能要求和素质模型,设计针对性的面试问题。这些问题应涵盖专业知识、工作经验、解决问题能力、团队协作能力等方面。

  • 面试中:

    • 音视频通话:选择合适的面试类型,为候选者提供合适的面试方式。

    • 个性化面试:通过对智能体参数配置,为每一个候选人提供一场量身定制的面试。

    • 防作弊检测:根据候选者面部表情、动作等内容,实时检测候选者是否存在作弊行为。

  • 面试后:

    • 音视频数据归档:您可以对面试过程中产生的原始音视频数据进行留存。

    • 对话文本转录归档:您可以对面试过程中产生的音视频数据进行转录成文本并进行留存。

方案选型

面试形式

AI面试场景,通常提供了3种面试形式的面试,您仅需在创建智能体时指定特定的通话类型并集成即可。您可以通过阿里云Demo体验先体验效果。如果您需要接入AI实时互动,请参见音视频通话快速入门

面试类型

纯语音面试

视觉理解面试

视频通话面试

效果示例

555d2e763e3c49c23ac59cb7060d2a44

19bd2b3ffe1089599439cb9f93bf30cf

image

面试形式

  • 候选者:语音

  • AI面试官:语音

  • 支持自然对话以及对讲机模式

  • 候选者:语音、视频

  • AI面试官:语音

  • 支持自然对话以及对讲机模式

  • 候选者:语音、视频

  • AI面试官:语音、视频

  • 支持自然对话以及对讲机模式

费用

终端SDK

SDK集成详情,请参见开发指南

SDK

说明

Web SDK

推荐使用

  • 桌面端浏览器:如Chrome等;

  • 移动端H5:如支付宝的H5、钉钉的H5、微信小程序H5

  • APP内置webview

说明
  • 不推荐使用手机原生浏览器,部分设备存在对WebRTC不兼容的情况。

  • 暂不支持微信小程序原生组件使用,建议使用微信小程序H5。接入详情,请参见如何在微信小程序中接入Web SDK

Android/iOS SDK

推荐使用:搭载安卓或者iOS操作系统的应用

其他

如果您想在Window或者Mac的桌面端进行开发,请通过钉钉搜索群号106730016696,加入群聊联系我们。

方案基础功能

个性化面试

阿里云开放了丰富的接口能力,允许您为每一个候选人提供一场量身定制的面试,将会使得面试的体验大幅提升,我们也建议您这么做。您可以通过在客户端启动智能体时,设置启动通话参数实现这一目标。您也可以通过在服务端启动时,设置参数来进行实现。以下是常用配置项:

设置项

说明

通话过程是否可修改

大模型提示词

通常您可以将候选人的个人信息、岗位信息作为提示词的一部分,在启动通话的时候进行入参,AI即可实现更有针对性的面试。

ASR语种

设置语种,如中文、英文...

TTS音色

设置AI的音色。

数字人形象

当您的智能体是VideoAgent时,且您有多个数字人形象,即可在通话时指定具体的形象。

欢迎语

针对不同的候选人设置欢迎语,例如:“你好小云,欢迎参加本次面试...”

题库设置

如果您有题库需求,您需要完成以下操作:

  1. 使用阿里云百炼创建智能体发布到AI实时互动。智能体发布详情,请参见阿里云百炼发布AI实时互动智能体

  2. 在阿里云百炼侧设置题库。如何设置题库,请参见创建与使用知识库

对话形式

在实际的面试场景中,不同的候选人说话风格、语速通常存在巨大的差异,当用户讲话语速频繁停顿,或用户在思考问题时容易被AI抢话,为解决此问题,阿里云针对面试场景提供了三套对话方案。

  • 方案一:自然对话+语义断句(推荐)

    候选人与AI将自行进行全双工的自然通话。 当用户说话时停顿或者陷入思考时,AI实时互动的语义识别板块将会结合当前语义和上下文智能判断用户本轮次的话是否说完。通常我们建议在面试场景当识别到用户当前的话没说完时,可以等待5秒(提供参数可配置),若识别到说话了则AI立马进行应答。具体详情,请参见语义断句

  • 方案二:对讲机模式

    每次轮到候选人进行讲话时,候选人需要进行按键来进行问题回答,在松开按键时结束回答。对讲机模式详情,请参见对讲机模式

  • 方案三:自然对话+特定词结束

    每次候选人讲完话后,都需要说一个特定的句子来结束本次对话,例如“我说完了”,您可以为一通通话设置多个结束语,否则智能体将一直处于聆听状态。

为用户发送自定义信息

在通话的过程中,若您希望实时为客户端下发诸如卡片、题目等信息,AI实时互动为您提供了专属的信息下发通道,客户端在接受到您的自定义信息后,可以自行做资源下载和交互渲染等任意业务行为。

image

阿里云为您提供了两套解决方案:

  • 方案一:您可以通过您的APPServer将自定义信息下发到客户端。详细内容,请参见向客户端发送自定义消息

  • 方案二:您也可以在大模型的响应中携带自定义信息,该信息会随着字幕实时到达客户端。

    说明

    您可以将指令藏在模型的回复内容中,并通过特殊符合例如{}、[]等进行标记。(操作方式:控制台-->工作流-->TTS节点-->过滤播报)被标记的内容将不会被语音播报,您仅需解析该内容即可做自定义业务处理。

用户信息透传模型

在通话过程中,如果当前有多个候选人同时在面试,对于同一个大模型而言需要能精准的区分当前的输入来自于哪个用户。 AI实时互动提供了信息透传大模型的能力,以便您能将一些自定义信息诸如UserID等透传到模型侧。 详细内容,请参见业务参数透传阿里云百炼大模型

用户未讲话识别及处理

您可以通过回调监听的方式通过监听intent_recognized参数来获得每一次用户的讲话时间。详细内容,请参见智能体回调。 以便您在识别到用户长期未讲话时,能够做出对应的业务处理,常见处理方式:

对话内容文本转录 & 音视频录制

您可以对整个面试过程中产生的音频数据或者文本数据进行留存。具体操作方式,请参见数据归档

方案进阶功能

防作弊体系

检测项

说明

执行方

无效画面识别

画面反光、黑屏、白屏X秒后认定为画面无效(用于识别画面遮挡)

AI实时互动

视频中画面中的人数

实时回调画面中的人数(可以发现是否有多人、人离开等)

AI实时互动

电子设备识别

实时回调画面中是否包含电子设备(手机、手表、耳机)

AI实时互动

频繁摇头

5秒内摇头两次,则认定为频发摇头

AI实时互动

频繁点头

5秒内点头两次,则认定为频繁点头

AI实时互动

内容模型重合度

企业在面试结束后,可以将用户的回答内容进行大模型查重,以判断在AI面试过程中,用户是否有借助AI大模型进行回答问题

企业自行处理

面试前电话通知

AI实时互动提供了电话外呼的能力,在面试场景可用于面试前的邀约通知,面试后的结果通知。详细内容,请参见电话呼出快速入门