Appearance
声纹识别接入
声纹识别利用用户的声音特征识别身份,让智能体根据说话人提供差异化服务。适合家庭助理、企业客服或需要区分多位用户的场景。
前置条件
- 当前仅支持 API / Real-Time SDK 等语音通话能力。
- 需在火山引擎账号中开通相关计费项目,声纹识别按调用次数收费。
- 语音输入质量会影响识别准确度,建议使用 16kHz 以上采样率。
步骤一:创建声纹与声纹组
- 进入资源库的「声纹」模块,创建声纹组(例如"家庭成员")。
- 在组内点击
新建声纹,为每位用户上传语音样本或录制音频。 - 支持为声纹添加备注信息,便于识别时输出附加数据。
步骤二:测试声纹
- 在声纹管理页面使用「声纹测试」上传样例音频,确认命中结果与相似度。
- 可根据相似度调整识别阈值,默认阈值为 40,数值越高越严格。
步骤三:在智能体中启用声纹识别
- 在智能体编排页点击
设置→声纹识别,选择需要挂载的声纹组。 - 配置参数:
- 识别阈值:0–100,建议结合测试结果调优。
- 空值沿用历史:开启后,当某轮未识别出声纹时沿用上一次结果,保持对话连贯。
- 开启后系统会自动注入以下系统变量:
sys_voiceprint_name:声纹名称,表示识别出的用户。sys_voiceprint_info:声纹附带信息,可自定义例如用户偏好。
步骤四:在对话或工作流中使用
- 在提示词或工作流节点中引用
sys_voiceprint_name判断说话人,进而选择不同的回复逻辑。 - 可结合变量或数据库,为特定用户提供个性化推荐。
- 通过调试面板的通话图标选择声纹组,模拟识别效果。
实际部署
发布智能体到 API 或 Real-Time SDK 后,在客户端发起语音通话时指定声纹组 ID,系统即可实时识别来电者身份并返回相应的个性化回答。
