Skip to content

声纹识别接入

声纹识别利用用户的声音特征识别身份,让智能体根据说话人提供差异化服务。适合家庭助理、企业客服或需要区分多位用户的场景。


前置条件

  • 当前仅支持 API / Real-Time SDK 等语音通话能力。
  • 需在火山引擎账号中开通相关计费项目,声纹识别按调用次数收费。
  • 语音输入质量会影响识别准确度,建议使用 16kHz 以上采样率。

步骤一:创建声纹与声纹组

  1. 进入资源库的「声纹」模块,创建声纹组(例如"家庭成员")。
  2. 在组内点击 新建声纹,为每位用户上传语音样本或录制音频。
  3. 支持为声纹添加备注信息,便于识别时输出附加数据。

创建声纹组


步骤二:测试声纹

  • 在声纹管理页面使用「声纹测试」上传样例音频,确认命中结果与相似度。

声纹测试界面

  • 可根据相似度调整识别阈值,默认阈值为 40,数值越高越严格。

步骤三:在智能体中启用声纹识别

  1. 在智能体编排页点击 设置声纹识别,选择需要挂载的声纹组。
  2. 配置参数:
    • 识别阈值:0–100,建议结合测试结果调优。
    • 空值沿用历史:开启后,当某轮未识别出声纹时沿用上一次结果,保持对话连贯。

声纹识别配置

  1. 开启后系统会自动注入以下系统变量:
    • sys_voiceprint_name:声纹名称,表示识别出的用户。
    • sys_voiceprint_info:声纹附带信息,可自定义例如用户偏好。

步骤四:在对话或工作流中使用

  • 在提示词或工作流节点中引用 sys_voiceprint_name 判断说话人,进而选择不同的回复逻辑。
  • 可结合变量或数据库,为特定用户提供个性化推荐。
  • 通过调试面板的通话图标选择声纹组,模拟识别效果。

实时识别演示


实际部署

发布智能体到 API 或 Real-Time SDK 后,在客户端发起语音通话时指定声纹组 ID,系统即可实时识别来电者身份并返回相应的个性化回答。