声纹识别接入

声纹识别利用用户的声音特征识别身份，让智能体根据说话人提供差异化服务。适合家庭助理、企业客服或需要区分多位用户的场景。

前置条件

当前仅支持 API / Real-Time SDK 等语音通话能力。
需在火山引擎账号中开通相关计费项目，声纹识别按调用次数收费。
语音输入质量会影响识别准确度，建议使用 16kHz 以上采样率。

步骤一：创建声纹与声纹组

进入资源库的「声纹」模块，创建声纹组（例如"家庭成员"）。
在组内点击 新建声纹，为每位用户上传语音样本或录制音频。
支持为声纹添加备注信息，便于识别时输出附加数据。

创建声纹组

步骤二：测试声纹

在声纹管理页面使用「声纹测试」上传样例音频，确认命中结果与相似度。

声纹测试界面

可根据相似度调整识别阈值，默认阈值为 40，数值越高越严格。

步骤三：在智能体中启用声纹识别

在智能体编排页点击 设置 → 声纹识别，选择需要挂载的声纹组。
配置参数：
- 识别阈值：0–100，建议结合测试结果调优。
- 空值沿用历史：开启后，当某轮未识别出声纹时沿用上一次结果，保持对话连贯。

声纹识别配置

开启后系统会自动注入以下系统变量：
- sys_voiceprint_name：声纹名称，表示识别出的用户。
- sys_voiceprint_info：声纹附带信息，可自定义例如用户偏好。

步骤四：在对话或工作流中使用

在提示词或工作流节点中引用 sys_voiceprint_name 判断说话人，进而选择不同的回复逻辑。
可结合变量或数据库，为特定用户提供个性化推荐。
通过调试面板的通话图标选择声纹组，模拟识别效果。

实时识别演示

实际部署

发布智能体到 API 或 Real-Time SDK 后，在客户端发起语音通话时指定声纹组 ID，系统即可实时识别来电者身份并返回相应的个性化回答。