你有没有过这种体验——跟AI语音助手说话,必须等它说完才能插嘴,打断它反而显得不礼貌?4月9日,字节跳动正式发布全双工语音大模型Seeduplex,把这个困扰了行业多年的"你一句我一句"问题彻底解决了。→ 查看Seeduplex工具详情

一、什么是全双工?突破传统语音交互的"回合制"
传统AI语音交互采用的是半双工模式,本质上是"你说完、我处理、我说完、你再说"的轮流模式。用户说一句,AI要等上一句完全结束后才能处理下一句,交互节奏生硬、迟钝感明显。
全双工(Full Duplex)技术的核心在于让AI同时具备听和说的能力——不再采用"听-处理-说-等待"的传统分段式逻辑,而是边听边处理、边处理边说,实现类似真人电话交谈的自然流畅感。
简单来说:半双工 = 对讲机;全双工 = 手机通话。Seeduplex就是让豆包的语音能力从"对讲机模式"进化到了"手机模式"。

二、两大核心技术突破:精准抗干扰 + 极速打断
根据官方介绍,Seeduplex重点实现了以下两项技术突破:
精准抗干扰是第一个核心能力。模型具备持续"倾听"能力,能实时理解用户所处声学环境,准确识别并忽略背景噪音和无关对话。这意味着在嘈杂的咖啡馆、马路边,豆包依然能准确捕捉你的指令。
极速打断响应是第二个核心能力。全双工模式下,用户可以随时打断AI说话。Seeduplex的打断准确率达到了97.3%,端到端延迟仅210ms——这个速度已经接近甚至超过真人对话中人们对"即时响应"的感知阈值。

三、豆包App已全量上线,普通用户也能体验
目前Seeduplex已在豆包App最新版本中全量上线。用户更新App后,在对话界面选择"打电话",即可体验全双工实时语音通话功能。
这是行业内首个完成规模化部署并面向全体用户开放的全双工语音大模型应用。此前,业内其他厂商发布的全双工方案大多停留在技术展示或小范围内测阶段,而字节此次真正做到了让每个普通用户都能用上。
从豆包到Seeduplex,字节在语音AI领域的布局正在加速。与上一代半双工端到端语音模型相比,Seeduplex让交互体验的自然感和顺畅度获得了大幅提升。随着全双工技术的成熟,AI语音交互正在从"能用"走向"好用",距离真正的"拟人化对话"越来越近。



