一个由清华大学、阿里巴巴和华中科大共同开发的一个基于扩散模型可以让人物照片说话,支持包括歌曲、多种语言的语音、嘈杂的音频在内的各种声音匹配让人物头像说话的框架。
character.ai是一个允许用户创建和与AI驱动的角色聊天的平台。这些角色可以是虚构的,也可以是基于真实人物的。character.ai使用大型语言模型来生成角色的响应,使其能够进行自然而引人入胜的对话。
网易有道推出的一系列基于人工智能技术的虚拟人物形象,旨在提供智能化和个性化的服务。这些数字人支持多种功能,包括但不限于照片说话和唱歌、视频翻译、形象克隆、歌声合成以及大屏交互等。
Seeduplex是字节跳动于2026年4月9日发布的全双工语音大模型。采用"边听边说"架构,突破传统半双工交互模式,实现听与说同步处理。已在豆包App全量上线,成为业内首个规模化部署的全双工语音大模型。
SongGeneration 是腾讯 AI Lab 推出的开源音乐生成大模型,旨在解决音乐生成领域中的音质、音乐性与生成速度等关键问题,同时支持文本控制、多轨合成与风格跟随等功能。
Qwen-Image-Layered 是阿里通义千问开源的 AI 模型,可把单张照片一键拆成带透明通道的独立图层,让“零 PS 基础”的用户也能像专业设计师一样精准改图。
Pad.ws 是一款集白板与代码编辑器功能于一体的在线协作工具,旨在为开发者和团队提供便捷的实时协作体验。
character.ai是一个允许用户创建和与AI驱动的角色聊天的平台。这些角色可以是虚构的,也可以是基于真实人物的。character.ai使用大型语言模型来生成角色的响应,使其能够进行自然而引人入胜的对话。