MagicAvatar：多模式头像生成和动画

AI开源项目 AI视频工具

MagicAvatar是一个多模式框架，能够将各种输入模式（文本、视频和音频）转换为运动信号，随后生成动画。

链接直达手机查看

MagicAvatar是一个多模式框架，能够将各种输入模式（文本、视频和音频）转换为运动信号，随后生成动画。

相关导航

苹果 Manzano：首个端侧“图像理解+图像生成”统一架构的多模态大模型

苹果 Manzano 是首个在端侧实现“图像理解+图像生成”统一架构的多模态大模型，用一套参数同时完成“看懂图”和“画出图”。

MobiAgent：开启移动端智能体新时代

MobiAgent 是上海交通大学 IPADS 实验室团队推出的一款移动端智能体工具链，支持用户从零构建专属 AI 助手，涵盖数据收集、模型训练到手机端部署的全流程。

BAGEL：多模态理解与生成的统一模型

字节跳动开源的一个多模态基础模型，拥有70亿活跃参数（总计140亿），在大规模交错多模态数据上进行训练，其在多模态理解排行榜上超越了当前顶级开源视觉语言模型，如Qwen2.5-VL和InternVL-2.5，并且在文本到图像生成质量上与强大的专业生成器如SD3相当。

MIDI：从单张图像到3D场景生成的多实例扩散模型

能够从单张图像生成高保真3D场景，通过捕捉物体间的交互关系和空间一致性，实现高效且高质量的3D场景生成。

Qwen3-Coder：通义千问的高效代码生成与辅助工具

Qwen3-Coder 是阿里巴巴通义千问团队发布的最新代码模型，具备卓越的代码生成和智能代理能力，能够大幅提升开发效率。

免责声明：本站为个人资讯、工具类学习博客，所发布的一切形式的内容，包括但不限于文字、链接、工具、图片、视频、软件等，仅限用于学习和研究目的，不得将上述内容用于商业或者非法用途，否则，一切后果请用户自负。本站信息来自网络，如有侵权请联系本站删除下架，您必须在下载后的24个小时之内，从您的电脑中彻底删除上述内容。访问和下载本站内容，说明您已同意上述条款。本站为非盈利性站点，本站不贩卖软件，所有内容不作为商业行为，点击、使用相关工具时请注意甄别，谨防上当受骗。咨询联系：yumiok88@gmail.com.