MagicAvatar是一个多模式框架,能够将各种输入模式(文本、视频和音频)转换为运动信号,随后生成动画。
Black Forest Labs 推出的开源图像编辑模型,支持通过自然语言对图像进行精准编辑,具备上下文感知能力,能够在多次迭代编辑中保持图像质量和风格一致性。
Infinite Talk 是一个由 MeiGen-ai 研发小组开源的数字人项目,能够生成无限长度的视频,具有准确的口型同步和一致的身份保留。
新型的多模态大语言模型(MLLM),专为时间序列分析而设计,通过合成数据训练,能够显著提升对时间序列的理解和推理能力。
GPT-4o mini是OpenAI推出的一款成本效益极高的小型模型,旨在通过降低智能技术的成本,使其更广泛地应用于各种领域。该模型在MMLU(Massive Multitask Language Understanding)基准测试中获得了82%的分数,并在LMSYS leaderboard的聊天偏好任务中超越了GPT-41,展现了其强大的性能。GPT-4o mini的定价为每百万输入令牌15美分,每百万输出令牌60美分,相比之前的尖端模型,其价格降低了一个数量级,且比GPT-3.5 Turbo便宜了超过60%。
DeepSeek-V3.2 是由中国深度求索 (DeepSeek AI) 开发的新一代大语言模型,通过创新的稀疏注意力机制 (DSA) 大幅提升长文本处理效率,降低 API 成本 50%,性能达到 GPT-5 水平,同时推出高算力版本 V3.2-Speciale 在复杂推理任务中表现超越 GPT-5。
DeepSeek推出的第一代推理模型,性能与OpenAI的o1正式版相当,且开源了模型权重与训练框架。
Black Forest Labs 推出的开源图像编辑模型,支持通过自然语言对图像进行精准编辑,具备上下文感知能力,能够在多次迭代编辑中保持图像质量和风格一致性。