蚂蚁集团开源Ming-Flash-Omni 2.0:国产全模态大模型首次超越Gemini 2.5 Pro,树立开源新标杆
近日,蚂蚁集团正式开源发布全模态大模型Ming-Flash-Omni 2.0。该模型在视觉语言理解、语音可控生成、图像生成与编辑等 ...
近日,蚂蚁集团正式开源发布全模态大模型Ming-Flash-Omni 2.0。该模型在视觉语言理解、语音可控生成、图像生成与编辑等 ...
近日,全球最大AI开源社区HuggingFace的Transformers项目页面中悄然出现Qwen3.5的代码合并申请(PR),预示着阿里巴巴 ...
2025年9月25日,生数科技正式发布新一代图生视频大模型 Vidu Q2,该模型在极致表情变化、推拉运镜、生成速度及语义理解 ...
在人工智能领域,阿里巴巴集团再次引领潮流,重磅开源了其最新的视觉多模态模型——Qwen2-VL。这一模型在性能测试中表现 ...
Google 在其 2024年I/O 开发者大会上展示了一项名为 Gemini Live 的突破性 AI 技术,预示着未来人机交互的新方向。 1、 ...