近日,腾讯AI助手“腾讯元宝”正式上线了备受瞩目的“看图说话”功能,标志着其在图像理解领域取得了重大突破。
此次升级的核心在于“混元+DeepSeek”双模聚合技术的应用。过去,DeepSeek主要作为信息提取工具,如今在腾讯混元多模态技术的加持下,DeepSeek已经能够真正理解图片中的细节、氛围,甚至是隐藏的含义。用户只需上传一张图片,腾讯元宝不仅能识别其中的文字,还能深入分析画面内容并给出独到的解读。
值得注意的是,“看图说话”功能在关闭联网搜索的情况下依然可以使用,这进一步增强了其独立性和实用性。此外,腾讯元宝还支持文件解析、联网搜索公众号或视频号内容、微信上传文件等多种功能,满足了用户在不同场景下的需求。
用户可以根据具体场景和业务需要,选择适合的“AI大脑”。例如,DeepSeek-R1满血版和混元T1适合进行深度思考,而DeepSeek-V3和腾讯混元Turbo则能够快速给出答案。这种灵活的选择方式,使得腾讯元宝能够更好地适应不同的应用场景。