阿里云通义开源首个多模态推理模型QVQ,视觉推理比肩OpenAI o1
作者:新媒网时间:2024-12-25 阅读数:96 +人阅读
新媒网获悉,12月25日,阿里云通义千问发布业界首个开源多模态推理模型QVQ-72B-Preview。QVQ展现出超预期的视觉理解和推理能力,在解决数学、物理、科学等领域的复杂推理问题上表现突出。多项评测数据显示,QVQ超越了此前的视觉理解模型Qwen2-VL,整体表现与OpenAI o1、Claude3.5 Sonnet等推理模型相当。目前,开发者可在魔搭社区和HuggingFace平台上直接体验。
>新媒网版权及免责声明:
1、凡本网注明“来源:新媒网全媒体、新媒网官方等账号”及标有原创的所有作品,版权均属于新媒网。未经允许禁止转载、摘编及镜像,违者必究。对于经过授权可以转载我方内容的单位,也必须保持转载文章、图像、音视频的完整性,并完整标注作者信息和本站来源。
2、凡本网注明“来源:XXX(非新媒网)”的作品,均转载自其它媒体,转载目的在于传递更多信息,并不代表本网赞同其观点和对其真实性负责。>
3、如因作品内容、版权和其它问题需要同本网联系的,请在相关作品刊发之日起30日内进行。
新媒网
新媒体行业门户平台_电商品牌增长社区