您的位置：首页 >科技 >

阿里云开源多模态视觉模型 Qwen-VL，号称“超同等规模模型表现”

来源：搜狐号-IT之家时间：2023-08-25 21:19:51

(资料图)

IT之家 8 月 25 日消息，阿里云今日推出了大规模视觉语言模型 Qwen-VL，目前已经在 ModeScope 开源，IT之家早前曾报道，阿里云此前已经开源通义千问 70 亿参数通用模型 Qwen-7B 和对话模型 Qwen-7B-Chat。

据悉，Qwen-VL 是一款支持中英文等多种语言的视觉语言（Vision Language，VL）模型，相较于此前的 VL 模型，其除了具备基本的图文识别、描述、问答及对话能力之外，还新增了视觉定位、图像中文字理解等能力。

▲ 图源 ArXiv 论文

Qwen-VL 以 Qwen-7B 为基座语言模型，在模型架构上引入视觉编码器，使得模型支持视觉信号输入，该模型支持的图像输入分辨率为 448，此前开源的 LVLM 模型通常仅支持 224 分辨率。

官方表示，该模型可用于知识问答、图像标题生成、图像问答、文档问答、细粒度视觉定位等场景，在主流的多模态任务评测和多模态聊天能力评测中，取得了远超同等规模通用模型的表现。

▲ 图源 modelscope

此外，在 Qwen-VL 的基础上，通义千问团队使用对齐机制，打造了基于 LLM 的视觉 AI 助手 Qwen-VL-Chat，可让开发者快速搭建具备多模态能力的对话应用。

通义千问团队同时表示，为了测试模型的多模态对话能力，他们构建了一套基于 GPT-4 打分机制的测试集 “试金石”，对 Qwen-VL-Chat 及其他模型进行对比测试，Qwen-VL-Chat 在中英文的对齐评测中均取得了开源 LVLM 最好结果。

▲ 图源 modelscope

标签：

热门资讯

易跑发布首款全地形M5马拉松跑步机 8月25日，YPOO易跑发布首款全地形...
后勤物资集采难？交付难?妥了网®助推军政采购服务更高效！ 近年来，在国家实施军民融合发展战...
汝南县汝宁街道：加强基层治理 “红马甲”们在路上 您好，我们是社区工作人员，我们街...
每日速讯：豫南燃气汝南分公司:燃气便民不打烊延时服务暖人心 近日，豫南燃气汝南分公司窗口服务...

观察

图片新闻

外交部：日方应当立即纠正错误不要让福岛之水成为日本之耻 点击图片查看视频8月25日，外交部...
数百名斐济民众举行抗议活动反对日本排放核污染水 当地时间25日，在日本开始将核污染...
南极海冰融化严重危及帝企鹅幼鸟 英国《通讯-地球与环境》杂志24日...
辽宁盘锦“1·15”重大生产安全责任事故调查报告公布 2023年1月15日13时25分左右，盘锦...

精彩新闻

注意！三亚海棠区一学校停止招生 8月25日记者从三亚市海棠区人民政...
新型脑机接口技术登《自然》杂志，“读心”速度和准确性相对更高 IT之家8月25日消息，根据学术期刊...
芬兰团队首度实现“声音在真空中传播”，将音频转换为电场传输 IT之家8月25日消息，芬兰于韦斯屈...
破索赔记录！东风日产诉自媒体侵权获胜：牛车实验室被判赔偿500万 破索赔记录！东风日产诉自媒体侵权...
美系车也有低油耗：全新林肯Z混动版发布比亚迪同款电池 美系车也有低油耗：全新林肯Z混动...
汝南县汝宁街道：加强基层治理 “红马甲”们在路上 您好，我们是社区工作人员，我们街...
泽瑞名字的含义是什么 泽瑞这个名字的含义可以从两个方面...
早期教育的重要性你了解多少？ 亲爱的朋友们，你是否还在为如何培...
【全球独家】驻马店市驿城区雪松街道纱厂社区开展防溺水救援应急演练 为进一步增强辖区青少年防溺水安全...
西平县二郎镇政协联络组多措并举推进全国第五次经济普查清查工作-天天热消息 近日，全国第五次经济普查清查工作...
梦见荷花是什么意思 梦见荷花代表着富贵和纯洁。荷花被...
柠字取名什么含义 柠字取名常常出现在命名宠物、品牌...
梦见家里被水淹了是什么意思 梦见家里被水淹了可能暗示着你在现...
贡献奉节力量第二届川渝气候经济发展大会在重庆奉节举行 8月25日，第二届川渝气候经济发展...
暖心“警妈”来回奔波让祖孙三代都有了新期待 近日，重庆市北碚区公安分局蔡家派...
蓝骑士全天候响应饿了么发布助力亚运四大行动 杭州亚运会进入倒计时30天。8月24...
水磨沟区“零工驿站” 小岗位稳住大民生 “外出打零工，但又不知道哪里招人...
杭州亚运会各项筹备工作进入最后冲刺阶段 点击图片查看视频央视网消息：目前...
《英雄联盟》新手专区改版：1-29 级玩家可解锁大量奖励 IT之家8月25日消息，《英雄联盟》...
甘草对生态环境有哪些要求，如何进行栽种？ 甘草是一种草本植物，其栽种与生态...
还敢说特斯拉坏话？特斯拉起诉多人名誉侵权：有人被索赔500万 还敢说特斯拉坏话？特斯拉起诉多人...
金龙鱼对水质有哪些要求，如何培育鱼苗？ 金龙鱼是一种淡水鱼类，它的养殖需...
研究人员：纸吸管“并不那么健康环保”，市售九成含有有毒PFAS IT之家8月25日消息，安特卫普大学...
比亚迪为员工造了个空中列车：全自动驾驶拥有独立路权 比亚迪为员工造了个空中列车：全自...
市值完爆比亚迪！这家越南造车新势力已成全球前三 市值完爆比亚迪！这家越南造车新势...
印度预计将于 2026 年发射月船 4 号，去月球南极找水 IT之家8月25日消息，前日印度“月...
蝗虫如何进行繁殖，蝗灾突然覆灭的原因有哪些？ 蝗虫是昆虫中的一种，具有快速繁殖...
11.3T卖31.19万：新款奔驰GLB上市这价格买国产不香吗 11 3T卖31 19万：新款奔驰GLB上...
昂达推出 RTX 4070 Ti 魔剑显卡，售价 5999 元 IT之家8月25日消息，昂达今日推出R...
星河动力航天助力吉林一号宽幅 02A 卫星上天，可拍 150km 宽照片 IT之家8月25日消息，据星河动力航...
海狼有哪些形态特征，主要分布在哪些海域? 海狼，又称海豹狼，是一种生活在北...
特斯拉车主称又遇“刹车失灵”：踏板变硬、靠追尾前车停了下来 特斯拉车主称又遇“刹车失灵”：踏...
最资讯丨驻马店开发区开源办事处召开促进新增就业工作会议 为切实加强和改进城镇新增就业工作...
西平县妇联开展“2023年驻马店市书香天中亲子悦读——跟着书本去旅行”公益巡回讲座 为深入贯彻落实党的二十大精神，按...
环球观热点：西平县柏苑街道真查真改真思以整改成效促工作提升 近日，西平县柏苑街道狠抓问题整改...
牛黄在牛体内是如何形成的，有哪些药用价值？ 牛黄是一种中草药，其名称源于它的...
镇江市经济工作推进会召开 8月24日下午，全市经济工作推进会...
“天玑京东品牌日”“高性能、高能效、低功耗”天玑旗舰体验广受好评 联发科天玑系列芯片始终秉持着引领...
致城乡居民的一封信_天天热点评 广大居民朋友们：近日，国内个别地...
海尔洗衣机e4是什么故障 海尔洗衣机E4是一个故障代码，它通...
梦见买白菜是什么意思 梦见买白菜通常暗示你正在追求平凡...
梦见捡到钱是什么意思 梦见捡到钱可以代表你在现实生活中...
梦见杀狗是什么预兆 梦见杀狗不是一个好的预兆。在梦中...
床垫什么牌子的比较好 无疑，床垫品牌的选择对于一个好的...
贵州黄平：“电酿酒”打造绿色用能“强磁场” 初秋时节，秋酿贵如金。走进贵州省...
第八届全国民宿大会暨首届全国森林民宿大会将在塔河县开幕 办好全国民宿大会，促进旅游产业发...
北京全流程监管农民工工资专用账户 本报北京8月23日电(记者潘俊强)近...
宣威：火腿飘香万里产业蓬勃发展 央广网宣威8月25日消息（见习记者...
人社部启动青年就业服务攻坚行动_世界播报 本报讯(中青报·中青网记者李桂杰)...
天天速看：福建加快现代化产业体系建设 传统产业改造升级新兴产业集链成...