Qwen3.7-Plus – 阿里巴巴发布的多模态智能体模型

AI最新项目1周前更新文明旁观者

109 00

Qwen3.7-Plus是阿里巴巴于2026年6月2日正式发布的多模态智能体模型，定位为视觉与语言统一的智能体基座。它在Qwen3.7文本能力基础上深度融合视觉理解与行动能力，不仅能看懂图像/视频，还能自主生成代码、调用工具、执行测试并迭代优化，实现从“感知界面”到“交付结果”的端到端任务闭环。

该模型在权威评测Vision Arena中位列全球前五、中国第一，标志着国产大模型从“对话能力”向“自主执行任务”的关键跃迁。

Qwen3.7-Plus - 阿里巴巴发布的多模态智能体模型

Qwen3.7-Plus核心特点

1. 多模态智能体工作流整合

“看、想、写、做、验”闭环能力：可同时处理图像、视频、屏幕、网页和文本输入，在GUI（图形界面）、CLI（命令行）环境中自主完成任务规划到结果验证的全流程。
跨模态任务处理：支持从视觉输入直接生成可执行代码，并自动调用API获取实时数据。

Qwen3.7-Plus - 阿里巴巴发布的多模态智能体模型

2. 视觉能力系统性突破

视觉推理性能跃升：在纯视觉推理评测BabyVision中得分达64.7分，较前代模型（37.4分）提升73%，超过Google Gemini 3.1-Pro。
真实场景理解强化：在ScreenSpot Pro（GUI操作）、AndroidWorld（移动端任务）等评测中表现突出，能精准解析复杂界面布局与功能逻辑。

3. 长程任务执行稳定性

超长时间自主运行：实测中基于该模型的Hybrid-Agent系统连续稳定工作11小时以上，完成英语单词学习APP的完整开发闭环。
高复杂度任务覆盖：累计生成超10000行代码，触发超1000次工具调用，涵盖需求文档、编码、部署、测试及迭代全流程。

Qwen3.7-Plus核心优势

1. 任务闭环能力领先

从“理解”到“执行”的质变：传统多模态模型仅能识别图像内容，而Qwen3.7-Plus可直接操作软件界面、生成可运行代码并自我验证，例如完整复刻macOS Stocks应用的暗色主题、分栏布局与实时行情交互。
全流程自动化：在浏览器Agent场景中，能自主完成ECS云服务器采购、配置与运维链路闭环，无需人工干预。

2. 文本与视觉能力均衡

纯文本能力接近旗舰模型：在编程、数学推理、指令遵循等任务中，性能接近Qwen3.7-Max水平。
多模态任务专项优化：在搜索增强视觉问答、视觉驱动的网页设计等场景中，性能较前代提升最高达2倍。

3. 企业级实用性保障

低成本推理架构：基于万亿参数稀疏混合专家（MoE）架构，通过“稀疏激活”机制控制推理成本，输入价格参考同系列模型约2元/百万词元。
上下文缓存优化：阿里云百炼平台的缓存技术可使高频调用成本降至普通输入的1/10，适合长程任务场景。

Qwen3.7-Plus技术原理

1. 多模态智能体底座设计

统一感知-行动框架：将视觉理解模块与代码生成、工具调用系统深度耦合，避免传统方案中多模型切换导致的逻辑断层。
动态任务规划引擎：通过强化学习优化长程任务分解策略，自主判断何时调用搜索工具、何时生成代码，确保任务连贯性。

2. 万亿参数MoE架构

稀疏激活机制：总参数量超1万亿，但单次推理仅激活部分专家模块，在保证性能的同时降低算力消耗。
36万亿tokens预训练：覆盖海量图文对、界面交互日志等数据，强化对GUI元素与操作逻辑的建模能力。

3. 智能体专属优化技术

上下文缓存系统：消除多轮对话中的重复计算开销，显著降低长任务链路的推理成本。
安全沙箱机制：通过权限约束确保Agent在预设边界内自主运行，避免越权操作风险。

Qwen3.7-Plus应用场景

1. 软件开发自动化

GUI复刻与代码生成：输入任意应用界面截图，自动生成可编译的前端代码，并接入真实数据API。
全流程APP开发：从需求文档到测试部署，11小时内独立完成英语学习类APP，覆盖需求分析、编码、测试用例创建等环节。

2. 办公与运维提效

自动化测试：自主执行GUI功能验证，识别界面元素并模拟用户操作。
云资源管理：在浏览器中自动完成ECS服务器采购、配置与监控，实现运维任务端到端闭环。

3. 创意与生产力工具

视觉驱动编程：将地铁线路图等复杂图像转为可交互的SVG矢量代码，或根据草图生成网页原型。
多模态问答增强：结合搜索工具解析模糊机械图纸，精准输出设备参数与功能说明，解决开放性问题。

Qwen3.7-Plus项目地址

项目官网：https://qwen.ai/blog?id=qwen3.7-plus

AI最新项目 # 大模型

© 版权声明

文章版权归作者所有，未经允许请勿转载。

为这篇文章评分

0.0/ 10

0 人评价

点击⭐️进行评分

相关文章

Leanstral 1.5 – Mistral AI推出的形式化验证与数学证明领域模型

Leanstral 1.5 – Mistral AI推出的形式化验证与数学证明领域模型

AI最新项目 # 大模型

1周前

0460

Tempolor v4.7 – 趣丸科技发布的天谱乐大模型最新版本

新Tempolor v4.7 – 趣丸科技发布的天谱乐大模型最新版本

AI最新项目 # 大模型

1天前

0160

HTML Anything – 开源的本地化HTML编辑器工作台

HTML Anything – 开源的本地化HTML编辑器工作台

3周前

0600

Boogu-Image-0.1 – 开源统一图像生成与编辑模型

Boogu-Image-0.1 – 开源统一图像生成与编辑模型

4周前

0830

暂无评论

none

暂无评论...