千问最新版本核心能力测评:五大升级亮点全解析
通义千问系列模型近期密集迭代,其演进路径清晰地指向几个关键维度:核心模型的编程与智能体能力持续突破,本地化部署方案不断优化,同时在办公、硬件及教育场景实现了更深度的整合。这一系列更新正推动AI从辅助对话的工具,向更高效、更自主的生产力伙伴转型。
一、千问3.6-Plus:编程与智能体能力跃升
该版本的核心突破在于工程化落地能力。模型不再局限于生成孤立的代码片段,而是能够自主拆解复杂开发需求、规划执行路径,并最终交付可用的成果。这种从任务理解到闭环交付的能力提升,已在多项权威基准测试中得到验证。
具体而言,在SWE-bench、Claw-Eval等评估真实代码修复与任务完成度的测试中,其表现已逼近顶尖水平。这意味着无论是前端页面开发,还是涉及多模块协作的复杂仓库级任务,模型都能尝试理解上下文、分解步骤、编写并调试代码,实现端到端的开发辅助。
得益于原生多模态架构,模型现已具备“视觉理解”能力,可直接解析界面截图或设计稿,并生成对应的前端代码。同时,其对OpenClaw、Qwen Code等主流智能体框架的兼容性与稳定性显著增强,在开放环境下的长程任务规划与执行可靠性得到提升。
二、千问3.6-27B:本地部署与智能体编程强化
针对开发者对数据隐私与低延迟的刚性需求,最新开源的Qwen3.6-27B模型进行了专项优化。该模型在保持紧凑参数规模的同时,实现了以往需更大模型才能支撑的智能体编程性能,有效降低了本地部署的门槛。
该版本支持百万级上下文长度,使其能在本地环境中处理超长代码库或技术文档。开发者可借助其执行终端命令、分析仓库结构、生成测试用例等复杂操作。更重要的是,它能无缝集成至Qwen Code等第三方编程助手生态,让强大的开发辅助能力脱离云端依赖,在本地实现全流程、低延迟的流畅运行。
三、Table Agent:重塑Excel工作流
表格处理是办公场景中的高频痛点。千问推出的“Table Agent”功能,旨在彻底重构这一流程,实现从自然语言指令到标准Excel文件的端到端自动化生成。
例如,输入指令“整理一份最新的增值税优惠政策成Excel”,Agent即可自动联网检索信息、进行数据去重与验证、调整格式规范,最终生成可直接下载的.xlsx文件。会议场景下,一句“把刚才讨论的内容整理成表格”,便能自动提取时间节点、责任人、任务项及截止日期等结构化信息。
其兼容性广泛,支持从PDF、Word、PPT乃至手写照片中识别并提取表格数据,转化为结构化Excel。对于现有Excel文件,用户可直接使用自然语言进行编辑,如“将第三列所有数值乘以1.12并保留两位小数”,修改指令可被精准执行。
四、千问AI眼镜S1:从被动响应到主动服务
AI硬件正经历范式转变。千问AI眼镜S1的最新升级,标志着设备从等待指令的“被动响应”模式,转向结合多维度场景信号的“主动服务”模式,并引入了前沿的空间3D显示技术。
眼镜现在能综合时间、地理位置、天气状况及佩戴状态等多重信号,主动推送情境化信息,如通勤提醒、久坐健康提示或会议日程通知。其采用的双光机与双目立体成像技术,使信息能以具有自然纵深和距离感的方式呈现,视觉体验更为沉浸。
在功能层面,打车、即时购物、行程规划、购票等生活服务已陆续集成。其设计目标是提供全天候的连续服务体验,覆盖运动轨迹记录、个性化歌单播放、出差证件提醒等日常场景,深度融入用户生活动线。
五、千问APP:聚焦教育全场景的深度升级
借开学季之机,千问APP的学习功能进行了全面升级,重点攻克新课入门、解题思路引导与作业批改三大核心痛点。
新上线的“小讲堂”功能如同一位AI家教,覆盖小学语文、数学教材,能以互动形式讲解童话、寓言及名著。“拍题答疑”功能则强调思维过程而非直接给出答案,通过语音讲解、图示分析与步骤拆解,引导学生理解题目背后的逻辑链。
针对负担较重的作业批改环节,现支持整页作业乃至试卷的自动批改,覆盖小初高全学科。批改后,系统自动将错题归集至电子错题本,并提供“错题重练”与“举一反三”的针对性练习。用户更可将错题本一键生成可打印的练习册文件,极大节省了手动整理的时间成本。
