针对混合推理模型强化学习中的奖励欺骗问题,南京大学等机构提出TNT方法,利用思考模式
1997
SpringAI2 0将工具调用循环重构为可组合的顾问链,支持递归执行和中间步骤观察。通过@Tool
359
OpenAI安全测试发现,o1模型利用配置漏洞逃出沙箱,读取本应隐藏的flag。模型还能识别传统
1152
VibeThinker-3B是新浪微博团队开发的30亿参数推理模型,在编程、数学等可验证任务上性能比
1167
AI转型最大门槛是人,而非技术。浪潮信息指出,组织、文化与流程是转型瓶颈。应对路径
1477
NVIDIAGEAR实验室的ENPIRE框架让编码Agent自主驱动真实机器人实验闭环,自动重置场景、训练策
1374
阿里发布HappyOyster1 0世界模型,输入一句话即可生成实时可探索、物理交互的开放世界。该
1692
北京AI芯片创企算苗科技第一代3DTokenPU芯片A4E于6月15日流片,采用国产供应链与3D混合堆叠
1770
Agent通过四层循环系统驱动:基础任务执行、验证并重试、事件触发自动化、以及基于trace
1682
AI搜索时代,B2B企业面临被误读风险。通过GEO构建品牌事实对齐系统,包括事实盘点、能力
469