2025.08.21全球AI新闻速递

Deepseek 发布 Deepseek V3.1 更新，引入混合推理架构#

Deepseek 正式发布 Deepseek V3.1 模型，核心亮点在于其首创的混合推理架构，支持“思考”与“非思考”两种模式，用户可根据任务复杂度自由切换。新模型大幅提升了 Agent 能力，在工具使用、编程和搜索等智能体任务上表现更强，尤其在复杂任务中性能显著。“思考模式” (V3.1-Think) 相比旧版能用更少的计算量（token消耗减少20%-50%）达到同等甚至更优的性能。官方App、网页端及API已全面升级，API中 deepseek-reasoner 对应思考模式，deepseek-chat 对应非思考模式，上下文长度均扩展至128K。API价格将从2025年9月6日起调整，并取消夜间优惠，输入价格为0.5元/百万Token（命中缓存）或4元/百万Token（未命中缓存），输出价格为12元/百万Token。

Google 硬件发布会总结：AI全面融入系统与硬件#

Google 在近期硬件发布会上展示了其AI战略的全面落地。主要趋势包括：手机系统自带软件全面AI化，功能实用性大幅提升；除手机外，其他硬件产品也全部集成Gemini对话和沟通能力；重点发力AI健康教练和AI修图&拍摄指导两大场景。AI功能不再局限于主动触发，而是能在合适场景下自动弹出和给出建议，且多个系统APP之间的AI能力可以联动，信息相互流转。大量使用端侧模型，覆盖所有模态，实现AI照片修改、100倍数码变焦细节补充以及通话实时翻译和文本建议等功能。此外，Google还发布了AI耳机 Pixel Buds Pro 2，内置 Tensor A1 和 Gemini 芯片，支持在嘈杂环境中与 Gemini Live 通话，并能自动调节音量、开启降噪，甚至通过点头或摇头实现接听/拒接来电和短信回复。

手机Agent技术进展与挑战：以AutoGLM 2.0为例#

智能体技术方向取得了显著进展，智谱AI的朋友介绍 AutoGLM 2.0 推出了一种创新方案，通过为 iPhone 用户配备云安卓手机，实现了在 iOS 设备上操控安卓应用的通用智能体功能，支持抖音、小红书、美团等40余款高频应用，能处理点外卖、订机票等日常任务，甚至支持办公场景的调研、PPT制作等。然而，该技术仍处于早期实验阶段，存在诸多挑战：任务成功率低（约10%）、意图和界面理解不足、任务易意外终止、无法回退或重启APP、对弹窗处理能力弱、应用支持范围有限、无法完全自动化购买流程、隐私泄露风险、账号被识别为机器人以及云手机资源稀缺等问题，预计完美解决这些问题至少需要一年时间。

OpenAI 推出 agents.md 官方站点，统一Agent配置文件 - 宝玉