Deepseek 发布 Deepseek V3.1 更新,引入混合推理架构#
Deepseek 正式发布 Deepseek V3.1 模型,核心亮点在于其首创的混合推理架构,支持“思考”与“非思考”两种模式,用户可根据任务复杂度自由切换。新模型大幅提升了 Agent 能力,在工具使用、编程和搜索等智能体任务上表现更强,尤其在复杂任务中性能显著。“思考模式” (V3.1-Think) 相比旧版能用更少的计算量(token消耗减少20%-50%)达到同等甚至更优的性能。官方App、网页端及API已全面升级,API中 deepseek-reasoner
对应思考模式,deepseek-chat
对应非思考模式,上下文长度均扩展至128K。API价格将从2025年9月6日起调整,并取消夜间优惠,输入价格为0.5元/百万Token(命中缓存)或4元/百万Token(未命中缓存),输出价格为12元/百万Token。
Google 硬件发布会总结:AI全面融入系统与硬件#
Google 在近期硬件发布会上展示了其AI战略的全面落地。主要趋势包括:手机系统自带软件全面AI化,功能实用性大幅提升;除手机外,其他硬件产品也全部集成Gemini对话和沟通能力;重点发力AI健康教练和AI修图&拍摄指导两大场景。AI功能不再局限于主动触发,而是能在合适场景下自动弹出和给出建议,且多个系统APP之间的AI能力可以联动,信息相互流转。大量使用端侧模型,覆盖所有模态,实现AI照片修改、100倍数码变焦细节补充以及通话实时翻译和文本建议等功能。此外,Google还发布了AI耳机 Pixel Buds Pro 2,内置 Tensor A1 和 Gemini 芯片,支持在嘈杂环境中与 Gemini Live 通话,并能自动调节音量、开启降噪,甚至通过点头或摇头实现接听/拒接来电和短信回复。
手机Agent技术进展与挑战:以AutoGLM 2.0为例#
智能体技术方向取得了显著进展,智谱AI的朋友介绍 AutoGLM 2.0 推出了一种创新方案,通过为 iPhone 用户配备云安卓手机,实现了在 iOS 设备上操控安卓应用的通用智能体功能,支持抖音、小红书、美团等40余款高频应用,能处理点外卖、订机票等日常任务,甚至支持办公场景的调研、PPT制作等。然而,该技术仍处于早期实验阶段,存在诸多挑战:任务成功率低(约10%)、意图和界面理解不足、任务易意外终止、无法回退或重启APP、对弹窗处理能力弱、应用支持范围有限、无法完全自动化购买流程、隐私泄露风险、账号被识别为机器人以及云手机资源稀缺等问题,预计完美解决这些问题至少需要一年时间。