Skip to content

2025.06.11全球AI新闻速递

· 3 min

科技新闻摘要#

Hugging Face专家合著O’Reilly新书,聚焦视觉语言模型(VLM)#

Hugging Face的Merve Noyann及合著者正与O’Reilly出版社合作编写一本关于视觉语言模型的新书。书中将深入探讨VLM的不同用例,并提供视觉与文本深度学习、Transformer模型、多模态CLIP革命及Hugging Face生态系统的直观理解。

AI大模型高考数学测评结果出炉,整体进步显著#

由「机器之心」组织的高考数学AI测评显示,AI大模型在解答高考数学试卷上的能力取得显著进步。其中,Gemini 2.5 Pro以145分位居第一,豆包DeepSeek以144分并列第二。

AI在复杂软件开发中的局限性:需专业人士辅助#

关于AI在软件开发中“完成度”的讨论,有观点指出,仅靠AI在复杂系统开发中,特别是在保证功能正确性和可运行性方面,仍存在显著限制,必须依赖专业人士的辅助。

Gary Marcus对AI行业评论的反驳与个人预测记录#

知名AI研究者Gary Marcus反驳了记者Kevin Roose的不实描述,回顾了自己长期以来对神经网络局限性的准确预测,包括GPT-5无法按期推出的预测,并指责Roose缺乏客观性。

Figma与Replit Agent集成,提升AI开发能力#

Figma与Replit Agent的集成被认为是AI代理能力的重要升级,将可能在设计、原型开发或相关工作流中提供更无缝、高效的AI辅助设计与编码体验。

AI未来格局:多模型共存的必然性#

业内专家Sarah Guo认为,随着人工智能的重要性提升,世界格局将走向“多模型”局面,这种趋势有助于多样化应用场景和促进创新竞争。

Gemini在PDF翻译方面优于GPT,意译需校验#

在翻译可公开检索到的PDF文件方面,Gemini表现优于GPT。尽管翻译结果更自然流畅,但仍需注意人工校验确保准确性。