Skip to content

2025.05.31全球AI新闻速递

· 14 min

AI模型格局与成本效益#

英伟达CEO黄仁勋对中国开源大模型DeepSeek和通义千问给予高度评价,显示全球AI模型格局正变得更加多元和竞争激烈,尤其是在成本效益方面,这一趋势也被“互联网女王”玛丽・米克尔强调,她警示大型通用模型或面临性价比对手的挑战。

AI技术应用#

技术应用方面,AI正深入医疗健康(蚂蚁AI健康管家通过信通院评估)、游戏开发(世纪华通AI大赛)、搜索(Perplexity Labs新功能)及自动驾驶(小米引入前一汽CTO,华为ADS 4应用)。

机器人赛道与开源#

同时,机器人赛道迎来开源低成本玩家(Hugging Face)。

AI的社会影响与挑战#

而AI的社会影响也引发讨论,如AI心理治疗的局限性和AI艺术创作中的审查问题。整体来看,AI正加速落地,但也面临技术成熟度、商业模式、伦理及工程化等多重挑战。

小米辅助驾驶迎来大将#

小米辅助驾驶再迎大将,前一汽南京CTO陈光加入

36氪独家获悉,前一汽南京研究院CTO陈光已入职小米汽车,担任辅助驾驶感知负责人,向负责人叶航军汇报。陈光曾负责一汽红旗L4级无人Robotaxi的研发,在人工智能和计算机视觉领域经验丰富,曾在百度Apollo任职。此次加入旨在推动小米“端到端”辅助驾驶功能的落地。小米汽车正投入大量资源追赶辅助驾驶领先水平,团队规模已达1200人,并计划推出基于VLA模型的新一代方案,但量产工程化和公众信任仍是其面临的挑战。

AI赋能游戏产业与创业机遇#

看完「数龙杯」AI大赛的报名后台,我狂想创业

2025年作为AI落地关键年,AI技术正加速融入内容产业及各行各业。游戏行业尤其活跃,米哈游、腾讯、网易等公司在AI角色互动、数字代言人、开发工具方面取得进展,如世纪华通旗下盛趣游戏AI美术工具效率提升高达80%。快手“可灵”、生数科技“Vidu”等技术厂商也在视频生成领域突破。世纪华通主办的“数龙杯”AI大赛旨在发掘和支持AI游戏及应用项目,显示出AI应用创业和产业智能化转型的巨大潜力。

黄仁勋评价中国开源AI模型#

黄仁勋:中国的Deepseek和通义千问是开源模型中最好的

英伟达CEO黄仁勋在北京时间5月29日的财报电话会上表示,中国的DeepSeek和阿里通义千问(Qwen)是目前表现最好的开源AI模型,并在全球范围内获得了广泛关注。他指出,即使没有美国芯片,中国AI进程也不会中断,关键在于其是否会基于美国技术平台。DeepSeek等成本更低的国产模型兴起,挑战了此前大规模AI基建投资的合理性,但也因其推理需求推高了对英伟达芯片的需求。

Resemble AI开源语音克隆模型#

Resemble AI 开放其语音克隆模型 Chatterbox 的源代码

美国语音克隆平台Resemble AI在X上宣布开源其文本转语音及语音转换模型Chatterbox。在一项测试中,Chatterbox的语音样本获得更多听众的偏爱,显示其生成自然、高质量语音的能力。该模型声称是首个具备情感夸张控制的开源模型,可通过单一参数调整语音表达强度。今年2月,Resemble AI推出Rapid Voice Clone 2.0,仅需20秒音频即可创建高质量语音,并支持快速编辑和本地化。

Perplexity Labs推出新功能#

新Perplexity Labs功能将提示转化为报告、应用等

AI搜索引擎初创公司Perplexity AI为Pro订阅用户推出新功能“Labs”,能将用户提示转化为完整的项目输出,如报告、仪表板或网页应用。Labs建立在现有搜索和研究功能之上,通过网页浏览、代码执行和资产生成等工具,在约10分钟内从零开始创建结构化内容。该功能旨在扩展工作流程,提供更丰富的输出,用户可在“资产”和“应用”标签中管理生成内容。这标志着AI从信息检索向内容创作和项目生成的深化。

Hugging Face计划推出低成本开源机器人#

Hugging Face 计划以仅3000美元的价格推出人形开源机器人

以AI平台闻名的Hugging Face宣布计划推出两款开源机器人,其中人形机器人HopeJR售价约为3000美元,远低于市场同类产品。HopeJR与法国公司The Robot Studio合作设计,具备66个自由度,能行走和操作物体,将是开源的。Hugging Face CEO强调开源和亲民价格,旨在避免机器人技术被少数大公司垄断。另一款桌面型机器人Reachy Mini售价约250-300美元,用于AI应用测试。

蚂蚁AI健康管家通过信通院评估#

蚂蚁AI健康管家率先通过信通院可信评估

中国信息通信研究院公布医疗健康行业大模型标准体系最新进展,蚂蚁集团旗下的“AI健康管家”成为首个通过该可信选型评估的AI产品。蚂蚁AI健康管家基于医疗大模型,提供找医生、测健康、读报告等服务,已服务4000万用户,并吸引多位名医AI智能体入驻,标志着AI在医疗健康领域的应用得到官方认可和推广。

玛丽·米克尔警示OpenAI#

“互联网女王”玛丽・米克尔示警 OpenAI:可能被性价比更高的对手超越

知名投资人玛丽・米克尔在其最新科技趋势报告中警告,OpenAI等美国生成式AI公司可能面临来自成本更低的对手的挑战。她认为,大型通用模型的训练成本日益高昂,而DeepSeek等价格低廉、用途定制的小型或本地模型正冲击现有商业模式。她指出,通用大模型盈利模式趋向“商品生意”,而训练成本飙升导致多数公司难以为继。她认为OpenAI估值相对其收入偏高,并建议在当前乐观阶段投资需谨慎。

Kubernetes原生AI推理框架llm-d#

Kubernetes Native llm-d 可能成为企业AI推理的‘转折点’

Red Hat AI推出Kubernetes原生的分布式推理框架“llm-d”,旨在解决大型AI模型在生产环境中部署和推理的挑战。该框架基于vLLM并增强其能力,突破单服务器限制,实现AI推理的规模化。llm-d由Google Cloud、IBM等合作开发,通过“预填充与解码分离”和KV缓存卸载等技术优化多GPU环境下的模型服务,在NVIDIA H100集群中测试显示,首次token时间降低3倍,QPS提升50-100%。这被认为是企业AI推理扩展的关键一步。

AI心理治疗的局限性#

寻求AI机器人进行心理治疗?再想想

随着孤独感和心理健康问题日益突出,AI聊天机器人被视为一种潜在辅助工具。然而,研究和专家观点都显示,虽然AI能提供即时陪伴和支持,但它无法替代人类治疗师。AI缺乏人际互动、共情、直觉分析和经验积累,存在误导、误诊或在危机时反应不当的风险。OpenAI和MIT的研究警告AI情感互动可能损害用户长期福祉。尽管AI能填补训练有素治疗师不足的缺口,尤其是在可及性和成本方面,但专家强调AI在心理治疗中的作用有限,应谨慎使用或结合人类监督。

Google DeepMind推出手语AI#

Google DeepMind 宣布推出 SignGemma:用于手语的 AI

Google DeepMind宣布推出SignGemma,这是其迄今最强大的手语翻译成口语文本模型。作为开源模型,SignGemma将于今年晚些时候加入Gemma模型家族,主要针对美国手语(ASL)和英语进行训练和优化。这一模型有望显著提高手语使用者在日常生活中各个方面的可及性和参与度,是包容性AI发展的重要一步。

Gmail应用自动生成AI摘要#

Gmail应用将自动生成AI摘要,无论你是否需要

谷歌宣布将在Gmail的Android和iOS应用中自动为符合条件的较长邮件或多回复线程生成并显示AI摘要。此前此功能需用户点击触发。此变化将首先面向付费Workspace账户和Google AI Premium订阅用户推出。自动摘要由Gemini生成,以要点列表形式显示在邮件顶部。用户可在设置中禁用“智能功能”以避免自动摘要,但这也会同时关闭其他智能功能。此举表明谷歌正积极推动AI功能成为其核心产品的默认体验。

AI艺术创作与审查#

AI时代的创意自由:当审查阻碍艺术时

文章探讨了AI艺术生成器中平台审查,特别是NSFW内容限制对创意自由的影响。作者认为,艺术表达常涉及身体、欲望等元素,而许多主流AI平台出于法律、政策和算法偏差等原因对这些内容进行一刀切式限制,这不仅限制了艺术家的创作,还可能边缘化特定群体。算法缺乏细致理解,常误判艺术意图。尽管需要必要审核以防有害内容,但过度审查扼杀了诚实表达。部分无NSFW限制的AI工具开始出现,它们在开放性和道德使用间寻求平衡,强调用户责任。作者呼吁平台采取更细致、人性化的审核方式。

宇树科技新款机器人预告#

宇树科技新海报:新机器人即将亮相,有26关节自由度

宇树科技发布海报预告一款即将亮相的新机器人,海报显示该机器人拥有“26 joint DOF(关节活动度)”。虽然官方未明确说明,有网友猜测这可能是一款家庭服务机器人,但具体型号和功能仍需等待官方后续公布。宇树科技此前以四足机器人闻名,此次涉足多关节机器人引发关注。