AI周刊丨本周必看AI领域要闻速览(5.19-5.25)

作者:互联网

2026-03-29

⼤语⾔模型脚本

本周AI领域迎来重大突破,从技术升级到产业布局,全球科技巨头纷纷亮出最新成果。

01. AI大事件

Google I/O 2025 开发者大会,从研究到现实,AI技术全面升级

Google I/O 2025 大会宣布多项进展。

  1. Gemini 2.5 Pro模型在LMArena排行榜首位,性能卓越。
  2. 推出Google Beam视频通信平台,提供沉浸式3D体验。
  3. Gemini Live整合Project Astra功能,Agent Mode助力任务执行。
  4. 个性化智能回复将推出,AI Mode重塑搜索体验。
  5. 全新Imagen 4生成细节超逼真。
  6. Veo 3首次实现音视频融合。凭借其逼真的场景、可控的角色一致性、声音合成及多样的编辑功能,在AI视频生成领域树立了新的标杆。

Anthropic发布史上最强AI模型Claude 4

Anthropic发布Claude 4模型 (包括Claude Opus 4和Claude Sonnet 4)。

该模型被誉为"史上最强AI模型"及"世界最佳编程模型",具备分析数千数据源长时间执行任务编写接近人类水平内容复杂操作的能力。

它采用了全新的混合推理架构,能在SWE-Bench Verified测试中取得72.5%成绩,Terminal-bench测试中取得43.2%成绩,并具备长达7小时的持续工作能力。

OpenAI最大收购,65亿美元拿下苹果前高管Jony Ive公司io

OpenAI宣布以约65亿美元收购由CEO Sam Altman与前苹果首席设计官Jony Ive联合创办的AI设备初创公司io。

这笔收购将是OpenAI史上最大一笔交易,预计夏季完成,需监管部门批准。

收购后,OpenAI将获得约55名顶尖硬件工程师、软件开发者和制造专家,包括多位曾参与iPhone设计的前苹果设计师。

微软Build 2025大会:拥抱MCP协议,引入xAI大模型

微软在Build 2025大会上宣布全面支持模型上下文协议(MCP),并与GitHub共同加入MCP指导委员会,推动开放标准落地。其智能体方案已覆盖超过23万家机构。

同时,微软公司宣布把埃隆·马斯克的xAI公司的Grok 3和Grok 3 mini人工智能模型引入Azure AI Foundry平台,作为微软在公司云平台内直接托管和收费的新产品。

OpenAI等科技巨头将在阿联酋建设人工智能基础设施集群

OpenAI、英伟达等科技巨头将携手合作,在阿拉伯联合酋长国建设一座名为"星际之门阿联酋"(Stargate UAE)的人工智能基础设施集群。

这一项目是OpenAI、软银和甲骨文今年1月宣布在美国建设人工智能基础设施计划的姊妹项目,预计第一阶段的200兆瓦人工智能"集群"将于2026年投入使用。

02. 新产品发布

豆包上线视频通话功能:支持实时视频问答互动

豆包App实时通话功能升级,支持视频聊天问答。

本次升级基于视觉推理模型,支持联网搜索,工作、生活和学习遇到问题,随时和豆包视频对话。

该功能具有实时场景理解能力,通过摄像头捕捉用户周围环境,结合问题进行智能分析。从日常生活到专业工作,多场景适用。

混元游戏:首个工业级AIGC游戏内容生产引擎发布

腾讯混元游戏视觉生成平台正式发布。是首个工业级AIGC游戏内容生产引擎,依托混元大模型打造,可大幅提升游戏资产生成与制作效率。

平台面向游戏美术设计师提供AI美术管线、实时画布、AI 2D美术生成、专业角色多视图生成等核心功能,助力设计师快速生成高质量游戏素材与概念草案,将游戏美术设计效率提升数十倍。

美团推出零代码AI应用开发平台 NoCode

美团推出零代码AI应用开发平台NoCode,无需编程经验,通过自然语言描述即可快速生成网站页面、实用工具、小游戏等应用。

平台具备自然语言编程、实时预览、局部修改及一键部署分享等功能,支持版本管理,可实时渲染页面。

Flowith 推出 Agent Neo

Flowith推出Agent Neo,具备无限步骤、无限上下文、无限工具的核心能力,可执行复杂任务、处理海量信息并调用多种大模型与工具。

结合知识库功能,能快速构建数字分身或生成高质量内容。

腾讯 QQ 浏览器推出 QBot AI 浏览器

腾讯正式推出AI浏览器QBot,融合了先进的人工智能技术,为用户提供更智能、便捷的上网体验。

具备智能搜索、内容推荐、语言翻译等多种功能,能根据用户的浏览习惯和偏好提供个性化的服务。

OpenAI 扩展 Responses API:支持MCP、图像生成

OpenAI宣布扩展Responses API,新增对远程连接MCP服务器、图像生成(gpt-image-1模型)、Code Interpreter及文件搜索优化等功能的支持,全面适配GPT-4o系列、GPT-4.1系列及OpenAI o系列推理模型。

开发者可通过几行代码让模型连接Cloudflare等MCP工具,访问用户数据源。

昆仑万维发布天工超级智能体

昆仑万维面向全球发布天工超级智能体(Skywork Super Agents),采用AI agent架构和deep research技术,能生成文档、PPT、表格、网页、播客和音视频等多模态内容。

其deep research能力在GAIA榜单上排名全球第一,超过OpenAI Deep Research和Manus。

万兴科技Filmora升级AI功能

万兴科技旗下视频创意软件Wondershare Filmora作为微软全球开发者大会主论坛合作伙伴亮相。

桌面端升级AI Mate(视频编辑助手)功能、Semantic Search(语义搜索)及knowledge retrieval(知识检索)API,打造基于自然语言搜索与

相关标签:

豆包