AI 日报|OpenAI 3 款实时语音模型上线,商汤 SenseNova 6.7 落地,终端国标统一行业标准

XNEWTHINGS
2026年05月08日 20:05
  • 分享
  • 收藏
  • 点赞

一、顶级大事・Big Things


三部门联合发布 AI 终端智能化分级国家标准(GB/Z 177—2026)

概要:工信部、国家市场监督管理总局、商务部联合发布 AI 终端分级国标,采用 “2+N” 架构,明确 L1-L4 四级智能等级划分,覆盖手机、家电、汽车座舱等 7 大类终端产品,终结 “伪智能” 乱象,统一行业研发与消费认知标尺。


OpenAI 计划 2026 年前投入 500 亿美元强化 AI 算力基础设施

概要:OpenAI 总裁披露,预计 2026 年投入约 500 亿美元算力资金,支撑 GPT 系列模型训练与推理需求,为 ChatGPT、企业 API 及多模态迭代提供算力保障,将进一步加剧全球 AI 算力军备竞赛。


SpaceX 提交 550 亿美元芯片工厂建设计划,拟建 Terafab 半导体制造设施

概要:SpaceX 与特斯拉合资推进 AI 芯片工厂项目,首期投资超 550 亿美元(远期总投资可达 1190 亿),采用英特尔 14A 制程(部分目标 2 纳米工艺),聚焦自动驾驶、人形机器人、星链卫星定制芯片研发,加速 AI 硬件自研进程。


二、新模型・技术发布


国内・Local


商汤科技发布 SenseNova 6.7 Flash-Lite 轻量化多模态智能体

概要:商汤推出原生多模态架构模型,摒弃 “视觉→文本” 中间层,可直接理解网页布局、文档结构与财务图表,Token 消耗降低 60%,支持毫秒级响应;同步上线免费 Token 计划与开源办公技能库,落地数据分析、PPT 生成等全流程办公场景。


宇树科技 UniStore 平台正式开放,全球首个人形机器人应用商店上线

概要:宇树发布全球首个机器人动作应用商店 UniStore,支持开发者以类移动 App 方式创建、上传动作序列,用户可一键拓展机器人在家庭、工业、科研等场景的能力,加速具身智能商业化落地。


美团 AI 社区 “觅游” 启动公测,聚焦 AI 智能体身份化与共生成长

概要:美团推出全球首个支持 AI 独立身份的数字生命社区,用户可培育、协作并见证 AI 智能体(昵称 “虾”)在任务执行、技能习得与社交互动中的进化,目前已接入超 3000 个 Agent、4 万 + 技能及万级 AI 生成内容。




海外・Overseas


OpenAI 发布 3 款实时语音模型,开启 “感知 - 推理 - 执行” 新范式

概要:OpenAI 上线 GPT-Realtime-2(GPT-5 级推理能力,支持工具调用与自然对话)、GPT-Realtime-Translate(支持 70 + 输入语言转 13 种输出语言)、GPT-Realtime-Whisper(低延迟流式语音转写),三者均集成于 Realtime API,面向全球开发者开放。


OpenAI 发布 GPT-5.5-Cyber 预览版,面向认证安全团队的网络安全专用模型

概要:OpenAI 推出 GPT-5.5 的安全垂直定制版,仅向经严格审核的网络安全团队限量开放,通过定向训练强化漏洞识别、补丁验证与恶意软件分析效率,聚焦关键基础设施防护,不增强攻击能力。


Anthropic 发布 NLA 技术,首次实现大模型 “读心术”

概要:Anthropic 推出 Natural Language Autoencoders(NLA)技术,首次将 Claude 内部激活值实时转换为自然语言,揭示模型真实认知策略(如规避诱导的防御机制),突破 AI 可解释性技术瓶颈。


xAI 发布 Grok Imagine 质量模式 API,强化图像写实与文字渲染能力

概要:xAI 推出 Grok Imagine 质量模式 API,在图像写实度、多语言文字渲染精度及创意控制能力上实现突破,大幅削弱 “AI 感”,支持企业级产品可视化、营销素材生成及视频资产扩展场景。


Google 升级 AI 搜索 “观点预览” 模块,整合 Reddit 等一手用户经验

概要:谷歌 AI 搜索新增 “观点预览” 功能,将 Reddit、独立论坛及 WordPress 博客的用户讨论片段直接嵌入 AI 生成摘要,标注发帖人 ID 与来源社区,填补权威信息与真实体验的鸿沟,呼应年轻用户搜索趋势。


Google 终止 Project Mariner 项目,跨网页自动化能力并入 Gemini Agent

概要:Google 停止实验性网页自动化项目 Project Mariner,其核心跨网页多步骤任务处理技术已整合至 Gemini Agent 与 AI Mode,并体现在 Chrome 新功能 “auto-browse” 中,优化用户网页交互体验。


OpenAI 上线官方 CLI 工具 openai-cli,简化模型调用流程

概要:OpenAI 开源命令行工具 openai-cli,支持通过单行命令直接调用 Responses API 及托管 Agent 工具(如网页搜索、文件检索),无需编写 SDK 代码,显著提升本地开发与自动化脚本部署效率。


TikTok 终止 AI 视频摘要功能 “AI 概览” 测试,聚焦垂类可控 AI

概要:TikTok 停止 AI 视频文字摘要功能测试,因系统频繁出现严重事实性幻觉(如错误关联创作者身份、误标无关实体),转而聚焦垂直场景下的可控 AI 能力研发。


三、融资・IPO 动态


阶跃星辰完成近 25 亿美元融资,红筹架构拆除启动港股 IPO

概要:国产大模型企业阶跃星辰完成近 25 亿美元新一轮融资,华勤技术、中兴通讯等产业链头部企业参与,已完成红筹架构拆除与股份制改造,加速推进港股 IPO 进程;其 Step 系列模型已适配 OPPO、荣耀、吉利等终端厂商。


途见科技完成超亿元 Pre-A 系列融资,柔性触觉手套量产落地

概要:途见科技获超亿元 Pre-A 轮融资,投资方含联想之星、华控基金等,已建成自动化产线,低成本柔性触觉手套即将量产,解决具身智能 “有眼无肤” 痛点,应用于 3C 制造、医疗康复、人形机器人等场景。


Google DeepMind 战略入股 Fenris Creations,以《EVE Online》为 AGI 沙箱

概要:Google DeepMind 收购冰岛游戏公司 CCP Games(现更名为 Fenris Creations)少数股权,将《EVE Online》作为 AGI 实验平台,在本地隔离服务器运行定制版游戏,聚焦 AI 长期规划、记忆建模与持续学习能力验证。


四、商业化・监管动态


Google 完成健康生态整合:Fitbit 更名 Google Health,AI 教练计划于 5 月 19 日上线

概要:Fitbit 应用正式更名为 Google Health,同步推出基于 Gemini 大模型的 AI 健康教练服务,覆盖运动、睡眠、营养、心理健康及美国医疗记录数据,订阅 9.99 美元 / 月或 99 美元 / 年;硬件端发布无屏健康追踪器 Fitbit Air。


Anthropic 收紧 Claude 桌面端接入,强制第三方模型 ID 白名单

概要:Anthropic 更新 Claude Desktop 至 1.6259.1 版本,封禁第三方大模型 API 直连,仅允许以 “claude/anthropic” 开头的模型调用,引导用户使用官方 API 与订阅服务,强化生态闭环与内容审核管控。


OpenAI 上线 “可信联系人” 功能,推出 AI 辅助心理危机预警

概要:OpenAI 面向成年用户上线 “可信联系人” 功能,系统通过多模态行为分析识别用户心理健康风险时,将自动向紧急联系人发送加密警报,提供早期数字支持,该功能不替代专业医疗干预。


小红书完成组织架构升级,设立 AI 与海外新部门

概要:小红书整合社区、电商、商业化三大核心业务,设立 AI 一级部门 Dots、企业智能部、海外业务部 Rednote 及创新实验室 Lab 1327,加速 AI 技术落地与全球化布局,为 IPO 夯实基础。


Anthropic Claude 深度集成 Microsoft 365,实现跨应用 AI 协同办公

概要:Claude 全面集成 Excel、Word、PowerPoint 及 Outlook 等 Microsoft 365 应用,支持跨应用上下文共享,如撰写报告时实时调用 Excel 数据、自动生成 PPT 图表,实现 Office 端到端 AI 原生工作流。


亚马逊 Alexa + 生成式 AI 助手上线德国,启动 Early Access 测试

概要:亚马逊新一代生成式 AI 助手 Alexa + 登陆德国市场,支持跨设备连续对话、上下文同步,并集成 OpenTable、Spotify、博世西门子家电等本地化服务,非 Prime 会员需付费订阅。


微软发布 AI 扩散报告:全球生成式 AI 使用率升至 17.8%

概要:微软 AI 经济研究院报告显示,全球 15-64 岁劳动力生成式 AI 使用率达 17.8%,发达国家与发展中国家使用率差距扩大至 13.1 个百分点,数字鸿沟已成为 AI 时代核心治理议题。


五、终端・生态进展


Google 发布 Chrome 148 正式版,上线 AI 智能问答与证件自动填充

概要:Chrome 148 正式版强化 AI 集成能力,用户可直接在地址栏提问并获网页信息聚合回答,授权后 AI 可自动填充护照、驾照等政府证件信息;Android 端新增 AI 驱动表单理解能力,ChromeOS 启用垂直标签栏。


苹果带摄像头 AI 版 AirPods 进入 DVT 阶段,预计秋季随新 Siri 发布

概要:苹果内置摄像头的 AirPods 进入设计验证测试(DVT)阶段,左右耳配备低分辨率摄像头,为增强 Siri 视觉交互能力(如食材识别、智能导航),外观接近 AirPods Pro 3,或因 Siri 升级延迟推迟发布。


Perplexity 发布 Mac 版 Personal Computer 本地 AI 智能体

概要:Perplexity 推出 Mac 端 AI 应用 “Personal Computer”,可安全访问本地文件系统、原生应用(如 Mail、iMessage)及 400 + 功能接口,以 “AI 项目经理” 模式自主执行复杂工作流,目前仅向 Max 订阅用户开放,月费 200 美元。


总结

  • 国内:AI 终端国标正式落地统一行业规范,商汤、字节迭代轻量化多模态模型,医疗大模型、人形机器人加速临床与产业落地,主打标准化 + 行业垂类深耕。
  • 海外:OpenAI 密集发布语音、安全专用模型,Anthropic 攻坚可解释性与金融 AI,SpaceX、谷歌加码千亿级算力基建与 AGI 底层探索,领跑基础模型 + 超算自研。
  • 资本市场:大模型、具身智能、AI 硬件持续大额融资,算力基建、终端生态、垂直行业应用成为资本重仓主线。
  • 业内共识:全模态融合、端侧本地推理、AI 智能体规模化、自建算力集群,已是全行业标配必做方向。
  • 差异化:国内重政策合规、产业落地、终端统一标准;海外重底层技术原创、前沿理论突破、超级算力自建。

启示:AI 告别单一模型比拼,进入算力基建 + 硬件终端 + 政策合规 + 行业场景全链条竞争时代,端侧智能与垂直行业落地,将是下一阶段核心红利赛道。

参考资料


  • 分享
  • 收藏
  • 点赞
体验新鲜事儿

上海阿慕比文化科技有限公司

沪ICP备 2021006543号-3