~/ai-stream
~/industry/meta-superintelligence-labs-ships-its-first-model-20260409
The Rundown AI·行业热门

Meta 超级智能实验室发布首款模型,HeyGen 解决 AI 身份漂移

content

Meta Muse Spark

🚀Meta 超级智能实验室发布首款模型 Muse Spark

Meta 超级智能实验室正式发布 Muse Spark,这是一款多模态推理模型,标志着 Alexandr Wang 去年夏天组建的明星部门的首个重要成果。

  • Muse Spark 支持语音、文本和图像输入,拥有思考模式,可在难题上让多个智能体相互对抗
  • 模型在推理基准测试上与 Opus 4.6 和 GPT 5.4 等前沿模型竞争,但在编程和 ARC-AGI 2 等测试中落后
  • Muse Spark 在健康推理方面表现尤为出色,这是 Meta"个人超级智能"使命的重要组成部分
  • 与 Llama 家族不同,Muse Spark 是专有模型,Meta 表示希望未来开源,但尚未承诺时间表
  • Alexandr Wang 在 9 个月前接管 Meta 超级智能实验室,此前 Meta 以 143 亿美元收购 Scale AI,他表示团队"从零开始重建了 AI 技术栈"

划重点: Meta 重返赛场。虽然 Muse Spark 仍低于顶级模型,但这与 Llama 家族时代的 Meta 相比是重大转变。凭借海量资源、平台宝贵数据和数十亿用户,Meta 的 AI 努力正朝着正确方向迈进。

HeyGen Avatar V

🎭HeyGen Avatar V 解决 AI 身份漂移问题

HeyGen 发布 Avatar V,公司称之为"世界上最逼真的 AI 虚拟形象模型",声称可以消除身份漂移问题——即 AI 生成的人脸随时间推移不再像用户本人的倾向。

  • 该系统仅需 15 秒手机录像即可构建完整视频虚拟形象,捕捉用户真实面部细节、手势和动作模式
  • 模型首次将身份与外观分离,用户只需录制一次,即可更换服装和背景而无需重新拍摄
  • HeyGen 表示 Avatar V 在内部测试中准确性和唇同步方面超越 Google Veo 3.1,在盲测中也击败 Kling 和 Seedance

划重点: 就像图像和视频模型一样,AI 虚拟形象在过去几年取得了巨大进步,从简单的嘴部动作发展到模仿用户的微动作以实现难以区分的输出。虽然有人可能对"AI 分身"嗤之以鼻,但内容创作格局正在改变,无论他们是否接受。

📺用 ElevenLabs Flows 构建自动广告生成器

在本指南中,你将学习如何使用 ElevenLabs Flows 将产品照片转化为成品视频广告。这是一个新的工作流构建器,将图像、视频、语音和音乐整合在一个地方。

  • 打开 ElevenLabs,点击 ElevenCreative > Flows,然后点击 + New Flow,命名为[产品线]广告模板以便重复使用
  • 添加 Image Generation 节点并上传 1-3 张产品照片,用场景提示:"产品在白色基座上,工作室产品拍摄,柔和晨光,逼真产品照"
  • 添加 Video Generation 节点,从图像节点的输出拖一条线到视频节点的起始帧,提示:"缓慢的电影级推进镜头,柔和晨光穿过场景,浅景深"
  • 点击视频节点上的 Run > Run till here 一键生成图像和视频,然后更换图像/视频提示快速迭代创意

划重点: 对于音频,添加 Text-to-Speech 或 Music 节点,并将其与视频一起连接到 Mix Audio 节点。你也可以通过复制画布并更换新图像来尝试其他产品。

Anthropic Managed Agents

Anthropic 推出 Claude Managed Agents 简化智能体构建

Anthropic 开放 Claude Managed Agents 公测,这是一个新平台,让开发者可以在几天内将智能体想法变为上线产品——处理过去需要工程团队数月才能搭建好的所有后端基础设施。

  • 用户选择任务、工具和防护栏,Managed Agents 负责运行、安全和控制智能体系统的访问权限
  • 智能体可以独自工作数小时而不丢失状态,协调模式也在预览中,允许一个智能体将子任务分配给其他智能体
  • Notion、Rakuten、Asana 和 Sentry 是早期采用者,据报道 Rakuten 在大约一周内在五个部门部署了智能体
  • 每个智能体会话每小时收费 0.08 美元,外加常规 AI 使用费,用户按消费付费而非预付平台费

划重点: Anthropic 继续推出简化用户充分利用模型和工具复杂性的功能。Managed Agents 现在做了同样的事情,简化智能体构建流程,让任何人无需典型的后端头痛问题即可部署和控制智能体。