
🤖微软发布自研 AI 模型
微软推出 MAI-Voice-1 和 MAI-1-preview,标志着其首批完全自研 AI 模型,此前多年依赖 OpenAI 的技术和动荡的合作关系。
- —MAI-Voice-1 是语音生成模型,能够在不到一秒内生成一分钟语音,已集成到 Copilot Daily 和 Podcasts
- —MAI-1-preview 是基于文本的模型,使用比竞争对手少得多的 GPU 训练,专门从事指令遵循和日常查询
- —CEO Mustafa Suleyman 表示 MAI-1"与世界上一些最好的模型不相上下",尽管基准测试尚未公开发布
- —文本模型目前正在 LM Arena 上通过 API 进行测试,微软表示将在未来几周内在"某些文本用例"中推出
为什么重要: 微软转向构建自研模型为其与 OpenAI 的合作关系引入了新的动态,也使其能够更好地控制自己的 AI 命运。虽然我们等待基准测试和更多真实世界测试以获得更好的理解,但这家科技巨头看起来准备好开辟自己的道路,而不是被视为 OpenAI 的配角。

🗣️ OpenAI 推出 gpt-realtime 用于语音代理
OpenAI 将 Realtime API 移出测试版,同时推出新的 gpt-realtime 语音转语音模型和新的开发者工具,如图像输入和模型上下文协议服务器集成。
- —gpt-realtime 具有细微的能力,如检测非语言线索和在保持自然流畅对话的同时切换语言
- —该模型在音频推理基准测试中达到 82.8% 的准确率,比其前身的 65.6% 分数大幅提升
- —OpenAI 还添加了 MCP 支持,允许语音代理连接外部数据源和工具,无需自定义集成
- —gpt-realtime 还可以处理图像输入,如照片或截图,使语音代理能够 alongside 对话对视觉进行推理
为什么重要: 语音代理的主流采用感觉是不可避免的,OpenAI 升级的类人对话能力和 MCP、图像理解等集成,为企业和开发者带来了更多功能,可直接插入客户支持渠道或自定义语音应用。

✉️ 创建 AI 代理处理邮件支持
本教程介绍如何构建一个 AI 代理,自动分类传入邮件,在 Slack 中标记团队成员,并起草专业回复,将你压倒性的收件箱转变为有组织的工作流。
- —前往 Zapier Agents,点击"New Agent",命名为"Email Triage Assistant",设置为每天上午 9 点运行(批处理节省 Zapier 调用)
- —点击 Copilot 并粘贴:"Every day at 9 AM PST, retrieve all emails from the last 24 hours. Classify as: Spam, Auto-replies, PR/Marketing, Customer Support, Feedback, or General Inquiry"
- —添加针对团队成员定制的标记规则,引导到特定部门或职责
- —点击"Add tools"并连接 Gmail、Slack 和你的 FAQ URL —— 授予自主操作的完全权限
- —用你当前的收件箱测试,验证分类准确性,然后启用每日计划
为什么重要: 在指令中向你的代理提供 FAQ URL、Notion 文档和之前的支持线程。你提供的上下文越多,它处理边缘情况的能力就越好,并确切知道该让谁参与。

🌍Cohere 推出 SOTA 企业翻译模型
Cohere 推出 Command AI Translate,这是一个新的企业模型,声称在关键翻译基准测试中得分最高,同时允许深度定制和安全的私有部署选项。
- —Command A Translate 在 23 种主要商业语言的关键基准测试中表现优于 GPT-5、DeepSeek-V3 和 Google Translate 等竞争对手
- —该模型还具有可选的"Deep Translation"代理工作流,可复查复杂和高风险内容,提升性能
- —Cohere 提供行业特定术语的定制,让制药公司教授其药物名称或银行添加其金融术语
- —公司还可以将其安装在自己的服务器上,保持合同、医疗记录和机密邮件完全离线安全
为什么重要: 安全一直是希望利用 AI 工具的公司的最大问题之一,全球企业面临将敏感文档上传到云端或支付耗时人工翻译的选择。Cohere 的模型为企业提供可定制的内部翻译,没有数据隐私风险。