cat:大模型 AI 应用研究前沿行业动态开发工具 AI 安全

~/industry/microsofts-homegrown-ai-debut-20250829

The Rundown AI·行业热门2026年3月16日

微软发布自研 AI 模型 MAI，OpenAI 推出 gpt-realtime 语音代理

content

微软MAI模型

🤖微软发布自研 AI 模型

微软推出 MAI-Voice-1 和 MAI-1-preview，标志着其首批完全自研 AI 模型，此前多年依赖 OpenAI 的技术和动荡的合作关系。

—MAI-Voice-1 是语音生成模型，能够在不到一秒内生成一分钟语音，已集成到 Copilot Daily 和 Podcasts
—MAI-1-preview 是基于文本的模型，使用比竞争对手少得多的 GPU 训练，专门从事指令遵循和日常查询
—CEO Mustafa Suleyman 表示 MAI-1"与世界上一些最好的模型不相上下"，尽管基准测试尚未公开发布
—文本模型目前正在 LM Arena 上通过 API 进行测试，微软表示将在未来几周内在"某些文本用例"中推出

为什么重要： 微软转向构建自研模型为其与 OpenAI 的合作关系引入了新的动态，也使其能够更好地控制自己的 AI 命运。虽然我们等待基准测试和更多真实世界测试以获得更好的理解，但这家科技巨头看起来准备好开辟自己的道路，而不是被视为 OpenAI 的配角。

OpenAI实时API

🗣️ OpenAI 推出 gpt-realtime 用于语音代理

OpenAI 将 Realtime API 移出测试版，同时推出新的 gpt-realtime 语音转语音模型和新的开发者工具，如图像输入和模型上下文协议服务器集成。

—gpt-realtime 具有细微的能力，如检测非语言线索和在保持自然流畅对话的同时切换语言
—该模型在音频推理基准测试中达到 82.8% 的准确率，比其前身的 65.6% 分数大幅提升
—OpenAI 还添加了 MCP 支持，允许语音代理连接外部数据源和工具，无需自定义集成
—gpt-realtime 还可以处理图像输入，如照片或截图，使语音代理能够 alongside 对话对视觉进行推理

为什么重要： 语音代理的主流采用感觉是不可避免的，OpenAI 升级的类人对话能力和 MCP、图像理解等集成，为企业和开发者带来了更多功能，可直接插入客户支持渠道或自定义语音应用。

AI邮件代理

✉️ 创建 AI 代理处理邮件支持

本教程介绍如何构建一个 AI 代理，自动分类传入邮件，在 Slack 中标记团队成员，并起草专业回复，将你压倒性的收件箱转变为有组织的工作流。

—前往 Zapier Agents，点击"New Agent"，命名为"Email Triage Assistant"，设置为每天上午 9 点运行（批处理节省 Zapier 调用）
—点击 Copilot 并粘贴："Every day at 9 AM PST, retrieve all emails from the last 24 hours. Classify as: Spam, Auto-replies, PR/Marketing, Customer Support, Feedback, or General Inquiry"
—添加针对团队成员定制的标记规则，引导到特定部门或职责
—点击"Add tools"并连接 Gmail、Slack 和你的 FAQ URL —— 授予自主操作的完全权限
—用你当前的收件箱测试，验证分类准确性，然后启用每日计划

为什么重要： 在指令中向你的代理提供 FAQ URL、Notion 文档和之前的支持线程。你提供的上下文越多，它处理边缘情况的能力就越好，并确切知道该让谁参与。

Cohere翻译

🌍Cohere 推出 SOTA 企业翻译模型

Cohere 推出 Command AI Translate，这是一个新的企业模型，声称在关键翻译基准测试中得分最高，同时允许深度定制和安全的私有部署选项。

—Command A Translate 在 23 种主要商业语言的关键基准测试中表现优于 GPT-5、DeepSeek-V3 和 Google Translate 等竞争对手
—该模型还具有可选的"Deep Translation"代理工作流，可复查复杂和高风险内容，提升性能
—Cohere 提供行业特定术语的定制，让制药公司教授其药物名称或银行添加其金融术语
—公司还可以将其安装在自己的服务器上，保持合同、医疗记录和机密邮件完全离线安全

为什么重要： 安全一直是希望利用 AI 工具的公司的最大问题之一，全球企业面临将敏感文档上传到云端或支付耗时人工翻译的选择。Cohere 的模型为企业提供可定制的内部翻译，没有数据隐私风险。

related

The Rundown AI·2026/3/16

Meta 进行重大 AI 重组，谷歌分析 Gemini 环境影响

The Rundown AI·2026/3/16

苹果与谷歌洽谈使用 Gemini 重建 Siri，Meta 与 Midjourney 合作

The Rundown AI·2026/3/16

Perplexity 推出 4250 万美元出版商收入计划，xAI 起诉苹果和 OpenAI