~/ai-stream
~/industry/openai-superapp-hiding-inside-codex-20260417
The Rundown AI·行业热门

OpenAI 推出 Codex 超级应用,Anthropic 发布 Opus 4.7 强势回击

content

OpenAI Codex 升级

🧰OpenAI Codex 迎来重大更新,向超级应用转型

OpenAI 升级了 Codex 平台,将其从单纯的编程工具转变为集成了 ChatGPT、Atlas 和 Codex 的综合性应用,支持后台操控、多代理协作等强悍功能。

  • 后台电脑操作:Codex 能够自动运行任何 Mac 应用,多个 Agent 可同时处理任务,甚至在没有 API 的应用中也能运作。
  • 跨会话记忆与自动化:新增预览版记忆功能,可保留用户偏好和上下文;自动化功能允许 Codex 在几天后继续处理长期任务。
  • 内置浏览器与图像生成:集成 Atlas 驱动的浏览器和 gpt-image-1.5,开发者可直接在应用内进行网页标注或生成模型图。
  • 用户飞速增长:Codex 周活用户已达 300 万,月环比增长 70%,OpenAI 目标是将其打造成真正的「超级应用」。

划重点: 这是对 Anthropic Claude Code 的强力回击,标志着 OpenAI 正在将 AI 从简单的助手转变为能够全面掌控电脑的「超级入口」。

Claude Opus 4.7

Anthropic 发布 Opus 4.7,编程能力力压群雄

Anthropic 推出了 Claude Opus 4.7,在 Agent 编程测试中一举超越了 GPT-5.4 和 Gemini 3.1 Pro,成为目前市面上最强的公开模型。

  • 基准测试大幅提升:在 SWE-bench Pro 测试中,Opus 4.7 的得分从 4.6 版本的 53.4% 暴涨至 64.3%。
  • 价格不变但更费 Token:API 调用价格维持不变,但升级后的模型在处理相同任务时消耗 Token 的速度显著加快。
  • 专业审查命令:引入 /ultrareview 命令用于识别代码漏洞和设计缺陷,并增加「极高(xhigh)」努力程度选项。
  • 双线并行策略:Anthropic 维持每两个月更新一次公测版,同时保留更强大的 Mythos 模型仅供独家合作伙伴使用。

划重点: Anthropic 正在通过极快的迭代速度保持竞争力,其「公测+独占」的双线模式也让其在追赶 OpenAI 的同时保留了技术底牌。

本地运行 Ollama

🦙零成本、本地运行:通过 Ollama 在笔记本上部署 LLM

这是一份教你如何在本地电脑上部署 AI 模型的指南,无需订阅、无需联网,保护隐私的同时完全免费。

  • 快速安装:访问 ollama.com 下载适用于 Mac/Linux/Windows 的安装程序并启动应用。
  • 模型选择:在应用中新建对话并选择轻量级模型(如 gemma3,约 3GB),适合 8GB 内存的笔记本运行。
  • 离线运行:模型下载后即可在断网环境下(开启飞行模式测试)流畅对话,数据不离开本地。
  • 进阶玩法:利用 Ollama 的 API,可以将模型接入 Web 工具,甚至让 Claude Code 等编程 Agent 免费调用本地模型。

划重点: 本地化部署是 AI 隐私保护的终极方案,Ollama 大大降低了普通用户私有化部署和定制化开发 AI 应用的门槛。

GPT-Rosalind

🧬OpenAI 推出首个生命科学领域专用模型 GPT-Rosalind

继网络安全专用模型后,OpenAI 又发布了 GPT-Rosalind,专注于药物研发和生物研究,开启了通用模型向行业深度定制化迈进的新篇章。

  • 多项全能科研助手:Rosalind 具备阅读文献、查询实验数据库、设计实验方案以及生成生物学假设的能力。
  • 能力显著跨越:在生物化学、工具使用等科学测试中,Rosalind 的表现大幅优于通用旗舰模型 GPT-5.4。
  • 超越顶尖专家:在 Dyno Therapeutics 组织的盲测中,Rosalind 在 RNA 预测任务上的表现优于 95% 的人类科学家。
  • 早期企业测试:该模型目前已向 Amgen、Moderna 等知名机构开放,用于加速实际的药物研发流程。

划重点: 接连发布安全和生物专用模型,显示出 OpenAI 的策略转型——未来的行业深水区不仅需要全能冠军,更需要专业领域的「特种兵」。