
📊Anthropic 调研 81,000 人对 AI 的希望与恐惧
Anthropic 发布了史上最大规模的 AI 态度定性研究,使用 Claude 在 12 月采访了 81,000 名来自 159 个国家的用户,了解他们对技术走向的看法和担忧。
- —Anthropic 推出了 Claude Interviewer,构建了能在 70 种语言中进行开放式对话的 Claude 特别版本
- —职业卓越是受访者最希望 AI 带来的价值,其次是节省时间、财务独立和更广泛的生活管理
- —对 AI 出错的恐惧超越其他所有担忧,工作焦虑、失去个人自主权和过度依赖紧随其后
- —AI 情绪因地区而异:印度和南美洲高于平均水平,美国、欧洲、日本和韩国则持平或低于平均
划重点: 主流民调中 AI 支持率已大幅下滑,但 Anthropic 的研究揭示了那些调查错过的细微差别。更值得注意的是,Claude 一周内完成了 80,000 次深度跨语言访谈——这在一年前根本无法实现,是 AI 作为研究工具的强大概念验证。

⚙️ Cursor 自研代码模型 Composer 2 成本逼近前沿水平
Cursor 背后的公司 Anysphere 发布了 Composer 2——第三代自研模型,在成本仅为 OpenAI 和 Anthropic 前沿模型零头的情况下,达到了相当的编码性能。
- —Composer 2 在独立测试 Terminal-Bench 2.0 上击败 Opus 4.6(61.7% vs 58%),在 Cursor 自有 CursorBench 上距 GPT-5.4 仅 5 分之差
- —在快速层级上每百万输出 token 仅需 $7.50,成本约为 GPT-5.4 的 1/10,Opus 4.6 的 1/20,速度相当
- —自 10 月以来,Composer 在内部 CursorBench 上的分数从 38% 攀升至 61.3%,跨越三代模型迭代
划重点: Cursor 从利用其他顶级 AI 模型,迅速转向自建模型并达到这一价格点。作为应用层公司逼近前沿水平令人印象深刻,Composer 2 的速度、成本和性能可能彻底改变开发者使用 GPT-5.4 或 Opus 4.6 进行编码的经济账。

⚙️ 用 Replit Tasks 功能更快改进你的网站
本指南介绍如何使用 Replit 的 Tasks 功能改进现有网站,而不会影响已正常运行的应用,避免孤立修复堆积,真正推进应用开发。
- —前往 Replit,输入你的应用想法并点击 Plan。如果已有应用则直接打开。需要至少 Replit Core 套餐才能使用该功能
- —进入项目后,点击左侧加号按钮,创建任务如移动端优化,提示:"使仪表盘和所有组件响应移动端。如不可行则使用不同组件"
- —规划时可并行排队第二个任务,如改进着陆页设计、清理导航栏或修复 bug
- —规划完成后启动任务。可预览每个任务,完成后点击 Apply Changes to Main Version 更新生产应用
划重点: 将主代理切换至计划模式并告知想要的改进,它会生成 PRD。然后将该 PRD 拆分为新的并行任务。

🎨微软 AI 图像模型登顶排行榜
微软 AI 超级智能团队发布了 MAI-Image-2,该文本到图像模型在 Arena AI 排行榜上位列第 5,标志着 Mustafa Suleyman 实验室迄今为止最强的发布。
- —Arena.ai 将 MAI-Image-2 排名第 5,仅次于 Gemini(多个版本)和 GPT Image-1.5,在真实感、3D 和艺术性方面有显著提升
- —相比前代最大的飞跃是文本渲染能力,提升了 115 分,海报、幻灯片和信息图表的表现大幅改善
- —美国用户可在微软 MAI Playground 免费试用,Copilot、Bing 和 Foundry 平台 API 访问即将推出
- —此次发布正值微软 AI 领导层调整,Suleyman 从 Copilot 转岗专注于前沿模型工作
划重点: 微软一直希望减少对 OpenAI 的依赖,用自研模型真正参与竞争,MAI-Image-2 是迄今为止最强的一步。但这家老牌科技巨头要在已根深蒂固的前沿选项中获得市场份额,仍有艰难的攻坚战要打。