~/ai-stream
~/large-models/openai-cracks-ais-hallucination-code-20250908
The Rundown AI·大模型热门

OpenAI 揭秘 AI 幻觉成因并提出解决方案

content

AI幻觉研究

🔬OpenAI 揭秘 AI 幻觉成因

OpenAI 发布新论文指出,AI 系统产生幻觉是因为标准训练方法奖励自信猜测而非承认不确定,这可能为解决 AI 质量问题指明方向。

  • 研究发现模型编造事实是因为训练评分对幸运猜测给满分,而对"我不知道"给零分
  • 论文揭示这造成冲突:为最大化准确率训练的模型学会了永远猜测,即使完全不确定答案
  • OpenAI 通过询问具体生日和论文标题测试该理论,发现模型每次都自信地给出不同的错误答案
  • 研究人员提议重新设计评估指标,对自信错误的惩罚要高于表达不确定的情况

为什么重要: 这项研究可能使幻觉问题成为可以在训练中更好解决的问题。如果 AI 实验室开始奖励诚实而非幸运猜测,我们可能会看到知道自己的极限的模型——用某些性能指标换取在实际处理关键任务时真正重要的可靠性。

版权和解

💰Anthropic 以 15 亿美元和解作者集体诉讼

Anthropic 同意支付至少 15 亿美元和解来自作者的集体诉讼,这是 AI 公司因使用受版权保护作品训练模型而支付的首笔重大赔偿。

  • 作者起诉称 Anthropic 从 LibGen 等影子图书馆下载超过 700 万本盗版书籍用于构建 Claude 训练数据集
  • 联邦法官 6 月裁定使用合法购买的书籍训练构成合理使用,但下载盗版副本违反版权法
  • 和解涵盖约 50 万本书籍,每本 3000 美元,如发现更多盗版材料还需额外支付
  • Anthropic 必须销毁所有盗版文件和副本,和解协议不授予未来训练许可

为什么重要: 这是针对 AI 实验室众多版权诉讼中首个具有先例意义的赔付——尽管裁决针对的是盗版而非合法文本的"合理使用"。虽然 15 亿美元听起来是一笔巨款,但考虑到该公司最近以 1830 亿美元估值融资 130 亿美元,这一打击可能有所缓解。

网络监控

📝使用 AI 代理自动监控网络

本教程介绍如何使用 Yutori Scouts,一个 AI 网络监控代理,在线监控特定更新并通过邮件提醒你。无需再刷新页面或手动检查变更。

  • 在 Yutori 主页输入框输入请求(如"OpenAI、Anthropic、Gemini 或 xAI 的新发布")创建 Scout
  • 选择提醒频率——即时、每日或每周,然后点击 Start scouting 激活
  • 在"My Scouts"仪表板查看和管理所有活跃 Scout,可随时编辑、暂停或删除
  • 在邮件或应用内查看报告,每份报告都有清晰发现和直达来源的链接以便快速行动

为什么重要: Scout 适用于预订、产品补货或行业新闻等时间敏感的机会,可与自动化工具配对获取更新。

OpenAI芯片

🔧OpenAI 与 Broadcom 合作开发自研 AI 芯片

据《金融时报》报道,OpenAI 将通过与 Broadcom 的合作明年开始量产自研定制 AI 芯片——加入其他科技巨头减少对英伟达硬件依赖的竞争行列。

  • Broadcom CEO 透露神秘客户承诺 100 亿美元芯片订单,消息人士确认 OpenAI 是计划内部部署的客户
  • 定制芯片将帮助 OpenAI 在五个月内将计算能力翻倍,以满足 GPT-5 激增的需求并解决持续 GPU 短缺问题
  • OpenAI 去年启动与 Broadcom 的合作,直到本周财报公告前生产时间表一直不明朗
  • 谷歌、亚马逊和 Meta 已创建定制芯片,分析师预计专有选项将继续从英伟达手中夺取市场份额

为什么重要: 顶级 AI 实验室都在努力确保更多算力,英伟达的王者地位正开始受到中国国内芯片生产努力和科技巨头自研定制选项的双重挑战。拥有全栈最终也有助于降低 OpenAI 在外部硬件上产生的巨额成本。