AI 每日简报 · 2026-06-19

智能的一种定义是样本效率，但近年AI进步主要靠扩充数据分布和增加算力。强化学习本质是合成数据生成--投入大量算力通过验证器筛选"好"数据，再训练模型预测正确输出。这一过程需要每个领域和技能的海量人类专家示例，数据行业年收入已达数十亿美元。近日Epoch报告，开源模型仅落后前沿闭源模型4个月，原因在于数据可从公开API蒸馏，而超参数等不易复制。人类一生接触约2亿token，前沿模型训练在数十到数百T token之间，相差近百万倍--机器人、自动驾驶等领域同样存在巨大效率差距。

行业

融资、政策与市场动向。

TechCrunch AIRSS·5 天前71

Allbirds 首席执行官的新 AI 业务有计划，但没有员工

可以称之为一家由唯一创始人和巨额种子轮融资支持的初创公司，但下一步发展尚不明确。

量子位RSS·5 天前71

我把昨晚的梦输入AI，它居然直接把我拉进去玩儿了一把？！

创作者的终极玩具来了

量子位RSS·6 天前71

GPT发AI原创新成果了

AI实现药物全自动研发，还远吗？

量子位RSS·6 天前71

全球首个人形机器人通用小脑来了！全球最大规模2万小时人类动作数据，实现零样本泛化

人形机器人正式迈入“GPT时代”

TechCrunch AIRSS·6 天前71

消息：Elastic同意以最高8500万美元收购由CRV投资的DeductiveAI

DeductiveAI是一家初创公司，利用人工智能检测并解决软件中的错误，成立仅三年。

论文

值得一读的研究与论文。

arXiv cs.AIPaper·6 天前61

代理AI系统的运行时治理伦理策略

arXiv:2606.19464v1 宣布类型：新论文摘要：由大型语言模型（LLMs）驱动的自主代理AI系统带来了新的安全、隐私和合规挑战：一个能够调用工具、操作数据、安装软件并在组织边界内与其他代理协调的代理，不仅需要通过身份验证和访问控制来限制，还需要通过企业治理的完整结构进行约束。这包括明确代理被允许和禁止的行为，以及在某些操作后代理必须履行的义务（例如，通知CISO），在什么条件下...

安全智能体

arXiv cs.AIPaper·6 天前61

跨主题覆盖、能力与认知深度的课程一致性测量：应用于CS2013和CS2023的纵向框架

arXiv:2606.19469v1 宣布类型：新论文摘要：本科计算机科学受国际课程指南的规范，这些指南大约每十年修订一次，但项目缺乏一种可靠且可重复的方法来衡量它们如何完全覆盖当前的指南，以及当指南重新结构化时覆盖率如何变化。我们通过一个人机协同的流程来解决这个问题，该流程测量一个项目对外部知识体系的覆盖情况，并将其纵向应用于一个获得认证的计算机科学学士学位，针对计算机科学课程2013年（CS2013）和2023年（CS2023）。该流程...

安全

arXiv cs.AIPaper·6 天前61

扩散语言模型：实验分析

arXiv:2606.19475v1 宣布类型：新论文摘要：大型语言模型（LLMs）通过自回归生成彻底改变了语言建模，使它们在各种任务中表现出色。最近，扩散语言模型（DLMs）作为一种替代范式出现，它通过迭代去噪生成文本，而不是下一个标记预测，从而允许整个序列的并行优化。虽然已经提出了许多基于扩散的架构，但由于评估协议、数据集、推理预算和生成超参数的不同，使得比较变得困难...

推理编程

arXiv cs.AIPaper·6 天前61

多代理LLM推理中的隐藏锚点

arXiv:2606.19494v1 宣布类型：新论文摘要：多代理LLM推理，即代理在多轮中交换和修改答案，越来越多地用于提高推理和准确性，但其工作原理和原因很少被建模。这种推理类似于人类做出决策的方式。作为社会动物，我们既受到群体的影响，也受到自身内部信念的影响，而经典的意见动态模型如DeGroot和Friedkin--Johnsen模型只捕捉了前者。我们将多代理推理建模为一个闭环动力系统，其中每个代理都携带一个...

推理智能体

arXiv cs.AIPaper·6 天前61

DeXposure-Claw：去中心化金融风险监督的代理系统

arXiv:2606.19501v1 宣布类型：新论文摘要：去中心化金融使监管者面临快速移动、网络化的信用风险。通用LLM代理在这种情况下表现不佳：它们过度解读弱证据并推荐高风险干预措施，而现有的评估方法没有一种能以监管者为导向的方式来衡量由此产生的误报。我们引入DeXposure-Claw，这是一个基于预测的代理监督系统，将LLM决策通过结构化证据进行路由：(1) DeXposure-FM，一种图时间序列基础模型，预测未来的暴露网络；(2) 确定性监控器...

智能体

大厂

大厂与平台今天的关键动作。

TechCrunch AIRSS·5 天前76

美国禁止Anthropic发布Fable 5，但数据似乎并不在意

就在上周结束时，美国政府迫使Anthropic撤下其最新两款模型Fable 5和Mythos 5，理由是国家安全问题，此前有报道称亚马逊研究人员找到了绕过Fable 5安全机制的方法。网络安全研究人员随后签署了一封公开信，称这一举措具有危险性，而Anthropic本身也指出，同样的越狱方法也存在于其他模型中。那么……

安全

AI HotRSS·5 天前74

OpenAI 将前沿健康 AI 能力迁移至免费版 GPT-5.5 Instant

OpenAI 将前沿健康 AI 能力从 premium 推理模型迁移至免费版 GPT-5.5 Instant，使其健康评估表现接近 Thinking 模型。每周超 2.3 亿用户通过 ChatGPT 咨询健康问题。OpenAI 采用知识蒸馏：由更强教师模型与 260+ 名医生（覆盖 60 国、49 种语言、26 专科）审查超 70 万条模型响应，训练学生模型学习临床回答模式。训练结合监督微调与偏好训练，重点提升"不确定性下的行为"（如主动询问年龄、症状等缺失信息）。真实健康流量中事实性问题减少 71%。GPT-5.5 Instant 已向全体免费用户开放。

TechCrunch AIRSS·5 天前71

美国政府对Anthropic的禁令是否意外帮助了该品牌？

安全

AI HotRSS·5 天前69

Anthropic 估值 2 万亿美元 IPO，AlphaFold 负责人加入

swyx 称 Anthropic 将以 2 万亿美元估值 IPO。与此同时，AlphaFold 团队负责人 John Jumper 在任职近 9 年后宣布离开 Google DeepMind 加入 Anthropic。

AI HotRSS·5 天前69

多家AI公司性能差距缩小，整体向上移动

另一个指数级增长，来自 Artificial Analysis。几乎是整个领域都在同时向上移动。 OpenAI、Anthropic、Google、xAI、Meta、DeepSeek、Alibaba、Mistral、Kimi 等公司现在*相互之间的聚集程度*比两年前更紧密了。鸣谢 @ArtificialAnlys

AI Hot 每日简报 · 2026-06-19

模型

如何评价 Claude Fable 5 全球暂停访问？

团队使用 Claude Code / Codex 的规范治理——献给所有全员 AI 开发的团队

LLM时代关键：GPT-3.5与微软未关闭Bing

Claude Code 破译 3500 年克里特线性文字 A

Claude Mythos 仍对 200 组织开放访问

产品

又一款国产模型诞生，StepPlan性价比杀疯了！

亿万富翁安巴尼希望将AI融入每通电话、每个应用和每个家庭

美国称ASML的顶级芯片工具可能已进入中国。ASML表示并非如此

Luma AI 推出 Timeline 剪辑与 EDL 导出

AI中心的数据黑洞

行业

Allbirds 首席执行官的新 AI 业务有计划，但没有员工

我把昨晚的梦输入AI，它居然直接把我拉进去玩儿了一把？！

GPT发AI原创新成果了

全球首个人形机器人通用小脑来了！全球最大规模2万小时人类动作数据，实现零样本泛化

消息：Elastic同意以最高8500万美元收购由CRV投资的DeductiveAI

论文

代理AI系统的运行时治理伦理策略

跨主题覆盖、能力与认知深度的课程一致性测量：应用于CS2013和CS2023的纵向框架

扩散语言模型：实验分析

多代理LLM推理中的隐藏锚点

DeXposure-Claw：去中心化金融风险监督的代理系统

大厂

美国禁止Anthropic发布Fable 5，但数据似乎并不在意

OpenAI 将前沿健康 AI 能力迁移至免费版 GPT-5.5 Instant

美国政府对Anthropic的禁令是否意外帮助了该品牌？

Anthropic 估值 2 万亿美元 IPO，AlphaFold 负责人加入

多家AI公司性能差距缩小，整体向上移动