返回每日简报
2026-06-20

AI Hot 每日简报 · 2026-06-20

模型

新模型、开源权重与评测。

AI HotRSS·4 天前74

GPT-5.6无辅助框架一次性生成《模拟人生》

非常期待 GPT-5.6。无需任何辅助框架,一次性生成《模拟人生》模拟,太疯狂了。

AI HotRSS·4 天前74

GPT-5.5幻觉率达86%,GLM-5.2仅28%--大模型越大越不可靠

GLM-5.2(MIT开源,753B参数,约40B活跃)在AA Intelligence Index上仅比GPT-5.5低4分、比Claude Fable 5低9分,但其幻觉率仅28%,远低于GPT-5.5的86%和DeepSeek V4 Pro(1.6T参数,49B活跃)的94%。后者在AA-Omniscience基准上仅6%的问题会承认不知道。实际代码测试中,GLM-5.2用12秒和800个推理token识别出技术悖论,而DeepSeek V4 Pro耗费3分26秒和近10倍推理token后仍给出错误答案。模型规模增长正导致幻觉率飙升而非智力提升。

AI HotRSS·5 天前74

GLM-5.2 表现接近 Opus 4.8/GPT-5.5

使用 GLM-5.2 一天后,我惊讶于它经常感觉接近 Opus 4.8/GPT-5.5 的水平。 我将它与 Opus 4.8 进行了并排比较,有时我甚至更喜欢 GLM-5.2 的结果。 开源大语言模型令人印象深刻,尤其是考虑到它们训练的 GPU 数量少得多。

AI HotRSS·4 天前69

Signal总裁Meredith Whittaker提醒:AI聊天机器人"不是你的朋友"

Signal总裁Meredith Whittaker在接受Bloomberg采访时警告,ChatGPT、Claude等AI聊天机器人"不是你的朋友、有意识的生物或有感知的对话者"。她坦言自己会用AI工具"格式化文档",但不会向它们提问,因为不想让思考过程被"平均已有内容"的系统答案取代。针对微软AI CEO Mustafa Suleyman预测用户可让Copilot处理全部圣诞购物,Whittaker指出,这需要Copilot监听家庭群聊、获取信用卡、浏览器、Signal、代发消息、家庭地址和日历等权限,相当于在Signal中"开了一个后门"。

AI HotRSS·4 天前69

GLM-5.2势头猛,开源LLM或胜闭源

Fable 仍未回归(遗憾)。与此同时,GLM-5.2 变得非常出色。 如果 Fable 或 GPT-5.6 因安全风险无法发布,而 Kimi K3 或 GLM-5.3 率先推出,那么开源大语言模型或许有机会击败公开的闭源模型。

产品

值得关注的产品发布与更新。

行业

融资、政策与市场动向。

大厂

大厂与平台今天的关键动作。

AI HotRSS·4 天前74

GPT-5.6 将是重大正面惊喜

我预感 GPT-5.6 会是一个巨大的正面惊喜。让我们回忆一下关于 GPT-5.6 的信息: "该公司正单独准备发布一款新的 AI 模型,代号为 5.6,它将是当前旗舰模型 GPT-5.5 的'有意义的改进',OpenAI 首席科学家 Jakub Pachocki 在一份给员工的备忘录中写道。"

AI HotRSS·4 天前74

GPT-5.6 Pro 泄露:下周四发布,视觉复刻、SVG 3D、浏览器自动化三大能力曝光

GPT-5.6 Pro 预计下周四发布,泄露信息显示其三项关键能力:视觉复刻已近乎能完全复刻设计;SVG 3D 生成表现超越 Fable 5,支持浏览器内旋转缩放;Playwright 浏览器自动化可真实操作网页(点击、输入、跳转、抓取)。这三项能力表明 OpenAI 正将 GPT 从语言模型进化为能执行物理操作的 Agent--不仅能"思考",还能打开浏览器、移动鼠标、复制设计并保存到桌面。

智能体
AI HotRSS·4 天前74

OpenAI 最强 AI 模型:GPT-5.6 系列有望下周登场

科技媒体 testingcatalog 报道,OpenAI 有望下周推出 GPT-5.6 系列,涵盖 mini、标准版和 Pro 版。部分 Pro 订阅用户已可访问 GPT-5.6 Pro,理解力增强,前端/Web 开发认知有进步。性能方面,上下文窗口从 100 万 tokens 扩展至 150 万 tokens,优化了长周期编码能力和 Codex 响应速度。消息称在智能体编码中,GPT-5.6 已优于 Anthropic 的 Mythos 系列。定价上,OpenAI 当前 token 价格仅为 Anthropic 一半左右,计划进一步降价。

TechCrunch AIRSS·4 天前71

诺贝尔奖得主约翰·詹普尔离开DeepMind加入竞争对手Anthropic

詹普尔并不是唯一一位离开谷歌DeepMind的大牌人物。

量子位RSS·4 天前71

诺奖得主、AlphaFold之父投奔Anthropic!谷歌48小时连跑俩大将

Gemini 3.5 Pro呢?