新模型、开源权重与评测。
真正模型实力来自底层权重与训练数据,而非复制 prompt。泄露 prompt 只能让老模型 cosplay 出 lite 版,性能差距大。Fable 5 在长时程复杂分析等任务上领先,业界期待更多训练创新和 benchmark。
不确定什么时候,但我终于在Gemini网页上看到了一个新的Connected App。 @canva 现已可用🔥 有很多连接器已经开发了相当一段时间,而且移动端比网页版拥有更多。 你有哪些?👀
该教程演示如何在不下载完整多 TB 语料库的前提下,通过 HuggingFace 的 `load_dataset` 流式接口加载 FineWeb sample-10BT 子集的 3000 条文档,检查其 schema 及 `url`、`language`、`language_score`、`token_count` 等元数据字段,并复现 FineWeb 的质量过滤流程(Gopher / C4 / FineWeb 自定义规则)、采用 MinHash 进行近似重复检测、用 GPT-2 tokenizer 验证 token 计数,最后生成域名、语言分数、文档长度和 tokenizer 效率等统计图表。
值得关注的产品发布与更新。
在 Fable 打断之前,我完成的最后一次一次性提示词:"做一个很酷的模拟工具,让我能演示从科幻名作和科学推测中来的各种超光速旅行形式。它应该有视觉吸引力且有趣。" https://superluminal-ftl.netlify.app/
Berry Xia 推荐四个开源 AI 项目:/last30days(新搜索引擎)、agent-skills(将全栈开发技能打包成可调用模块)、open-notebook(本地版 NotebookLM,可离线运行知识整理与生成)、headroom(不改代码即可将 AI API 账单降低 90%)。这些项目聚焦工具层优化,免费开源,一次性解决本地化、成本控制和 agent 能力三个痛点,让开发者能直接拿来提升效率。
OpenRouter 发布 Fusion API,一种服务器端复合模型,将同一提示词并行发送给多个模型,允许它们调用网络搜索和 bash 工具。系统通过法官模型比较各模型回答,再由合成器生成最终回复。官方声称,Fusion 在 Perplexity 的 DRACO 深度研究基准上击败前沿模型,同时成本更低--以一半价格即可达到 Fable 级别的智能。
Step 3.7 Flash 现已上线 @DeepInfra 🚀 开发者和团队现可通过 DeepInfra 的 API 试用我们的开源多模态推理模型,并可为专用工作负载部署私有端点。 专为智能体编程、工具使用、搜索和视觉工作流而构建。 感谢 DeepInfra 团队!
Step 3.7 Flash 现已在 @DeepInfra 上线 🚀 开发者现在可以通过 DeepInfra 的 API 试用我们的开源多模态推理模型,并支持为专用工作负载部署私有端点。 专为智能体编程、工具使用、搜索和视觉工作流打造。 感谢 DeepInfra 团队!
融资、政策与市场动向。
初创公司正在尝试"搭乘SpaceX上市的浪潮。"
轻松使用Grok Imagine一键生成竹林中的剑斗场景(5分钟),初次尝试效果不错。试试最新Grok Imagine!
ChatGPT 为正在进行的 2026 世界杯开设了专属页面。用户可以在那里查看赛程、实时比分及其他信息。 /football /football/*country 如果错过了,别忘了👀
@TheDibsterX 在 Digital Ocean 云主机上尝试了 Grok Build,称赞它极其有用--不仅能生成代码,还能处理包更新、服务器设置、防火墙设置等一切操作。Elon Musk 回应称感谢任何改进产品的反馈。
Codex 可以查看并设置它自己的 /goal。 我们所构建的一切,也都是作为该智能体的工具而构建的。 这是元提示的一种泛化,即让智能体根据你的意图自行设定任务。
值得一读的研究与论文。
即将推出的Perplexity Digest功能很可能由Deep Research驱动。 用户将能够安排并定制来自广泛连接源的周期性更新,这些更新也会发送到他们的邮箱。 * 目前尚未可用 Deep Digest 👀
MIT、Stanford、New York Univ、Princeton 联合论文发现,AI 会让用户产生"效率幻觉"--感觉使用 AI 后更高效,但实际提升极小甚至为负。三项预注册研究涉及 2691 名参与者,在算术、拼写、记忆和短文改写任务中,用户实际使用 AI 的比例高于其预测,且平均预期节省 55.7 秒,实测仅 7.5 秒。简单任务的隐藏成本是界面摩擦:写提示、等待、阅读、检查、判断答案是否可接受。这一循环形成后,用户会更倾向再次使用 AI,即使自己完成更快。研究指出,AI 使用会自我强化,导致用户逐渐丧失对"何时自己更快"的判断力。论文链接:arxiv.org/abs/2605.22687。
小米新媒体高级工程师 @小米_邹師傅 今日再发文谈大模型,称过去一年国内大模型行业最令他兴奋的是开始靠作品说话--开源代码放GitHub、论文挂arXiv、模型让开发者使用。他认为大模型的核心评委只有开发者,而非媒体或榜单。他期望赛道竞争回归技术本身,比拼代码质量、推理速度和开源贡献,而不是比嗓门或预算。同时澄清上述为个人观点,不代表公司立场,并希望大模型成为"一方净土",让研发人员专注开发。
大厂与平台今天的关键动作。
科技领袖们争论称,Anthropic 事件是否是印度人工智能抱负的一次警钟。
Meta在北京市要求撤销该交易后,开始拆分其20亿美元收购Manus的交易。
因出口管制,Anthropic的顶级模型Mythos和Fable被强制下线。公司已派遣高级技术人员飞往华盛顿,试图修复与白宫的关系并说服官员模型可以被安全控制。有未经证实的指控称中国相关组织曾访问Mythos,但David Sacks公开关注的是破解风险而非中国,Anthropic也表示白宫未提及中国访问。此事触发了周五围绕Fable 5的事件。
由于出口管制导致其顶级模型 Mythos 和 Fable 被强制下线,Anthropic 紧急派遣高级技术人员前往华盛顿,修复与白宫的冲突。公司正努力说服官员这些模型可被安全控制,此事成为 AI 地缘政治的实时测试案例。据 Axios 独家报道。
Learn how to vibe code in 5 days! 了解如何在5天内进行vibe coding!在这门由我们的研究人员和工程师主持的@Kaggle课程中,使用自然语言构建可扩展的智能体系统,并完成一个实践性的顶点项目。