instructor 1.15.4 发布 主要是维护性扫除: - 修复了 v2 列表/标量响应模型 - 保留了流式 JSON 字符串中的反引号 - Image.autodetect 现在处理原始字节 - 刷新了过时的文档模型字符串,包括 Ollama llama3.2 小补丁,更少奇怪边缘 🔗 阅读原文:https://x.com/jxnlco/status/2071137861362172273
Codex 支持两种计划工作方式。Scheduled Tasks 每次运行创建新线程,适合无需上下文延续的任务,如每日 9 点自动总结邮件、日历;Scheduled Messages 在同一现有线程反复运行,适合需要历史上下文的场景,如每 30 分钟检查 PR 状态并处理评论,直至合并。推文还给出创建可复用循环技能的提示词,让 Codex 自动判断使用哪种方式并引导用户填写关键参数。 🔗 阅读原文:https://x.com/jxnlco/status/2071136366893859044
美国官员将与中国的人工智能竞赛定位为国家安全对抗,称微小领先也能改变结果。众议院外交委员会主席Brian Mast在哈德逊研究所活动上称美国是"超级英雄"、中国是"超级反派"。参议员Jim Banks表示这场竞赛涉及经济、军事和道德层面,警告美国不能输给"最大对手"。财长Bessent直言,中国愿意讨论AI是因为美国目前仍领先,但华盛顿担忧这一优势正不断缩小。作者认为,"Fable 5禁令"必须在此背景下理解。 🔗 阅读原文:https://x.com/kimmonismus/status/2071134253375451407
一项新研究(arXiv: 2606.21880)表明,AI正在将部分自由职业市场变成价格竞赛,高技能简历的优势被削弱。在ChatGPT出现后,AI暴露程度最高的职业中,人力资本信号(经验、声誉)的重要性下降了约7.8%,而价格的重要性上升了约1.1%。强背景工作者失去了部分需求优势,需求向更便宜的工人转移,表明AI使这些工作者显得更可互换。 🔗 阅读原文:https://x.com/rohanpaul_ai/status/2071133245673202120
本教程使用Hugging Face上的Fable 5 Traces数据集,在Google Colab中搭建轻量环境并手动下载JSONL文件。流程包括预览原始agent trace示例、规范化工具调用与文本输出、审计数据结构、检测密钥模式,以及可视化输出类型、工具、源根目录和文本长度等分布。还创建了安全的no-CoT聊天/SFT导出,构建关键词搜索辅助,并训练纯Python朴素贝叶斯基线,评估trace上下文能否预测助手的输出类型与工具使用。 🔗 阅读原文:https://www.marktechpost.com/2026/06/28/building-a-stable-fable-5-traces-workflow-in-colab-parsing-tool-calls-auditing-data-and-training-baselines
本文介绍如何配置两节点 AMD Strix Halo 集群,通过 Intel E810 (RoCE v2) 网卡实现 RDMA 互联,用于分布式 vLLM 推理(Tensor Parallelism)。硬件采用两块 Framework Desktop 主板(AMD Ryzen AI MAX+ "Strix Halo",128GB 统一内存)及 E810-CQDA1 100GbE 网卡,直连无需交换机。软件栈基于 Fedora 43,使用 Ray 编排集群、RCCL 通信。RDMA 延迟约 5μs(TCP/IP 为 70-100μs)。涵盖 BIOS 设置、网络配置、工具箱安装及启动集群的详细步骤。 🔗 阅读原文:https://github.com/kyuz0/amd-strix-halo-vllm-toolboxes/blob/main/rdma_cluster/setup_guide.md
据X用户Rohan Paul爆料,OpenRouter增长最快的智能体模型"Owl Alpha"实为美团LongCat-2.0-Preview。该模型采用1.6T参数MoE架构,激活参数量48B,动态激活范围33B-56B,原生支持1M token上下文窗口。已在OpenRouter秘密测试近两月,成为全球使用最多的AI智能体模型之一。OpenRouter数据显示其排名:Hermes Agent第1、Claude Code第2、OpenClaw第3;月处理token 10.1T,日token 559B,月增长率242%。 🔗 阅读原文:https://x.com/rohanpaul_ai/status/2071123605694652737
Meta 向谷歌申请的 Gemini 算力规模超出后者供给能力,谷歌现已对 Meta 调用其 Gemini 大模型实施使用限制。Alphabet 约在今年 3 月告知 Meta 无法满足所需算力,导致 Meta 多项内部 AI 项目受阻延期。Meta 已要求员工节约使用模型 token。谷歌一季度云营收达 200 亿美元,CEO 皮查伊表示算力供给瓶颈制约云业务增速,同时令云部门积压订单量环比近乎翻倍。 🔗 阅读原文:https://www.ithome.com/0/969/625.htm
福特因激进采用AI质检系统导致成本损失数十亿美元,三年内返聘350多名资深工程师(内部称"gray beards"),负责质量审查并帮助改进AI。首席运营官Kumar Galhotra承认自动化系统未达预期,经验丰富的工程师能预先发现故障点。返聘后,福特在J.D. Power年度新车质量调查中16年来首次获得主流品牌排名第一。公司表示不会放弃AI,但未来将结合人类监督与经验使用该技术。 🔗 阅读原文:https://www.the-independent.com/tech/ford-ai-automation-human-workers-b3003787.html
一项新研究指出,基于聊天日志的AI职业暴露评分可能将平台流行度误当作真实劳动力暴露。分析发现,此类平台指标往往高估计算机与办公室工作,低估食品、运输、生产和体力服务岗位。在将数据按真实就业分布重新加权后,估计的就业影响缩水42%至93%,部分结果几乎归零。研究提示当前测量可能更多反映平台采用情况而非实际工作流程改变。论文题为《谁在使用AI?平台选择与职业AI暴露的测量》。 🔗 阅读原文:https://x.com/rohanpaul_ai/status/2071115254793396620
某人辞去了数据中心的工作,租了一个空仓库。 里面摆满了成排的 🔗 阅读原文:https://x.com/rohanpaul_ai/status/2071114015124898225
Liquid AI 推出 LFM2.5-230M,230M 参数开源文本模型,基于 LFM2 架构,开放权重。支持 llama.cpp、MLX、vLLM、SGLang、ONNX 推理,内存占用 293-375 MB。Galaxy S25 Ultra 上达 213 tok/s,Raspberry Pi 5 上 42 tok/s。IFEval 指令跟随得分 71.71,领先 Qwen3.5-0.8B(59.94)和 Gemma 3 1B IT(63.49);CaseReportBench 临床数据提取得分 22.51。上下文窗口 32768 tokens,预训练于 19 万亿 tokens。专为数据提取和工具调用设计,不适用于数学推理、代码生成或创意写作。 🔗 阅读原文:https://www.marktechpost.com/2026/06/27/liquid-ai-ships-lfm2-5-230m-with-llama-cpp-mlx-vllm-sglang-and-onnx-support-for-on-device-inference
针对AI研究论文因同行评审周期长导致结果过时的问题,一篇医疗AI论文开源其评估框架(GitHub: health-ai-readiness-eval)。@yishan 用该框架在最新模型上复现测试:GPT-5.5 Pro 在放射影像解读中得分79/100,优于论文原始最佳模型(69/100),但未达到论文设定的"适合可靠医疗使用"标准(需抗扰动、识别信息不足、给出临床合理推理)。@yishan 未能完整复现定性评估,但基本测试表明最新模型虽有提升,尚不足以可靠用于临床。他呼吁所有AI论文开源实验框架,以便社区持续验证。 🔗 阅读原文:https://x.com/emollick/status/2071094858891120796
6月28日,比亚迪董事长王传福与地平线创始人余凯会面并体验智驾,暗示深度合作。余凯回应股价称"搞了一票特别大的",并预告HSD 2.0将推出。地平线4月国内乘用车域控芯片装机量跃居第二(8万套,占比13.6%),余凯称明年排名将变。尽管比亚迪已发布自研4nm智驾芯片"璇玑A3",地平线仍为天神之眼C主力供应商,其舱驾融合芯片可单辆车节省1500-4000元硬件成本,HSD V2.0有望在比亚迪车型首发落地。 🔗 阅读原文:https://www.ithome.com/0/969/591.htm
Sol 在操作 Codex 时。 约 2026 年。 🔗 阅读原文:https://x.com/thsottiaux/status/2071089307062837744
文章引用《心灵捕手》中罗宾·威廉姆斯饰演的Sean对Will的经典独白,指出面对AI生成的垃圾内容、海量建议与网络噪音,最好的回应不是更多信息,而是真实的个人体验与情感联结。Sean用艺术、战争、爱情、失去等话题质问Will,强调二手知识无法替代亲身经历。作者认为这段台词完美概括了AI slop问题的本质--信息堆砌不等于真正理解。 🔗 阅读原文:https://jayacunzo.com/blog/your-move-chief
Google Research 于2024年开源时序预测基础模型TimesFM(ICML 2024),采用预训练+零样本预测范式。2025年9月发布的2.5版本参数从500M降至200M,上下文窗口扩展至16K,新增30M分位数预测头,可同时输出点预测及10%-90%置信区间。200M参数单GPU可运行,16K上下文支持五年日数据。模型已内置在BigQuery ML、Google Sheets、Vertex AI中,开源版本通过pip install即可使用。2026年4月通过HuggingFace Transformers和PEFT支持LoRA微调,便于领域适配。 🔗 阅读原文:https://x.com/berryxia/status/2071081885552500928
Adrafinil 是一款 macOS 菜单栏应用,仅在 Claude Code、Codex、Cursor、Gemini CLI、Aider、Hermes、OpenCode、Cline、Pi 等 9 种 AI coding agent 持有活跃会话时阻止系统睡眠(包括合盖睡眠)。无 agent 工作时,合盖后 Mac 正常睡眠。它通过各 agent 的钩子系统调用 CLI,往返延迟低于 50ms,支持引用计数断言、热切出(温度阈值强制释放)、空闲释放及进程嗅探。需要 macOS Tahoe 26.4,Xcode 26+ 构建,以签名公证的磁盘映像提供。 🔗 阅读原文:https://github.com/kageroumado/adrafinil
Anthropic CEO Dario Amodei 认为,开源在 AI 领域与传统开源不同,属于"红鲱鱼"(干扰因素)。他指出,当前 AI 模型通常只开放权重而非源代码,无法看到内部逻辑,因此传统开源带来的多方协作、累加式改进等优势不成立。他不在乎模型是否开源,只关心其在关键任务上的表现。此外,大模型必须托管在云端进行推理,并非免费,任何用户都需要支付推理成本。该观点出自 Alex Kantrowitz 的 YouTube 访谈。 🔗 阅读原文:https://x.com/rohanpaul_ai/status/2071079939403809252
我的 OpenAI 哥们刚刚发布了最权威的基准测试。 🔗 阅读原文:https://x.com/Yuchenj_UW/status/2071079752623133038
Gemini 3.5 Pro 是否受到出口管制?因为如果没有…… 🔗 阅读原文:https://x.com/emollick/status/2071078492830060780
OpenAI 发布 planttalk 构建指南,让植物拥有声音。 主推文评论:和植物对话不再奇怪,只需 codex 即可。 🔗 阅读原文:https://x.com/thsottiaux/status/2071077932244570112
红魔游戏平板5 Pro公布软件功能:内置AI战术教练,支持赛前赛中提供选英雄、出装等指导;AI魔姬嘴替接入DeepSeek,实现自然回复交流。投屏助手支持1080P 185Hz/4K 144Hz无黑边低延迟投屏;新增剪辑应用和电子书模式(彩墨/黑白两种方案,可指定App开启)。该平板搭载第五代骁龙8至尊版(CPU主频4.6GHz),配备185Hz OLED电竞屏、新思S3930触控芯片(2000Hz瞬时报点率、300Hz多指原生触控采样率、10X超分辨率触控),升级红魔CUBE擎天游戏引擎3.0,支持2K 144Hz超分超帧并发及PC模拟器Steam直连。外观提供氘锋透明银翼/暗夜两款配色,RGB水冷灯效均匀度提升200%。 🔗 阅读原文:https://www.ithome.com/0/969/583.htm
VISReg 用于JEPA训练的方差-不变性-草图正则化 🔗 阅读原文:https://x.com/_akhaliq/status/2071073711319298473
Sakana Fugu 发布技术报告,提出智能正从模型转移到其周围系统。Fugu 是一个编排器,由数据训练的管理器动态选择最合适的专家模型,而非简单规则(如投票或固定分工)。Regular 版快速选出单个 worker 模型;Ultra 版则能针对每个任务实时设计工作流,例如让一个模型求解、另一个检查、第三个从不同角度求解,再综合最佳答案。工作流非预设,而是根据任务实时构建。 🔗 阅读原文:https://x.com/rohanpaul_ai/status/2071072431813656712
深圳开鸿数字产业发展有限公司 CEO 王成录宣布,全国首个开源鸿蒙机器人操作系统 M-Robots OS 正式完整捐献至开放原子开源基金会,专属一级根社区同步启动运营。该系统 1.0 版本于 2025 年 4 月发布,今年 5 月升级至 2.0 版本。2.0 版本具备积木式框架、混合部署、自研 M-DDS 分布式通信、硬件能力及算法共享、AI 原生及中间件生态兼容等核心能力,其中本体间音视频时延低至 4 毫秒,应用迁移成本降低 80%。 🔗 阅读原文:https://www.ithome.com/0/969/580.htm
Codex 本周推出多项体验改进。超长线程处理更流畅,导航栏悬浮可预览和跳转对话回合。设置搜索覆盖更多控制项,外观与主机过滤选项更清晰,自定义提供商设置更易找到。缩放时工具提示、对话框、菜单等不再错位。复制到 Slack 保留 Markdown 格式,大文本粘贴不冻结 UI。此外还新增了专属 Pets 面板。 🔗 阅读原文:https://x.com/thsottiaux/status/2071071289247244481
历史告诉我们,访问封锁很少能阻止有决心的用户。 https://www.chinatalk.media/p/how-to-buy-cheap-claude-tokens-in 🔗 阅读原文:https://x.com/steipete/status/2071063588329193551
每周精选最值得关注的 AI 故事,直接发送至您的邮箱。