技术动态采集 - 2026-06-02¶
采集来源:InfoQ、开源中国、Dev.to、Solidot 采集时间:2026-06-02 10:00 CST
AI / 大模型¶
-
编程 Agent 可能是软件开发史上最昂贵的错误之一 — InfoQ 深度分析编程 Agent 的成本与价值困境,一场清算正在到来
-
米哈游一夜烧掉200万元Token,大厂高管开始质疑AI支出的回报 — 米哈游等大厂发现 Token 消耗与业务价值严重不匹配,开始反思 tokenmaxxing 策略
-
Opus 4.8 刚发布,DHH 盛赞的 GPT-5.5 正在动摇编码王座 — Claude Opus 4.8 发布引发基准测试争议,Redis 之父质疑跑分可靠性
-
面壁推出全球首个完全AI编写的训练框架,速度反超英伟达 — 面壁智能用 AI 重写国产算力软件,训练框架性能超过英伟达对应方案
-
英伟达开源全模态物理AI大模型 Cosmos3 — Cosmos3 是全球首个完全开源的全模态物理 AI 基础模型,融合视觉推理、世界生成和动作预测
-
超越 TurboQuant!OSCAR:面向真实 Serving 的 2-bit KV Cache 量化 — 新量化方案 OSCAR 解决长上下文模型在线推理的 KV Cache 内存瓶颈
-
Kog AI 推理引擎发布:标准GPU实现 3000 tokens/s 单请求速度 — 在 8×AMD MI300X 上达到 3000 tokens/s,8×NVIDIA H200 上 2100 tokens/s
-
一家美国公司一个月内在 Claude AI 上花费了 5 亿美元 — 公司忘记为员工设置 Claude 使用限制,暴露企业 AI 支出的失控风险
Agent / MCP¶
-
Nobody installs your MCP server. The ones who do don't use it. — Dev.to 热文,深入分析 MCP Server 当前面临的采用率和实际使用困境
-
Anthropic 在 Code With Claude 上发布托管式智能体与主动式工作流 — Claude Code 新增托管式智能体、主动工作流和能力曲线,GitHub/Vercel 分享落地经验
-
Debloating The AI-Grown Codebase — 探讨如何清理 AI Agent 生成的臃肿代码,实用技巧
云原生 / 架构¶
-
平台工程实验室 formae 扩展支持 Kubernetes 和原生 Helm 集成 — 开源 IaC 平台 formae 重大更新,增强云原生部署能力
-
构建云原生 Kafka:从分层存储迈向无盘未来 — Kafka 架构演进从分层存储到无盘部署的运营挑战与策略
-
HorizonVault 技术深潜:HDD 上实现 100GB/s+ 大吞吐分布式存储 — 自研分布式存储引擎,面向 Kafka 远程存储和低成本温数据场景
开源 / 工具¶
-
OpenRouter 获 1.13 亿美元 B 轮融资 — AI 路由平台获大额融资,反映企业从单模型向多模型生产系统转型的趋势
-
rsync 维护者用 AI 写代码引发社区愤怒 — GitHub issue "Please Do Not Vibe Fuck Up This Software" 反映开源社区对 AI 代码的信任危机
-
GodeX v1.1.0 发布:开源 OpenAI Responses API 网关 — 支持 MiniMax-M3、多模态理解和原生搜索结果桥接