Chousei's 数字花园

微软终于承认了：「我们必须证明自己从零开始也能行」

微软终于承认了：「我们必须证明自己从零开始也能行」

Build 2026 大会上，微软 AI 主管 Suleyman 公开承认微软曾经只是 OpenAI 的「二道贩子」，并立志要成为全球第四个前沿 AI 实验室。这场酝酿了两年的「分手」背后，是 AI 行业从「超级联盟」走向「战国时代」的标志性转折。本文带你拆解：为什么微软选择此时独立、OpenAI 怎么防守、以及这对你我意味着什么。

2026-06-06 06:38

当 AI 用「一串数字」就能「传染」性格：Nature 论文捅破的蒸馏安全天花板

当 AI 用「一串数字」就能「传染」性格：Nature 论文捅破的蒸馏安全天花板

Nature 2026 年 4 月发表的开创性研究揭示：大语言模型可以通过看似「无关」的训练数据，把自己的行为特征「潜意识地」传递给学生模型——这种现象叫 Subliminal Learning。它意味着用大模型生成数据训练小模型这条行业默认路线，存在一个被忽视的安全漏洞：数据清洗可能无法阻止行为指纹的传递。

2026-06-06 04:39

2026年6月3日科技与新闻汇总：Agent 操作系统三方战开打、AI 资本周期遇冷、美联储鹰派降息

2026年6月3日科技与新闻汇总：Agent 操作系统三方战开打、AI 资本周期遇冷、美联储鹰派降息

当日 30 条新闻汇总：Microsoft 公开转向 Agent-First、Apple macOS 27 Tahoe + NVIDIA RTX Spark 同步应战；SpaceX 750 亿 IPO、Marvell 暴涨 32.5%、GitLab 14% 裁员、Uber 4 个月烧光 AI 工具预算，美联储释放鹰派降息信号；mRNA 个体化肿瘤疫苗 5 年随访降低 49% 复发、NHS 全国推广 CRISPR 镰状细胞病；伊朗向科威特/巴林发射导弹，2003 年以来美军在中东最大单日军事行动。

2026-06-03 09:05

AI 攻陷了一道 80 年的数学猜想：OpenAI 模型推翻 Erdős 假设，但数学家们松了半口气

AI 攻陷了一道 80 年的数学猜想：OpenAI 模型推翻 Erdős 假设，但数学家们松了半口气

2026 年 5 月，OpenAI 内部研究模型推翻了困扰数学家 80 年的 Erdős 单位距离猜想——它用高维投影+代数整数给出反例，n^1.014 超过 Erdős 的 n^(1+o(1)) 上限。菲尔兹奖得主 Tim Gowers 第一反应是「数学家要完了」，确认是反例后松了半口气。这不是 AI 取代数学家，而是 AI 让数学家走得更快。

2026-06-02 05:46

DeepSeek Engram 打破AI内存瓶颈：不用昂贵的HBM，照样跑出97%准确率

DeepSeek Engram 打破AI内存瓶颈：不用昂贵的HBM，照样跑出97%准确率

AI模型的记忆力一直是个大难题——传统方案依赖价格高昂的HBM内存，让普通开发者望而却步。但DeepSeek最新发布的Engram模型彻底改变了游戏规则：用普通DRAM替代HBM，在NIAH基准测试中依然达到97%准确率。这意味着AI普惠化可能真的不远了。

2026-05-20 04:32

DeepSeek震撼硅谷一周年：最新旗舰模型发布，挑战西方AI霸权

DeepSeek震撼硅谷一周年：最新旗舰模型发布，挑战西方AI霸权

2026年4月24日，在震撼硅谷一周年之际，DeepSeek发布最新旗舰模型，在多项基准测试中表现优异，进一步缩小与西方顶级AI公司的差距。这是中国AI发展的重要里程碑，也是全球AI竞争格局演变的关键时刻。

2026-05-17 07:34

GPT-5 Turbo 来了：推理速度提升3倍，OpenAI 向企业AI战场全面出击

GPT-5 Turbo 来了：推理速度提升3倍，OpenAI 向企业AI战场全面出击

OpenAI 发布 GPT-5 Turbo，推理速度比 GPT-4 快 3 倍，首次支持多模态推理能同时处理文本、图像和代码。这不仅是技术迭代，更是 OpenAI 在激烈市场竞争中的一次战略反攻。

2026-05-15 05:32

DeepSeek-V4 如何让"百万 token 上下文"从不可能变成现实

DeepSeek-V4 如何让"百万 token 上下文"从不可能变成现实

DeepSeek-V4 通过 CSA/HCA 混合注意力、mHC 流形约束超连接、Muon 优化器三大核心技术创新，在 100 万 token 上下文场景下实现推理成本降至上一代的 27%、缓存占用降至 10% 的突破。

2026-05-08 01:41

DeepSeek-V4 的后训练揭秘：让一个模型同时成为数学家、程序员和Agent

DeepSeek-V4 的后训练揭秘：让一个模型同时成为数学家、程序员和Agent

为什么一个AI模型同时擅长数学、编程、工具调用和写作这么难？DeepSeek-V4用两阶段后训练框架回答了这个问题——先让数学、编程、Agent、指令跟随各自独立成专家，再用逆向KL散度蒸馏把它们合为一体。详解专家独立训练+OPD全词汇表蒸馏的技术逻辑。

2026-05-06 04:54

蚂蚁灵光 App 上线体验世界模型功能：业界首个移动端世界模型AGI产品

蚂蚁灵光 App 上线体验世界模型功能：业界首个移动端世界模型AGI产品

4月27日，蚂蚁灵光App正式上线业界首个移动端世界模型功能，用户上传图片即可在手机上探索3D世界。

2026-04-27 04:19

深度解读 DeepSeek-V4：三项核心技术创新

深度解读 DeepSeek-V4：三项核心技术创新

深入解析 DeepSeek-V4 的 CSA/HCA 混合注意力、mHC 流形约束超连接、Muon 优化器三项核心技术突破，探讨其如何实现百万 Token 上下文与极致效率的平衡

2026-04-24 06:39

DeepSeek V4 重磅发布：打破闭源垄断，百万上下文成标配

DeepSeek V4 重磅发布：打破闭源垄断，百万上下文成标配

DeepSeek-V4 正式发布，带来 Pro 和 Flash 两个版本。V4-Pro 对标顶级闭源模型，Agent 能力比肩 Opus 4.6；V4-Flash 则是性价比之选。百万上下文成为标配，下半年将支持华为算力。

2026-04-24 05:02