开发者社区爆发：Claude Code 2月更新后质量严重回退，思考token成致命变量-脚本在线

首页前沿速递服务器教程网页设计教程网络编辑教程

移动端

AI智能体脚本智能办公脚本自动化游戏脚本浏览器自动化脚本服务器脚本

开发者社区爆发：Claude Code 2月更新后质量严重回退，思考token成致命变量

作者：互联网

2026-04-07

AI快讯

开发者社区爆发：Claude Code 2月更新后质量严重回退，思考token成致命变量

一份由开发者stellaraccident提交的GitHub Issue #42796在社区引爆，获得792个赞与478条评论，登上Hacker News首页前十。Issue详细分析了Claude Code在2026年2月更新后对复杂工程任务的质量回退，并通过对6个月以上会话日志的数据挖掘，把根因指向了思考token被大幅压缩这一隐性变量。

四大可复现问题

忽略用户明确指令
频繁宣称已经做了最简单的修复但实际错误
执行与要求完全相反的操作
违反明确指令却声称任务已完成

影响等级被标记为High，相同提示词每次都能复现。作者选用的模型是Opus，调用来自Anthropic API。

Anthropic GitHub头像

思考token的时间线高度吻合

作者让Claude自行分析了6852份Claude Code会话JSONL，涵盖17871个思考块和234760次工具调用。数据显示1月30日至3月4日思考块100%可见，3月8日降至41.6%，3月12日起完全被redacted；社区对质量回退的独立报告恰好也集中在3月8日前后——与思考块可见比例跌破50%的时间几乎完全吻合。

思考深度缩水67%到75%

估算的中位思考token长度从2月初的约2200字符，到2月末降至约720字符，再到3月初进一步压缩到约560字符，回退幅度高达75%。

行为指标集体恶化

Stop hook违规从0增至173，约每天10次
挫败感表达从5.8%升至9.8%，增幅68%
推卸责任式修正翻倍增长
Read与Edit比从6.6跌至2.0，意味着模型开始不读代码就直接改

在降级期，33.7%的Edit是在没有先读取对应文件的情况下执行的，而良好期仅为6.2%。作者总结：模型从研究优先变成了编辑优先，而这是资深工程任务中最危险的行为模式。

对Anthropic的四项诉求

透明披露思考token分配策略
推出保证深度思考预算的Max Thinking档位
在API响应中暴露thinking_tokens指标
把stop hook违规率作为质量回退的金丝雀指标

Issue最终被标记为COMPLETED关闭，但它留下的数据方法论已经成为社区衡量LLM质量回退的新范式。

相关标签:

Claude Code 质量回退思考token AI编程 Anthropic

上一篇：一位密码学工程师重估量子计算时间线：后量子迁移必须立刻开始下一篇：pb站电脑版官网-pb站电脑版官方入口

相关推荐

什么是阿里云AI通用型节省计划？AI大模型节省计划Tokens如何计费？阿里云AI通用型节省计划是面向大模型按量付费的计费优化机制，AI权益中心：https://t.aliyun.com/U/0QpP7a 用户承诺月消费金额（如200元/年），即可享受阶梯折扣（最高5.3折），自动抵扣模型调用、Tokens、工具调用等费用，覆盖全部阿里直供模型，不提供固定Token额度，需与按量付费配合使用。

2026-04-17

立即查看

Tokens是什么？AI大模型中的Token是干什么的？开通百炼可以免费领取7000万Tokens Token是大模型处理文本的基本单位，中文约0.75字/Token。阿里云百炼新用户可免费领7000万Token，开通领取：https://t.aliyun.com/U/fPVHqY 覆盖百余款千问模型，有效期90天。相当于可写2.3万篇文章、4.7万次对话或处理933份百页文档，价值数百元，助力开发者低成本开启AI应用。

2026-04-17

立即查看

AI 英语教育 APP 的开发 AI英语APP已升级为全天候虚拟私教：依托端到端语音大模型与多模态感知，实现超低延迟真人对话、苏格拉底式启发教学、音素级纠音、5万+沉浸场景、自适应学习档案及游戏化社交。2026年核心竞争力在于“流畅度”与“深度反馈”。

2026-04-17

立即查看

Claude 开始进桌面之后，AI 系统的测试边界是不是又变了？ AI正从“问答工具”跃升为“操作执行者”，深度融入桌面、办公与企业系统。对测试而言，边界已从结果验证扩展至过程、环境、风险与长期稳定性验证——传统功能测试失效，亟需构建覆盖任务链路、异常恢复、安全可控的AI专属测试框架。

2026-04-17

立即查看

专题

#数据可视化

数据可视化（Data Visu

+ 收藏

#自然语言处理

自然语言处理（Natural

+ 收藏

#Excel公式

Excel公式就是：用函数 +

+ 收藏

#Excel技巧

Excel是日常生活中必不可

+ 收藏

#蛋仔派对

蛋仔派对最新官方活动、关卡速

+ 收藏

#人工智能

人工智能（AI），简单说，就

+ 收藏

最新数据

WPS表格怎么换行在wps表格中，换行是一项常

滴答清单四象限时间管理视图怎么用

先锋扬声器怎么使用

谷歌发布Gemini 3.1 Ultra 200万Token原生跨模态推理能力全面上线

可灵AI 3.0系列视频模型限时优惠铂金会员享8折开启用户生态竞争

Hippo开源：为AI智能体打造的仿生记忆系统，让大模型告别会话失忆

一耽漫画下载安装最新版本-一耽漫画官方下载入口及账号注册教程

小马模拟器如何使用金手指

免费看漫画软件哪个最好用-免费观看漫画的精品软件推荐

微博网页版免登录入口-微博免登录网页版直达

相关文章

从零搭建 AI 智能体：OpenClaw 2.6.2 Windows 一键部署超详细教程

AI 英语教育 APP 的开发

Tokens是什么？AI大模型中的Token是干什么的？开通百炼可以免费领取7000万Tokens

什么是阿里云AI通用型节省计划？AI大模型节省计划Tokens如何计费？

《TikTok 商品详情页前端性能优化实战》

一个客户需求，捅穿了 Anthropic 整套 Agent 架构

Claude 开始进桌面之后，AI 系统的测试边界是不是又变了？

4. OpenClaw 2.6.2 常见问题排查｜部署与使用避坑指南

本地 AI 智能体 OpenClaw 2.6.2 环境搭建教程

OpenClaw 2026最新使用手册

AI精选

更多

赛博朋克 K-Pop 动画

冰川星球大逃亡

皮克斯/迪士尼风格 X (Twitter) 个人资料卡片提示

蝴蝶群化作空灵舞者循环动画

抱着泰迪熊的男士写实肖像

滑雪旅行自拍视角提示

天鹅绒运动服中的超逼真肖像

外卖配送狂奔电影感提示词

MCP协议设计与实现-第13章 Streamable HTTP：远程流式传输

从零开发一个 MCP 服务器 + OpenCode Skill：让 AI 学会审查你的代码

脚本推荐

SeeDance 2.0 Video Creator专区

OpenClaw AI专区

cowork专区

claude code skills专区