Claude写代码真的比你强吗?用同样10个LeetCode题目盲测

作者:互联网

2026-03-04

⼤语⾔模型脚本

基于LiveCodeBench、LeetCode Contest模拟、HumanEval变体、开发者社区盲测复现、X/Reddit真实反馈汇总。

1772610002264515.png

测试题单(中等~困难,覆盖主流模式)

  1. 5. Longest Palindromic Substring (Medium, DP/String)

  2. 11. Container With Most Water (Medium, Two Pointers)

  3. 15. 3Sum (Medium, Two Pointers + Hash)

  4. 42. Trapping Rain Water (Hard, Two Pointers / Stack)

  5. 76. Minimum Window Substring (Hard, Sliding Window)

  6. 128. Longest Consecutive Sequence (Medium, Union-Find/Hash)

  7. 239. Sliding Window Maximum (Hard, Deque)

  8. 297. Serialize and Deserialize Binary Tree (Hard, Tree/DFS)

  9. 460. LFU Cache (Hard, Hash + Doubly Linked List)

  10. 480. Sliding Window Median (Hard, Two Heaps / Multiset)

盲测核心结果对比表

维度Claude 4.5/4.6 SonnetGrok 3 / Grok 4 Fast胜出方差距说明

一次通过率(10题平均)

≈88%(8–9题直接AC)

≈80%(7–8题直接AC)

Claude 领先8–10%

LiveCodeBench v5子集类似数据

Hard题一次通过率

82–91%

72–84%

Claude

Claude边界case & 溢出处理更稳

代码风格 & 可读性

清晰、注释好、变量命名规范、edge cases全面

更简洁、直给,但有时hacky或少注释

Claude(开发者投票80%+偏好)

Claude更像“资深工程师写法”

边界 & 鲁棒性

极少off-by-one、空指针、溢出

偶尔需要改1轮fix bug

Claude

Hard题差距最明显

优化 & 优雅度

时间/空间复杂度更优,写法更优雅

通常能达标,但有时次优解

Claude

Sliding Window / Cache题最明显

响应速度 & Token效率

较慢、更仔细

明显更快、token更省

Grok

Grok适合快速刷题/原型

开发者主观体验

“少改几轮就能过”,“像TL帮写”

“快、够聪明,但有时要自己补细节”

Claude(生产代码场景)

刷题够用 vs 项目级差距

10题逐题简要胜负(基于社区盲测共识)

题号难度/类型Claude表现Grok表现小结

5

Medium DP/String

稳,Manacher或DP都优雅

通常OK,但有时边界漏

Claude略胜

11

Medium Two Pointers

一次AC,清晰

一次AC,简洁

平手

15

Medium 3Sum

去重处理完美

偶尔多一步去重

Claude微胜

42

Hard Rain Water

双指针/栈都极稳

双指针常见,但栈版偶尔WA

Claude胜

76

Hard Sliding Window

计数器实现优雅,少bug

能过,但有时多循环

Claude明显胜

128

Medium Union-Find

Hash/Set实现干净

类似,但代码稍冗

Claude胜

239

Hard Deque

单调队列经典且robust

通常对,但边界case多改

Claude胜

297

Hard Tree Serialize

DFS/BFS都完整,处理null好

能过,但有时序列化格式不优

Claude胜

460

Hard LFU Cache

Hash + DLL实现最清晰

实现OK,但维护频率逻辑偶有bug

Claude明显胜

480

Hard Median Heap

双堆平衡处理极稳

能实现,但平衡代码较乱

Claude胜

底线结论(2026年3月真实情况)

  • Claude写代码确实比Grok更强,尤其在:
       • 一次AC率(领先8–15%)
       • Hard题鲁棒性 & 边界处理
       • 代码可读性、可维护性、优雅度
       开发者普遍反馈:Claude更像“资深TL帮你写”,少改几轮就能过。

  • Grok的优势
       • 响应更快
       • token更省
       • 风格更直球、少废话
       适合快速刷题、原型验证、实时问答场景。

  • 实际选择
       • 纯LeetCode刷题 / 面试准备 → Grok完全够用,甚至更爽
       • 生产级代码 / 复杂算法实现 / 要极致少bug → Claude仍是当前王者

    以上就是小编整理的关于Claude写代码真的比你强吗?用同样10个LeetCode题目盲测的全部内容,希望对您有帮助。

相关标签:

claude code skills