首页前沿速递服务器教程网页设计教程网络编辑教程

移动端

AI智能体脚本智能办公脚本自动化游戏脚本浏览器自动化脚本服务器脚本

GPT5实测竟算错数学题升级还是噱头

作者：互联网

2026-03-29

⼤语⾔模型脚本

OpenAI最新力作GPT-5正式发布，这款备受期待的大模型能否延续传奇？让我们通过实测一探究竟。

该模型上线后迅速登顶lmarena.ai竞技榜：

在文本处理、Web开发和视觉任务领域表现突出；
同时在硬提示、编程、数学等专业领域同样占据领先地位。

不过发布会现场出现尴尬一幕：GPT-5生成的图表数据存在明显错误，52.8竟然比69.1显示得更大，30.8和69.1的柱状图高度完全一致。

这款被Sam Altman称为"OpenAI最聪明模型"的产品，实测表现究竟如何？

01. 核心测试

数学能力测试

首先进行经典数学题测试：

提问：比较9.9和9.11的大小关系

GPT-5给出的解释是：比较整数部分相同后，认为小数部分11大于9。若理解为日期，则9月11日晚于9月9日。

编程能力评估

需求：用JavaScript实现六边形内弹跳小球效果，需包含重力、摩擦力等物理特性

实现效果基本达标，物理特性表现尚可，但弹跳效果有待加强。

多模态表现

任务：将给定图片内容翻译成中文，要求忠实原意且通俗易懂

与其他模型对比结果显示：

Gemini 2.5 Pro：

豆包：

GPT‑5：

综合评估显示Gemini翻译最为自然流畅，GPT-5表现与豆包相近但略逊于Gemini。

前端开发测试

开发需求：实现番茄钟应用，需包含计时、统计、主题切换等完整功能

GPT-5实现的界面视觉效果较佳，但存在环形设计不合理等问题；相比之下Gemini实现的功能更完整实用。

02. 总结评价

经过系列测试发现，GPT-5在文案创作、数学推理等方面表现不尽如人意，编程能力保持稳定但未突破，前端设计审美在线但存在细节问题。目前该模型已全面开放使用，建议用户根据实际需求选择适合的AI工具。

相关标签:

豆包

上一篇：10款免费AI语音输入工具与软件轻松实现语音转文字下一篇：浏览器自动化：自然语言网页控制 - Openclaw Skills

相关推荐

电影哥特式火水社论一个高度细致、超现实的电影级提示，用于黑暗哥特式奇幻高级定制时装编辑拍摄。它描绘了一个身着飘逸白裙的主体，站在浅黑色水中，周围环绕着熊熊火焰，并对灯光、氛围（烟雾形成“Shreya”字样）和面部身份锁定有具体指示。

2026-04-18

立即查看

本能电影剧照一段高度详细的电影化提示，旨在重现《本能》（1992 年）中标志性的审讯场景。它详细描述了场景（青蓝色瓷砖房间）、灯光（戏剧性的新黑色电影风格，高对比度）、摄像机设置（35mm 变形宽银幕），以及拍摄对象的姿势（诱惑性地交叉双腿）和服装（无袖白色迷你连衣裙）。

2026-04-18

立即查看

夜桥上的电影三联画肖像一个详细的提示，用于创作一张写实电影风格的三联画（一张图片中包含三个画框），描绘一个人在夜间城市桥上的肖像，强调都市浪漫、动感和青春，同时严格保留上传参考照片中的人物身份。

2026-04-18

立即查看

黄金时段海岸生活方式照片一个高度详细的提示，用于生成一张年轻女性在地中海风格悬崖餐厅黄金时段的生活方式照片。它指定了光线（逆光、暖色）、背景元素（大海、白色椅子、栏杆）以及拍摄对象的形象（深色波浪发、黑色波点连衣裙、金色配饰）。

2026-04-18

立即查看

专题

#数据可视化

数据可视化（Data Visu

+ 收藏

#自然语言处理

自然语言处理（Natural

+ 收藏

#Excel公式

Excel公式就是：用函数 +

+ 收藏

#Excel技巧

Excel是日常生活中必不可

+ 收藏

#蛋仔派对

蛋仔派对最新官方活动、关卡速

+ 收藏

#人工智能

人工智能（AI），简单说，就

+ 收藏

最新数据

HeyGen: AI 数字人视频生成 - Openclaw Skills 什么是 HeyGen AI 视频

浏览器自动化：自然语言网页控制 - Openclaw Skills

焦圈儿国内首创AI原生社交平台实现动态个性化推荐

AI制作狗狗视频播客详细教程与案例分享

27岁姚顺雨执掌AI大旗誓要重铸腾讯辉煌

豆包AI视频模型_字节跳动发布AI视频生成大模型PixelDance与Seaweed

FullStackBench-字节豆包联合MAP社区开源全新代码评估基准

豆包视觉理解模型重磅上线实现精准识别与智能推理

豆包AI编程新功能上线助力开发者轻松攻克编程难关

字节豆包BFS-Prover自动定理证明系统

相关文章

04｜MCP 服务接口：让本地能力变成 Agent 可调用的 Tools

为什么需要KVCache?

Claude 一个插件，让全球软件股蒸发 2850 亿美元

如何创建一个 Agent Skill？

打造 GitHub 仓库智能推荐系统

挣脱上下文的枷锁：OpenViking，为 AI Agent 而生的开源上下文数据库

Claude Opus 4.6 和 GPT-5.3 Codex 同时发布，OpenAI 极限截杀 Opus 4.6！

数据库巡检进入智能时代：异常检测算法的落地实践

阿里开源AgentScope多智能体框架解析系列（十八）第18章：企业Skill系统实战 - 用户行为深度分析

2025年终总结：AI浪潮下的一年

AI精选

更多

电影哥特式火水社论

本能电影剧照

夜桥上的电影三联画肖像

黄金时段海岸生活方式照片

高速摄影：亚洲汤品爆裂瞬间

玻璃马雕像变形动画（视频提示）

秋叶超现实主义鹿

90 年代复古闪光摄影肖像

Sydney Sweeney《蜘蛛夫人》首映礼礼服描述

女性在床上听音乐的私密生活照

脚本推荐

SeeDance 2.0 Video Creator专区

OpenClaw AI专区

cowork专区

claude code skills专区