GPT-5 发布了，到底有没有那么神？

日期：2025-08-13 17:03:27 / 人气：112

GPT-5，终于在深夜出炉。
本以为会被深深震惊，满心期待它带来惊艳表现，而它确实也做到了一部分。但开场就出现了令人大跌眼镜的一幕：在全球直播展示 Benchmark 时，OpenAI 竟将 52.8 显示得比 69.1 还高，甚至 69.1 能跟 30.8 平齐。这一严重失误瞬间点燃网友怒火，遭到众人怒喷。就连 Altman 都急忙出面转移话题，称技术博客上的数据才是正确的。虽说技术博客后续进行了更正，但如此低级错误，实在不应该，毕竟大家翘首以盼了整整两年！
博士水平的 AI，来了
抛开这个严重失误不谈，GPT-5 在发布会上其他方面的表现还是可圈可点的。在技术博客中，OpenAI 开篇就宣称：“迄今为止，这是我们最智能、最快速、最实用的模型，内置的思考能力让每个人都能拥有专家级智能。”
此次发布的 GPT-5 拥有四个版本：
GPT-5：在不同领域中进行 Coding 和执行任务的标准模式；
GPT-5 mini：轻量版版本，适用于对明确界定的任务和场景；
GPT-5 nano：强调运行速度和性价比；
GPT-5 Chat：ChatGPT 中使用的版本。
目前，GPT-5 已面向普通用户提供免费、plus 和 Pro 三种模式，同时在 API 平台上，推出了 GPT-5、GPT-5 nano、GPT-5 mini 三种模型选择。不仅如此，OpenAI 此次承诺面向所有人免费开放，并且号称达到博士水平。
先看 Benchmark 成绩，最引人瞩目的当属 GPT-5 在 AIME 2025 中的满分表现，着实惊艳众人。在编程能力方面，相较于 o3 和 4o，借助思考模式的加持，GPT-5 达到了 74.9% 的水平，实现了大幅提升。此外，该模型在多种多模态评测中同样表现出色，涵盖图像、视频、空间理解和科学推理等诸多方面。强大的多模态能力，意味着 ChatGPT 在处理图片和其他非文字信息时更加智能，比如能够轻松看懂图表、精准总结演示照片的内容，或是准确回答关于图示的问题。
第三方的大模型竞技场（Imarena.ai）也迅速跟进，直言 GPT-5 在全方面表现第一，涉及文本、Web 开发、视觉、编程、数学、创造力、长查询等多个领域。从目前的评测标准来看，GPT-5 确实在众多 AI 大模型中占据领先地位，堪称卫冕之王。
再看效果
成绩固然重要，但实际应用效果才是检验其是否强大的关键。深谙此道的 Sam Altman 在自己的 X 账号上迅速发布了由 GPT-5 生成的效果示例，还表示有 GPT-5 权限的用户，只需发送 “use beatbot to make a sick beat to celebrate gpt-5” 即可亲身体验。不得不说，在营销方面，Altman 手段高明。
在直播现场演示过程中，GPT-5 也展现出不少令人惊艳之处。比如，要求它生成一个学语法的 APP，其成果令人眼前一亮。这并非简单的网站，除具备市面上 AI 常见的交互功能外，还内嵌了小游戏（点击 “Mouse&Cheese”）。若想改变 APP 内的内容，只需简单一句话，就能瞬间（现场实测）完成布局调整。对于更为庞大复杂的项目，如现场展示的用 GPT-5 编程生成的代码，运行后得到了一个逼真的 3D 效果 “世界”。从现场展示的效果来看，GPT-5 确实担得起 “最聪明、最强编程” 大模型的称号。
“观众” 们买单吗？
从目前 X 上 “观众” 们的反馈来看，讨论最为激烈的仍是前文提到的图表 bug，甚至有网友制作了一张简单粗暴的 Excel 表格来讽刺这一失误。不过，老东家微软 CEO 火速出面站台，配上 “爱心” 图片表达支持。开发者常用的 VS Code 官方也在第一时间无缝衔接 GPT-5。
然而，对于广大普通民众而言，反馈最多的声音则是：“说好的免费，我的 ChatGPT 咋没有呢？” 可见，虽然 GPT-5 在性能表现上有诸多亮点，但这次发布也因图表失误、免费政策落实等问题引发了不少争议。用户到底买不买单，它的实测效果究竟有没有宣传的那么神，还需要时间来检验，让子弹再飞一会儿吧。

作者：杏彩娱乐注册登录官网

GPT-5 发布了，到底有没有那么神？

新闻资讯 News

案例展示 Case

现在致电 xylmwohu OR 查看更多联系方式 →

现在致电 xylmwohu OR 查看更多联系方式 →