GPT-5 发布了,到底有没有那么神?
日期:2025-08-13 17:03:27 / 人气:6

GPT-5,终于在深夜出炉。
本以为会被深深震惊,满心期待它带来惊艳表现,而它确实也做到了一部分。但开场就出现了令人大跌眼镜的一幕:在全球直播展示 Benchmark 时,OpenAI 竟将 52.8 显示得比 69.1 还高,甚至 69.1 能跟 30.8 平齐。这一严重失误瞬间点燃网友怒火,遭到众人怒喷。就连 Altman 都急忙出面转移话题,称技术博客上的数据才是正确的。虽说技术博客后续进行了更正,但如此低级错误,实在不应该,毕竟大家翘首以盼了整整两年!
博士水平的 AI,来了
抛开这个严重失误不谈,GPT-5 在发布会上其他方面的表现还是可圈可点的。在技术博客中,OpenAI 开篇就宣称:“迄今为止,这是我们最智能、最快速、最实用的模型,内置的思考能力让每个人都能拥有专家级智能。”
此次发布的 GPT-5 拥有四个版本:
GPT-5:在不同领域中进行 Coding 和执行任务的标准模式;
GPT-5 mini:轻量版版本,适用于对明确界定的任务和场景;
GPT-5 nano:强调运行速度和性价比;
GPT-5 Chat:ChatGPT 中使用的版本。
目前,GPT-5 已面向普通用户提供免费、plus 和 Pro 三种模式,同时在 API 平台上,推出了 GPT-5、GPT-5 nano、GPT-5 mini 三种模型选择。不仅如此,OpenAI 此次承诺面向所有人免费开放,并且号称达到博士水平。
先看 Benchmark 成绩,最引人瞩目的当属 GPT-5 在 AIME 2025 中的满分表现,着实惊艳众人。在编程能力方面,相较于 o3 和 4o,借助思考模式的加持,GPT-5 达到了 74.9% 的水平,实现了大幅提升。此外,该模型在多种多模态评测中同样表现出色,涵盖图像、视频、空间理解和科学推理等诸多方面。强大的多模态能力,意味着 ChatGPT 在处理图片和其他非文字信息时更加智能,比如能够轻松看懂图表、精准总结演示照片的内容,或是准确回答关于图示的问题。
第三方的大模型竞技场(Imarena.ai)也迅速跟进,直言 GPT-5 在全方面表现第一,涉及文本、Web 开发、视觉、编程、数学、创造力、长查询等多个领域。从目前的评测标准来看,GPT-5 确实在众多 AI 大模型中占据领先地位,堪称卫冕之王。
再看效果
成绩固然重要,但实际应用效果才是检验其是否强大的关键。深谙此道的 Sam Altman 在自己的 X 账号上迅速发布了由 GPT-5 生成的效果示例,还表示有 GPT-5 权限的用户,只需发送 “use beatbot to make a sick beat to celebrate gpt-5” 即可亲身体验。不得不说,在营销方面,Altman 手段高明。
在直播现场演示过程中,GPT-5 也展现出不少令人惊艳之处。比如,要求它生成一个学语法的 APP,其成果令人眼前一亮。这并非简单的网站,除具备市面上 AI 常见的交互功能外,还内嵌了小游戏(点击 “Mouse&Cheese”)。若想改变 APP 内的内容,只需简单一句话,就能瞬间(现场实测)完成布局调整。对于更为庞大复杂的项目,如现场展示的用 GPT-5 编程生成的代码,运行后得到了一个逼真的 3D 效果 “世界”。从现场展示的效果来看,GPT-5 确实担得起 “最聪明、最强编程” 大模型的称号。
“观众” 们买单吗?
从目前 X 上 “观众” 们的反馈来看,讨论最为激烈的仍是前文提到的图表 bug,甚至有网友制作了一张简单粗暴的 Excel 表格来讽刺这一失误。不过,老东家微软 CEO 火速出面站台,配上 “爱心” 图片表达支持。开发者常用的 VS Code 官方也在第一时间无缝衔接 GPT-5。
然而,对于广大普通民众而言,反馈最多的声音则是:“说好的免费,我的 ChatGPT 咋没有呢?” 可见,虽然 GPT-5 在性能表现上有诸多亮点,但这次发布也因图表失误、免费政策落实等问题引发了不少争议。用户到底买不买单,它的实测效果究竟有没有宣传的那么神,还需要时间来检验,让子弹再飞一会儿吧。
作者:杏彩娱乐注册登录官网
新闻资讯 News
- GPT-5 发布了,到底有没有那么...08-13
- 房主任:我是没有退路,才努力爬...08-13
- 实测GPT - 5:写作坠入谷底,...08-13
- OpenAI 前员工创业潮:7 家独角...08-13