"头部应用 DeepSeek 月均下载量较第一季度环比下跌 72.2%;腾讯元宝月均下载量环比下跌 54%;Kimi 月均下载量环比跌 57.7%。"
文 / 巴九灵
900 天,GPT-5 终于闪亮登场,但是朋友圈似乎并没有那么热闹。
圈内人士转发点赞,说要"抢走打工人饭碗了",而圈外人士了无波澜。
图源:OpenAI 官网
在发布会前后,OpenAI CEO 山姆 · 奥特曼做足了给世界一个"惊喜"的氛围。
会场前说,面对 GPT-5,感觉自己一无是处;会场中,把 GPT-5 形容为熟悉各个领域的专家;在会后的宣发文章,则是强调它"博士级"的智能水平。
奥特曼甚至不惜否定前作:" GPT-3 像个高中生,GPT-4 像个大学生。""我尝试过用回 GPT-4,但效果相当糟糕。"
他在发布会上反复强调这些话。
OpenAI 发布会,山姆 · 奥特曼
怎么形容 GPT-5 呢?结合报道和专家分析,总结如下
◎ 首先,编程能力变强了。
比如,可以两分钟就可以搭建出一个完整网站,五分钟做出一款语言学习 App,并能精准识别并修复 Bug。
当然,还是不免出现 Bug。比如,演示过程中展示的性能测试图表制造了 GPT-5 "碾压式领先" GPT-o3 和 GPT-4o 模型的"幻象"。
◎ 其次,实现免费了。
GPT-5 首次使用推理模型来支持 ChatGPT 的免费版本。用奥特曼的话来说:"让每个人都能获得博士级别的智慧。"
知名数字经济学者刘兴亮高速小巴,"这反映了 AI 应用正逐渐迈向‘免费也能用上高级能力’的趋势,标志着更复杂、更可靠的 AI 技术正在普惠大众,不再局限于付费人群。"
但是,"不是真免费,有限制,用多了或者问题太复杂,它就会切换成"迷你版"(GPT-5 mini),这个版本能力就弱一些了。想一直用好的,还是得掏钱买 Plus 或者更贵的 Pro。"深度科技研究院院长张孝荣如此补充道。
◎ 第三,下了大力气解决" AI 幻觉"。
GPT-5 联网搜索时错误率比 GPT-4o 低 45%,独立思考时错误率比 OpenAI o3 低 80%。
OpenAI 发布会
然而,就在 GPT5 发布前的几个月,人们对 AI 应用的热情出现明显消退。
点点数据显示,2025 年 5 月,全球 AI APP 苹果 App Store 与谷歌 GooglePlay 双端预估下载总量达 2.8 亿次(不含重复下载),环比 4 月下滑了 16.4%。
6 月,下载总量达 2.7 亿次,环比下滑了 1.6%;7 月,3.4 亿次,环比 6 月上涨了 24.9%。
此外,TOP 5 应用下载量占比中,ChatGPT、Google Gemini 分别由 6 月份的 35% 和 8% 下滑至 7 月份的 29% 和 5%。
在国内,据《2025 年二季度 AI 应用价值榜》显示,头部应用 DeepSeek 月均下载量较第一季度环比下跌 72.2%,其 MAU 环比下滑 9.3%;腾讯元宝月均下载量环比下跌 54%;Kimi 月均下载量环比跌 57.7%,同时 MAU 环比降 35%。
姗姗来迟的 GPT-5 到底带来了哪些突破性的改变,为什么普通人对包括它在内的 AI 应用不再"热诚",要如何唤起大家对 AI 的兴趣?小巴邀请了业内人士来深入谈谈。
请在手机微信登录投票
你在日常工作中使用 AI 工具了吗? 单选
有,几乎天天都用
还行,一周 2-3 次
不怎么使用,非常偶尔
从来没用过
1
GPT-5 的核心优势是什么?哪些方面不如预期?
陆新之
商界 AI 新媒体总编辑
央媒评论员
可能是因为事先张扬很久,千呼万唤始出来之后,倒没有感觉到特别惊艳。
但是用起来还是能有变化,回答更严谨,准确度变高,也更简洁了。
实事求是来说,今时今日的大模型的版本进化,不会有太革命性的飞跃了。
之前 4o 的多模态发布那次的惊艳感,已经很难重现。暂时可见,对比国内的 DeepSeek、豆包和通义等同类,GPT-5 还是综合能力更强一些,而且自动动态切换思考和非思考模型。
初步感觉的这版核心优势,就是代码能力和推理能力的进化,这个大部分普通人感知不明显,开发者可能感知明显一些。
当然,不及我们期待的,就是 Agent 能力,因为这应该是 OpenAI 的方向之一,本来期待的是一出来就可以替代大部分通用 Agents,显然现在还做不到,得等下一版了。
张孝荣
深度科技研究院院长
GPT-5 确实进步不小,好用多了,但没能成神。
尤其是所谓"博士级智能水平"还是有点夸大。
我认为,它在编程领域进步最突出,比如让它写个带学习功能的法语小游戏网页,几分钟就能整出来,代码写得还挺好看,比之前处于大学生水平的 GPT-4 强一截。数学推理能力的得分也不错,准确率提升,幻觉率下降。
看病历报告啥的,也能解释得比较清楚,还带点人情味儿(当然,医生还是得看,不能全靠它)。
文章写作上,比上一代更接近人类风格,当然,跟人类作家相比,还是有点生硬。
中文能力还是差点意思。用中文写东西,比如写短视频脚本、文章啥的,它出来的东西还是有点"外国味儿",语感不如国内的通义千问,DS,文小言等。
看图看视频的能力,也比不过之前的 GPT-4o 和国内的通义,比如让它分析个复杂图表或者中国公司财报,就很容易抓瞎。
AI 幻觉下降是值得称道的一大进步。比如让它上网查资料再回答,它犯错几率比 GPT-4o 低了 45%;让它认真思考复杂问题,犯错几率比之前的"聪明版"低了 80%。实在搞不懂或者问题不对,它也会老实承认"我不会"或者"你这问题有问题",不会硬着头皮瞎蒙。
美国用户使用 OpenAI GPT-5 人工智能模型
刘兴亮
知名数字经济学者
工信部信息通信经济专家委员会委员
1.形态进化。从"选模型"到"模型会选自己",GPT-5 直接成了 ChatGPT 的默认款,会根据任务自动决定"快答"还是"深想",你也能手动切换到" GPT-5 Thinking/Pro "来走更长推理,而且这次面向所有用户开放,付费用户只是额度更高,同时还上了语音升级、学习模式,以及接入了 Gmail/ 日历等"生活插件"。
一句话,少折腾菜单,多交付结果。
2.硬指标 + 新工具。码得更像人,写得更像你。官方放出的基准显示,GPT-5 在数字、真实世界编码、视觉和健康等多项评测拔尖,并且强化多步指令与工具编排 …… 翻译成人话就是:写代码更少废话,走流程更少走神。
3.更聪明不等于更"上道",更安全不等于没风险。
我很认可它在推理 / 编码的进步,但在写作质感和 AGI 跨度上并没有达到我的想象。OpenAI 一边高举"更少幻觉 / 更少欺骗"的大旗,一边推出" Safe-Completions "安全训练并承认涉及生物等领域的高风险属性,这意思就是说能干的更多了,能"作妖"的边界也得更严。
在商业层面上,GPT-5 更像一台利润引擎,铺开给全体用户,押注企业用量会放大。所以,我给 GDP-5 的初步结论是四个更——更快更强更准更懂我。
但我更想强调的是,别急着给程序员写墓志铭,也别指望它给 PPT 装灵魂,先把它当超级实习生,该放权放权,该验收验收。
2
怎么看国内外头部 AI 应用的下载和月活出现明显下滑?
陆新之
商界 AI 新媒体总编辑
央媒评论员
大模型厂家与巨头很兴奋,但是一直没有刚需应用,还缺一个现象级出圈的产品,所以在杀手级应用出来之前,大多数开发者与中小公司还得煎熬一段。AI 时代也在呼唤移动互联网时代的 TikTok 与拼多多。
现在的 AI 应用发力方向,逐步转向业务 +AI,而不是纯 AI 应用,这是比较务实的。但是也缺少一点想象力。目前,除了顶级的大模型,大部分 AI 应用都是基于原有的业务或者行业经验 +AI 去做原有业务的增长和进化。当然,原生 AI 应用新造的需求很难出圈,目前也难有清晰的商业模式。但是真正未来能够指数级发展的公司,更大可能还是在原生 AI 应用。
张孝荣
深度科技研究院院长
当前下滑是行业挤泡沫的阵痛,用户过了尝鲜期,只保留有用的工具,这也是市场走向成熟的必经之路——能活下来的,必是那些让 AI 从"炫技"变成"水电煤"的产品。那些蹭热点、同质化、做流量、创新不足的产品,注定会被淘汰。
现在 AI 圈打得很热闹,基本是"巨头打架,小厂找缝钻"的局面,现在拼的是谁能绑定用户生活、谁更便宜、谁解决实际问题。单打独斗的小 AI,基本没戏了。
从国内外对比来看,国外 AI 在算力上领先优势明显,技术迭代速度加快。
刘兴亮
知名数字经济学者
工信部信息通信经济专家委员会委员
普适型聊天机器人疲软,用户兴趣转移。通用 AI 聊天应用下载量大幅下降,MAU 也下滑明显,这说明这一类产品已经失去新鲜感,用户转而青睐更具针对性的工具型应用(如办公、教育类 AI 工具)。
产品定位与差异化不足。很多 AI 社交或聊天产品同质化严重,功能体验重复、引导缺乏新意,导致用户留存率下降、兴趣减弱。
行业转向"功能垂类"应用。诸如 AI 写作、在线辅导、助考类工具,在特定场景需求推动下表现仍强劲(如毕业季写作需求上涨、AI 高考志愿专家应用暴涨)。
AI 应用市场已从"聊天爆款"回归理性阶段,用户更愿意为"解决实际问题"的垂直应用埋单。
3
AI 是否已经开始改变了人们的生活?
张孝荣
深度科技研究院院长
在重复劳动、数据活上超有用,但搞艺术、做复杂决策、惠及普通人还差点意思,现在还是花拳绣腿,最多只发挥了六成功力。
大模型本质是"语言缝合怪",全靠拼词造句碰答案,不懂分辨事实真假,加强伦理限制后,幻觉率更高。从根本上说,AI 幻觉像"改不掉的撒谎习惯",能管住七八成就不错了,现在有许多技术可以减少 AI 幻觉,但是没法根除。
陆新之
商界 AI 新媒体总编辑
央媒评论员
目前,AI 应用的价值还远远没有发挥出来,无论是对于工作与生活。更多的用户还是当一个问答机器人,加点画画生成视频等等,还是很浅的尝试。
比如教育,对于懂 AI 的人来说会用提示词就能把豆包变成一个很好用的教育工具,但是对于普通人就不知道怎么问,所以现阶段的 Agents 有真实的需求,也能够发展得快。对智能体来说,2025 年下半年是一个窗口期。
幻觉问题我反而不是很担心,因为还是能有解决的方法。大模型都有一个范围调节,创意优先的选择但是自然幻觉率最高,而控制幻觉率的话,容易回答不全面,这也取决于个体的使用习惯。
其实大模型的预训练的数据相对来说还是比较可控的,主要是联网搜索之后的内容常常出问题,这个需要巨头后面改善搜索的 RAG 技术。同时,个人也要对于幻觉有警惕与觉察,要有自己的判断来使用。
本篇作者 | 林波
图源 | VCG
阳美网配资-阳美网配资官网-配资炒股论坛平台查询-股票配资论坛网站提示:文章来自网络,不代表本站观点。