不是GPT-5.4,OpenAI深夜发新模型!幻觉率暴降29%_Instant_用户_ChatGPT
智东西
作者|王涵
编辑|李水青
智东西3月4日报道,今天,OpenAI正式发布GPT‑5.3 Instant,该模型在回答的语气倾向、回复相关度以及对话的顺畅度均有相应的提升。
OpenAI团队称其收到用户反馈,GPT‑5.2 Instant有时会拒绝回答本可以安全响应的问题。在涉及敏感话题时,模型的表现偶尔显得过于保守或带有说教感。
GPT‑5.3 Instant的回答将直击重点,不再夹杂冗长的限制性说明,显著减少了不必要的拒答行为,并削减了回答前那些过度防卫或带有说教色彩的开场白。
此外,GPT‑5.3 Instant还优化了联网搜索结果的整合质量,模型现在能更有效地平衡搜索结果与自身知识储备及逻辑推理。例如,它能够利用既有的认知图谱为近期资讯提供深度背景解析,不再是简单地罗列并汇总搜索信息。
从更广泛的层面来看,GPT‑5.3 Instant降低了对联网搜索结果的过度依赖,解决了此前偶尔出现的“链接堆砌”或信息松散的问题。它现在能更精准地洞察问题的潜台词,并在回答开头即优先呈现核心信息。
此前,GPT‑5.2 Instant的语气偶尔会让人感到“尴尬、违和”,表现为言语过于强势,或者在未获确认的情况下,就对用户的意向和情绪进行过度解读或妄加揣测。
本次更新大幅削减了不必要的冗余宣告,以及类似“停一下,深呼吸”等口吻。用户可以在设置中调整模型的回复语调,例如其亲和力与热情度。
相比GPT‑5.2 Instant ,GPT‑5.3 Instant提供的回答更具事实性,在广泛的话题领域内均显著降低了幻觉率。
为了衡量准确度,OpenAI团队***用了两项内部评估指标:其一侧重于医疗、法律及金融等高风险领域;其二则专门针对“幻觉”高发场景进行测试,样本取自经过脱敏处理、被用户标记为事实错误的真实对话记录。
对比前代模型,GPT‑5.3 Instant在“高风险领域”评估中,联网模式下的幻觉率降低了26.8%,仅依靠模型自身知识库时,幻觉率降低了19.7%。
而在基于用户真实反馈的评估中,该模型在联网模式下的幻觉率下降了22.5%,非联网模式下则下降了9.6%。
在故事写作方面,GPT‑5.3 Instant在处理实用任务与表达性写作之间切换得更加顺畅,且不会牺牲逻辑的清晰度与连贯性。
OpenAI团队补充到,GPT‑5.3 Instant仍存在一些改进空间。例如ChatGPT在某些语言,如日语和韩语,中的回复风格可能稍显生硬,或带有刻板的直译感。并且,OpenAI团队仍在持续监控反馈并进行功能优化,同时也在不断扩展自定义选项。
GPT‑5.3 Instant自即日起面向所有ChatGPT用户开放,开发者也可通过API使用名为gpt-5.3-chat-latest的模型。Thinking和Pro版本的更新也将于近期推出。
GPT‑5.2 Instant将在“Legacy Models”下拉菜单中为付费用户保留三个月,并***于2026年6月3日正式退役。
结语:OpenAI用对话挽留用户
GPT‑5.2 Instant在回答中的“油腻”“冗杂”的套路句式一直被广大用户所诟病,此次GPT‑5.3 Instant的升级更新,将视角重新放回“聊天”上,回应了用户长期以来对聊天机器人 “好用、实在、不绕弯” 的核心诉求。
在3月初,OpenAI因与美国军方签订合作协议,大批用户开始发起“抵制ChatGPT”等活动,Anthropic更是直接推出了一键转移上下文内容的服务,ChatGPT的用户或正在流失。
OpenAI在此时优化对话风格或许也是其试图留住用户的举措。返回搜狐,查看更多
同类文章排行
- 在杭州2021年买房的你,房子亏了多少了?
- 如何评价上海理工大学 C语言考试,老师不认识vscode 说是切屏***?
- 我在百纵科技买了一台美国CN2云服务器,如何测试是不是CN2线路?
- 一名女子在杭州万象城遭挟持被捅 20 多刀,隆胸***体救了一命,这反映出哪些公安系统的问题?
- 女生穿牛仔裙好看吗?
- 求pr安装包及安装方法?
- 大家对蔡澜这个人怎么看?
- 你是如何知道并去到小众旅行地的?
- 海贼王为什么现在被全网黑?
- 蔡澜曾说「年轻人要存到 100 万以上,这是脱离牛马生活的第一步」,怎样看这一观点?
最新资讯文章
- 一个练过功夫的姑娘能打过一个没练过的男人吗?
- 为什么QQ上的网络状态没有了?
- 现在还有人一直坚持使用 Eclipse,不使用 IntelliJ IDEA 吗?
- 评价一下Proxmox VE与ESXi的优劣?
- 有什么是你去河南才明白的事?
- 2025 江西高考本科线历史类 486 分,物理类 429 分较去年降 19 分,怎样看待江西分数线?
- mysql每天有1千万数据 怎么办?分表吗 有什么好的方案。?
- 你觉得《捞女游戏》会因为不可抗力而被下架吗?
- 重装系统之后该装哪些驱动?
- 你为什么在日常生活中不敢穿的太漂亮?
- golang总体上有什么缺陷?
- INTJ 的缺点是什么?
- 中国与敌国发生战争,哪些国家会帮中国?
- 为什么小岛秀夫在游戏《死亡搁浅》系列开发中要使用游骑兵的Decima引擎,为啥不用虚幻5呢?
- 女子被闺蜜按水中后续如何?
- 健身可以不练硬拉吗?
- 什么笑话让你看一次笑一次?
- 忘语能靠《凡人修仙传》吃一辈子吗?
- 穿瑜伽裤爬山的女生会不会害羞?
- 冬天也要穿胸罩吗?





