OpenAI“草莓”落地了？ChatGPT惊现奥秘GPT-4o模型，网友热榜：新版本加强不多，草莓单词测试依然“翻车”，但规律推理有改进

m5k1umn · 发表于 2024-8-22 13:10:55

每经记者：文巧每经实习记者：岳楚鹏每经编辑：兰素英

当地时间8月13日，OpenAI的聊天设备人账号@ChatGPTapp发帖宣布，自上周败兴，ChatGPT上了一个新的GPT-4o模型。

按照该账号的回帖，新上线的ChatGPT-4o模型并不是上周发布的API端GPT-4o 0806模型，日前该模型亦对免花费户开放，不外有运用次数的限制。

照片源自：X

这一信息立刻诱发了网友的热榜与猜测：难道这便是传说中的“草莓”项目？之因此网友的热情如此之高，是由于“草莓”项目的前身是Q*算法模型，Q*能够处理棘手的科学和数学问题。倘若AI模型把握了数学能力，将持有更强的推理能力，乃至与人类智能相媲美。

然而，在随后的测试中，网友们发掘新模型与原来的版本相比，无太大改善，亦未能经过经典的草莓单词测试，不外在规律推理方面还是有所改进。

GPT-4o家族上新，“草莓”落地？

网友的激动并非毫无缘由。

新模型发布的前1星期，OpenAI CEO阿尔特曼在X上发布了一张花园里的草莓照片，网友随即联想到了OpenAI团队此前被爆出的一个名为“草莓（Strawberry）”的项目。但针对评论区的猜测，阿尔特曼自己无证实，亦无否认，只是确认这张照片拍的是他现实中的花园。

而后，ChatGPT账号发了一个草莓表情，OpenAI员工特里弗·克里奇发了餐盘上的草莓照片，以及爆料人@iruletheworldmo亦频繁更新，几乎次次都与草莓关联，这些似乎都指向了一个可能即将揭晓的重要时刻。

因此呢，当ChatGPT账号宣布GPT-4o家族更新，网友们的心情和讨论亦达到了高点，这一更新是不是便是“草莓”的落地？

不外，随着测试信息的披露，网友发掘，这一更新并没能满足她们的预期。况且，针对新模型的详细改进和新功能，OpenAI却出奇地保持了沉默。

一系列测试表示，新模型与之前的模型相比并无太大的改善。在经典的草莓单词测试中，新模型还是显现了错误。大都数测试者反馈叫作，她们并无感受到显著的性能提高。有的网友乃至直言基本分不清楚新版本和旧版本到底有什么区别。

照片源自：X

但这次更新并非无亮点。有些用户指出，新模型在规律推理方面有所改进，例如它再也不轻易陷入规律循环。另一，新模型的响应速度亦比之前的版本快了不少。

有网友还总结出了新旧模型之间的三点差异：一是输出风格略有区别，其次推理略有改进，再也不陷入循环，最后是更加亲切，更愿意探索其存在的哲学层面（更少设备人化，更像Claude）。然则他亦承认新旧模型之间的差异不大。

源自：X

AI发展背面的安全挑战

针对这些评论，ChatGPT的回复是：“还有非常多工作要做，咱们正在奋斗。”至于新更新是不是是备受关注的“草莓”，外界依然不得而知。

之因此网友们的热情如此高涨，是由于“草莓”项目的前身是Q*算法模型，Q*能够处理棘手的科学和数学问题。倘若AI模型把握了数学能力，将持有更强的推理能力，乃至与人类智能相媲美。而这一点是日前的大语言模型还没法做到的。

尽管这一办法有可能使模型在智能上实现质的飞跃，但其伴同的危险性亦不容忽略。正如斯坦福大学教授、STaR技术的研发者之一Noah Goodman所言：“这种技术潜能巨大，但同期亦伴同着相当大的危害。”

据外媒此前报告，“草莓”项目的训练触及对经过后期训练的模型（这些模型已然针对特定用途或应用进行了有效的后期训练）进行最后微调。这一过程类似于斯坦福大学的自学推理机（STaR）技术。STaR技术准许AI模型经过反复创建自己的训练数据，“引导”自己进入更高的智能水平，理论上能够让语言模型达到超越人类的智能水平。

值得重视的是，OpenAI此前多次因安全问题而受到质疑。今年7月，OpenAI的一名内部人士向美国证券交易委员会（SEC）投诉，指控机构经过违法限制性保密协议限制员工对外披露与机构技术潜在安全问题关联的信息。更早之前，OpenAI原超级对齐团队负责人Jane Leike在离职后亦指责机构忽略安全文化，只注重“闪亮的制品”而非安全。

而在8月9日，OpenAI发布了一篇关于安全性的博客文案，仔细介绍了机构在研发ChatGPT用户的旗舰模型GPT-4o时所做的安全奋斗，并探讨了这些技术可能对社会带来的危害。

OpenAI警告叫作，用户可能会与AI创立社会关系，从而减少对人际交往的需要——这或许对孤独的人有益，但亦可能影响健康的社会关系。与AI的长时间互动乃至可能影响社会规范，例如，模型准许用户随时打断和“拿走麦克风”，这种行径虽然对AI来讲理所当然，但在人际交往中却显出粗鲁。

在谈到GPT-4o的初期测试时，OpenAI透露，她们观察到用户与模型的互动语言起始显现微妙的变化，例如，表达一起纽带的语言，“这是咱们在一块的最后一天”等等。这种看似无害的行径，背面可能隐匿着更大的问题。

另外，OpenAI还说到，GPT-4o有时会无意间生成模仿用户声音的输出。换句话说，它可能被用来冒充他人，从而被利用进行犯罪活动。

每日经济资讯返回外链论坛：www.fok120.com，查看更加多

责任编辑：网友投稿

4zhvml8 · 发表于 2024-9-30 19:17:36

可以发布外链的网站 http://www.fok120.com/

j8typz · 发表于 2024-10-5 12:51:25

感谢你的精彩评论，为我的思绪打开了新的窗口。

		自动登录	找回密码
密码			立即注册

OpenAI“草莓”落地了？ChatGPT惊现奥秘GPT-4o模型，网友热榜：新版本加强不多，草莓单词测试依然“翻车”，但规律推理有改进

浏览过的版块