OpenAI GPT-4o 谷歌Astra谁更强？前者音频更逼真，后者视觉更先进

6hz7vif · 发表于 2024-8-13 17:42:14

本周，谷歌和 OpenAI 都宣布，她们已然构建了“超级”人工智能助手。这些工具能够实时与你交流，并准许你随时打断它们，还能经过实时视频分析你的周边环境，并即时翻译对话。

当地时间 5 月 13 日，OpenAI 首次展示了其最新旗舰模型 GPT-4o。

在现场演示中，它能阅读睡前故事并帮忙处理数学问题，所用的声音听起来就像电影《她》（Her）里华金·菲尼克斯（Joaquin Phoenix）的人工智能女友。

显然，OpenAI 的 CEO 山姆·奥特曼（Sam Altman）始终惦记着电影中的这一点。

当地时间 5 月 14 日，谷歌宣布了一系列新的人工智能工具，包含一款名为 Gemini Live 的对话助手，它能做的事情和 GPT-4o 类似。

谷歌还透露，它正在构建一种“无所不可”的人工智能代理，日前正在研发中，但要到 2024 年晚些时候才会发布。

火速，你将能够自己探索这些工具，瞧瞧是不是会像研发者所期盼的那样，在平常生活中运用这些工具，或它们是不是更像哪些早晚会失去吸引力的小把戏。

以下是你应该认识的关于怎样拜访这些新工具、运用它们的目的以及关联花费的信息。

OpenAI 的 GPT-4o

它的功能：该模型能够实时与你交流，响应延迟约 320 毫秒，OpenAI 暗示这与人类的自然对话平起平坐。

你能够让该模型解释你用手机摄像头拍摄的任何东西，它能够帮忙你完成写代码或翻译文本等任务。它还能够汇总信息，生成图像、字体和 3D 渲染。

怎样拜访：OpenAI 暗示，它将起始在网页和 GPT 应用程序中推出 GPT-4o 的文本和视觉功能，但日期尚未颁布。该机构暗示，将在将来几周内增多语音功能，但亦尚未确定详细日期。

研发人员此刻能够经过官方 API 运用文本和视觉功能，但语音模式最初只对“一小部分”研发人员开放。

花费：运用 GPT-4o 将是免费的，但 OpenAI 将设置运用上限，用户能够经过订阅来增多上限。

针对哪些加入 OpenAI 订阅计划（每月 20 美元起）的人，GPT-4o 的信息容量将增多五倍。

谷歌的 Gemini Live

什么是 Gemini Live？这是谷歌直接与 GPT-4o 竞争的制品，你能够与之实时对话。谷歌暗示，在 2024 年晚些时候，你还能够运用该工具经过视频进行交流。

该机构承诺，它将作为一个有用的对话助手，用于准备面试或练习演讲。

怎样拜访：Gemini Live 将在将来几个月加入谷歌的高级人工智能计划 Gemini Advanced。

花费：Gemini Advanced 供给两个月的免费试用期，此后每月花费为 20 美元。

那样 Astra 项目是什么？Astra 是一个构建无所不可的人工智能代理的项目。谷歌在 I/O 大会上演示了该项目，但要到 2024 年晚些时候才会发布。

谷歌 DeepMind 科研副总裁奥里奥尔·维尼亚尔斯（Oriol Vinyals）告诉《麻省理工科技评论》，人们将能够经过智能手机和台式电脑运用 Astra，但该机构亦在探索其他选取，例如将其嵌入智能眼镜或其他设备。

（源自：STEPHANIE ARNETT/MITTR | GOOGLE, OPENAI）‍

哪个更好？

就日前来看，咱们还没法体验这些模型的完整版本，因此很难判断哪个更好。谷歌经过一段精心制作的视频展示了 Astra 项目，而 OpenAI 选取经过看似更真实的现场演示展示了 GPT-4o。

但在这两种状况下，模型都被需求做研发者可能已然练习了非常多次的事情。真正的考验将在它们首次面向数百万有独特需求的用户时到来。

亦便是说，倘若你将 OpenAI 发布的视频与谷歌的视频进行比较，这两个领先的工具看起来非常类似，最少在易用性方面是如此。

整体上看，GPT-4o 似乎在音频方面略微领先，展示了逼真的声音、对话，乃至是唱歌。而 Astra 则展示了更先进的视觉能力，例如能够“记住”你把眼镜忘在哪里了。

OpenAI 可能会更快地推出新功能，这寓意着它的制品一起始会比谷歌的制品得到更加多的运用，而谷歌要到 2024 年晚些时候才可完全推出其制品。

此刻判断哪个模型产生“幻觉”或虚假信息的频率较低，哪个模型能产生更有用的回复还为时过早。

它们安全吗？

OpenAI 和谷歌都暗示，它们的模型经过了很好的测试。OpenAI 暗示，GPT-4o 由 70 多位错误信息和社会心理学等行业的专家进行了评定。

谷歌暗示，Gemini“持有迄今为止谷歌人工智能模型中最全面的安全评定，包含偏见和毒性。”

但这些机构正在构建一个将来，让人工智能模型搜索、审查和评定真实世界的信息，为咱们供给问题的答案。与相对简单的聊天设备人相比，更明智的做法是对它们告诉你的信息保持可疑。

支持：Ren

责任编辑：网友投稿

4lqedz · 发表于 2024-9-29 20:44:13

这篇文章真的让我受益匪浅，外链发布感谢分享！

b1gc8v · 发表于 2024-10-12 00:03:33

“板凳”（第三个回帖的人）‌

b1gc8v · 发表于 2024-10-15 12:06:03

一看到楼主的气势，我就觉得楼主同在社区里灌水。

4lqedz · 发表于 2024-10-18 02:22:36

祝福你、祝你幸福、早日实现等。

m5k1umn · 发表于 2024-11-6 05:04:07

感谢你的精彩评论，为我的思绪打开了新的窗口。

		自动登录	找回密码
密码			立即注册