天涯论坛

 找回密码
 立即注册
搜索
查看: 62|回复: 5

OpenAI GPT-4o 谷歌Astra谁更强?前者音频更逼真,后者视觉更先进

[复制链接]

2966

主题

144

回帖

9912万

积分

论坛元老

Rank: 8Rank: 8

积分
99129182
发表于 2024-8-13 17:42:14 | 显示全部楼层 |阅读模式

本周,谷歌和 OpenAI 都宣布,她们已然构建了“超级”人工智能助手。这些工具能够实时与你交流,并准许你随时打断它们,还能经过实时视频分析你的周边环境,并即时翻译对话。

当地时间 5 月 13 日,OpenAI 首次展示了其最新旗舰模型 GPT-4o。

在现场演示中,它能阅读睡前故事并帮忙处理数学问题,所用的声音听起来就像电影《她》(Her)里华金·菲尼克斯(Joaquin Phoenix)的人工智能女友。

显然,OpenAI 的 CEO 山姆·奥特曼(Sam Altman)始终惦记着电影中的这一点。

当地时间 5 月 14 日,谷歌宣布了一系列新的人工智能工具,包含一款名为 Gemini Live 的对话助手,它能做的事情和 GPT-4o 类似

谷歌还透露,它正在构建一种“无所不可”的人工智能代理,日前正在研发中,但要到 2024 年晚些时候才会发布。

火速,你将能够自己探索这些工具,瞧瞧是不是会像研发者所期盼的那样,在平常生活中运用这些工具,它们是不是更像哪些早晚会失去吸引力的小把戏。

以下是你应该认识的关于怎样拜访这些新工具、运用它们的目的以及关联花费的信息。

OpenAI 的 GPT-4o

它的功能:该模型能够实时与你交流,响应延迟约 320 毫秒,OpenAI 暗示这与人类的自然对话平起平坐

能够让该模型解释你用手机摄像头拍摄的任何东西,它能够帮忙你完成写代码或翻译文本等任务。它还能够汇总信息,生成图像、字体和 3D 渲染。

怎样拜访:OpenAI 暗示,它将起始在网页和 GPT 应用程序中推出 GPT-4o 的文本和视觉功能,但日期尚未颁布。该机构暗示,将在将来几周内增多语音功能,但尚未确定详细日期。

研发人员此刻能够经过官方 API 运用文本和视觉功能,但语音模式最初只对“一小部分”研发人员开放。

花费运用 GPT-4o 将是免费的,但 OpenAI 将设置运用上限,用户能够经过订阅来增多上限。

针对哪些加入 OpenAI 订阅计划(每月 20 美元起)的人,GPT-4o 的信息容量将增多五倍。

谷歌的 Gemini Live

什么是 Gemini Live?这是谷歌直接与 GPT-4o 竞争的制品,你能够与之实时对话。谷歌暗示,在 2024 年晚些时候,你还能够运用该工具经过视频进行交流。

机构承诺,它将作为一个有用的对话助手,用于准备面试或练习演讲。

怎样拜访:Gemini Live 将在将来几个月加入谷歌的高级人工智能计划 Gemini Advanced。

花费:Gemini Advanced 供给两个月的免费试用期,此后每月花费为 20 美元。

那样 Astra 项目是什么?Astra 是一个构建无所不可的人工智能代理的项目。谷歌在 I/O 大会上演示了该项目,但要到 2024 年晚些时候才会发布。

谷歌 DeepMind 科研副总裁奥里奥尔·维尼亚尔斯(Oriol Vinyals)告诉《麻省理工科技评论》,人们将能够经过智能手机和台式电脑运用 Astra,但该机构在探索其他选取,例如将其嵌入智能眼镜或其他设备。

源自:STEPHANIE ARNETT/MITTR | GOOGLE, OPENAI)‍

哪个更好?

日前来看,咱们没法体验这些模型的完整版本,因此很难判断哪个更好。谷歌经过一段精心制作的视频展示了 Astra 项目,而 OpenAI 选取经过看似更真实的现场演示展示了 GPT-4o。

但在这两种状况下,模型都被需求研发者可能已然练习了非常多次的事情。真正的考验将在它们首次面向数百万有独特需求的用户时到来。

便是说,倘若你将 OpenAI 发布的视频与谷歌的视频进行比较,这两个领先的工具看起来非常类似最少在易用性方面是如此。

整体上看,GPT-4o 似乎在音频方面略微领先,展示了逼真的声音、对话,乃至是唱歌。而 Astra 则展示了更先进的视觉能力,例如能够“记住”你把眼镜忘在哪里了。

OpenAI 可能会更快地推出新功能,这寓意着它的制品起始会比谷歌的制品得到更加多运用,而谷歌要到 2024 年晚些时候才可完全推出其制品

此刻判断哪个模型产生“幻觉”或虚假信息的频率较低,哪个模型能产生更有用的回复还为时过早。

它们安全吗?

OpenAI 和谷歌都暗示,它们的模型经过了很好的测试。OpenAI 暗示,GPT-4o 由 70 多位错误信息和社会心理学等行业的专家进行了评定

谷歌暗示,Gemini“持有迄今为止谷歌人工智能模型中最全面的安全评定包含偏见和毒性。”

但这些机构正在构建一个将来,让人工智能模型搜索、审查和评定真实世界的信息,为咱们供给问题的答案。与相对简单的聊天设备人相比,更明智的做法是对它们告诉你的信息保持可疑

支持:Ren

运营/排版:何晨龙返回外链论坛:www.fok120.com,查看更加多

责任编辑:网友投稿





上一篇:原创 明朝和清朝谁更强?
下一篇:原创 索斯盖特和斯卡洛尼到底谁更强?
回复

使用道具 举报

2950

主题

3万

回帖

9997万

积分

论坛元老

Rank: 8Rank: 8

积分
99979413
发表于 2024-9-29 20:44:13 | 显示全部楼层
这篇文章真的让我受益匪浅,外链发布感谢分享!
回复

使用道具 举报

3048

主题

3万

回帖

9606万

积分

论坛元老

Rank: 8Rank: 8

积分
96065850
发表于 2024-10-12 00:03:33 | 显示全部楼层
“板凳”(第三个回帖的人)‌
回复

使用道具 举报

3048

主题

3万

回帖

9606万

积分

论坛元老

Rank: 8Rank: 8

积分
96065850
发表于 2024-10-15 12:06:03 | 显示全部楼层
一看到楼主的气势,我就觉得楼主同在社区里灌水。
回复

使用道具 举报

2950

主题

3万

回帖

9997万

积分

论坛元老

Rank: 8Rank: 8

积分
99979413
发表于 2024-10-18 02:22:36 | 显示全部楼层
祝福你、祝你幸福、早日实现等。
回复

使用道具 举报

3139

主题

3万

回帖

9996万

积分

论坛元老

Rank: 8Rank: 8

积分
99968622
发表于 2024-11-6 05:04:07 | 显示全部楼层
感谢你的精彩评论,为我的思绪打开了新的窗口。
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

站点统计|Archiver|手机版|小黑屋|天涯论坛 ( 非经营性网站 )|网站地图

GMT+8, 2024-11-23 13:18 , Processed in 0.175407 second(s), 22 queries .

Powered by Discuz! X3.4

Copyright © 2001-2023, Tencent Cloud.