OpenAI GPT-4o 谷歌Astra谁更强?前者音频更逼真,后者视觉更先进
<p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;">本周,谷歌和 OpenAI 都宣布,<span style="color: black;">她们</span><span style="color: black;">已然</span>构建了“超级”人工智能助手。这些工具<span style="color: black;">能够</span>实时与你<span style="color: black;">交流</span>,并<span style="color: black;">准许</span>你随时打断它们,还能<span style="color: black;">经过</span>实时视频分析你的<span style="color: black;">周边</span>环境,并即时翻译对话。</p>
<p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;">当地时间 5 月 13 日,OpenAI 首次展示了其最新旗舰模型 GPT-4o。</p>
<p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;">在现场演示中,它能阅读睡前故事并<span style="color: black;">帮忙</span><span style="color: black;">处理</span>数学问题,所用的声音听起来就像电影《她》(Her)里华金·菲尼克斯(Joaquin Phoenix)的人工智能女友。</p>
<p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;">显然,OpenAI 的 CEO 山姆·奥特曼(Sam Altman)<span style="color: black;">始终</span>惦记着电影中的这一点。</p>
<p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;">当地时间 5 月 14 日,谷歌宣布了一系列新的人工智能工具,<span style="color: black;">包含</span>一款名为 Gemini Live 的对话助手,它能做的事情和 GPT-4o <span style="color: black;">类似</span>。</p>
<p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;">谷歌还透露,它正在构建一种“无所<span style="color: black;">不可</span>”的人工智能代理,<span style="color: black;">日前</span>正在<span style="color: black;">研发</span>中,但要到 2024 年晚些时候才会发布。</p>
<p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;"><span style="color: black;">火速</span>,你将能够自己探索这些工具,<span style="color: black;">瞧瞧</span><span style="color: black;">是不是</span>会像<span style="color: black;">研发</span>者所<span style="color: black;">期盼</span>的那样,在<span style="color: black;">平常</span>生活中<span style="color: black;">运用</span>这些工具,<span style="color: black;">或</span>它们是不是更像<span style="color: black;">哪些</span>早晚会失去吸引力的小把戏。</p>
<p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;">以下是你应该<span style="color: black;">认识</span>的关于<span style="color: black;">怎样</span><span style="color: black;">拜访</span>这些新工具、<span style="color: black;">运用</span>它们的目的以及<span style="color: black;">关联</span><span style="color: black;">花费</span>的信息。</p>
<p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;"><img src="//q4.itc.cn/images01/20240516/e8cb5165cce84142a37a710994934ca7.png" style="width: 50%; margin-bottom: 20px;"></p>
<p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;"><strong style="color: blue;">OpenAI 的 GPT-4o</strong></p>
<p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;">它的功能:该模型<span style="color: black;">能够</span>实时与你<span style="color: black;">交流</span>,响应延迟约 320 毫秒,OpenAI <span style="color: black;">暗示</span>这与人类的自然对话<span style="color: black;">平起平坐</span>。</p>
<p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;">你<span style="color: black;">能够</span>让该模型解释你用手机摄像头拍摄的任何东西,它<span style="color: black;">能够</span><span style="color: black;">帮忙</span>你完成写代码或翻译文本等任务。它还<span style="color: black;">能够</span>汇总信息,生成图像、字体和 3D 渲染。</p>
<p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;"><span style="color: black;">怎样</span><span style="color: black;">拜访</span>:OpenAI <span style="color: black;">暗示</span>,它将<span style="color: black;">起始</span>在网页和 GPT 应用程序中推出 GPT-4o 的文本和视觉功能,但日期尚未<span style="color: black;">颁布</span>。该<span style="color: black;">机构</span><span style="color: black;">暗示</span>,将在<span style="color: black;">将来</span>几周内<span style="color: black;">增多</span>语音功能,但<span style="color: black;">亦</span>尚未确定<span style="color: black;">详细</span>日期。</p>
<p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;"><span style="color: black;">研发</span>人员<span style="color: black;">此刻</span><span style="color: black;">能够</span><span style="color: black;">经过</span>官方 API <span style="color: black;">运用</span>文本和视觉功能,但语音模式最初只对“一小部分”<span style="color: black;">研发</span>人员开放。</p>
<p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;"><span style="color: black;">花费</span>:<span style="color: black;">运用</span> GPT-4o 将是免费的,但 OpenAI 将设置<span style="color: black;">运用</span>上限,用户<span style="color: black;">能够</span><span style="color: black;">经过</span>订阅来<span style="color: black;">增多</span>上限。</p>
<p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;"><span style="color: black;">针对</span><span style="color: black;">哪些</span>加入 OpenAI 订阅计划(每月 20 美元起)的人,GPT-4o 的<span style="color: black;">信息</span>容量将<span style="color: black;">增多</span>五倍。</p>
<p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;"><img src="//q7.itc.cn/images01/20240516/75620371ed7045c1bea9a567db264d33.png" style="width: 50%; margin-bottom: 20px;"></p>
<p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;"><strong style="color: blue;">谷歌的 Gemini Live</strong></p>
<p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;">什么是 Gemini Live?这是谷歌直接与 GPT-4o 竞争的<span style="color: black;">制品</span>,你<span style="color: black;">能够</span>与之实时对话。谷歌<span style="color: black;">暗示</span>,在 2024 年晚些时候,你还<span style="color: black;">能够</span><span style="color: black;">运用</span>该工具<span style="color: black;">经过</span>视频进行交流。</p>
<p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;">该<span style="color: black;">机构</span>承诺,它将<span style="color: black;">作为</span>一个有用的对话助手,用于准备面试或练习演讲。</p>
<p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;"><span style="color: black;">怎样</span><span style="color: black;">拜访</span>:Gemini Live 将在<span style="color: black;">将来</span>几个月加入谷歌的高级人工智能计划 Gemini Advanced。</p>
<p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;"><span style="color: black;">花费</span>:Gemini Advanced <span style="color: black;">供给</span>两个月的免费试用期,此后每月<span style="color: black;">花费</span>为 20 美元。</p>
<p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;"><span style="color: black;">那样</span> Astra 项目是什么?Astra 是一个构建无所<span style="color: black;">不可</span>的人工智能代理的项目。谷歌在 I/O 大会上演示了该项目,但要到 2024 年晚些时候才会发布。</p>
<p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;">谷歌 DeepMind <span style="color: black;">科研</span>副总裁奥里奥尔·维尼亚尔斯(Oriol Vinyals)告诉《麻省理工科技评论》,人们将能够<span style="color: black;">经过</span>智能手机和台式电脑<span style="color: black;">运用</span> Astra,但该<span style="color: black;">机构</span><span style="color: black;">亦</span>在探索其他<span style="color: black;">选取</span>,例如将其嵌入智能眼镜或其他设备。</p>
<p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;"><img src="//q3.itc.cn/images01/20240516/4659c666390b4679a511de69a6b14de6.png" style="width: 50%; margin-bottom: 20px;"><span style="color: black;">(<span style="color: black;">源自</span>:STEPHANIE ARNETT/MITTR | GOOGLE, OPENAI)</span></p>
<p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;"><img src="//q1.itc.cn/images01/20240516/3022272e01334dd88eecbc26e2d37857.png" style="width: 50%; margin-bottom: 20px;"></p>
<p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;"><strong style="color: blue;">哪个更好?</strong></p>
<p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;">就<span style="color: black;">日前</span>来看,<span style="color: black;">咱们</span>还<span style="color: black;">没法</span>体验这些模型的完整版本,<span style="color: black;">因此</span>很难判断哪个更好。谷歌<span style="color: black;">经过</span>一段精心制作的视频展示了 Astra 项目,而 OpenAI <span style="color: black;">选取</span><span style="color: black;">经过</span>看似更真实的现场演示展示了 GPT-4o。</p>
<p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;">但在这两种<span style="color: black;">状况</span>下,模型都被<span style="color: black;">需求</span>做<span style="color: black;">研发</span>者可能<span style="color: black;">已然</span>练习了<span style="color: black;">非常多</span>次的事情。真正的考验将在它们首次面向数百万有独特需求的用户时到来。</p>
<p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;"><span style="color: black;">亦</span><span style="color: black;">便是</span>说,<span style="color: black;">倘若</span>你将 OpenAI 发布的视频与谷歌的视频进行比较,这两个领先的工具看起来非常<span style="color: black;">类似</span>,<span style="color: black;">最少</span>在易用性方面是如此。</p>
<p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;">整体上看,GPT-4o 似乎在音频方面略微领先,展示了逼真的声音、对话,<span style="color: black;">乃至</span>是唱歌。而 Astra 则展示了更先进的视觉能力,<span style="color: black;">例如</span>能够“记住”你把眼镜忘在哪里了。</p>
<p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;">OpenAI 可能会更快地推出新功能,这<span style="color: black;">寓意</span>着它的<span style="color: black;">制品</span>一<span style="color: black;">起始</span>会比谷歌的<span style="color: black;">制品</span>得到<span style="color: black;">更加多</span>的<span style="color: black;">运用</span>,而谷歌要到 2024 年晚些时候<span style="color: black;">才可</span>完全推出其<span style="color: black;">制品</span>。</p>
<p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;"><span style="color: black;">此刻</span>判断哪个模型产生“幻觉”或虚假信息的频率较低,哪个模型能产生更有用的<span style="color: black;">回复</span>还为时过早。</p>
<p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;"><img src="//q3.itc.cn/images01/20240516/4f7f5e6b64754099bf78019227511042.png" style="width: 50%; margin-bottom: 20px;"></p>
<p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;"><strong style="color: blue;">它们安全吗?</strong></p>
<p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;">OpenAI 和谷歌都<span style="color: black;">暗示</span>,它们的模型经过了很好的测试。OpenAI <span style="color: black;">暗示</span>,GPT-4o 由 70 多位错误信息和社会心理学等<span style="color: black;">行业</span>的专家进行了<span style="color: black;">评定</span>。</p>
<p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;">谷歌<span style="color: black;">暗示</span>,Gemini“<span style="color: black;">持有</span>迄今为止谷歌人工智能模型中最全面的安全<span style="color: black;">评定</span>,<span style="color: black;">包含</span>偏见和毒性。”</p>
<p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;">但这些<span style="color: black;">机构</span>正在构建一个<span style="color: black;">将来</span>,让人工智能模型搜索、审查和<span style="color: black;">评定</span>真实世界的信息,为<span style="color: black;">咱们</span><span style="color: black;">供给</span>问题的答案。与相对简单的聊天<span style="color: black;">设备</span>人相比,更明智的做法是对它们告诉你的信息保持<span style="color: black;">可疑</span>。</p>
<p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;">支持:Ren</p>
<p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;">运营/排版:何晨龙<a style="color: black;"><span style="color: black;">返回<span style="color: black;">外链论坛:www.fok120.com</span>,查看<span style="color: black;">更加多</span></span></a></p>
<p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;"><span style="color: black;">责任编辑:网友投稿</span></p>
这篇文章真的让我受益匪浅,外链发布感谢分享! “板凳”(第三个回帖的人) 一看到楼主的气势,我就觉得楼主同在社区里灌水。 祝福你、祝你幸福、早日实现等。 感谢你的精彩评论,为我的思绪打开了新的窗口。
页:
[1]