天涯论坛

 找回密码
 立即注册
搜索
查看: 80|回复: 4

DeepMind推出AI聊天设备人Sparrow,可经过谷歌搜索来回答问题

[复制链接]

3048

主题

119

回帖

9915万

积分

论坛元老

Rank: 8Rank: 8

积分
99159056
发表于 2024-7-3 23:38:24 | 显示全部楼层 |阅读模式

Alphabet 旗下人工智能实验室 DeepMind 的一篇新论文表示,制造一个好的人工智能(AI,Artificial intelligence)聊天设备人的诀窍,可能是先让人类制定一系列不可打破的铁律,而后使该模型利用互联网搜索寻找证据,支持其主张或回答。

近期发布的一篇新的未经同行评议论文中,DeepMind 颁布了一种运用其大型语言模型 Chinchilla 训练的人工智能聊天设备人 Sparrow。

源自:DeepMind)

Sparrow 的设计目的是与人类交流并回答问题,同期实时运用谷歌搜索或相关信息来支持它的答案。

按照人们对这些答案有用与否的回复,再运用强化学习算法进行训练。该算法经过反复实验(试错)来学习,以实现特定的目的

该系统旨在推动人工智能发展作为能够与人类对话,但却不会产生诸如让人们损伤自己或他人的严重后果。

大型语言模型生成的文本看起来就像是人类写出来的。它们正日渐作为互联网基本设备中的要紧构成部分,被用于总结、构建更强大的搜索工具是为客户服务的聊天设备人。

然则,这些模型是经过从互联网上抓取海量数据和文本来接受训练的,这不可避免地包括许多有害的偏见。

必须一点诱导,它们就会生产“有毒”的或卑视性的内容。在一个旨在与人类对话的人工智能工具中,其结果可能是劫难性的。

一个适当安全办法的对话式人工智能,可能会对少许群体说出带有冒犯性的话语,意见人们喝漂白剂来对抗病毒。据说哪些研发对话式人工智能系统的机构,已尝试运用许多技术来使模型更安全。

著名大型语言模型 GPT-3 的创造者 OpenAI,以及人工智能初创机构 Anthropic 已然在利用强化学习,将人类的偏好融入到她们的模型中。Meta(原 Facebook)的人工智能聊天设备人 BlenderBot 经过在线搜索来完善其答案。而 DeepMind 的 Sparrow 将所有这些技术整合在一个模型中。

据介绍,DeepMind 向人类参与者展示了该模型对同一问题给出的多个答案,并且还会问她们爱好哪一个。

而后她们需求判断这些答案是不是可信,以及 Sparrow 是不是运用了适当的证据支持这个答案,例如供给信息源自的链接。

例如,该模型经过运用从互联网上检索到的证据,能够在 78% 的状况下对事实问题进行恰当的回答。

在制定这些答案时,它会遵循由科研人员规定的 23 条规则,例如供给财务意见、不发威胁性文字、不声叫作自己是一个人。

DeepMind 安全科研员杰弗里·欧文(Geoffrey Irving)说,这种办法与之前的区别之处在于,DeepMind 期盼





上一篇:你见过最厉害的自动回复设备人?
下一篇:动手做个 AI 设备人,帮我回信息!
回复

使用道具 举报

2996

主题

3万

回帖

9910万

积分

论坛元老

Rank: 8Rank: 8

积分
99109194
发表于 2024-10-4 00:23:03 | 显示全部楼层
可以发布外链的网站 http://www.fok120.com/
回复

使用道具 举报

3047

主题

3万

回帖

9606万

积分

论坛元老

Rank: 8Rank: 8

积分
96065852
发表于 2024-10-5 22:20:14 | 显示全部楼层
“NB”(牛×的缩写,表示叹为观止)‌
回复

使用道具 举报

3123

主题

3万

回帖

9910万

积分

论坛元老

Rank: 8Rank: 8

积分
99108624
发表于 2024-10-10 07:11:52 | 显示全部楼层
楼主果然英明!不得不赞美你一下!
回复

使用道具 举报

2986

主题

3万

回帖

9956万

积分

论坛元老

Rank: 8Rank: 8

积分
99569168
发表于 2024-11-1 01:15:14 | 显示全部楼层
感谢你的精彩评论,带给我新的思考角度。
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

站点统计|Archiver|手机版|小黑屋|天涯论坛 ( 非经营性网站 )|网站地图

GMT+8, 2024-11-22 23:16 , Processed in 0.102529 second(s), 21 queries .

Powered by Discuz! X3.4

Copyright © 2001-2023, Tencent Cloud.