挑战一篇文案讲清楚ChatGPT相关概念!小学生亦能看懂!
<p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;">生成式AI<span style="color: black;">已然</span>发展数年,还是有不少人弄不清楚Transformer、GPT、大模型、AIGC这些词汇的概念。有<span style="color: black;">非常多</span>非从业者想要<span style="color: black;">认识</span>ChatGPT到底会<span style="color: black;">怎样</span>影响<span style="color: black;">咱们</span>,<span style="color: black;">或</span>有<span style="color: black;">非常多</span>当爹当妈的被<span style="color: black;">孩儿</span>问到却不<span style="color: black;">晓得</span>怎么“幼儿园化”地把这些概念讲清楚。这篇<span style="color: black;">文案</span>,<span style="color: black;">咱们</span>就来<span style="color: black;">处理</span>下这个问题。</p><img src="https://p3-sign.toutiaoimg.com/tos-cn-i-axegupay5k/df11111e98f646d5a59def597a6a7b81~noop.image?_iz=58558&from=article.pc_detail&lk3s=953192f4&x-expires=1724859411&x-signature=%2FHJSUyA%2BtTN19b2SCefUi3LGlH4%3D" style="width: 50%; margin-bottom: 20px;">
<p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;">Transformer、GPT、InstructGPT、大模型、AIGC……<strong style="color: blue;">你是不是被这个概念闹晕了?</strong></p>
<p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;"><span style="color: black;">做为</span>一个文科生+AIGC从业者+市场人,其实要搞懂ChatGPT等等晦涩的概念多多少少有些吃力,我想应该会有不少人<span style="color: black;">亦</span>有这种感觉。</p>
<p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;"><span style="color: black;">然则</span>我看了大部分市场上传播的<span style="color: black;">文案</span>,依然晦涩难懂,造<span style="color: black;">成为了</span>不少认知门槛。</p>
<p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;">今天,我试着挑战,<strong style="color: blue;">用一篇<span style="color: black;">文案</span>搞清楚ChatGPT的<span style="color: black;">关联</span>概念</strong>,一方面让自己加深理解,另一方面,<span style="color: black;">期盼</span>对各位有用。</p>
<h1 style="color: black; text-align: left; margin-bottom: 10px;"><span style="color: black;">1、</span>Transformer</h1>
<p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;">我的理解是,这是一种<strong style="color: blue;">高级的“翻译<span style="color: black;">设备</span>”</strong>,它能够理解和翻译<span style="color: black;">区别</span>语言之间的文本。为了<span style="color: black;">帮忙</span>你更通俗地理解这个模型,<span style="color: black;">咱们</span><span style="color: black;">能够</span>将其比作一个有着超凡记忆力和<span style="color: black;">重视</span>力分配能力的多语言翻译家。</p>
<p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;">这个翻译家有以下几种能力:</p><strong style="color: blue;">自<span style="color: black;">重视</span>力机制:</strong>这个翻译家在阅读一段文本时,不仅关注当前的单词,还能够记住并<span style="color: black;">思虑</span>到<span style="color: black;">全部</span>句子或段落中的其他单词。这种能力使得翻译家能够<strong style="color: blue;"><span style="color: black;">捉捕</span>到文本中的重要信息和上下文关系</strong>,从而更准确地理解和翻译。<strong style="color: blue;">位置编码:</strong>就像翻译家在阅读时会<span style="color: black;">重视</span>到单词在句子中的位置<span style="color: black;">同样</span>,位置编码<span style="color: black;">帮忙</span>模型<strong style="color: blue;">理解单词的<span style="color: black;">次序</span></strong>。这<span style="color: black;">针对</span>理解句子结构和<span style="color: black;">道理</span>非常重要,就像<span style="color: black;">咱们</span><span style="color: black;">晓得</span><strong style="color: blue;">“狗追赶猫”和“猫追赶狗”</strong>这两个句子的意思完全<span style="color: black;">区别</span>。<strong style="color: blue;">编码器和解码器:</strong>模型的编码器部分就像翻译家在理解原文时的<strong style="color: blue;">大脑</strong>,它会分析输入文本的内容和结构。而解码器部分则像是翻译家在创造译文时的大脑,它会基于对原文的理解生成新的句子,相当于设计了一个程序语言。<strong style="color: blue;">多头<span style="color: black;">重视</span>力:</strong>这就像是翻译家有<strong style="color: blue;">多个分身</strong>,<span style="color: black;">每一个</span>分身专注于文本的<span style="color: black;">区别</span>方面,<span style="color: black;">例如</span>语法、词汇<span style="color: black;">选取</span>、文化背景等。<span style="color: black;">经过</span>这种方式,翻译家<span style="color: black;">能够</span>从多个<span style="color: black;">方向</span>理解文本,从而做出更准确的翻译。<strong style="color: blue;">前馈神经网络:</strong><span style="color: black;">能够</span>比作翻译家在处理信息时的<strong style="color: blue;"><span style="color: black;">规律</span>和分析能力</strong>,它会对编码器和解码器的输出进行进一步的分析和加工,<strong style="color: blue;"><span style="color: black;">保证</span>翻译的准确性和流畅性。</strong>
<h1 style="color: black; text-align: left; margin-bottom: 10px;"><span style="color: black;">2、</span>GPT</h1>
<p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;">GPT,一个多层的Transformer解码器,它就像是一个<span style="color: black;">经过</span><span style="color: black;">海量</span>阅读和学习,<strong style="color: blue;"><span style="color: black;">把握</span>了许多语言知识和写作技巧的“虚拟作家”。</strong>这个作家不仅阅读了<span style="color: black;">海量</span>的书籍和<span style="color: black;">文案</span>,<span style="color: black;">况且</span>还学会了<span style="color: black;">怎样</span><span style="color: black;">按照</span>上下文生成连贯、有<span style="color: black;">道理</span>的文本。</p>
<p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;">想象这个作家在成长的过程中,<span style="color: black;">无</span>老师直接告诉他<span style="color: black;">那些</span>句子是正确的,<span style="color: black;">那些</span>是错误的。相反,他<span style="color: black;">经过</span>阅读<span style="color: black;">海量</span>的文本,<strong style="color: blue;">自己学会了语言的规则和模式。</strong>这<span style="color: black;">便是</span>GPT模型的自监督学习,它<span style="color: black;">经过</span>阅读<span style="color: black;">海量</span>未标记的文本数据,自己学习语言的结构和用法。</p>
<p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;">这个作家<span style="color: black;">首要</span><span style="color: black;">经过</span><strong style="color: blue;">广泛的阅读来<span style="color: black;">累积</span>知识(预训练)</strong>,<span style="color: black;">而后</span>在需要写特定类型的<span style="color: black;">文案</span>时,他会针对这种类型进行<strong style="color: blue;">专门的练习(微调)</strong>。GPT模型<span style="color: black;">亦</span>是如此,它<span style="color: black;">首要</span>在<span style="color: black;">海量</span>数据上进行预训练,<span style="color: black;">而后</span>在特定任务上进行微调,以<span style="color: black;">加强</span>在该任务上的表现。</p>
<p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;">在写作时,这个作家只能<span style="color: black;">按照</span>他<span style="color: black;">已然</span>写好的内容来预测下一个字或句子,而<span style="color: black;">不可</span>提前<span style="color: black;">晓得</span>后面的内容。GPT模型<span style="color: black;">运用</span>因果掩码来<span style="color: black;">保证</span>在生成文本时,<span style="color: black;">每一个</span>单词只依赖于它之前的单词,<span style="color: black;">保准</span>了文本的连贯性。</p>
<p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;">随着时间的推移,这个作家<span style="color: black;">持续</span>学习和<span style="color: black;">累积</span>经验,写作技巧<span style="color: black;">亦</span>越来越<span style="color: black;">熟悉</span>。<strong style="color: blue;">GPT-1、GPT-2和GPT-3就像这个作家的<span style="color: black;">区别</span>成长<span style="color: black;">周期</span>,每一代都比前一代阅读了<span style="color: black;">更加多</span>的书籍,<span style="color: black;">把握</span>了<span style="color: black;">更加多</span>的知识,写作能力<span style="color: black;">亦</span>更强。</strong></p>
<p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;">到了GPT-3这个<span style="color: black;">周期</span>,这个作家<span style="color: black;">已然</span>非常<span style="color: black;">熟悉</span>,即使<span style="color: black;">无</span>或<span style="color: black;">仅有</span>很少的示例,他<span style="color: black;">亦</span>能够写出高质量的<span style="color: black;">文案</span>。这<span style="color: black;">寓意</span>着GPT-3能够在<span style="color: black;">无</span>或<span style="color: black;">仅有</span>极少的特定任务训练数据的<span style="color: black;">状况</span>下,理解和完成新的任务。</p>
<h1 style="color: black; text-align: left; margin-bottom: 10px;"><span style="color: black;">3、</span>InstructGPT</h1>
<p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;">什么是InstructGPT?</p>
<p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;"><span style="color: black;">倘若</span> GPT-3想象成一个聪明的学生,<span style="color: black;">那样</span> InstructGPT则是这个学生经过<span style="color: black;">尤其</span>辅导后的样子。</p>
<p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;">GPT-3这个学生虽然学习了<span style="color: black;">非常多</span>知识,但有时候回答问题可能会离题、编造故事、<span style="color: black;">或</span>带有<span style="color: black;">有些</span>不公平的看法。<span style="color: black;">同期</span>,他在进行长对话时,有时会忘记之前说过的内容,<span style="color: black;">引起</span>对话<span style="color: black;">不足</span>连贯。</p>
<p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;">为了让这个学生更好地理解老师(人类用户)的意图,并且<span style="color: black;">根据</span>老师的<span style="color: black;">爱好</span>来回答问题,<span style="color: black;">咱们</span>需要一种<span style="color: black;">办法</span>来<span style="color: black;">调节</span>他的学习方式,这<span style="color: black;">便是</span>“Alignment”(对齐)的概念。</p>
<p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;">为了让GPT-3变得更好,<span style="color: black;">咱们</span>给他请了一个<span style="color: black;">尤其</span>的家教(RLHF),这个家教<span style="color: black;">经过</span>收集老师的反馈来<span style="color: black;">晓得</span><span style="color: black;">那些</span>答案是好的,<span style="color: black;">那些</span>是<span style="color: black;">欠好</span>的。<span style="color: black;">而后</span>,家教用这些反馈来<span style="color: black;">指点</span>学生学习,<span style="color: black;">帮忙</span>他在<span style="color: black;">将来</span>给出更符合老师期望的答案。</p>
<h1 style="color: black; text-align: left; margin-bottom: 10px;"><span style="color: black;">4、</span>ChatGPT(GPT3.5/GPT4.0)</h1>
<p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;">我的理解是, ChatGPT就像是一个<strong style="color: blue;">全能的、知识渊博的<span style="color: black;">设备</span>人图书管理员</strong>,随时准备<span style="color: black;">帮忙</span>你解答问题和<span style="color: black;">供给</span>信息。<span style="color: black;">况且</span>,随着时间的推移,它会学到<span style="color: black;">更加多</span>的东西,变得更加聪明和有用。</p>
<p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;">这个<span style="color: black;">设备</span>人图书管理员不仅<span style="color: black;">晓得</span><span style="color: black;">非常多</span>关于书籍和文字的知识,它还能理解<span style="color: black;">照片</span>。<span style="color: black;">因此</span>,<span style="color: black;">倘若</span>你给它看一张<span style="color: black;">照片</span>,它不仅能告诉你<span style="color: black;">照片</span>里有什么,还能<span style="color: black;">按照</span><span style="color: black;">照片</span>给你讲一个故事<span style="color: black;">或</span>回答你关于<span style="color: black;">照片</span>的问题。</p>
<h1 style="color: black; text-align: left; margin-bottom: 10px;"><span style="color: black;">5、</span>大模型</h1>
<p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;"><span style="color: black;">怎样</span>理解这一概念?</p>
<p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;"><span style="color: black;">咱们</span>用一个小学生<span style="color: black;">亦</span>能理解的方式来解释这些概念。</p>
<p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;">想象一下,有一个非常非常大的学校,这个学校有<span style="color: black;">非常多</span>层楼和<span style="color: black;">非常多</span>教室。这个<strong style="color: blue;">学校就像是一个“大模型”</strong>,它有<span style="color: black;">非常多</span><strong style="color: blue;">老师(参数)和学生(数据)</strong>。这些老师非常聪明,<span style="color: black;">她们</span><span style="color: black;">能够</span>教<span style="color: black;">非常多</span><span style="color: black;">区别</span>的课程,<span style="color: black;">例如</span>数学、语文、科学等等。</p><strong style="color: blue;">模型架构设计:</strong>这个学校的建筑(模型架构)设计得很<span style="color: black;">尤其</span>,有<span style="color: black;">非常多</span>教室和走廊,<span style="color: black;">这般</span>老师们就<span style="color: black;">能够</span>在<span style="color: black;">区别</span>的教室里教<span style="color: black;">区别</span>的课程,<span style="color: black;">况且</span>学生们<span style="color: black;">亦</span><span style="color: black;">能够</span><span style="color: black;">容易</span>地从一个教室<span style="color: black;">步行到</span>另一个教室。<strong style="color: blue;">数据准备:</strong>为了让老师们教得更好,学校收集了<span style="color: black;">非常多</span>教科书和练习册(数据),<span style="color: black;">这般</span>老师们就<span style="color: black;">能够</span>用这些资料来准备课程,并且<span style="color: black;">帮忙</span>学生们学习。<strong style="color: blue;">计算资源:</strong><span style="color: black;">由于</span>这个学校非常大,<span style="color: black;">因此</span>需要<span style="color: black;">非常多</span>电脑和服务器(计算资源)来<span style="color: black;">帮忙</span>老师们准备课程和批改作业。<strong style="color: blue;">优化算法:</strong>学校还有一个非常聪明的校长(优化算法),他会<span style="color: black;">保证</span>老师们用最好的<span style="color: black;">办法</span>来<span style="color: black;">教育</span>,并且<span style="color: black;">帮忙</span>学生们取得好成绩。<strong style="color: blue;">正则化技术:</strong>有时候,老师们可能会对某个课程太专注,忽略了其他课程。校长会<span style="color: black;">保证</span>这种<span style="color: black;">状况</span>不会<span style="color: black;">出现</span>,让所有的课程都得到平衡(这<span style="color: black;">便是</span>正则化技术)。<strong style="color: blue;">模型并行和数据并行:</strong><span style="color: black;">由于</span>这个学校有<span style="color: black;">非常多</span>学生,<span style="color: black;">因此</span>老师们会分成小组来教课(模型并行),<span style="color: black;">同期</span>,学生们<span style="color: black;">亦</span>会分成小组来学习(数据并行)。<p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;"><span style="color: black;">此刻</span>,这个学校有<span style="color: black;">非常多</span>成功的毕业生,<span style="color: black;">例如</span>GPT-3、BERT和T5等。<span style="color: black;">她们</span>都是在这个大学校里学习过的,<span style="color: black;">此刻</span><span style="color: black;">她们</span><span style="color: black;">能够</span><span style="color: black;">帮忙</span>人们<span style="color: black;">处理</span><span style="color: black;">非常多</span>问题,<span style="color: black;">例如</span>写作文、做数学题<span style="color: black;">或</span>解答科学问题。</p>
<p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;"><span style="color: black;">因此</span>,这个大学校(大模型)就像是一个能够培养出<span style="color: black;">非常多</span>聪明学生的好<span style="color: black;">地区</span>,虽然它需要<span style="color: black;">非常多</span>资源和<span style="color: black;">奋斗</span>来运营,<span style="color: black;">然则</span>它能够<span style="color: black;">帮忙</span><span style="color: black;">咱们</span>做<span style="color: black;">非常多</span>事情,让<span style="color: black;">咱们</span>的生活变得更好。</p>
<h1 style="color: black; text-align: left; margin-bottom: 10px;"><span style="color: black;">6、</span>AIGC(人工智能生成内容)</h1>
<p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;">想象一下,你有一个非常聪明的<span style="color: black;">设备</span>人<span style="color: black;">伴侣</span>,它<span style="color: black;">能够</span>做<span style="color: black;">非常多</span>事情,<span style="color: black;">例如</span>画画、写故事、<span style="color: black;">乃至</span>帮你做数学题。这个<span style="color: black;">设备</span>人<span style="color: black;">伴侣</span><span style="color: black;">便是</span>人工智能(AI)的一个例子。</p>
<p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;"><strong style="color: blue;">AIGC(人工智能生成内容):</strong>这个<span style="color: black;">设备</span>人<span style="color: black;">伴侣</span><span style="color: black;">能够</span>创造<span style="color: black;">非常多</span>东西,就像一个会画画和写故事的艺术家。它<span style="color: black;">能够</span>画出你想象中的图画,<span style="color: black;">或</span>写出一个关于你最<span style="color: black;">爱好</span>的超级英雄的故事。这<span style="color: black;">便是</span>人工智能生成内容,<span style="color: black;">寓意</span>着<span style="color: black;">设备</span>人<span style="color: black;">能够</span>用它的大脑(AI技术)来创造新的东西。</p>
<p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;"><strong style="color: blue;">Diffusion(扩散模型):</strong>想象你把一滴墨水滴进清水里,墨水会慢慢散开,最后水变得浑浊。<span style="color: black;">设备</span>人<span style="color: black;">伴侣</span>就像能够把这个浑浊的水变回清澈<span style="color: black;">同样</span>,它<span style="color: black;">能够</span>从一团混乱的噪点中创造出清晰的图画。</p>
<p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;"><strong style="color: blue;">CLIP(图文表征模型):</strong><span style="color: black;">倘若</span>你给这个<span style="color: black;">设备</span>人<span style="color: black;">伴侣</span>看<span style="color: black;">非常多</span><span style="color: black;">照片</span>和它们的名字(<span style="color: black;">例如</span>“苹果”、“小狗”、“汽车”),它会学会识别这些<span style="color: black;">照片</span>。下次你给它看一个新的<span style="color: black;">照片</span>,它就能告诉你<span style="color: black;">照片</span>里是什么。</p>
<p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;"><strong style="color: blue;">Stable Diffusion(稳定扩散模型):</strong>这个<span style="color: black;">设备</span>人<span style="color: black;">伴侣</span>还<span style="color: black;">能够</span><span style="color: black;">按照</span>你给它的提示来画画。<span style="color: black;">例如</span>你告诉它“画一个<span style="color: black;">愉快</span>的小狗”,它就能画出一个小狗的图画,<span style="color: black;">况且</span>这个小狗看起来很开心。</p>
<h1 style="color: black; text-align: left; margin-bottom: 10px;"><span style="color: black;">7、</span>AGI(通用人工智能)</h1>
<p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;">想象一下,<span style="color: black;">倘若</span>这个<span style="color: black;">设备</span>人<span style="color: black;">伴侣</span>不仅会画画和写故事,还能像人类<span style="color: black;">同样</span>理解世界,学习任何东西,并且<span style="color: black;">能够</span>做任何工作,<span style="color: black;">那样</span>它就像一个真正的小<span style="color: black;">伴侣</span><span style="color: black;">同样</span>了。<strong style="color: blue;">这<span style="color: black;">便是</span>通用人工智能,它能够做任何人类能做的事情。</strong></p>
<p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;"><span style="color: black;">此刻</span>的AI,<span style="color: black;">例如</span>GPT,就像是一个在某个特定<span style="color: black;">行业</span>(<span style="color: black;">例如</span>写故事)非常<span style="color: black;">善于</span>的<span style="color: black;">设备</span>人,但它并不像真正的小<span style="color: black;">伴侣</span>那样理解世界。<span style="color: black;">专家</span>们正在<span style="color: black;">奋斗</span>让AI变得更像人类,但这是一个很大的挑战,需要<span style="color: black;">非常多</span>时间和<span style="color: black;">科研</span>。</p>
<p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;"><span style="color: black;">因此</span>,<strong style="color: blue;">AIGC<span style="color: black;">便是</span>让AI像艺术家<span style="color: black;">同样</span>创造内容,而AGI是让AI变得像人类<span style="color: black;">同样</span>理解和<span style="color: black;">办事</span>。</strong></p>
<h1 style="color: black; text-align: left; margin-bottom: 10px;">八、LLM(大型语言模型)</h1>
<p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;">大型语言模型就像是一个非常非常聪明的图书管理员,它读过<span style="color: black;">非常多</span>书,<span style="color: black;">晓得</span><span style="color: black;">非常多</span>关于语言的知识,<span style="color: black;">能够</span><span style="color: black;">帮忙</span><span style="color: black;">咱们</span>做<span style="color: black;">非常多</span>事情,<span style="color: black;">乃至</span><span style="color: black;">能够</span>自己写故事。</p>
<p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;">想象一下,这个图书馆管理员<span style="color: black;">每日</span>都在阅读图书馆里的成千上万的书籍。它<span style="color: black;">经过</span>阅读这些书籍,学会了<span style="color: black;">非常多</span>单词、句子和故事。这<span style="color: black;">便是</span>大型语言模型的训练过程,它通过阅读<span style="color: black;">海量</span>的文本数据来学习语言。</p>
<p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;"><span style="color: black;">由于</span>读过<span style="color: black;">非常多</span>书,这个管理员<span style="color: black;">能够</span>帮你做<span style="color: black;">非常多</span>事情。<span style="color: black;">例如</span>,它<span style="color: black;">能够</span>给你讲一个故事的摘要,<span style="color: black;">或</span>帮你把一个故事翻译成另一种语言,<span style="color: black;">乃至</span><span style="color: black;">能够</span>告诉你一个故事里的<span style="color: black;">名人</span>是开心还是伤心。大型语言模型<span style="color: black;">亦</span>是<span style="color: black;">这般</span>,它<span style="color: black;">能够</span>执行<span style="color: black;">非常多</span><span style="color: black;">区别</span>的任务,<span style="color: black;">例如</span>文本总结、翻译和情感分析。</p>
<p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;"><strong style="color: blue;">这个管理员之<span style="color: black;">因此</span>这么聪明,是<span style="color: black;">由于</span>它有一个超级大脑,里面有<span style="color: black;">非常多</span>“小房间”(参数),</strong><span style="color: black;">每一个</span>“小房间”都存储着<span style="color: black;">区别</span>的信息和知识。大型语言模型<span style="color: black;">亦</span>是<span style="color: black;">这般</span>,它有<span style="color: black;">非常多</span>参数,这些参数<span style="color: black;">帮忙</span>它记住和理解语言的<span style="color: black;">繁杂</span>规则和模式。</p>
<p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;">当你问这个管理员一个问题,<span style="color: black;">或</span>给它一个主题时,它<span style="color: black;">能够</span>给你一个答案<span style="color: black;">或</span>讲一个故事。它<span style="color: black;">能够</span><span style="color: black;">按照</span>它读过的书籍和学到的知识,创造出连贯和有<span style="color: black;">道理</span>的文本。大型语言模型<span style="color: black;">亦</span>是<span style="color: black;">这般</span>,它<span style="color: black;">能够</span>生成新的文本,就像它自己在写故事<span style="color: black;">同样</span>。</p>
<p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;"><strong style="color: blue;">GPT-3、ChatGPT、BERT和T5就像是<span style="color: black;">区别</span><span style="color: black;">行业</span>的图书馆管理员</strong>,有的可能更<span style="color: black;">善于</span>讲故事,有的可能更<span style="color: black;">善于</span>解释科学知识,而文心一言就像是会写诗的图书管理员。它们都有自己的特长,但都能<span style="color: black;">帮忙</span><span style="color: black;">咱们</span>理解和<span style="color: black;">运用</span>语言。</p>
<h1 style="color: black; text-align: left; margin-bottom: 10px;"><span style="color: black;">9、</span>Fine-tuning(微调)</h1>
<p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;"><strong style="color: blue;">微调就像是在你<span style="color: black;">已然</span>学会一项技能的<span style="color: black;">基本</span>上,做<span style="color: black;">有些</span>小的改变和练习,让你能够更好地完成一个特定的任务。</strong><span style="color: black;">这般</span>做<span style="color: black;">能够</span>节省时间,<span style="color: black;">由于</span>你不需要重新学习所有的东西,只需要专注于你需要改进的部分。</p>
<p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;">举个例子,你在学习骑<span style="color: black;">自动</span>车。你的爸爸或妈妈先带你在一个空旷的大公园里练习(这就像是预训练模型,公园里的<span style="color: black;">各样</span>地形就像是<span style="color: black;">海量</span>的数据,<span style="color: black;">帮忙</span>你学会骑车的基本技巧)。</p>
<p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;"><span style="color: black;">此刻</span>你<span style="color: black;">已然</span>会骑车了,<span style="color: black;">然则</span>你想学习<span style="color: black;">怎样</span>在你家<span style="color: black;">周边</span>的小山丘上骑(这就像是一个新的任务,需要微调)。<span style="color: black;">由于</span>小山丘的路和公园里的路可能不<span style="color: black;">同样</span>,有上坡、下坡和弯道,<span style="color: black;">因此</span>你需要<span style="color: black;">有些</span><span style="color: black;">尤其</span>的练习来适应这些新的<span style="color: black;">状况</span>。</p>
<p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;">你的爸爸或妈妈会带你在小山丘上练习几天,<span style="color: black;">这般</span>你就会<span style="color: black;">晓得</span><span style="color: black;">怎样</span>在上坡时蹬得更用力,在下坡时<span style="color: black;">掌控</span>速度,在弯道时转弯(这<span style="color: black;">便是</span>微调过程,你在学习<span style="color: black;">怎样</span>应用你<span style="color: black;">已然</span><span style="color: black;">把握</span>的骑车技巧来适应新的环境)。</p>
<p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;">微调的好处是,<span style="color: black;">由于</span>你<span style="color: black;">已然</span><span style="color: black;">晓得</span>怎么骑车了,<span style="color: black;">因此</span>你不需要再从零<span style="color: black;">起始</span>学习,只需要做<span style="color: black;">有些</span>小的<span style="color: black;">调节</span>就<span style="color: black;">能够</span>了。这就像是微调一个<span style="color: black;">已然</span>预训练好的模型,让它适应一个新的任务,<span style="color: black;">例如</span>理解医学文本。</p>
<h1 style="color: black; text-align: left; margin-bottom: 10px;">十、 自监督学习(Self-Supervised Learning)</h1>
<p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;"><strong style="color: blue;">自监督学习就像是<span style="color: black;">经过</span>读故事和玩游戏来学习新单词,而不需要别人告诉<span style="color: black;">咱们</span>答案。</strong><span style="color: black;">这般</span>,<span style="color: black;">咱们</span><span style="color: black;">能够</span>用<span style="color: black;">非常多</span><span style="color: black;">无</span>标签的数据来训练模型,让模型变得更聪明。</p>
<p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;"><span style="color: black;">例如</span>你正在读一本非常有趣的故事书。你读了<span style="color: black;">非常多</span>页,学到了故事里的<span style="color: black;">非常多</span>新单词和句子。<span style="color: black;">此刻</span>,<span style="color: black;">倘若</span>你的<span style="color: black;">伴侣</span>在旁边,你<span style="color: black;">能够</span>玩一个游戏:你给他读故事的一部分,<span style="color: black;">而后</span>遮住<span style="color: black;">有些</span>单词,让你的<span style="color: black;">伴侣</span>猜下一个单词是什么。这个游戏就像是自监督学习。</p>
<p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;">在这个游戏中,你的<span style="color: black;">伴侣</span>不需要别人告诉他正确的答案是什么,<span style="color: black;">由于</span>故事的上下文(<span style="color: black;">已然</span>读过的部分)<span style="color: black;">便是</span>线索。你的<span style="color: black;">伴侣</span><span style="color: black;">能够</span><span style="color: black;">经过</span>他<span style="color: black;">已然</span><span style="color: black;">晓得</span>的单词和故事的内容来猜测下一个单词。这就是自监督学习的方式,模型<span style="color: black;">经过</span><span style="color: black;">已然</span><span style="color: black;">晓得</span>的信息来学习新的东西,而不需要额外的答案或标签。</p>
<p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;">以上,<span style="color: black;">便是</span>我的本周观察和思考,欢迎讨论。</p>
<p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;"><strong style="color: blue;">专栏作家</strong></p>
<p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;">黄河懂运营,<span style="color: black;">微X</span>公众号:黄河懂运营,人人都是<span style="color: black;">制品</span>经理专栏作家。5年+运营实操经验,甲乙方市场/营销/运营经验,<span style="color: black;">善于</span>从0到1<span style="color: black;">帮忙</span>企业搭建运营增长体系,在项目管理、市场调研、消费者心理<span style="color: black;">科研</span>、社媒营销等方面有较为丰富的实战经验。</p>
<p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;">本文原创发布于人人都是<span style="color: black;">制品</span>经理,未经许可,禁止转载。</p>
<p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;">题图来自 Unsplash,基于 CC0 协议。</p>
<p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;">该文观点仅<span style="color: black;">表率</span>作者<span style="color: black;">自己</span>,人人都是<span style="color: black;">制品</span>经理平台仅<span style="color: black;">供给</span>信息存储空间服务。</p>
楼主发的这篇帖子,我觉得非常有道理。 可以发布外链的网站 http://www.fok120.com/ 真情实感,其含义为认真了、走心了的意思,是如今的饭圈常用语。 seo常来的论坛,希望我的网站快点收录。
页:
[1]