nqkk58 发表于 2024-6-30 14:23:31

知乎 AI 革命:智能搜索与实时问答的融合


    <p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;">在生成式人工智能(Generative AI)的信息技术跃迁背景下,<span style="color: black;">怎样</span>看待知乎当下和<span style="color: black;">将来</span>,有三个基本的视角:</p>
    <p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;">它是大语言模型预训练中文语料最<span style="color: black;">要紧</span><span style="color: black;">源自</span>之一,例如<span style="color: black;">近期</span>现象级的大模型聊天应用 Kimi Chat,就以知乎为<span style="color: black;">要紧</span>的训练资料<span style="color: black;">源自</span>(<span style="color: black;">乃至</span>是 80% 以上的<span style="color: black;">源自</span>)。</p>
    <p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;">每一个在知乎上提问的用户,其实都是在发 prompt(提示词);而每一个知乎的答主,基本都相当于基于个人知识和经验(语料)、价值观和思考<span style="color: black;">规律</span>(算法和思维链)的人肉语言模型。基于此,基于大语言模型的 " 数字人答主 " 会在知乎<span style="color: black;">持续</span><span style="color: black;">显现</span>。</p>
    <p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;">鉴于 " 提问——回答 " 是知乎<span style="color: black;">做为</span>内容社区运转的基本<span style="color: black;">规律</span>,<span style="color: black;">亦</span>是一系列大语言模型<span style="color: black;">工具</span>运转的基本逻辑,还是搜索引擎 20 年<span style="color: black;">连续</span>进化的主线—— Google、百度,还有新型的 AI 问答聚合<span style="color: black;">工具</span> Perplexity,近期所做的一切,实质都是搜索引擎的 AI 化。<span style="color: black;">因此呢</span>,知乎的搜索属性——基于 AI 的搜索,将得到强化。</p>
    <p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;">基于这三个视角,在 AI 的众声喧哗之侧的知乎,有以下可能拥抱生成式人工智能浪潮的方式:</p>
    <p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;">做更好的中文预训练语料<span style="color: black;">供给</span>商,<span style="color: black;">作为</span>高质量中文语料的永动机,<span style="color: black;">供给</span>更高质量的、由人而不是<span style="color: black;">设备</span>创造的中文内容,让这些内容有<span style="color: black;">更加多</span>被采集、<span style="color: black;">运用</span>和预训练的可能。参与国家级中文语料库建设,<span style="color: black;">作为</span><span style="color: black;">要紧</span>的语料建设者。</p>
    <p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;"><span style="color: black;">全部</span>社区的激进 AI 化。AI 进行提问,更负责回答。知乎社区将<span style="color: black;">显现</span><span style="color: black;">海量</span>的 AI 数字人<span style="color: black;">做为</span>独立的 IP ——历史的、科技的、医学的、文学的垂直<span style="color: black;">行业</span>数字人,让<span style="color: black;">她们</span>回答用户的提问,给出用户想要的答案。</p>
    <p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;">以搜索为突破,以知乎自己的大模型能力(知海图 AI)为依托,让大模型参与部分问题答案的生成和总结,提示用户追问,引导用户在知乎社区内进行 " 多轮对话 ",从而吸引<span style="color: black;">更加多</span>的答主,让大模型<span style="color: black;">作为</span>激发用户活跃度的催化剂。</p>
    <p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;">以上三个路径,<span style="color: black;">第1</span>个保守,第二个激进,第三个是前两者的结合。知乎<span style="color: black;">选取</span>哪条路径,取决于知乎是什么,它在大语言模型生态产业链<span style="color: black;">其中</span>的角色是什么,以及它<span style="color: black;">善于</span>什么。</p>
    <p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;"><img src="https://q7.itc.cn/q_70/images03/20240331/e6f3996b2f2d4c2d845f70677a61a75d.jpeg" style="width: 50%; margin-bottom: 20px;"></p>
    <p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;">3 月 20 日的 " <span style="color: black;">发掘</span>大会 " 上,知乎推出了三个与 AI <span style="color: black;">关联</span>功能——</p>
    <p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;">一个是搜索,<span style="color: black;">帮忙</span>用户找到社区的 " 共识 "。</p>
    <p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;">它其实相当于知乎站内的 Perpelexity ——用户提出问题,知海图 AI 模型基于社区内的内容,生成用户<span style="color: black;">必须</span>的答案。并不是所有的内容都能在知乎上找到答主生成的答案,<span style="color: black;">非常多</span>时候,一个有深度的、<span style="color: black;">必须</span>专业知识支撑的问题,<span style="color: black;">必须</span>很久<span style="color: black;">才可</span>有专业<span style="color: black;">行业</span>的答主<span style="color: black;">供给</span>高质量的答案。但<span style="color: black;">这般</span>的问题,散落在社区各个角落的答主们针对其它问题的各条高质量答案,是<span style="color: black;">能够</span><span style="color: black;">做为</span>参考依据的。这个时候,<span style="color: black;">倘若</span> AI 能<span style="color: black;">经过</span>搜索和生成,将这些答案里的有价值信息提炼出来,进行有效的推理,就能为一个 " <span style="color: black;">鲜嫩</span>出炉 " 的专业问题<span style="color: black;">供给</span>一个立等可取的答案,提问的用户就<span style="color: black;">能够</span>能为快,<span style="color: black;">而后</span>再等其它的专业答主<span style="color: black;">持续</span>赶到,下场答题。</p>
    <p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;">在灰度测试这个功能的时候,知乎消费电子<span style="color: black;">行业</span>的专业答主 Navis Li 提出过一个专业问题:俄罗斯或前苏联<span style="color: black;">好似</span>有一个著名的镜头<span style="color: black;">能够</span>实现旋转的焦外虚化效果,镜头<span style="color: black;">详细</span>是什么?讲真,面对这种极度偏门专业的冷知识,等人来答<span style="color: black;">必须</span>花很长的时间,<span style="color: black;">亦</span>可能等不到。但基于 AI 搜索,知乎其它专业答主和社区创作者在其它问题下面的答案经过提炼、分析和推理,给出了一个准确的答案。</p>
    <p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;">第二个是实时问答,用于完成公共编辑。</p>
    <p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;">它相当于 AI 生成的站内维基百科。一个高质量的提问下面可能有成百<span style="color: black;">乃至</span>上千的答案,其中的高赞答案可能<span style="color: black;">亦</span>不下几十个。是不是<span style="color: black;">每一个</span>人都有时间和耐心读完所有的答案,再形成一个自己<span style="color: black;">必须</span>的知识输出?这恐怕不太现实。它<span style="color: black;">必须</span>一个基于创作者的答案的 " 最佳答案 ",<span style="color: black;">亦</span><span style="color: black;">便是</span>最佳答案的提炼、萃取的维基百科功能。早年的知乎是有这个功能的,<span style="color: black;">大众</span><span style="color: black;">经过</span>公共编辑,对所有的回答进行总结," 众创 " 出一个最佳回答。这个初衷是理想的,现实却有些骨感。它反倒<span style="color: black;">成为了</span>知乎颇受争议的功能。<span style="color: black;">由于</span>人的主观、偏见和倾向是难以避免的,是容易制造更大冲突、对立和争议的,以至于知乎不得不下线了这个功能。</p>
    <p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;">真正适合做 " 维基百科 " 工作的,是 AI。AI 的偏见<span style="color: black;">不可</span>说<span style="color: black;">无</span>,但<span style="color: black;">能够</span><span style="color: black;">经过</span>强化训练得到约束和<span style="color: black;">掌控</span>。AI 的提炼和推理能力是呈指数级<span style="color: black;">提高</span>的。<span style="color: black;">因此呢</span>,基于创作者回答的 " 最佳回答 ",<span style="color: black;">此刻</span>有了更好的生成者——大语言模型。这个实时问答其实是基于 AI 的公共编辑,让用户得到一个简单、直接和有效答案的路径更直接、更快速。</p>
    <p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;">第三个是<span style="color: black;">持续</span>提问和追问的功能,<span style="color: black;">乃至</span><span style="color: black;">能够</span>不<span style="color: black;">必须</span>提示词。</p>
    <p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;">知乎<span style="color: black;">长时间</span>是一个比较单向度的<span style="color: black;">制品</span>:一问多答。尽管有算法<span style="color: black;">举荐</span>的<span style="color: black;">相关</span>提问,但它不是同一个用户实时提出的问题,未必折射了一个提问者内心最大的好奇心和疑惑。<span style="color: black;">此刻</span>看完了一个问题的回答,<span style="color: black;">能够</span>基于这个回答和提炼出来的 " 最佳答案 " 进行追问——追问<span style="color: black;">乃至</span>不<span style="color: black;">必须</span>主动输入提示词,而是 AI 自动生成。它其实在鼓励用户在知乎社区里进行 " 多轮对话 " ——就像一个人在 ChatGPT 和 Kimi Chat 上做的<span style="color: black;">哪些</span>事<span style="color: black;">同样</span>。针对用户的追问,AI <span style="color: black;">能够</span>给出它的答案,答主们<span style="color: black;">亦</span>应该会<span style="color: black;">持续</span>赶到现场。</p>
    <p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;"><span style="color: black;">这般</span>,知乎<span style="color: black;">做为</span>一个 " 问答社区 " 的形态,就有可能从 " 一问多答 " 向 " 多问多答 " 演进。在一个基于问答的内容社区里,提问是最大的供给侧。过去的提问<span style="color: black;">重点</span>依靠的是人们的好奇心和求知欲,<span style="color: black;">此刻</span><span style="color: black;">能够</span>有 AI 加持和赋予的灵感。这么做的好处当然<span style="color: black;">亦</span>很直观——产生<span style="color: black;">更加多</span>的问题,以及相应的<span style="color: black;">更加多</span>的答案。</p>
    <p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;">一个搜索,一个实时问答,一个追问,它们<span style="color: black;">暗地里</span>都基于知乎的 AI,知乎把这个三合一的 AI 功能叫 " <span style="color: black;">发掘</span> · AI 搜索 ",在首页的左侧给了一个 " 四芒星 " 的 logo。</p>
    <p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;">看上去,它有搜索,但不是一个专门的搜索框。它有大模型对话,但不以对话界面的方式呈现。它<span style="color: black;">能够</span>追问,但 AI 不是<span style="color: black;">独一</span>的答主。它看上去还是那个知乎,还<span style="color: black;">必须</span><span style="color: black;">海量</span>有好奇的提问者,还<span style="color: black;">必须</span>高质量的专业答主。<span style="color: black;">而后</span>,AI 站在<span style="color: black;">她们</span>的身侧。</p>
    <p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;">在前面的知乎拥抱 AI 的三条路径里,知乎<span style="color: black;">选取</span>的是第三条。这条路径的<span style="color: black;">最后</span>指向,是知乎<span style="color: black;">做为</span>一个知识问答社区最<span style="color: black;">重要</span>的命脉——用户的活跃、<span style="color: black;">连续</span><span style="color: black;">持续</span>的高质量问题,以及高质量的可信赖的答案。</p>
    <p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;">知乎相信 " <span style="color: black;">发掘</span> · AI 搜索 " 会<span style="color: black;">作为</span>知乎社区的活水,但它高度<span style="color: black;">警觉</span><span style="color: black;">全部</span>社区的激进 AI 化——<span style="color: black;">海量</span>的 AI 生成问题,<span style="color: black;">海量</span>的 AI 回答问题。社区里充满了<span style="color: black;">设备</span>人和数字人的提问者和答主,<span style="color: black;">海量</span><span style="color: black;">乃至</span>大<span style="color: black;">都数</span>问题和答案都是 AI 生成的。</p>
    <p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;">在硅星人与知乎创始人、CEO 周源<span style="color: black;">近期</span>的一次对话中,周源对 "NPC 答主 " 的态度高度审慎:" 平台<span style="color: black;">不该</span>该主动做这个事儿,平台<span style="color: black;">为何</span>要让自己的体系里面产生这么多 NPC 呢?"</p>
    <p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;"><img src="//q9.itc.cn/q_70/images03/20240331/7e054940467440fdbb000f53a645a108.jpeg" style="width: 50%; margin-bottom: 20px;"></p>
    <p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;">他认为知乎的 "AI 搜索 " 是一个 " 不依赖原来的信息流,换了一种基于大模型的能力和交互的方式,而对后续产生数据反馈非常直接 " 的功能。这个 " 数据的直接反馈 ",<span style="color: black;">指的是</span>向活生生的 " 人 " 的,而不是 AI 的。<span style="color: black;">做为</span>提问者,能够更快、更直接得到<span style="color: black;">她们</span>想到的答案;<span style="color: black;">做为</span>答主,能够让自己的回答被更频繁地搜索、调取、索引和再度生<span style="color: black;">作为</span>新的内容。<span style="color: black;">做为</span>普通的浏览型用户,能够换一个界面和交互,用 " 搜索 " 和 " <span style="color: black;">发掘</span> " 到<span style="color: black;">更加多</span>过去<span style="color: black;">必须</span>下拉<span style="color: black;">非常多</span>次信息流<span style="color: black;">才可</span>找到的问题和答案,这<span style="color: black;">针对</span>一个社区的活跃度是非常<span style="color: black;">要紧</span>的事。它们将产生<span style="color: black;">更加多</span>的内容,<span style="color: black;">亦</span>是大语言模型训练所用的语料。</p>
    <p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;">"AI 本身是一个语言模型,不会遇到问题。<span style="color: black;">仅有</span>人才会在社会中遇到问题。你失恋了,下岗了,人才会有这种痛苦和欲望。人产生的问题和相应的内容才是可信的。AI <span style="color: black;">能够</span>辅助你,<span style="color: black;">然则</span><span style="color: black;">倘若</span>把这层光明层去掉,AI 只是自循环的,我觉得就<span style="color: black;">无</span>太大价值了 ",周源对硅星人说。</p>
    <p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;">基于这个认知,他反对让 "AI 搜索 " 生成的答案和问题,以<span style="color: black;">设备</span>人的 IP 形式<span style="color: black;">显现</span>,而<span style="color: black;">保持</span>只让它们出<span style="color: black;">此刻</span> " 四芒星 " 的角标里面,以私聊的方式<span style="color: black;">显现</span>,只属于用户个人,而不呈<span style="color: black;">此刻</span>由提问者和答主这些真正的 " 创作者 " <span style="color: black;">显现</span>的信息流里。</p>
    <p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;">面对 AI,知乎真正要回答的问题是:人类<span style="color: black;">怎样</span>与 AI 共享智慧,又保持对人类原创性的尊重和鼓励。这不是一个新问题,但<span style="color: black;">必须</span>一个新的解法。<span style="color: black;">日前</span>,它给出答案是:透过 AI,让人们<span style="color: black;">发掘</span>人类创造的更大的世界,人类创作的<span style="color: black;">更加多</span>的内容,而不是用 AI <span style="color: black;">发掘</span><span style="color: black;">更加多</span> AI 生成的内容。</p>
    <p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;">它指向了一个更为<span style="color: black;">重要</span>的问题:当世界上越来越多的内容<span style="color: black;">是由于</span> AI 生成的,人类的经验和人类创造的内容,会不会变成一种日益边缘化的稀缺资源?AI 生成内容的前提和<span style="color: black;">基本</span>是人类经验生成的语料——即人类<span style="color: black;">经过</span>历史、社会、经济、科技实践创造的内容——<span style="color: black;">没</span>论它们是<span style="color: black;">文案</span>、数据、图像、声音、视频还是代码。但<span style="color: black;">倘若</span>人类创造的内容在 AI 生成的几何级增长 " 挤压 " 下变成一种稀缺资源,<span style="color: black;">将来</span> AI 生成内容的经验从何而来,语料又从何而来?</p>
    <p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;">这对每一个人都很<span style="color: black;">要紧</span>,对事实上已<span style="color: black;">作为</span>全世界中文语料的<span style="color: black;">要紧</span>资源库——知乎<span style="color: black;">来讲</span>,<span style="color: black;">更加是</span>一个必答题。</p>
    <p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;"><img src="//q4.itc.cn/q_70/images03/20240331/42f13e1a6cea43d48e54312e3d97ce75.jpeg" style="width: 50%; margin-bottom: 20px;"></p>
    <p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;">" 人工智能发展离不开芯片、模型、数据三个<span style="color: black;">要紧</span><span style="color: black;">原因</span>。芯片确实卡脖子,但芯片是一个工程学的问题,只要有了<span style="color: black;">必定</span>的规模,就能够迭代起来,<span style="color: black;">咱们</span>工程师还是很厉害的。模型有开源<span style="color: black;">优良</span>,进化速度<span style="color: black;">亦</span>不会慢。<span style="color: black;">仅有</span>数据是不可再生资源,<span style="color: black;">况且</span>还没办法马上<span style="color: black;">持有</span>。<span style="color: black;">没</span>论投 10 亿美金还是投 100 亿美金,都不可能在<span style="color: black;">短期</span>里<span style="color: black;">创立</span>一个 UGC 社区,语料是一种不可再生资源 ",周源认为。</p>
    <p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;">" 你把语料当成静态的,即便他是<span style="color: black;">这般</span>的,那<span style="color: black;">亦</span>得把它看成是一片土地。你<span style="color: black;">不可</span>在<span style="color: black;">一起</span>土地上把玉米割了,<span style="color: black;">而后</span>去<span style="color: black;">另一</span>一个<span style="color: black;">地区</span><span style="color: black;">营销</span>,不管这片土地明天有<span style="color: black;">无</span>虫灾," 周源认为,<span style="color: black;">全世界</span>的语料都存在着一种贫瘠化<span style="color: black;">乃至</span>枯竭化的可能,就像石油<span style="color: black;">同样</span>。</p>
    <p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;"><span style="color: black;">因此呢</span>,让数据的供给和消费的飞轮能够转起来,让<span style="color: black;">更加多</span>的数据变成大模型训练的语料,被 AI" 消费 " 的<span style="color: black;">同期</span>,<span style="color: black;">更加多</span>的语料能够被反哺、AI 能激发人类再创造更好的内容,变成更有价值的语料,就变<span style="color: black;">成为了</span>知乎在生成式人工智能浪潮下寻求答案的最有价值求解——尤其在它<span style="color: black;">已然</span>是<span style="color: black;">全世界</span>中文互联网语料中绕<span style="color: black;">不外</span>去的存在的<span style="color: black;">状况</span>下。</p>
    <p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;"><span style="color: black;">作为</span>可再生的<span style="color: black;">连续</span>供给的<span style="color: black;">全世界</span>最大中文语料库有什么价值?来自美国的答案是:Google <span style="color: black;">已然</span>向美国最<span style="color: black;">要紧</span>的内容社区 Reddit 累计支付了 6000 多万美元,用于购买高质量的语料。</p>
    <p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;">来自中国的答案是什么?在数据交易市场<span style="color: black;">已然</span>在政府和市场的双轮驱动下<span style="color: black;">已然</span>日臻成熟的<span style="color: black;">状况</span>下,中文语料将<span style="color: black;">作为</span><span style="color: black;">要紧</span>的可被交易的数据资源。谁是最<span style="color: black;">要紧</span>的中文语料库,将<span style="color: black;">作为</span>继芯片和算力之后,另一种稀缺但<span style="color: black;">要紧</span>的 " 水 "。谁都<span style="color: black;">晓得</span>,AI 的发展,<span style="color: black;">常常</span>是 " 卖水 " 的人最先赚到钱。</p>
    <p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;"><span style="color: black;">源自</span>:品玩<a style="color: black;"><span style="color: black;">返回<span style="color: black;">外链论坛:http://www.fok120.com/</span>,查看<span style="color: black;">更加多</span></span></a></p>

    <p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;"><span style="color: black;">责任编辑:网友投稿</span></p>




youxijiasuqi 发表于 2024-8-28 14:24:46

我深受你的启发,你的话语是我前进的动力。

sinowatcher 发表于 2024-9-9 02:10:14

祝福你、祝你幸福、早日实现等。
页: [1]
查看完整版本: 知乎 AI 革命:智能搜索与实时问答的融合