清华大学孙茂松:人工智能是怎么样写诗的?
<p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;"><img src="https://mmbiz.qpic.cn/mmbiz_gif/9qL39L0ykxuPeghMA1p88VHP1BIBibqdvTsGZ311Q93FyYa1G8ibzF4PBepusHUPAC8y7X9iby0Slew4WfyHtav6A/640?wx_fmt=gif&tp=webp&wxfrom=5&wx_lazy=1" style="width: 50%; margin-bottom: 20px;"></p><img src="https://mmbiz.qpic.cn/mmbiz_png/9qL39L0ykxvohJ70zKicZwrnS05MgUvP2mkaJ5zFSnvRYkGibo2AZfvZRVrYWLzNTzHHaWEPeKW9MTPjia9aO5W6Q/640?wx_fmt=png&tp=webp&wxfrom=5&wx_lazy=1&wx_co=1" style="width: 50%; margin-bottom: 20px;">
<p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;"><span style="color: black;">2022年5月20日,由中华书局和清华大学中国古典文献<span style="color: black;">科研</span>中心联合发起的“《数字人文》专家面对面”系列讲座活动,邀请到了《数字人文》三位主编:来自清华大学的孙茂松教授、刘石教授和中华书局编审周绚隆执行董事,<span style="color: black;">一起</span>给<span style="color: black;">大众</span>带来<span style="color: black;">第1</span>讲《浅谈人工智能背景下的数字人文》。此次讲座采取线上腾讯会议与“伯鸿读书会”直播相结合的方式,共有一千两百余名师生和学者观看并参与讨论。</span></p>
<p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;"><span style="color: black;">中华书局朱翠萍老师<span style="color: black;">首要</span>介绍了“《数字人文》专家面对面”系列讲座的活动,旨在讨论跨学<span style="color: black;">研究</span>究<span style="color: black;">行业</span>的数字人文问题,将以《数字人文》学刊<span style="color: black;">发布</span>的论文成果为线索,邀请作者亲身<span style="color: black;">诠释</span><span style="color: black;">科研</span>思路和<span style="color: black;">办法</span>,以期<span style="color: black;">更加多</span>专业的人文学者关注数字人文<span style="color: black;">科研</span>成果、利用数字人文方法和手段进行学术<span style="color: black;">科研</span>。</span></p>
<p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;"><span style="color: black;">讲座主持人、清华大学人文学院刘石教授介绍了中国数字人文的发展<span style="color: black;">状况</span>,以及《数字人文》的创刊和发展历程。他认为,计算机科学、人工智能和大数据技术的发展使得大数据时代不期而至,技术的发展倒逼<span style="color: black;">咱们</span>提出更高和更激荡人心的<span style="color: black;">目的</span>。在深度学习技术的快速发展下,数字人文正在利用从数字化向知识化的转变,从简单的搜索转向更为<span style="color: black;">繁杂</span>的分析与<span style="color: black;">科研</span>。《数字人文》的口号是“数字使人文更新”,这个“更”字,既是更加,<span style="color: black;">亦</span>是更换的意思。数字人文技术不仅为人文<span style="color: black;">科研</span>带来新的<span style="color: black;">科研</span>材料和<span style="color: black;">科研</span>视野,<span style="color: black;">况且</span>能够更新人文<span style="color: black;">科研</span>的范式和路径。在数字时代,对数字人文的<span style="color: black;">注重</span><span style="color: black;">必须</span><span style="color: black;">提升</span>到文化发展战略的高度来看待。</span></p>
<p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;"><span style="color: black;">主讲人、清华大学计算机科学与技术系的孙茂松教授<span style="color: black;">首要</span>简单介绍了知识的生产与传播中的<span style="color: black;">有些</span>辩证关系。他提出,知识<span style="color: black;">重点</span>由形式和内容<span style="color: black;">构成</span>,形式<span style="color: black;">包含</span>载体形式和内容形式,而知识的内容<span style="color: black;">重点</span>指知识的思想内涵。从本质上讲,内容决定了知识的深刻度和影响力,形式则对知识的传播度有巨大<span style="color: black;">功效</span>。<span style="color: black;">亦</span><span style="color: black;">便是</span>说,尽管深刻性<span style="color: black;">非常</span>重要,但它不是<span style="color: black;">独一</span>的标准,知识传播<span style="color: black;">亦</span><span style="color: black;">特别有</span>价值。</span></p>
<p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;"><span style="color: black;"><span style="color: black;">怎么样</span>把人文原始材料提炼转化为适合计算机分析的对象,以及<span style="color: black;">怎么样</span>利用计算机的分析结果来辅助<span style="color: black;">处理</span>人文问题,是数字人文所面临的挑战。数字人文所<span style="color: black;">运用</span>的计算机技术<span style="color: black;">触及</span>的面很广,但可归纳为若干类。从历时<span style="color: black;">方向</span>讲,<span style="color: black;">初期</span>的工作是针对文本,后来逐步扩大到图像、视频、语音、3D等。最早的数字人文工作非常基本、简单,<span style="color: black;">重点</span>是将人文材料数字化,构建数字人文<span style="color: black;">科研</span>的资源<span style="color: black;">基本</span>(这催生了后来的OCR技术),以及利用计算机对已数字化了的文献著作自动<span style="color: black;">创立</span>索引。紧接着是词搜索、排序、词频统计等技术,后来随着计算机<span style="color: black;">关联</span>学科分支的发展,又生发出聚类分析、主题分析、标签标注、自然语言文本分析等与内容<span style="color: black;">相关</span>的分析<span style="color: black;">办法</span>以及可视化设计等数据呈现<span style="color: black;">办法</span>。近些年来,图像、视频、语音以及多模态联合分析<span style="color: black;">办法</span><span style="color: black;">亦</span>取得了长足进步。但总的<span style="color: black;">来讲</span>,<span style="color: black;">以上</span>技术手段对内容语义的理解能力存在天然不足,完全<span style="color: black;">处理</span>语义问题<span style="color: black;">日前</span>看是不可能的。现有数字人文项目的经验告诉<span style="color: black;">咱们</span>,人工对数据的加工越多,数字人文<span style="color: black;">科研</span>的效果就越好。<span style="color: black;">不外</span><span style="color: black;">一般</span>数字人文技术<span style="color: black;">重点</span>用于<span style="color: black;">帮忙</span>人类专家从难以驾驭的超大规模数字化人文材料中分析宏观趋势,<span style="color: black;">因此呢</span>语义分析的准确率即使<span style="color: black;">仅有</span>七八成,<span style="color: black;">亦</span>是<span style="color: black;">特别有</span>参考价值的。</span></p>
<p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;"><span style="color: black;">深度学习算法<span style="color: black;">重点</span>有两大类:一类是卷积神经网络(CNN),<span style="color: black;">重点</span>用于图像理解;另一类是循环神经网络(RNN)<span style="color: black;">重点</span>用于语言理解。深度学习算法所采用的深层神经网络,结构简洁,规模<span style="color: black;">繁杂</span>。神经元节点之间连接的权重最<span style="color: black;">起始</span>都是随机生成的,随后<span style="color: black;">按照</span>训练数据的误差进行梯度反向传播,重新<span style="color: black;">调节</span>权重来降低误差,循环往复,直到训练结果趋于稳定。数学上<span style="color: black;">已然</span>证明,只要神经网络模型规模足够大,就能够逼近求解任何<span style="color: black;">归类</span>问题。<span style="color: black;">同期</span>还有一条基本法则:要训练出规模足够大的好模型,<span style="color: black;">必定</span>要有足够大的训练数据量,两者互为依存、互为<span style="color: black;">要求</span>。深度学习算法和大数据在这个<span style="color: black;">道理</span>上实现了高度的对立统一。</span></p>
<p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;"><span style="color: black;">孙茂松认为,深度学习技术在数字人文<span style="color: black;">行业</span>内<span style="color: black;">能够</span>有<span style="color: black;">非常多</span>应用。最早进入公众视野的是人工智能写诗,其基本过程是循环神经网络对<span style="color: black;">海量</span>已有诗歌数据进行自动分析,<span style="color: black;">经过</span>其内置的<span style="color: black;">重视</span>力机制算出已生成上文中<span style="color: black;">每一个</span>字的重要性,对产生下一个字的概率进行预测。依此逐字向前推进,写出诗歌。所生成诗句的通顺性乃至所生成整首诗的整体一致性是<span style="color: black;">以上</span>机制重点考量的<span style="color: black;">原因</span>。就现有结果而言,计算机在生成短文本方面的性能可圈可点,例如“九歌”对对子,<span style="color: black;">或</span>是生成集句诗,即从历史文本中寻找已有语义类似的句子来匹配组合,都有不错的表现。但<span style="color: black;">针对</span>生成长文本,如短篇小说、散文等,能力还很差。<span style="color: black;">近期</span>有西方学者对计算机写诗质量进行严肃认真的<span style="color: black;">评估</span>,实验设置为:人从计算机自动生成的诗中挑选若干首,再同人写的若干首诗混起来,让其他被试去甄别<span style="color: black;">那些</span>诗是计算机写的,<span style="color: black;">那些</span>诗是人写的。结论是被试难以区分,这<span style="color: black;">显示</span>计算机生成的诗<span style="color: black;">已然</span>差不多<span style="color: black;">能够</span>以假乱真。但该实验观察<span style="color: black;">亦</span><span style="color: black;">显示</span>,被试对计算机所写诗的<span style="color: black;">喜欢</span>度<span style="color: black;">显著</span><span style="color: black;">小于</span>人写的诗。<span style="color: black;">这儿</span>面还<span style="color: black;">触及</span>一个<span style="color: black;">非常</span><span style="color: black;">繁杂</span>、深刻的问题,即计算机写诗能否<span style="color: black;">拥有</span>文学所追求的创新性?从深度学习的机制来看,应该说是有可能的,其原理是基于古代诗歌之大数据,可望让计算机习得古人诗歌<span style="color: black;">各样</span>规律所决定的可能生成空间。这个空间是<span style="color: black;">非常</span>巨大的,古人<span style="color: black;">已然</span>写出来的诗歌,或许只是这个可能空间中的很小一部分,剩余部分应该会有<span style="color: black;">必定</span>机会展现出文学新意。当然,这<span style="color: black;">亦</span>取决于智能算法<span style="color: black;">是不是</span>足够高明,否则很容易落入已有诗歌的模仿和拼凑的“信息茧房”中。<span style="color: black;">倘若</span>采用“机生成+人修改”模式,创新效果更便于发挥出来。深度学习在数字人文的其他应用还有<span style="color: black;">非常多</span>,例如生成绘画作品、<span style="color: black;">按照</span>句子生成图像、<span style="color: black;">设备</span>人绘画、AI作曲等等。</span></p><img src="https://mmbiz.qpic.cn/mmbiz_png/9qL39L0ykxvohJ70zKicZwrnS05MgUvP2ajj3P8QQWv3zR2TxYwbwEFJOfMP7F1bPicJjFPCznOT0juoCfQn2ibAA/640?wx_fmt=png&tp=webp&wxfrom=5&wx_lazy=1&wx_co=1" style="width: 50%; margin-bottom: 20px;">
<p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;"><img src="https://mmbiz.qpic.cn/mmbiz_jpg/9qL39L0ykxvohJ70zKicZwrnS05MgUvP2cFcTe1mTiaSqWwWyW7f6Ozh6JXfdMgLpvMsyPzNa8jic01l4vWwk3DNA/640?wx_fmt=jpeg&tp=webp&wxfrom=5&wx_lazy=1&wx_co=1" style="width: 50%; margin-bottom: 20px;"></p>
<p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;"><span style="color: black;">图:一个基于改进<span style="color: black;">重视</span>力机制的计算机诗歌生成基本模型(引自清华大学矣晓沅的博士学位论文)</span></p>
<p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;"><span style="color: black;">当然关于数字人文还有<span style="color: black;">非常多</span>其他问题,例如数字人文中的伦理道德问题:计算机产生的“虚情假意”的艺术能被人类接受吗?<span style="color: black;">或</span>人类对数字艺术的宽容度问题:人类能够接受受<span style="color: black;">设备</span>启发<span style="color: black;">或</span>人机<span style="color: black;">一起</span>产生的艺术吗?这些问题有待<span style="color: black;">更加多</span>学者探讨。</span></p>
<p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;"><span style="color: black;">最后,孙茂松教授总结道,深度学习本质上并<span style="color: black;">无</span>理解语义,深度学习机制,看穿了<span style="color: black;">便是</span>神经元节点和连接神经元节点之间的权重,其<span style="color: black;">行径</span>呈现出某种智能,但内在机理上却完全<span style="color: black;">无</span>智能。<span style="color: black;">仅有</span>密切结合数字人文的<span style="color: black;">详细</span>问题,妥善<span style="color: black;">运用</span>它,<span style="color: black;">才可</span>够<span style="color: black;">处理</span><span style="color: black;">有些</span>问题。归根结底,数字人文的核心还是<span style="color: black;">拥有</span>深刻性的人文<span style="color: black;">科研</span>,受囿于人工智能技术的局限性,要达到这个<span style="color: black;">目的</span>,依然任重道远。<span style="color: black;">不外</span>,数字人文与人工智能技术的结合在促进文化思想传播方面的巨大<span style="color: black;">功效</span>,倒是顺水推舟的。</span></p>
<p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;"><span style="color: black;">讲座结束后,中华书局执行董事周绚隆进行了简短的评议。他<span style="color: black;">非常</span>肯定孙茂松教授的观点,认为文献<span style="color: black;">科研</span><span style="color: black;">已然</span>自觉或不自觉地借用了<span style="color: black;">有些</span>数字人文的技术和成果,例如中华书局古联<span style="color: black;">机构</span>的中华经典古籍库等。当然他<span style="color: black;">亦</span>认同,数字技术是基于历史数据的,<span style="color: black;">不可</span>完全<span style="color: black;">处理</span>语义问题,<span style="color: black;">亦</span><span style="color: black;">不可</span>从<span style="color: black;">基本</span>上实现巨大的突破和创新。但人文创作却<span style="color: black;">必须</span>背叛历史,<span style="color: black;">持续</span>寻求创新。在这方面,人文学术有着数字技术所<span style="color: black;">不可</span>达到的深度和高度。</span></p>
<p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;"><span style="color: black;">关于数字人文对学术的影响,他提出,从出版的<span style="color: black;">方向</span>看,近些年来,无论是论文还是书稿,篇幅都比以前要长<span style="color: black;">非常多</span>,一个<span style="color: black;">重点</span><span style="color: black;">原由</span>是<span style="color: black;">日前</span>的可用资料<span style="color: black;">更加多</span>了,<span style="color: black;">科研</span>的内容自然<span style="color: black;">亦</span>多了。但<span style="color: black;">倘若</span>仅仅把数据库和分析工具的结果不假思索地拿来应用到<span style="color: black;">科研</span>成果上,是<span style="color: black;">非常</span>不可取的。基于数据库的分析结果<span style="color: black;">必定</span>要经过人的<span style="color: black;">干涉</span>,剔除无用和垃圾信息,基于人的<span style="color: black;">科研</span>和需求,寻求和<span style="color: black;">运用</span>有针对性的数据和材料。</span></p>
<p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;"><span style="color: black;">他强调,对完全不<span style="color: black;">认识</span>计算机技术的人文学者<span style="color: black;">来讲</span>,孙茂松教授介绍的<span style="color: black;">办法</span>和案例深入浅出,启发性很大。数字人文不是一种学科,而是一种<span style="color: black;">办法</span>,一种<span style="color: black;">认识</span>,有了人文阅读和学习,再<span style="color: black;">经过</span>工具来拓展视野,确实能够提出<span style="color: black;">有些</span>需求,改变<span style="color: black;">有些</span>认识,<span style="color: black;">亦</span>能够为人文<span style="color: black;">科研</span><span style="color: black;">供给</span>新的<span style="color: black;">科研</span><span style="color: black;">办法</span>和<span style="color: black;">方向</span>。</span></p>
<p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;"><span style="color: black;">在提问环节,听众提出了不少有针对性的问题,孙茂松教授<span style="color: black;">亦</span>一一做了精彩的解答。</span></p>
<p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;"><span style="color: black;">最后,刘石教授总结道,数字人文是工程性项目,<span style="color: black;">必须</span>合作,<span style="color: black;">必须</span><span style="color: black;">海量</span>的人力与财力的投入,期待<span style="color: black;">经过</span>此次讲座,能有<span style="color: black;">更加多</span>人关注数字人文,关注《数字人文》杂志、网站(www.dhlib.cn)以及公众号(DH数字人文),还有即将上线的璇琮数字人文智慧平台,以及古联<span style="color: black;">机构</span>推出的OCR识别系统(ocr.ancientbooks.cn)。当然,更重要是的是期待能够有<span style="color: black;">更加多</span>的人投入到数字人文<span style="color: black;">关联</span><span style="color: black;">科研</span>中,<span style="color: black;">一起</span>为中国的数字人文发展作出贡献。</span></p><img src="https://mmbiz.qpic.cn/mmbiz_png/9qL39L0ykxvohJ70zKicZwrnS05MgUvP2ajj3P8QQWv3zR2TxYwbwEFJOfMP7F1bPicJjFPCznOT0juoCfQn2ibAA/640?wx_fmt=png&tp=webp&wxfrom=5&wx_lazy=1&wx_co=1" style="width: 50%; margin-bottom: 20px;">
<p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;"><span style="color: black;"><span style="color: black;">源自</span>:光明日报</span></p>
<p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;"><img src="https://mmbiz.qpic.cn/mmbiz_png/9qL39L0ykxuOZ9hV2rNMIARIS1u2HZpBwoglanVtibN72zOLfyTTsRHo55qlZTWv1GCzORtERhRiaUOK6vTalArQ/640?wx_fmt=png&tp=webp&wxfrom=5&wx_lazy=1&wx_co=1" style="width: 50%; margin-bottom: 20px;"></p>
谷歌网站排名优化 http://www.fok120.com/ 可以发布外链的网站 http://www.fok120.com/ 你的言辞如同繁星闪烁,点亮了我心中的夜空。 i免费外链发布平台 http://www.fok120.com/ 外贸B2B平台有哪些?
页:
[1]