4zhvml8 发表于 2024-9-28 04:31:16

独家 | 王海峰:百度大数据与人工智能(附PPT下载)


    <p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;"><img src="https://mmbiz.qpic.cn/mmbiz_png/heS6wRSHVMn0YptVVJtnANRduO6oQSa9cyiacHBrHnT1JA0YOn2Ric2G5gVwA8CpFxpiczaJedoSxUP81ClEZwuEw/640?wx_fmt=png&amp;tp=webp&amp;wxfrom=5&amp;wx_lazy=1&amp;wx_co=1" style="width: 50%; margin-bottom: 20px;"></p>
    <p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;"><span style="color: black;">1月28日上午,由中国工程院和清华大学联合主办的</span><span style="color: black;"><strong style="color: blue;"><span style="color: black;">“长城工程科技会议”第四次会议工业大数据分会</span></strong></span><span style="color: black;">在清华大学信息科技大楼召开。中国工程院院士</span><span style="color: black;"><strong style="color: blue;"><span style="color: black;">李伯虎</span></strong></span><span style="color: black;">、工业和信息化部信息化和软件服务业司副司长</span><span style="color: black;"><strong style="color: blue;"><span style="color: black;">李冠宇</span></strong></span><span style="color: black;">、中国工程院制造业<span style="color: black;">科研</span>室<span style="color: black;">专家</span></span><span style="color: black;"><strong style="color: blue;"><span style="color: black;">屈贤明</span></strong></span><span style="color: black;">、中国信息通信<span style="color: black;">科研</span>院总工程师</span><span style="color: black;"><strong style="color: blue;"><span style="color: black;">余晓辉</span></strong></span><span style="color: black;">、百度集团副总裁</span><span style="color: black;"><strong style="color: blue;"><span style="color: black;">王海峰</span></strong></span><span style="color: black;">、富士康科技集团幕僚长</span><span style="color: black;"><strong style="color: blue;"><span style="color: black;">陈辉龍</span></strong></span><span style="color: black;">、富士康科技集团<span style="color: black;">新闻</span>长</span><span style="color: black;"><strong style="color: blue;"><span style="color: black;">胡智深</span></strong></span><span style="color: black;">等出席。会议由清华大学软件学院院长、数据科学<span style="color: black;">科研</span>院副院长、大数据系统软件国家工程实验室执行<span style="color: black;">专家</span>、工业大数据系统与应用北京市重点实验室<span style="color: black;">专家</span></span><span style="color: black;"><strong style="color: blue;"><span style="color: black;">王建民</span></strong></span><span style="color: black;">教授主持,主题为“大数据与工业互联网”。</span></p>
    <p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;"><span style="color: black;"><strong style="color: blue;"><span style="color: black;"><strong style="color: blue;"><span style="color: black;">数据派</span></strong></span></strong></span><strong style="color: blue;"><span style="color: black;"><span style="color: black;">做为</span><span style="color: black;">独一</span>合作<span style="color: black;">媒介</span>参会,并为<span style="color: black;">大众</span>整理了<span style="color: black;">百度集团副总裁、百度AI技术平台体系总负责人兼百度<span style="color: black;">科研</span>院院长</span></span></strong><span style="color: black;"><strong style="color: blue;"><span style="color: black;"><strong style="color: blue;"><span style="color: black;">王海峰</span></strong></span></strong><strong style="color: blue;"><span style="color: black;">先生主题演讲</span></strong><strong style="color: blue;"><span style="color: black;"><strong style="color: blue;"><span style="color: black;">《大数据与人工智能》</span></strong></span></strong></span><strong style="color: blue;"><span style="color: black;">的</span></strong><strong style="color: blue;"><span style="color: black;">精华内容:</span></strong></p>
    <p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;"><span style="color: black;"><strong style="color: blue;"><span style="color: black;">后台回复关键词<strong style="color: blue;"><span style="color: black;">“0911”</span></strong>,下载王海峰演讲PPT。</span></strong></span></p>
    <p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;"><img src="https://mmbiz.qpic.cn/mmbiz_png/heS6wRSHVMkxOzdDmxVPmibagwpQ9BBvAqiaSey2JHaKeSG3JYNVpQE3iaWkHBqpgaKA5F66paWRLQqTDia93I1plQ/640?wx_fmt=png&amp;tp=webp&amp;wxfrom=5&amp;wx_lazy=1&amp;wx_co=1" style="width: 50%; margin-bottom: 20px;"></p>
    <p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;"><strong style="color: blue;"><span style="color: black;"><strong style="color: blue;"><span style="color: black;">人工智能是第四次工业革命</span></strong></span></strong></p>
    <p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;"><span style="color: black;">从18世纪<span style="color: black;">起始</span>,随着技术的发展,以及<span style="color: black;">需要</span>的牵引,人类<span style="color: black;">逐步</span><span style="color: black;">起始</span>进入技术革命或工业革命。历史上的工业革命有三次,<span style="color: black;">能够</span>大致归纳为<span style="color: black;">第1</span>次机械化革命、第二次电气化革命和第三次的信息化革命,而第四次工业革命则是以智能化——人工智能<span style="color: black;">(Artificial Intelligence,英文缩写为AI)</span>——为标志的。</span></p>
    <p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;"><img src="https://mmbiz.qpic.cn/mmbiz_png/heS6wRSHVMn5Gjib6ibgD9ID7QHCmjswsF5p1UVFdUeozqIu7swCMsiagTQYL1zZ8zmhhSuLFHoXicEgBa1C9UYqGA/640?wx_fmt=png&amp;tp=webp&amp;wxfrom=5&amp;wx_lazy=1&amp;wx_co=1" style="width: 50%; margin-bottom: 20px;"></p>
    <p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;"><span style="color: black;">回顾一下人工智能的发展历史,正式的起点是1956年的达特茅斯会议,诞生了AI这个概念。而在1956年之前,<span style="color: black;">已然</span><span style="color: black;">显现</span>了<span style="color: black;">迄今</span>仍然很热门的<span style="color: black;">有些</span>人工智能方向,例如<span style="color: black;">设备</span>翻译、自然语言处理、计算机下棋、神经网络等等。而从AI诞生<span style="color: black;">败兴</span>的60<span style="color: black;">数年</span>,人工智能的发展起起落落,从下面的图中可见一斑。</span></p>
    <p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;"><span style="color: black;">过去10年,随着深度学习的<span style="color: black;">显现</span>,更重要的是“数据井喷”,以及数据支撑的算法和计算能力的突破,尤其是在语音、图像等<span style="color: black;">行业</span>,人工智能再次迎来了发展的新机遇。而这一次的复兴即将带动<span style="color: black;">全部</span>社会产生深层次的变革,这是<span style="color: black;">咱们</span><span style="color: black;">已然</span>可预见的<span style="color: black;">将来</span>。这次人工智能的爆发,在很大程度上是从互联网<span style="color: black;">起始</span>的,而互联网带来了<span style="color: black;">非常多</span><span style="color: black;">需要</span>,<span style="color: black;">包含</span>搜索、社交、购物等等。这些<span style="color: black;">需要</span>越来越多的线上化,<span style="color: black;">同期</span>带动了数据的线上化。</span></p>
    <p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;"><span style="color: black;">数据真正线上化以后,<span style="color: black;">亦</span>带动了<span style="color: black;">更加多</span>的算法去处理这些数据,而<span style="color: black;">需要</span>和数据的在线化<span style="color: black;">亦</span>带动了<span style="color: black;">全部</span>生态的活跃,<span style="color: black;">从而</span>使越来越多的数据开放出来,依托更强大的计算平台,结合更好的AI算法,实现计算能力的突破。<span style="color: black;">例如</span><span style="color: black;">此刻</span><span style="color: black;">大众</span>常用的GPU,利用深度学习、深度神经网络算法,就有非常强大的<span style="color: black;">优良</span>。<strong style="color: blue;">大数据、算法和大计算这三者俨然<span style="color: black;">作为</span>了人工智能复兴的必要<span style="color: black;">要求</span>。</strong></span></p>
    <p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;"><strong style="color: blue;"><span style="color: black;"><strong style="color: blue;"><span style="color: black;">百度人工智能<span style="color: black;">已然</span>扬帆起航</span></strong></span></strong></p>
    <p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;"><img src="https://mmbiz.qpic.cn/mmbiz_png/heS6wRSHVMn5Gjib6ibgD9ID7QHCmjswsF9hciciaQwsMiccueO8IZLicmnXiael2wibdXp1qkLf1gn7RZNz6uD2ZqWJIA/640?wx_fmt=png&amp;tp=webp&amp;wxfrom=5&amp;wx_lazy=1&amp;wx_co=1" style="width: 50%; margin-bottom: 20px;"></p>
    <p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;"><span style="color: black;">百度从做搜索<span style="color: black;">起始</span>,人工智能的<span style="color: black;">科研</span>和发展<span style="color: black;">已然</span>有十几年了,如自然语言处理<span style="color: black;">基本</span>的分词、短语分析等。而全面布局人工智能大概是在<span style="color: black;">7、</span>八年以前,逐步从NLP、语音、<span style="color: black;">设备</span>学习、图像等方面<span style="color: black;">起始</span>,<strong style="color: blue;">时<span style="color: black;">迄今</span>天,百度<span style="color: black;">已然</span>形<span style="color: black;">成为了</span>一个较完整的人工智能技术布局,<span style="color: black;">包含</span><span style="color: black;">基本</span>层、感知层、认知层、平台层、生态层和应用层,共计六层。</strong></span></p>
    <p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;"><span style="color: black;">数据、算法和计算平台是<span style="color: black;">基本</span>。感知层对应人的视觉、听觉,这些能力是直接感知外界。认知层对应的是人类区别于其他生物特有的,<span style="color: black;">例如</span>人的语言能力、人类对知识的总结、理解、提炼、运用等等,以及对人的理解。AI的开放平台不仅支持百度内部的应用还支持所有的合作伙伴,现已开放了60多个能力,在<span style="color: black;">机构</span>内部,<span style="color: black;">每日</span>大概有几千亿的调用量,而在<span style="color: black;">外边</span><span style="color: black;">亦</span>有数以亿计的调用。<span style="color: black;">这里</span><span style="color: black;">基本</span>上,百度<span style="color: black;">期盼</span>跟所有各行各业的合作伙伴<span style="color: black;">一块</span>打造技术的平台,形成良性循环的生态,从而生长出<span style="color: black;">各样</span>各样的创新应用。</span></p>
    <p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;"><span style="color: black;">百度从做互联网To C(针对消费者)的<span style="color: black;">制品</span>到<span style="color: black;">起始</span>做<span style="color: black;">海量</span>支持To B(面向企业服务)的应用。这些都依赖于人工智能技术布局的实现。下面将对每层技术布局的关键技术展开说明。</span></p>
    <p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;"><strong style="color: blue;"><span style="color: black;"><strong style="color: blue;"><span style="color: black;"><span style="color: black;">1、</span><span style="color: black;">基本</span>层:大数据、算法和大计算</span></strong></span></strong></p>
    <p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;"><span style="color: black;"><span style="color: black;">此刻</span>每一个人每一天会产生非常多的数据,如个人的<span style="color: black;">行径</span>、生理状态的变化,<span style="color: black;">倘若</span>要监测、记录的话,都有非常庞大的数据。况且,每一个人<span style="color: black;">每日</span>都在跟互联网打交道,<span style="color: black;">或</span>是自己建网站,<span style="color: black;">或</span>向网上贡献数据,<span style="color: black;">乃至</span>在<span style="color: black;">运用</span>互联网过程中,<span style="color: black;">亦</span>会产生<span style="color: black;">非常多</span>数据。<strong style="color: blue;"><span style="color: black;">必定</span>程度上,互联网<span style="color: black;">已然</span><span style="color: black;">作为</span><span style="color: black;">全部</span>客观世界的镜像。<span style="color: black;">因此</span>,<span style="color: black;">把握</span>好、利用好、分析好这些互联网数据,在很大程度上<span style="color: black;">亦</span>是对客观世界很重要的刻画和理解。</strong></span></p>
    <p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;"><span style="color: black;">总体上,大数据技术分为几个方面,<span style="color: black;">例如</span>数据的采集、提炼以及应用。<span style="color: black;">倘若</span>对一个零售商店数据里的用户进行建模,某一个用户可能是白领,另一个是主妇,<span style="color: black;">这般</span>的行业数据经过分析就<span style="color: black;">能够</span><span style="color: black;">帮忙</span>商户更好地进行营销<span style="color: black;">行径</span>。另一方面,百度<span style="color: black;">基本</span>的计算载体是数据中心,有20多个大型的数据中心,不只是在中国,在世界各地都设立了大数据中心,<span style="color: black;">亦</span>有国内最大的GPU集群,有非常强的带宽和吞吐能力,还有像集装箱<span style="color: black;">同样</span>,模块化的计算中心。</span></p>
    <p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;"><strong style="color: blue;"><span style="color: black;"><strong style="color: blue;"><span style="color: black;"><span style="color: black;">2、</span>感知层:语音、图像、视频、AR/VR</span></strong></span></strong></p>
    <p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;"><span style="color: black;">语音技术的突破有<span style="color: black;">非常多</span>方向,如识别、合成和唤醒,这是<span style="color: black;">咱们</span><span style="color: black;">此刻</span>比较看重的,<span style="color: black;">由于</span>市场应用的<span style="color: black;">需要</span>很大。<span style="color: black;">例如</span>语音识别,<span style="color: black;">已然</span>达到97%以上的准确率。<span style="color: black;">此刻</span>随着人工智能应用的深入,在家居场景、车载场景等等,越来越多的语音识别不是对着麦克风说,而是要有<span style="color: black;">必定</span>距离,这就<span style="color: black;">触及</span>到远场的语音识别。这与<span style="color: black;">此刻</span>手机上的麦克风不<span style="color: black;">同样</span>,<span style="color: black;">首要</span>会有定位,还有一系列新的技术待<span style="color: black;">处理</span>。合成想做得非常好,<span style="color: black;">尤其</span>自然、流畅,<span style="color: black;">况且</span><span style="color: black;">能够</span>是个性化的,<span style="color: black;">包含</span>把人的<span style="color: black;">心情</span>变化等都带进去,就变得非常难。</span></p>
    <p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;"><span style="color: black;"><span style="color: black;">这儿</span>不只是语音和声学信号处理问题,<span style="color: black;">同期</span><span style="color: black;">触及</span>到对语言的理解、对人的理解,<span style="color: black;">这般</span><span style="color: black;">才可</span>做出有<span style="color: black;">心情</span>、个性化的合成。唤醒,是需要设备的时候就叫一声,它就<span style="color: black;">晓得</span>你要跟它说话,<span style="color: black;">例如</span>家居场景的一个智能音箱<span style="color: black;">或</span>智能电视,<span style="color: black;">此时</span>候就需要唤醒技术。唤醒技术的困难在于<span style="color: black;">咱们</span>要<span style="color: black;">掌控</span>误唤醒,<span style="color: black;">例如</span>在家里放一个智能音箱,<span style="color: black;">倘若</span>不叫它的时候,忽然之间它自己就跳起来了,<span style="color: black;">或</span>睡觉的时候,有点外界噪音,它就忽然跳起来,体验会很差。<span style="color: black;">因此</span>,<span style="color: black;">掌控</span>住误唤醒很重要<span style="color: black;">亦</span><span style="color: black;">特别有</span>挑战。</span></p>
    <p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;"><span style="color: black;">图像方面,人脸识别是计算机视觉的一个重要方向。人脸分为静态和动态。静态,如一张<span style="color: black;">照片</span>,检测里面有<span style="color: black;">无</span>人脸,<span style="color: black;">或</span>有两张照片,比对一下两处<span style="color: black;">显现</span>的是不是同一个人,这方面的准确率<span style="color: black;">已然</span>很高了。而识别动态图像的时候更<span style="color: black;">繁杂</span>一点,<span style="color: black;">例如</span>有一段视频,<span style="color: black;">首要</span>要定位这些人脸,而<span style="color: black;">这儿</span>会产生<span style="color: black;">非常多</span>应用,<span style="color: black;">例如</span>在很长的视频流里找到一个人。</span></p>
    <p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;"><span style="color: black;"><span style="color: black;">另一</span>,<span style="color: black;">咱们</span><span style="color: black;">能够</span>对图像进行识别匹配,做语义的标注,粒度很细,如一幅图里很<span style="color: black;">详细</span>地找到其中一个部分是什么,<span style="color: black;">这儿</span><span style="color: black;">能够</span>做<span style="color: black;">非常多</span>细粒度的图像识别。OCR是图像识别里相对<span style="color: black;">详细</span>的方向,如清华<span style="color: black;">亦</span>有OCR方向做得非常好的老师和课题组。<span style="color: black;">此刻</span>OCR技术不仅<span style="color: black;">能够</span>扫描书,更<span style="color: black;">能够</span>识别一个表格<span style="color: black;">或</span>一个很<span style="color: black;">繁杂</span>的结构,如发票,<span style="color: black;">不仅</span>把里面的文字识别出来,还<span style="color: black;">能够</span>把一个区域识别出来的文字</span><span style="color: black;">结构化,整体上会做<span style="color: black;">非常多</span>定制化的识别。</span></p>
    <p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;"><img src="https://mmbiz.qpic.cn/mmbiz_png/heS6wRSHVMn5Gjib6ibgD9ID7QHCmjswsFBsxpFSLL87qFsKibLKNoGR2fXicYbUpfjpeCAZZIbYdCxRsMH5YklOFQ/640?wx_fmt=png&amp;tp=webp&amp;wxfrom=5&amp;wx_lazy=1&amp;wx_co=1" style="width: 50%; margin-bottom: 20px;"></p>
    <p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;"><span style="color: black;">视频<span style="color: black;">区别</span>于图像有<span style="color: black;">非常多</span>权威的数据集,视频数据集本身还<span style="color: black;">不足</span>成熟。视频很<span style="color: black;">大都是</span>人工标注好的,<span style="color: black;">例如</span>标题、内容,<span style="color: black;">然则</span>还有<span style="color: black;">非常多</span>视频人工标注<span style="color: black;">不足</span>完善,<span style="color: black;">此时</span>候就需要视频语义理解技术把这个视频标注出来,<span style="color: black;">包含</span>这个视频到底是哪一类,视频的标题,<span style="color: black;">倘若</span>相对长的视频,就把其中亮点怎么样<span style="color: black;">亦</span>摘录出来。</span></p>
    <p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;"><span style="color: black;"><span style="color: black;">设备</span>人视觉<span style="color: black;">触及</span>到怎么样做定位,做地图的重建,<span style="color: black;">包含</span>检测<span style="color: black;">阻碍</span>物等等。领先的SLAM技术,有<span style="color: black;">非常多</span>算法。前面讲的图像和视频技术,在<span style="color: black;">设备</span>人视觉里都会有应用。</span><span style="color: black;"><span style="color: black;">加强</span>现实(AR/VR)是一个独立的方向,<span style="color: black;">然则</span>跟视觉技术有<span style="color: black;">非常多</span>关系,<span style="color: black;">一般</span>拍一个照片,会触发出<span style="color: black;">加强</span>现实的效果,相应地会<span style="color: black;">触及</span>到三维感知、跟踪、渲染等技术。</span></p>
    <p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;"><strong style="color: blue;"><span style="color: black;"><strong style="color: blue;"><span style="color: black;"><span style="color: black;">3、</span>认知层:自然语言处理、知识图谱和用户画像</span></strong></span></strong></p>
    <p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;"><span style="color: black;">自然语言处理的范围广泛,<span style="color: black;">倘若</span>细分的话,有<span style="color: black;">非常多</span>子<span style="color: black;">行业</span>,较宏观地可划分为语言的理解和生成,以及相应的应用系统。一方面要理解人的语言,另一方面要表达,能生成语言。<span style="color: black;">例如</span>,基本的分词、短语分析,核心的<span style="color: black;">处理</span>思路<span style="color: black;">便是</span>做句法的分析和语义的理解或意图的理解。如搜索“想去一家宠物医院,医院<span style="color: black;">周边</span>要有停车位”。这是人的一种自然的表达,<span style="color: black;">倘若</span>让计算机能够理解,就要把意图提取出来,从很<span style="color: black;">繁杂</span>的话中分析出其核心意图,<span style="color: black;">而后</span>再去找相应的答案。</span></p>
    <p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;"><img src="https://mmbiz.qpic.cn/mmbiz_png/heS6wRSHVMn5Gjib6ibgD9ID7QHCmjswsFz5LuiczOQ7JkVzLBcMlGiaicVgn2Fq6dV1hBTAKg6Lppaib8He2KA17C7Q/640?wx_fmt=png&amp;tp=webp&amp;wxfrom=5&amp;wx_lazy=1&amp;wx_co=1" style="width: 50%; margin-bottom: 20px;"></p>
    <p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;"><span style="color: black;">图示:用传统信息检索和搜索算法搜索“蒋英的女儿是谁”和“蒋英是谁的女儿”,会找到<span style="color: black;">一样</span>的答案,<span style="color: black;">由于</span>传统的信息检索是不管语序的。<span style="color: black;">此时</span>候<span style="color: black;">咱们</span>就要做真正的自然语言分析和理解,<span style="color: black;">晓得</span>它们<span style="color: black;">实质</span>上是在找<span style="color: black;">区别</span>的答案。这<span style="color: black;">背面</span>是知识图谱的支撑,<span style="color: black;">大众</span><span style="color: black;">能够</span>看到结构化的图文并茂的结果。</span></p>
    <p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;"><img src="https://mmbiz.qpic.cn/mmbiz_png/heS6wRSHVMn5Gjib6ibgD9ID7QHCmjswsFRuFz3BibDeYZqQUY6QibJLJ3A9ibpYtmy7eLBH6ufzIXaynD6AFIZRmSg/640?wx_fmt=png&amp;tp=webp&amp;wxfrom=5&amp;wx_lazy=1&amp;wx_co=1" style="width: 50%; margin-bottom: 20px;"></p>
    <p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;"><span style="color: black;"><span style="color: black;">咱们</span>看一篇<span style="color: black;">文案</span>、一本书,<span style="color: black;">此时</span>候<span style="color: black;">不仅</span>是理解其中每一句话,而是对整篇<span style="color: black;">文案</span>有一个理解,<span style="color: black;">便是</span>篇章的理解。篇章的理解,<span style="color: black;">能够</span>把<span style="color: black;">全部</span>篇章打上主题标签,打上<span style="color: black;">各样</span>实体标签,而这些对计算机来讲<span style="color: black;">便是</span>理解了这篇<span style="color: black;">文案</span>。在应用时,为了<span style="color: black;">区别</span>的应用,标签会有<span style="color: black;">区别</span>的形式,如用在<span style="color: black;">新闻</span>流里,打上这些标签以后,就<span style="color: black;">能够</span>匹配用户的兴趣,从而<span style="color: black;">举荐</span>给用户一篇他可能感兴趣的<span style="color: black;">文案</span>。</span></p>
    <p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;"><span style="color: black;">除了理解句子、篇章、文字以外,人写一句话、写一首诗<span style="color: black;">也</span>或写一篇<span style="color: black;">文案</span>,都是带有情感倾向的,<span style="color: black;">因此</span>相应地,<span style="color: black;">咱们</span><span style="color: black;">亦</span>做情感倾向的分析,<span style="color: black;">包含</span>用户看了一篇<span style="color: black;">文案</span>以后,下面有<span style="color: black;">非常多</span>评论,这些评论本身<span style="color: black;">咱们</span><span style="color: black;">亦</span>会做观点的抽取。</span></p>
    <p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;"><span style="color: black;">除了分析、理解以外,还有生成。<span style="color: black;">咱们</span>尝试过写诗、写对联等,<span style="color: black;">例如</span>在手机百度信息流里看到的<span style="color: black;">文案</span>,<span style="color: black;">非常多</span>都是人写的,但<span style="color: black;">亦</span>有很大一部分是<span style="color: black;">设备</span>自动写成的。<span style="color: black;">咱们</span>做过<span style="color: black;">各样</span>测试,用户基本上分辨不出来到底是人写的还是<span style="color: black;">设备</span>写的,这说明<span style="color: black;">设备</span>写的还是很不错的。其次,人要与智能硬件展开交互,对话过程中<span style="color: black;">触及</span>到对“人说的话”的理解和预测人<span style="color: black;">怎样</span>说下一句话,相当于理解和生成两方面都在用,<span style="color: black;">这儿</span>面<span style="color: black;">便是</span>对话管理以及交互的技术。</span></p>
    <p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;"><span style="color: black;">到<span style="color: black;">日前</span>为止,<span style="color: black;">咱们</span>讲的都是一种语言,都是中文,但“百度翻译”是<span style="color: black;">处理</span>多语言问题的,在28种语言之间互译,互译的方向大概是700多个,<span style="color: black;">每日</span>有过亿次的翻译请求。<span style="color: black;">同期</span><span style="color: black;">亦</span>结合了语音技术、视觉技术,延伸出了语音会话翻译、拍照翻译等等应用。</span></p>
    <p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;"><img src="https://mmbiz.qpic.cn/mmbiz_png/heS6wRSHVMn5Gjib6ibgD9ID7QHCmjswsFLvtwabzAsHLbl9HicCYiclXmf4cVhzqNcVEkL6pGvSyQhUr68qzibXGlA/640?wx_fmt=png&amp;tp=webp&amp;wxfrom=5&amp;wx_lazy=1&amp;wx_co=1" style="width: 50%; margin-bottom: 20px;"></p>
    <p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;"><span style="color: black;">人类几千年传承下来的知识,是人类能<span style="color: black;">循序渐进</span><span style="color: black;">持续</span>向前进步的原动力,而做这些知识的累积和传承很重要的载体是知识图谱,知识图谱里面<span style="color: black;">有些</span>基本的单位,如实体,<span style="color: black;">此刻</span><span style="color: black;">咱们</span>的知识图谱<span style="color: black;">已然</span>有几亿个实体,<span style="color: black;">每一个</span>实体会有<span style="color: black;">非常多</span>属性,实体与实体之间<span style="color: black;">亦</span>会有<span style="color: black;">非常多</span>关系,这些关系就<span style="color: black;">形成</span><span style="color: black;">非常多</span>事实,如A和B两个人可能是老师和学生的关系,这<span style="color: black;">便是</span>一个事实,<span style="color: black;">咱们</span><span style="color: black;">已然</span><span style="color: black;">累积</span>了几千亿事实。</span></p>
    <p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;"><img src="https://mmbiz.qpic.cn/mmbiz_png/heS6wRSHVMn5Gjib6ibgD9ID7QHCmjswsF7oUK7pahhajHiaFUZ2PVfrdW1OZYiaqlHfxeaMgQ6BiaVyt2M9dZsnqFg/640?wx_fmt=png&amp;tp=webp&amp;wxfrom=5&amp;wx_lazy=1&amp;wx_co=1" style="width: 50%; margin-bottom: 20px;"></p>
    <p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;"><span style="color: black;">知识不只是静态的存取,<span style="color: black;">况且</span><span style="color: black;">触及</span>到知识计算和推理。<span style="color: black;">例如</span>,离圣诞节还有多少天,系统<span style="color: black;">晓得</span>今天是哪一天,圣诞节是哪一天,系统会以此动态做一个计算。再<span style="color: black;">例如</span>,民航有<span style="color: black;">有些</span>规章,基于这些规章问一个问题,能<span style="color: black;">不可</span>“带打火机上飞机”,系统会<span style="color: black;">按照</span>这些规章的规则,判断这个问题的答案是“是”还是“否”。其次,<span style="color: black;">咱们</span>要<span style="color: black;">认识</span>用户本身的<span style="color: black;">需要</span>,<span style="color: black;">因此</span>对用户画像<span style="color: black;">亦</span>是非常重要的方向。<span style="color: black;">此刻</span>百度<span style="color: black;">累积</span>了非常丰富的用户画像,有非常多细分的标签,如一个人<span style="color: black;">能够</span>从人口属性、<span style="color: black;">行径</span>习惯、<span style="color: black;">长时间</span>兴趣、位置、短期意图等五个维度去刻画,形成初级的用户画像,构建个体模型。</span></p>
    <p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;"><strong style="color: blue;"><span style="color: black;"><strong style="color: blue;"><span style="color: black;"><span style="color: black;">4、</span>平台以及生态层</span></strong></span></strong></p>
    <p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;"><span style="color: black;">这一层<span style="color: black;">更加多</span>集中在百度大脑(ai.baidu.com),完整的生态<span style="color: black;">包含</span>云和端两大部分。百度云是很大的计算平台,不只是百度<span style="color: black;">能够</span>用,<span style="color: black;">况且</span>开放给所有的合作伙伴,变成<span style="color: black;">基本</span>的支撑平台,上面有百度大脑的<span style="color: black;">各样</span>能力。<span style="color: black;">同期</span>还有<span style="color: black;">有些</span>垂直的<span style="color: black;">处理</span><span style="color: black;">方法</span>,<span style="color: black;">例如</span>基于自然语言的人机交互的新一代操作系统,以及与智能驾驶<span style="color: black;">关联</span>的Apollo。整车厂商<span style="color: black;">能够</span>调用其中<span style="color: black;">她们</span>需要的能力,汽车电子厂商<span style="color: black;">亦</span><span style="color: black;">能够</span>调用<span style="color: black;">她们</span>需要的相应能力,<span style="color: black;">大众</span>共建<span style="color: black;">全部</span>平台和生态。</span></p>
    <p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;"><strong style="color: blue;"><span style="color: black;"><strong style="color: blue;"><span style="color: black;"><span style="color: black;">5、</span>应用层</span></strong></span></strong></p>
    <p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;"><span style="color: black;">语音搜索,是典型的在搜索上引入<span style="color: black;">有些</span>AI能力之后的<span style="color: black;">制品</span>形态,<span style="color: black;">这儿</span>不是一个“语音识别+简单的搜索”,而是<span style="color: black;">咱们</span>直接语音输入<span style="color: black;">咱们</span>想要的字的时候,<span style="color: black;">倘若</span><span style="color: black;">显现</span>多音字,如俪、莉,就会<span style="color: black;">显现</span>错误,但<span style="color: black;">倘若</span>用户说:“茉莉的莉”,语音纠错就会自动修改成“莉”,<span style="color: black;">而后</span>找到用户<span style="color: black;">最后</span>想要的答案。<span style="color: black;">因此</span>这就需要<span style="color: black;">非常多</span><span style="color: black;">关联</span>技术的支持。图像搜索<span style="color: black;">亦</span>是,<span style="color: black;">咱们</span>做了<span style="color: black;">非常多</span>图像搜索<span style="color: black;">关联</span>的尝试。</span></p>
    <p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;"><span style="color: black;">例如,找题很困难,<span style="color: black;">非常多</span>学生做题,题里有图、有公式,想把内容输入进去就很难,<span style="color: black;">因此</span>拍照就变成<span style="color: black;">尤其</span>方便的方式,<span style="color: black;">这儿</span>就会结合OCR的技术,对图像做识别。智能问答、个性化<span style="color: black;">举荐</span>等<span style="color: black;">一样</span>是综合了多种AI能力,如知识图谱、NLP、用户理解等,把答案或<span style="color: black;">新闻</span>更直观、更有针对性地展现给用户。除了互联网应用,<span style="color: black;">咱们</span><span style="color: black;">亦</span>在尝试AI能力与各行各业的结合,如智能客服、智慧机场等。</span></p>
    <p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;"><img src="https://mmbiz.qpic.cn/mmbiz_png/heS6wRSHVMn5Gjib6ibgD9ID7QHCmjswsF6nzUGzh0OCmib4B7QG4Q6rDLOZYpibVzAKoWO3aRWtKzxmQU9Eia9FLmQ/640?wx_fmt=png&amp;tp=webp&amp;wxfrom=5&amp;wx_lazy=1&amp;wx_co=1" style="width: 50%; margin-bottom: 20px;"></p>
    <p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;"><span style="color: black;">人工智能正在<span style="color: black;">作为</span>这个时代技术变革的核心驱动力,AI在To B<span style="color: black;">行业</span>的渗入将会给各行各业带来革命性的改变,<span style="color: black;">亦</span>会对人们的<span style="color: black;">平常</span>生活产生巨大的影响。人工智能应用广泛,其<span style="color: black;">实质</span><span style="color: black;">功效</span>绝<span style="color: black;">不仅</span>在互联网,就像<span style="color: black;">咱们</span><span style="color: black;">已然</span>很难想象任何一个行业离开电该<span style="color: black;">怎样</span>运转<span style="color: black;">同样</span>,人工智能<span style="color: black;">亦</span>会是新时代的电力。</span></p>
    <p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;"><span style="color: black;"><span style="color: black;">能够</span>预见,人工智能必将无处不在。</span></p>
    <p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;"><span style="color: black;"><strong style="color: blue;"><span style="color: black;">后台回复关键词<strong style="color: blue;"><span style="color: black;">“0911”</span></strong>,下载王海峰演讲PPT。</span></strong></span></p>
    <p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;"><span style="color: black;"><strong style="color: blue;"><span style="color: black;"><span style="color: black;">这次</span>会议</span></strong><span style="color: black;"><strong style="color: blue;"><span style="color: black;">演讲干货及PPT</span></strong></span><strong style="color: blue;"><span style="color: black;">经演讲嘉宾确认后会在</span></strong><strong style="color: blue;"><span style="color: black;">数据派THU</span></strong><strong style="color: blue;"><span style="color: black;"><span style="color: black;">第1</span>时间推送。<span style="color: black;">更加多</span></span></strong><strong style="color: blue;"><span style="color: black;"><span style="color: black;">关联</span>信息</span></strong><strong style="color: blue;"><span style="color: black;">,请关注<span style="color: black;">微X</span>公众号</span></strong><span style="color: black;"><strong style="color: blue;"><span style="color: black;">数据派THU(ID:DatapiTHU)</span></strong></span><strong style="color: blue;"><span style="color: black;">。</span></strong></span></p>
    <p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;"><span style="color: black;"><strong style="color: blue;"><span style="color: black;">回顾往期活动干货:</span></strong></span></p>
    <h2 style="color: black; text-align: left; margin-bottom: 10px;"><span style="color: black;"><a style="color: black;">独家 | Michael I. Jordan最新清华授课笔记!</a></span></h2>
    <h2 style="color: black; text-align: left; margin-bottom: 10px;"><a style="color: black;">倪光南院士最新演讲:<span style="color: black;">怎样</span>构建安全可控的信息技术体系(附PPT&amp;视频)</a></h2>
    <h2 style="color: black; text-align: left; margin-bottom: 10px;"><a style="color: black;"><span style="color: black;">重磅 | 数据挖掘之父韩家炜:文本语料库的数据挖掘(附视频+PPT下载)</span></a></h2>
    <h2 style="color: black; text-align: left; margin-bottom: 10px;"><span style="color: black;"><a style="color: black;"><span style="color: black;">设备</span>智能加速器:大数据环境下知识工程的机遇和挑战 | 清华李涓子教授</a></span></h2>
    <h2 style="color: black; text-align: left; margin-bottom: 10px;"><a style="color: black;"><span style="color: black;">IBM苏中:怎</span></a>样利用深度学习、<span style="color: black;">加强</span>学习等<span style="color: black;">办法</span><span style="color: black;">加强</span>信息处理效率</h2>
    <p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;">......</p>
    <p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;"><img src="https://mmbiz.qpic.cn/mmbiz_jpg/heS6wRSHVMmCGJlfLia0LBzV1XyKic2AHoDSX2dPOIVnNz6DksXpGEevdkaxicHJHpCbI1JnVGPsz0pMqatduBDkg/640?wx_fmt=jpeg&amp;tp=webp&amp;wxfrom=5&amp;wx_lazy=1&amp;wx_co=1" style="width: 50%; margin-bottom: 20px;"></p>




页: [1]
查看完整版本: 独家 | 王海峰:百度大数据与人工智能(附PPT下载)