m5k1umn 发表于 2024-10-9 06:36:22

俄罗斯最大搜索引擎Yandex开源了一款梯度加强设备学习库CatBoost


    <div style="color: black; text-align: left; margin-bottom: 10px;">
      <p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;"><img src="https://p3-sign.toutiaoimg.com/31b800009331b18c2310~noop.image?_iz=58558&amp;from=article.pc_detail&amp;lk3s=953192f4&amp;x-expires=1728528778&amp;x-signature=2d95gCE3BSoX7u7QvYRvpufHoJ8%3D" style="width: 50%; margin-bottom: 20px;"></p>
      <p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;"><span style="color: black;">此刻</span>,人工智能正在为越来越多的计算功能<span style="color: black;">供给</span>支持,今天,俄罗斯搜索巨头Yandex宣布,将向开源社区提交一款梯度<span style="color: black;">提高</span><span style="color: black;">设备</span>学习库CatBoost。它能够在数据稀疏的<span style="color: black;">状况</span>下“教”<span style="color: black;">设备</span>学习。<span style="color: black;">尤其</span>是在<span style="color: black;">无</span>像视频、文本、图像这类感官型数据的时候,CatBoost<span style="color: black;">亦</span>能<span style="color: black;">按照</span>事务型数据或历史数据进行操作。</p>
      <p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;">今天,CatBoost以两种方式进行了亮相。</p>
      <p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;"><span style="color: black;">首要</span>,Yandex宣布,将在自有服务中<span style="color: black;">运用</span>这款新的框架替换原来的<span style="color: black;">设备</span>学习算法MatrixNet。MatrixNet<span style="color: black;">始终</span>被应用在<span style="color: black;">机构</span>的<span style="color: black;">非常多</span>业务上,<span style="color: black;">例如</span>排名、天气预报、出租车和<span style="color: black;">举荐</span>业务。<span style="color: black;">此刻</span>,业务正在逐步从MatrixNet切换到CatBoost上来,并将延续几个月。</p>
      <p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;">其次,Yandex将免费<span style="color: black;">供给</span>CatBoost库,任何<span style="color: black;">期盼</span>在自己的程序中<span style="color: black;">运用</span>梯度<span style="color: black;">提高</span>技术的人员都<span style="color: black;">能够</span>在Apache许可证下<span style="color: black;">运用</span>这个库。 Yandex<span style="color: black;">设备</span>智能<span style="color: black;">科研</span>主管Misha Bilenko在接受采访时<span style="color: black;">暗示</span>:“CatBoost是Yandex<span style="color: black;">数年</span><span style="color: black;">科研</span>的巅峰之作。<span style="color: black;">咱们</span>自己<span style="color: black;">始终</span>在<span style="color: black;">运用</span><span style="color: black;">海量</span>的开源<span style="color: black;">设备</span>学习工具,<span style="color: black;">因此</span>是时候向社会作出回馈了。” 他<span style="color: black;">说到</span>,Google在2015年开源的Tensorflow以及Linux的<span style="color: black;">创立</span>与发展是<span style="color: black;">这次</span>开源CatBoost的原动力。</p>
      <p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;">Bilenko<span style="color: black;">弥补</span>说到,暂时还<span style="color: black;">无</span>计划将CatBoost<span style="color: black;">商场</span>化,或以任何专利的形式将其闭源。 “这和竞争对手无关,”他说,“<span style="color: black;">咱们</span>很高兴有竞争对手<span style="color: black;">运用</span>它”</p>
      <p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;"><span style="color: black;">长时间</span><span style="color: black;">败兴</span>,随着Yandex的<span style="color: black;">持续</span>发展,它<span style="color: black;">始终</span>在寻求<span style="color: black;">提高</span>俄语世界之外的国际地位。<span style="color: black;">这次</span>开源举动<span style="color: black;">不仅</span>是Yandex对开源社区的承诺,<span style="color: black;">况且</span><span style="color: black;">亦</span>展示了Yandex<span style="color: black;">期盼</span><span style="color: black;">作为</span>大型科技<span style="color: black;">机构</span>与<span style="color: black;">研发</span>者社区发展中心的决心。</p>
      <p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;">就像Google<span style="color: black;">连续</span>地扩展和更新Tensorflow<span style="color: black;">同样</span>,今天的CatBoost版本是其<span style="color: black;">第1</span>个版本,以后将<span style="color: black;">连续</span>更新迭代。<span style="color: black;">日前</span>,这个库<span style="color: black;">重点</span>有三个特点:</p>
      <p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;">“减少过度拟合”:这<span style="color: black;">能够</span><span style="color: black;">帮忙</span>你在训练计划中取得更好的成果。它基于一种构建模型的专有算法,这种算法与标准的梯度<span style="color: black;">提高</span><span style="color: black;">方法</span><span style="color: black;">区别</span>。</p>
      <p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;">“类别特征支持”:这将改善你的训练结果,<span style="color: black;">同期</span><span style="color: black;">准许</span>你<span style="color: black;">运用</span>非数字<span style="color: black;">原因</span>,“而不必预先处理数据,或花费时间和精力将其转化为数字。”</p>
      <p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;">“API接口支持”:<span style="color: black;">能够</span><span style="color: black;">经过</span>命令行<span style="color: black;">或</span>基于Python或R的API接口来<span style="color: black;">运用</span>CatBoost,<span style="color: black;">包含</span>公式分析和训练可视化工具。</p>
      <p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;">虽然<span style="color: black;">日前</span>有<span style="color: black;">海量</span>的库<span style="color: black;">能够</span>利用梯度<span style="color: black;">提高</span>或其他<span style="color: black;">处理</span><span style="color: black;">方法</span>来训练<span style="color: black;">设备</span>学习系统,但Bilenko认为,CatBoost相较其他大型<span style="color: black;">机构</span><span style="color: black;">运用</span>的框架(如Yandex)的最大优点是测试<span style="color: black;">精细</span>度高。</p>
      <p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;">“有<span style="color: black;">非常多</span><span style="color: black;">设备</span>学习库的代码质量比较差,需要做<span style="color: black;">海量</span>的调优工作,”他说,“而CatBoost只需少量调试,就<span style="color: black;">能够</span>实现良好的性能。这是一个关键性的区别。”</p>
      <p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;">附CatBoost开源代码<span style="color: black;">位置</span>: https://catboost.yandex/</p>
      <p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;"><span style="color: black;">文案</span>原标题《Yandex open sources CatBoost, a gradient boosting machine learning library》,作者:Ingrid Lunden,译者:夏天,审校:主题曲。</p>
    </div>




页: [1]
查看完整版本: 俄罗斯最大搜索引擎Yandex开源了一款梯度加强设备学习库CatBoost