f9yx0du 发表于 2024-8-31 02:09:06

基于AI算法的无线网络邻区关系优化科研与实践


    <p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;"><span style="color: black;"><strong style="color: blue;">&nbsp; 摘要:&nbsp;</strong></span></p>
    <p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;">针对现有邻区优化方式的不足,基于现网数据引入XGBoost<span style="color: black;">设备</span>学习回归预测算法,<span style="color: black;">经过</span>学习<span style="color: black;">拥有</span>自动邻区关系网络的两两小区切换占比<span style="color: black;">创立</span>预测模型,优化非自动邻区关系网络小区邻区关系。<span style="color: black;">科研</span>结果<span style="color: black;">显示</span>,基于AI算法的无线网络邻区关系优化能有效<span style="color: black;">加强</span>邻区优化效率,<span style="color: black;">提高</span>邻区关系的准确性。</p>
    <p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;"><strong style="color: blue;">&nbsp; 引&nbsp; 言&nbsp;&nbsp;</strong></p>
    <p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;">在无线网络优化工作中,邻区优化是降低掉话率、<span style="color: black;">提高</span>移动网络质量、改善用户感知的最基本且最有效的手段。<span style="color: black;">日前</span>基站邻区优化有2种方式:自动邻区关系(ANR)和非自动邻区关系(下文简<span style="color: black;">叫作</span>非自动邻区关系网络为传统网络)。具备自动邻区关系的网络可自动优化邻区关系,不需人工<span style="color: black;">干涉</span>;传统网络邻区关系需优化人员手工优化。这些网络邻区的数目众多,优化工作量非常大;需要优化邻区的确定与个人优化经验有很大的关系,稍有<span style="color: black;">不小心</span>就可能<span style="color: black;">导致</span>邻区漏配或冗余邻区,存在<span style="color: black;">很强</span>的优化<span style="color: black;">危害</span>。规避<span style="color: black;">以上</span>问题,<span style="color: black;">加强</span>邻区优化的效率和精度已<span style="color: black;">作为</span>网络优化的关键。<span style="color: black;">思虑</span>到在ANR网络中,自动邻区关系已<span style="color: black;">作为</span>小区SON功能的标配,无需人员操作网络便可自动识别和添加邻区,<span style="color: black;">怎样</span>利用ANR邻区关系来优化传统网络邻区已<span style="color: black;">作为</span>网络运营智能化的重要课题。</p>
    <p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;"><span style="color: black;">设备</span>学习技术<span style="color: black;">做为</span>人工智能的重要<span style="color: black;">构成</span>部分,是国家发展战略重点扶持的<span style="color: black;">目的</span>和当下各行业关注应用的焦点。为了推动传统网络邻区优化的智能化,<span style="color: black;">提高</span>网络运营智能化水平,特开展基于<span style="color: black;">设备</span>学习算法的邻区关系优化的<span style="color: black;">科研</span>。</p>
    <p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;"><strong style="color: blue;">01</strong></p>
    <p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;">传统无线网络邻区关系优化难点</p>
    <p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;">在传统网络优化中,邻区关系优化<span style="color: black;">始终</span><span style="color: black;">败兴</span>是一个难点。<span style="color: black;">因为</span>邻区关系数量多、影响大、技术<span style="color: black;">需求</span>高、优化手段匮乏等等方面的<span style="color: black;">原因</span>,使得邻区关系优化在传统网络中存在<span style="color: black;">有些</span>挑战。</p><strong style="color: blue;">1.1 邻区关系数量多,<span style="color: black;">引起</span>优化耗时耗力</strong>
    <p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;">以福州联通为例,W现网有小区25 000个,用<span style="color: black;">每一个</span>小区有20~25条邻区来计算,所配置的邻区个数<span style="color: black;">最少</span>50万条以上,网优人员每周提取MR数据,<span style="color: black;">运用</span>厂家工具进行同频、异频邻区核查,<span style="color: black;">按照</span>核查结果,确定需要优化的邻区,并进行相应操作,邻区优化的工作量非常大。</p><strong style="color: blue;">1.2 邻区关系影响面大,直接关系网络口碑</strong>
    <p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;">邻区设置<span style="color: black;">欠妥</span>,会<span style="color: black;">引起</span>干扰增大、容量下降和性能恶化,严重影响用户感知,<span style="color: black;">诱发</span>的掉话等问题会<span style="color: black;">引起</span>用户投诉,给运营商网络口碑带来<span style="color: black;">消极</span>影响,影响NPS得分。邻区设置<span style="color: black;">欠妥</span>有2种表现方式:邻区漏配和冗余邻区。邻区漏配会<span style="color: black;">导致</span>干扰增大,降低用户的通话质量<span style="color: black;">乃至</span>掉话,从而<span style="color: black;">导致</span>容量及覆盖能力下降;冗余邻区一方面将会<span style="color: black;">因为</span>切换的<span style="color: black;">太多</span>会<span style="color: black;">引起</span>信令负荷加重;另一方面<span style="color: black;">因为</span>终端<span style="color: black;">测绘</span>能力的限制,会降低<span style="color: black;">测绘</span>的精度、<span style="color: black;">增多</span><span style="color: black;">测绘</span>时延。<span style="color: black;">同期</span>信号较多会<span style="color: black;">导致</span>干扰,容易<span style="color: black;">显现</span>掉话,影响速率的<span style="color: black;">提高</span>,从而影响用户感知。</p><strong style="color: blue;">1.3 邻区关系优化手段缺乏,对技术<span style="color: black;">需求</span>高</strong>
    <p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;">传统的邻区关系优化手段有2种:基于路测软件分析和基于厂家的邻区核查工具平台。</p>
    <p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;">a)路测软件分析。基于导频的小区切换关系来定位邻区关系<span style="color: black;">恰当</span>性,该<span style="color: black;">办法</span>的局限性是路测范围有限,覆盖面不足,<span style="color: black;">没法</span>开展全网的精细邻区优化,且路测<span style="color: black;">办法</span>耗时耗力。</p>
    <p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;">b)基于厂家的邻区核查平台。<span style="color: black;">经过</span>采集UE上报的<span style="color: black;">测绘</span>报告、话统呼叫记录、事件进行汇总分析,判断邻区漏配和冗余。该<span style="color: black;">办法</span>有较高的精确性,但受限于厂家License配额和优化人员的技术水平。</p>
    <p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;"><strong style="color: blue;">02</strong></p>
    <p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;">基于XGBoost算法的小区切换占比预测</p>
    <p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;">随着运营商移动用户数的<span style="color: black;">持续</span><span style="color: black;">增多</span>,良好的用户网络体验<span style="color: black;">保证</span>对无线网络运营提出了更高的<span style="color: black;">需求</span>。影响无线网络质量的<span style="color: black;">原因</span><span style="color: black;">非常多</span>,其中邻区关系是一个关键<span style="color: black;">原因</span>,它是小区移动性管理的直接承载者。做好邻区关系优化,始终是网优工作的重点。</p>
    <p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;">本文<span style="color: black;">经过</span>利用XGBoost<span style="color: black;">设备</span>学习算法学习ANR现网邻区关系数据,<span style="color: black;">创立</span>小区间切换次数占比模型预测出传统网络小区的邻区关系。该模型可在开站邻区配置、邻区核查、用户投诉分析等网优<span style="color: black;">平常</span>工作中起到积极<span style="color: black;">功效</span>。</p><strong style="color: blue;">2.1 训练集和测试集样本生成</strong>
    <p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;">2.1.1 样本的采集</p>
    <p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;">提取某省联通2个行政区LTE网络3天的两两小区切换次数报表,汇总<span style="color: black;">每一个</span>小区邻区的切换次数占比降序<span style="color: black;">摆列</span>,<span style="color: black;">每一个</span>小区取占比前50名的邻区<span style="color: black;">做为</span>样本,切换占比为样本标签,<span style="color: black;">同期</span><span style="color: black;">相关</span>网络工参<span style="color: black;">关联</span>字段(见表1),形成<span style="color: black;">最后</span>样本。</p>
    <p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;">表1&nbsp; 网络工参字段</p><img src="https://mmbiz.qpic.cn/mmbiz_png/rmgntykSUhIUuxPciaIytbREZgXPBlvT0zHCPrWgCD9PEVR6cEmwZR2rSDt4mydNpuHfWnibaMQwXovVPuamp2MA/640?wx_fmt=png&amp;tp=webp&amp;wxfrom=5&amp;wx_lazy=1&amp;wx_co=1" style="width: 50%; margin-bottom: 20px;">
    <p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;">2.1.2 样本划分为训练集和测试集</p>
    <p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;"><span style="color: black;">设备</span>学习<span style="color: black;">通常</span>将样本划分为训练集和测试集,训练集用于模型训练,测试集用于测试模型性能。本文利用sciki-learn的train_test_split()函数将样本划分为训练集和测试集,其中参数测试集比例test_size取0.2,即训练集和测试集比例为8:2。</p>
    <p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;"><strong style="color: blue;">2.2 数据预处理</strong></p>
    <p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;">数据预处理<span style="color: black;">重点</span>是<span style="color: black;">检测</span><span style="color: black;">每一个</span>特征<span style="color: black;">是不是</span>有缺失值或<span style="color: black;">违法</span>字符,对不<span style="color: black;">恰当</span>的值进行校正替换。<span style="color: black;">检测</span>样本数据<span style="color: black;">发掘</span>,覆盖类型为室分的小区方位角都是0值,这与<span style="color: black;">实质</span>室分小区为全向覆盖不符,故室分小区的方位角需修正。修正<span style="color: black;">办法</span>如下:若室分小区与宏站邻小区同经纬度,则室分小区取宏站邻小区的方位角;若室分小区与室分邻小区同经纬度,则室分小区方位角取值368︒;若室分小区与邻小区<span style="color: black;">区别</span>经纬度,则室分小区方位角取室分小区与邻小区连线与正北方向的顺时针夹角r(见图1)。</p><img src="https://mmbiz.qpic.cn/mmbiz_png/rmgntykSUhIUuxPciaIytbREZgXPBlvT0OjfAKsH76LicDOeZq18yfRHLjmqnlwnZCkl4kpjppibdDjD3olPmS5Og/640?wx_fmt=png&amp;tp=webp&amp;wxfrom=5&amp;wx_lazy=1&amp;wx_co=1" style="width: 50%; margin-bottom: 20px;">
    <p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;"><strong style="color: blue;">图1. 室分小区方位角定义</strong></p>
    <p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;">设室分小区经纬度(X1,Y1),邻小区经纬度(X2,Y2),<span style="color: black;">详细</span>小区连线夹角r计算公式如下:</p><img src="https://mmbiz.qpic.cn/mmbiz_png/rmgntykSUhIUuxPciaIytbREZgXPBlvT0YQY8OsKX5AgpdRJ5yibaRic0icfHSqyQibSSSic1GEPGAwTTqF2YUXnQRDA/640?wx_fmt=png&amp;tp=webp&amp;wxfrom=5&amp;wx_lazy=1&amp;wx_co=1" style="width: 50%; margin-bottom: 20px;"><img src="https://mmbiz.qpic.cn/mmbiz_png/rmgntykSUhIUuxPciaIytbREZgXPBlvT09ibva4ttxT2zUnmmE7mib8aBO92h9FLV0MEDrEAjs3uR2yajLv2YzWiaQ/640?wx_fmt=png&amp;tp=webp&amp;wxfrom=5&amp;wx_lazy=1&amp;wx_co=1" style="width: 50%; margin-bottom: 20px;">
    <p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;"><strong style="color: blue;">图2&nbsp; &nbsp;室分小区方位角特征预处理</strong></p>
    <p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;">图2给出了室分小区方位角特征预处理过程。</p>
    <p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;"><strong style="color: blue;">2.3 特征工程</strong></p>
    <p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;">特征工程是<span style="color: black;">设备</span>学习过程的重要环节,样本特征的好坏决定了<span style="color: black;">设备</span>学习性能的上限,而模型只是逼近这个上限<span style="color: black;">罢了</span>。特征工程的<span style="color: black;">重点</span>内容<span style="color: black;">包含</span>特征构造、特征抽取和特征<span style="color: black;">选取</span>。本文的原始特征<span style="color: black;">包含</span>本地/<span style="color: black;">目的</span>小区经纬度、本地/<span style="color: black;">目的</span>小区方位<span style="color: black;">方向</span>、本地/<span style="color: black;">目的</span>小区合计下倾<span style="color: black;">方向</span>及本地/<span style="color: black;">目的</span>小区天线挂高10个维度。为了满足特征<span style="color: black;">选取</span>的需要,<span style="color: black;">这里</span>基于本地/<span style="color: black;">目的</span>小区的经纬度构造额外的特征,<span style="color: black;">重点</span><span style="color: black;">包含</span>haversine距离、两经纬度的方位角、经纬度PCA分量,最后进行特征<span style="color: black;">选取</span>。</p>
    <p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;">2.3.1 haversine距离</p>
    <p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;">haversine公式是计算球面两点间距离的一种<span style="color: black;">办法</span>,该<span style="color: black;">办法</span>采用了正弦函数,即使距离很小,<span style="color: black;">亦</span>能保持足够的有效数字。haversine距离计算公式如下:</p><img src="https://mmbiz.qpic.cn/mmbiz_png/rmgntykSUhIUuxPciaIytbREZgXPBlvT0mqf5IxeueKrrdEIXaOvyibL3GF8JeZbVJF69Stp7YJ8fKia7vEzc7hCw/640?wx_fmt=png&amp;tp=webp&amp;wxfrom=5&amp;wx_lazy=1&amp;wx_co=1" style="width: 50%; margin-bottom: 20px;">
    <p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;"><span style="color: black;">其中,haversine(α)=sin</span>2<span style="color: black;">&nbsp;(α⁄2)=((1-cos⁡α ))⁄2,R为地球半径<span style="color: black;">,</span>取6 371 km,φ</span>1&nbsp;<span style="color: black;">、φ</span>2<span style="color: black;"><span style="color: black;">暗示</span>2点的纬度,∆θ<span style="color: black;">暗示</span>2点经度的差值。代码实现如图3所示。</span></p><img src="https://mmbiz.qpic.cn/mmbiz_png/rmgntykSUhIUuxPciaIytbREZgXPBlvT0ERAD3ONonpvGgDUhlajhhgNVN3ythGnIA8RzBVGMl0iczK62sLztlSQ/640?wx_fmt=png&amp;tp=webp&amp;wxfrom=5&amp;wx_lazy=1&amp;wx_co=1" style="width: 50%; margin-bottom: 20px;">
    <p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;"><strong style="color: blue;">图3&nbsp; &nbsp;本地/<span style="color: black;">目的</span>小区haversine距离计算</strong></p>
    <p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;">2.3.2&nbsp; 两经纬度的方位角</p>
    <p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;">设本地小区经纬度为(lat1,lng1),<span style="color: black;">目的</span>小区经纬度为(lat2,lng2),两经纬度间的方位角公式计算如下,代码实现如图4所示。</p><img src="https://mmbiz.qpic.cn/mmbiz_png/rmgntykSUhIUuxPciaIytbREZgXPBlvT0kwYnKc6EFu7S8vxJicRficD0G2JVcibFicnv433EmgBQMzS6FxTMWAgOCA/640?wx_fmt=png&amp;tp=webp&amp;wxfrom=5&amp;wx_lazy=1&amp;wx_co=1" style="width: 50%; margin-bottom: 20px;"><img src="https://mmbiz.qpic.cn/mmbiz_png/rmgntykSUhIUuxPciaIytbREZgXPBlvT0129zk3eMI6dJ954aBYE2VVlMUr8VWZ1ibk0qiaf4uplguFh5HsJptPAg/640?wx_fmt=png&amp;tp=webp&amp;wxfrom=5&amp;wx_lazy=1&amp;wx_co=1" style="width: 50%; margin-bottom: 20px;">
    <p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;"><strong style="color: blue;">图4&nbsp; &nbsp;2个经纬度间的方位角计算</strong></p>
    <p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;">2.3.3 经纬度的PCA分量</p>
    <p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;">主<span style="color: black;">成份</span>分析(PCA——Principal Component Analysis)是最广泛的数据压缩算法,<span style="color: black;">重点</span><span style="color: black;">经过</span>降维<span style="color: black;">能够</span>生成更便于人理解的新特征,加快对样本有价值信息的处理速度。此处对本地/<span style="color: black;">目的</span>小区经纬度4个特征采用PCA进行变换,默认降维后的特征数仍为4(见图5)。</p><img src="https://mmbiz.qpic.cn/mmbiz_png/rmgntykSUhIUuxPciaIytbREZgXPBlvT0ibb8G6WmlaBU9icHwdFicRiayKeN1AMAF50adSzNrgLWzpUibN4CiboaPt8A/640?wx_fmt=png&amp;tp=webp&amp;wxfrom=5&amp;wx_lazy=1&amp;wx_co=1" style="width: 50%; margin-bottom: 20px;">
    <p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;"><strong style="color: blue;">图5&nbsp; &nbsp;本地/<span style="color: black;">目的</span>小区经纬度的PCA变换</strong></p>
    <p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;">2.3.4&nbsp; 特征/<span style="color: black;">目的</span><span style="color: black;">关联</span>性分析</p>
    <p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;">特征<span style="color: black;">选取</span>不仅<span style="color: black;">拥有</span>减少特征数量(降维)、减少过拟合、<span style="color: black;">加强</span>模型泛化能力等优点,<span style="color: black;">况且</span>还<span style="color: black;">能够</span>使模型<span style="color: black;">得到</span>更好的解释性,<span style="color: black;">加强</span>对特征和特征值、特征和<span style="color: black;">目的</span>之间关系的理解,加快模型的训练速度<span style="color: black;">得到</span>更好的预测性能。此处采用pandas的<span style="color: black;">关联</span>系数计算函数corr()来分析特征和<span style="color: black;">目的</span>间的<span style="color: black;">关联</span>性(见图6和表2)。</p><img src="https://mmbiz.qpic.cn/mmbiz_png/rmgntykSUhIUuxPciaIytbREZgXPBlvT08Lib2940ciaSQecerrwEMCkoK5G4NCBS5Izve99IOlpEaTrtxGzzdD5w/640?wx_fmt=png&amp;tp=webp&amp;wxfrom=5&amp;wx_lazy=1&amp;wx_co=1" style="width: 50%; margin-bottom: 20px;">
    <p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;"><strong style="color: blue;">图6&nbsp; 特征和<span style="color: black;">目的</span>间的<span style="color: black;">关联</span>性热力图</strong></p>
    <p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;">表2&nbsp; 特征和<span style="color: black;">目的</span>间的<span style="color: black;">关联</span>系数值</p><img src="https://mmbiz.qpic.cn/mmbiz_png/rmgntykSUhIUuxPciaIytbREZgXPBlvT0Ao5JoTWZvxkRlmBicUsaNLiadaFcIcquZrpHiaeTI9IOpQT5E4sLrnVmQ/640?wx_fmt=png&amp;tp=webp&amp;wxfrom=5&amp;wx_lazy=1&amp;wx_co=1" style="width: 50%; margin-bottom: 20px;">
    <p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;">从热力图上<span style="color: black;">能够</span><span style="color: black;">发掘</span>,部分特征间的<span style="color: black;">关联</span>性过高,这将<span style="color: black;">导致</span>特征间的多重共线性,影响模型效果,<span style="color: black;">这儿</span>剔除<span style="color: black;">关联</span>系数大于0.8的特征(<span style="color: black;">包含</span>本地小区LATI⁃TUDE,本地小区LATITUDE_pca_0,本地小区LONGITUDE),<span style="color: black;">保存</span>与<span style="color: black;">目的</span><span style="color: black;">关联</span>性最大的特征。</p>
    <p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;">2.3.5&nbsp; 特征标准化</p>
    <p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;">特征标准化<span style="color: black;">便是</span>将某列特征的值缩放到均值为0,方差为1的状态,计算公式为z=((x-μ))⁄σ。标准化的好处是<span style="color: black;">提高</span>模型精度和加快收敛速度。此处<span style="color: black;">运用</span>scikit-learn自带的StandardScaler()类进行转换。</p><strong style="color: blue;">2.4 模型训练</strong>
    <p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;">2.4.1 基于交叉验证的回归预测模型<span style="color: black;">选取</span></p>
    <p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;"><span style="color: black;">设备</span>学习中常用的回归预测模型有线性回归、KNN、随机森林、GBDT和XGBoost等。<span style="color: black;">这儿</span>分别<span style="color: black;">运用</span>这几个模型进行交叉验证打分,选出最好的模型。这些模型的参数都取默认值,交叉验证折数取5,<span style="color: black;">评定</span>标准为平均绝对误差MAE。实验结果<span style="color: black;">显示</span>,最好的模型为XGBoost,平均cross_val_score得分最高为-0.03(见图7)。下面就<span style="color: black;">运用</span>XGBoost模型进行建模训练。</p><img src="https://mmbiz.qpic.cn/mmbiz_png/rmgntykSUhIUuxPciaIytbREZgXPBlvT0Ja3KicScOqcib8BcQ4bHkUKgLncrcfmehUbpb7woj5aUzpcQaRGIaYlg/640?wx_fmt=png&amp;tp=webp&amp;wxfrom=5&amp;wx_lazy=1&amp;wx_co=1" style="width: 50%; margin-bottom: 20px;">
    <p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;"><strong style="color: blue;">图7&nbsp; 基于交叉验证的回归模型<span style="color: black;">选取</span></strong></p>
    <p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;">2.4.2&nbsp; XGBoost算法原理概述</p>
    <p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;">XGBoost算法近年来在工业界和各类数据挖掘竞赛中大放异彩,取得良好的预测效果。与传统的Boosting算法如GBDT比较,XGBoost算法优点在于:GBDT只利用了一阶导数的信息,而XGBoost对损失函数做了二阶泰勒展开,并且在<span style="color: black;">目的</span>函数中加入了正则项,用来权衡<span style="color: black;">目的</span>函数和模型的<span style="color: black;">繁杂</span>程度,防止过拟合;Boosting是串行过程,<span style="color: black;">不可</span>并行化且计算<span style="color: black;">繁杂</span>度较高,<span style="color: black;">亦</span>不适合高维稀疏特征,而XGBoost在特征粒度上可进行并行化计算且<span style="color: black;">思虑</span>了训练数据为稀疏值的<span style="color: black;">状况</span>。该算法原理如下:</p>
    <p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;">XGBoost算法的<span style="color: black;">目的</span>函数<span style="color: black;">包括</span>损失函数L和正则化项Ω:</p><img src="https://mmbiz.qpic.cn/mmbiz_jpg/rmgntykSUhIUuxPciaIytbREZgXPBlvT0SHZNWoicpZIUClfOJ8acCJeRNtZPGlEMaAzqTEZO0Wic5ibhPUfiaS55Yg/640?wx_fmt=jpeg&amp;tp=webp&amp;wxfrom=5&amp;wx_lazy=1&amp;wx_co=1" style="width: 50%; margin-bottom: 20px;">
    <p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;">(8)</p>
    <p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;"><span style="color: black;">按照</span>第t步的新模型的预测值ft&nbsp;(xi&nbsp;),此时的<span style="color: black;">目的</span>函数可写成:</p><img src="https://mmbiz.qpic.cn/mmbiz_jpg/rmgntykSUhIUuxPciaIytbREZgXPBlvT0gk5Mb8X174x3j8nAiaFp7jJTdDu53OS5qkZYNp8iatuwAiax2xNt4icfPA/640?wx_fmt=jpeg&amp;tp=webp&amp;wxfrom=5&amp;wx_lazy=1&amp;wx_co=1" style="width: 50%; margin-bottom: 20px;">
    <p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;">(9)</p>
    <p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;">利用泰勒公式将<span style="color: black;">目的</span>函数进行泰勒二阶展开,得</p><img src="https://mmbiz.qpic.cn/mmbiz_jpg/rmgntykSUhIUuxPciaIytbREZgXPBlvT0PtpoZtaCSIHchE1NPNJOJAs3eNTybCx30rWYCKTkzaYzWxW09TfKuw/640?wx_fmt=jpeg&amp;tp=webp&amp;wxfrom=5&amp;wx_lazy=1&amp;wx_co=1" style="width: 50%; margin-bottom: 20px;">
    <p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;">(10)</p>
    <p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;">其中gi为损失函数一阶导数,hi为损失函数的二阶导数。当损失函数取平方损失时,<span style="color: black;">目的</span>函数近似为:</p><img src="https://mmbiz.qpic.cn/mmbiz_jpg/rmgntykSUhIUuxPciaIytbREZgXPBlvT0G7nvT2TCsaAfPPrA5BGFag0NRTzia7abTzNeyGDhtXqgnZw5u4IwN4Q/640?wx_fmt=jpeg&amp;tp=webp&amp;wxfrom=5&amp;wx_lazy=1&amp;wx_co=1" style="width: 50%; margin-bottom: 20px;">
    <p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;">(11)</p>
    <p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;">进一步地,基函数取为决策树模型ft&nbsp;(x)=ωq(x)&nbsp;,q(x)<span style="color: black;">暗示</span>样本x所在的叶子节点,<span style="color: black;">同期</span>设决策树叶子节点数为T,该值决定了决策树的<span style="color: black;">繁杂</span>度,值越大模型越<span style="color: black;">繁杂</span>,此时<span style="color: black;">目的</span>函数的正则项<span style="color: black;">暗示</span>为:</p><img src="https://mmbiz.qpic.cn/mmbiz_jpg/rmgntykSUhIUuxPciaIytbREZgXPBlvT0I3FvTrYeUQNaFGpuZlYfnyccr4uBrcpOeA3XMpgk6InuanmZSEyaHg/640?wx_fmt=jpeg&amp;tp=webp&amp;wxfrom=5&amp;wx_lazy=1&amp;wx_co=1" style="width: 50%; margin-bottom: 20px;">
    <p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;">(12)</p>
    <p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;"><span style="color: black;">因为</span><span style="color: black;">每一个</span>样本x_i<span style="color: black;">最后</span>都是落在叶子节点上,且<span style="color: black;">每一个</span>叶子节点都会<span style="color: black;">包括</span>多个样本,<span style="color: black;">因此呢</span>遍历所有样本x_i求损失函数等价于遍历所有叶子节点求损失函数,设第j个叶子节点<span style="color: black;">包括</span>的样本集合为Ij={i},则损失函数为:</p><img src="https://mmbiz.qpic.cn/mmbiz_jpg/rmgntykSUhIUuxPciaIytbREZgXPBlvT0oCj3QCibUWySicKWLzbeLF3icEw6MvhDLuicYibMP3Pfp2IQ5ib4RhWwia6fg/640?wx_fmt=jpeg&amp;tp=webp&amp;wxfrom=5&amp;wx_lazy=1&amp;wx_co=1" style="width: 50%; margin-bottom: 20px;">
    <p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;">(13)</p>
    <p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;">为简化公式,定义<img src="https://mmbiz.qpic.cn/mmbiz_png/rmgntykSUhIUuxPciaIytbREZgXPBlvT0diaDyD4h0DtBVkkOpTiadCH8BP8hdI4qakkJyKg0fMgMhmGJvCibFN7HA/640?wx_fmt=png&amp;tp=webp&amp;wxfrom=5&amp;wx_lazy=1&amp;wx_co=1" style="width: 50%; margin-bottom: 20px;"><span style="color: black;">目的</span>函数为:</p><img src="https://mmbiz.qpic.cn/mmbiz_png/rmgntykSUhIUuxPciaIytbREZgXPBlvT0KYDJdSz1eviaQjUImd2E7x6icxME8NCAksnvS05njnBibib2Veqn0EHZlg/640?wx_fmt=png&amp;tp=webp&amp;wxfrom=5&amp;wx_lazy=1&amp;wx_co=1" style="width: 50%; margin-bottom: 20px;">
    <p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;">(14)</p>
    <p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;">接着对ωj求一阶导数,并使之为0,得叶子节点j对应的权值和最优<span style="color: black;">目的</span>函数为:</p><img src="https://mmbiz.qpic.cn/mmbiz_png/rmgntykSUhIUuxPciaIytbREZgXPBlvT0lwVC3s8xt43hopnbhtlHb94erTkdkVvcFx9wX9NCYnstuibYG7gq8xQ/640?wx_fmt=png&amp;tp=webp&amp;wxfrom=5&amp;wx_lazy=1&amp;wx_co=1" style="width: 50%; margin-bottom: 20px;">
    <p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;">(15)</p><img src="https://mmbiz.qpic.cn/mmbiz_png/rmgntykSUhIUuxPciaIytbREZgXPBlvT0CNicMbrG8oMhbmQ4JBYQn9ZB6uicB1xo8ciciaibjh1oibEOHaUBKgNJb8ibg/640?wx_fmt=png&amp;tp=webp&amp;wxfrom=5&amp;wx_lazy=1&amp;wx_co=1" style="width: 50%; margin-bottom: 20px;">
    <p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;">(16)</p>
    <p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;">2.4.3 基于网格搜索的XGBoost模型超参数<span style="color: black;">调节</span></p>
    <p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;">XGBoost模型的超参数分2类:第1类负责<span style="color: black;">掌控</span>模型的<span style="color: black;">繁杂</span>度,第2类用于<span style="color: black;">增多</span>随机性,从而使得模型在训练时<span style="color: black;">针对</span>噪音不<span style="color: black;">敏锐</span>。下面介绍调参重点关注的超参数:</p>
    <p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;">a) eta,学习率,默认为0.3,范围为 。</p>
    <p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;">b) gamma,最小划分损失,它是<span style="color: black;">针对</span>一个叶子节点,当对它采取划分之后,损失函数的降低值的阈值,默认为0。</p>
    <p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;">c)&nbsp; max_depth,每棵子树的最大深度。其取值范围为,0<span style="color: black;">暗示</span><span style="color: black;">无</span>限制,默认值为6。该值越大,则子树越<span style="color: black;">繁杂</span>;值越小,则子树越简单。</p>
    <p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;">d) min_child_weight,子节点的权重阈值。<span style="color: black;">暗示</span><span style="color: black;">针对</span>一个叶子节点,当对它采取划分之后,它的所有子节点的权重之和的阈值。该值越大,则算法越保守。默认值为1。</p>
    <p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;">e)&nbsp; subsample,对训练样本的采样比例。取值范围为(0,1],默认值为1。</p>
    <p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;">f)&nbsp; colsample_bytree,构建子树时,对特征的采样比例。取值范围为(0,1],默认值为1。</p>
    <p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;">g)&nbsp; lambda,正则化系数(基于weights的正则化),默认为1。该值越大则模型越简单。</p>
    <p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;">h)&nbsp; alpha,正则化系数(基于weights的正则化),默认为0。该值越大则模型越简单。</p>
    <p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;">本文利用scikit-learn库自带的GridSearchCV网格搜索算法来<span style="color: black;">调节</span>XGBoost算法超参数(见图8),候选超参数值集合如下:</p><img src="https://mmbiz.qpic.cn/mmbiz_png/rmgntykSUhIUuxPciaIytbREZgXPBlvT01GWwqlvjDg0QvIVZHqQyr6hWlCBzj8PRv33ylgwiaoOIjZUSf7lAcKQ/640?wx_fmt=png&amp;tp=webp&amp;wxfrom=5&amp;wx_lazy=1&amp;wx_co=1" style="width: 50%; margin-bottom: 20px;"><img src="https://mmbiz.qpic.cn/mmbiz_png/rmgntykSUhIUuxPciaIytbREZgXPBlvT0fWibItcej6hm4RbrCz6sAlbKegJlicWpbapRrUzdvNzZIXvl9OZMtVBA/640?wx_fmt=png&amp;tp=webp&amp;wxfrom=5&amp;wx_lazy=1&amp;wx_co=1" style="width: 50%; margin-bottom: 20px;">
    <p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;"><strong style="color: blue;">图8&nbsp; 基于GridSearchCV的XGBoost模型超参数<span style="color: black;">调节</span></strong></p>
    <p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;">2.4.4&nbsp; 基于ANR网络切换占比模型的传统网络小区邻区关系预测</p>
    <p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;">对需优化邻区关系的传统网络小区<span style="color: black;">选择</span>5 km范围内的周边小区,<span style="color: black;">按照</span>切换占比模型特征采集数据,<span style="color: black;">形成</span>样本输入模型进行预测。实验结果<span style="color: black;">显示</span>,对现网真实邻区关系命中率为60%,即60%的现网邻区出<span style="color: black;">此刻</span>预测出的占比前50名小区中。</p>
    <p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;"><strong style="color: blue;">03</strong></p>
    <p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;">总结</p>
    <p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;">传统网络小区邻区优化是网优工作的重点和难点,人工优化<span style="color: black;">办法</span>费时费力。<span style="color: black;">经过</span>引入<span style="color: black;">设备</span>学习算法学习ANR网络的邻区关系<span style="color: black;">创立</span>切换次数占比模型可<span style="color: black;">极重</span>程度模拟真实的传统现网邻区关系<span style="color: black;">状况</span>,<span style="color: black;">极重</span>程度地<span style="color: black;">加强</span>了邻区优化效率和用户网络口碑。</p>
    <p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;">参考文献</p>
    <p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;">[1]工业和信息化部.促进新一代人工智能产业发展三年行动计划(2018-2020)[EB/OL].[2020-10-21].http://www.cac.gov.cn/2017-12/26/c_1122166495.htm.</p>
    <p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;">[2]周晓鹏,李程峻.WCDMA同频邻区漏配多配的测试<span style="color: black;">办法</span>分析[J/OL].[2020-10-21].http://d.wanfangdata.com.cn/conference/7320426.</p>
    <p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;">[3]聂嘉文,宋昭辉,王栋,等.基于拓扑结构进行邻区规划优化的<span style="color: black;">办法</span>:CN201610245047.3[P].2016-07-27.</p>
    <p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;">[4]czhhh.XGBoost算法原理[EB/OL].[2020-10-21].https://zhuan⁃lan.zhihu.com/p/88966999.</p>
    <p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;">[5]阿泽.<span style="color: black;">最终</span>有人把XGBoost和LightGBM讲明白了,项目中最主流的集成算法![EB/OL][.2020-10-21].https://mp.weixin.qq.com/s/LoX987dypDg8jbeTJMpEPQ.</p>
    <p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;">[6]王硕然,林华乐,陈爽.基于MR大数据的邻区优化算法应用[J].中国新通信,2016,18(020):95-96.</p>
    <p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;">[7]陈奇.移动通信邻区优化系统的设计与实现[D].大连:大连理工大学,2014.</p>
    <p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;">[8]赵春阳,赵春雷,王蔚.一种基于MRE数据的LTE邻区优化<span style="color: black;">办法</span><span style="color: black;">科研</span>[J].移动通信,2016,40(9):60-64.</p>
    <p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;">[9]郑亚平,贾磊,方路成,等.基于AI的突发人流聚集区域识别与预警<span style="color: black;">办法</span>[J].电信工程技术与标准化,2020(9).</p>
    <p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;">[10]王明君.TD-LTE高铁专网优化<span style="color: black;">办法</span><span style="color: black;">科研</span>[J].移动通信,2014(19):67-71.</p>
    <p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;">[11]张功国.基于X2接口TD-LTE系统邻区自优化流程设计[J].数字技术与应用,2013(3):174-175.</p>
    <p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;">[12]王新楼,郭超,纪国强.基于MR位置指纹定位的优化算法分析和实践[J].邮电设计技术,2014(11):52-56.</p>
    <p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;"><strong style="color: blue;">作者简介:</strong></p>
    <p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;">李张铮,毕业于大连理工大学,工程师,<span style="color: black;">重点</span>从事无线网络优化工作;</p>
    <p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;">陈锋,毕业于福州农林大学,高级工程师,<span style="color: black;">重点</span>从事无线网络优化工作;</p>
    <p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;">董帝烺,毕业于厦门大学,高级工程师,<span style="color: black;">重点</span>从事WCDMA、LTE的网络优化和NR新技术的<span style="color: black;">科研</span>。</p>
    <p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;"><strong style="color: blue;"><span style="color: black;">举荐</span>阅读</strong></p><a style="color: black;"><span style="color: black;">中讯邮电咨询设计院部分重大工程回顾 &nbsp;<span style="color: black;">第1</span>篇</span></a><a style="color: black;"><span style="color: black;">中国联通圆满完成庆祝中国共产党成立100周年大会通信<span style="color: black;">保证</span>任务</span></a><a style="color: black;"><span style="color: black;">GSMA官方举办5G共建共享峰会 &nbsp;中国联通和中国电信受邀参会并<span style="color: black;">发布</span>主题演讲</span></a><a style="color: black;"><span style="color: black;">爱立信和Telstra宣<span style="color: black;">叫作</span>拨打了</span></a>“世界上最远的5G<span style="color: black;">tel</span>”<img src="data:image/svg+xml,%3C%3Fxml version=1.0 encoding=UTF-8%3F%3E%3Csvg width=1px height=1px viewBox=0 0 1 1 version=1.1 xmlns=http://www.w3.org/2000/svg xmlns:xlink=http://www.w3.org/1999/xlink%3E%3Ctitle%3E%3C/title%3E%3Cg stroke=none stroke-width=1 fill=none fill-rule=evenodd fill-opacity=0%3E%3Cg transform=translate(-249.000000, -126.000000) fill=%23FFFFFF%3E%3Crect x=249 y=126 width=1 height=1%3E%3C/rect%3E%3C/g%3E%3C/g%3E%3C/svg%3E" style="width: 50%; margin-bottom: 20px;">
    <p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;"><strong style="color: blue;">扫描二维码 |</strong><strong style="color: blue;"><span style="color: black;">关注<span style="color: black;">咱们</span></span></strong></p>
    <p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;"><span style="color: black;">头条号:邮电设计技术</span></p>
    <p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;"><span style="color: black;">官方网站:http://ydsjjs.paperopen.com</span></p>
    <p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;"><span style="color: black;">编辑:李星初&nbsp; 校对:李长青&nbsp; 审核:薛海斌</span></p>




7wu1wm0 发表于 2024-9-25 19:53:20

软文发布论坛开幕式圆满成功。 http://www.fok120.com

b1gc8v 发表于 2024-9-27 04:44:39

哈哈、笑死我了、太搞笑了吧等。

wrjc1hod 发表于 2024-11-9 06:16:56

谷歌网站排名优化 http://www.fok120.com/
页: [1]
查看完整版本: 基于AI算法的无线网络邻区关系优化科研与实践