基于AI算法的无线网络邻区关系优化科研与实践

f9yx0du · 发表于 2024-8-31 02:09:06

摘要：

针对现有邻区优化方式的不足，基于现网数据引入XGBoost设备学习回归预测算法，经过学习拥有自动邻区关系网络的两两小区切换占比创立预测模型，优化非自动邻区关系网络小区邻区关系。科研结果显示，基于AI算法的无线网络邻区关系优化能有效加强邻区优化效率，提高邻区关系的准确性。

引言

在无线网络优化工作中，邻区优化是降低掉话率、提高移动网络质量、改善用户感知的最基本且最有效的手段。日前基站邻区优化有2种方式：自动邻区关系（ANR）和非自动邻区关系（下文简叫作非自动邻区关系网络为传统网络）。具备自动邻区关系的网络可自动优化邻区关系，不需人工干涉；传统网络邻区关系需优化人员手工优化。这些网络邻区的数目众多，优化工作量非常大；需要优化邻区的确定与个人优化经验有很大的关系，稍有不小心就可能导致邻区漏配或冗余邻区，存在很强的优化危害。规避以上问题，加强邻区优化的效率和精度已作为网络优化的关键。思虑到在ANR网络中，自动邻区关系已作为小区SON功能的标配，无需人员操作网络便可自动识别和添加邻区，怎样利用ANR邻区关系来优化传统网络邻区已作为网络运营智能化的重要课题。

设备学习技术做为人工智能的重要构成部分，是国家发展战略重点扶持的目的和当下各行业关注应用的焦点。为了推动传统网络邻区优化的智能化，提高网络运营智能化水平，特开展基于设备学习算法的邻区关系优化的科研。

01

传统无线网络邻区关系优化难点

在传统网络优化中，邻区关系优化始终败兴是一个难点。因为邻区关系数量多、影响大、技术需求高、优化手段匮乏等等方面的原因，使得邻区关系优化在传统网络中存在有些挑战。

1.1 邻区关系数量多，引起优化耗时耗力

以福州联通为例，W现网有小区25 000个，用每一个小区有20~25条邻区来计算，所配置的邻区个数最少50万条以上，网优人员每周提取MR数据，运用厂家工具进行同频、异频邻区核查，按照核查结果，确定需要优化的邻区，并进行相应操作，邻区优化的工作量非常大。

1.2 邻区关系影响面大，直接关系网络口碑

邻区设置欠妥，会引起干扰增大、容量下降和性能恶化，严重影响用户感知，诱发的掉话等问题会引起用户投诉，给运营商网络口碑带来消极影响，影响NPS得分。邻区设置欠妥有2种表现方式：邻区漏配和冗余邻区。邻区漏配会导致干扰增大，降低用户的通话质量乃至掉话，从而导致容量及覆盖能力下降；冗余邻区一方面将会因为切换的太多会引起信令负荷加重；另一方面因为终端测绘能力的限制，会降低测绘的精度、增多测绘时延。同期信号较多会导致干扰，容易显现掉话，影响速率的提高，从而影响用户感知。

1.3 邻区关系优化手段缺乏，对技术需求高

传统的邻区关系优化手段有2种：基于路测软件分析和基于厂家的邻区核查工具平台。

a）路测软件分析。基于导频的小区切换关系来定位邻区关系恰当性，该办法的局限性是路测范围有限，覆盖面不足，没法开展全网的精细邻区优化，且路测办法耗时耗力。

b）基于厂家的邻区核查平台。经过采集UE上报的测绘报告、话统呼叫记录、事件进行汇总分析，判断邻区漏配和冗余。该办法有较高的精确性，但受限于厂家License配额和优化人员的技术水平。

02

基于XGBoost算法的小区切换占比预测

随着运营商移动用户数的持续增多，良好的用户网络体验保证对无线网络运营提出了更高的需求。影响无线网络质量的原因非常多，其中邻区关系是一个关键原因，它是小区移动性管理的直接承载者。做好邻区关系优化，始终是网优工作的重点。

本文经过利用XGBoost设备学习算法学习ANR现网邻区关系数据，创立小区间切换次数占比模型预测出传统网络小区的邻区关系。该模型可在开站邻区配置、邻区核查、用户投诉分析等网优平常工作中起到积极功效。

2.1 训练集和测试集样本生成

2.1.1 样本的采集

提取某省联通2个行政区LTE网络3天的两两小区切换次数报表，汇总每一个小区邻区的切换次数占比降序摆列，每一个小区取占比前50名的邻区做为样本，切换占比为样本标签，同期相关网络工参关联字段（见表1），形成最后样本。

表1 网络工参字段

2.1.2 样本划分为训练集和测试集

设备学习通常将样本划分为训练集和测试集，训练集用于模型训练，测试集用于测试模型性能。本文利用sciki-learn的train_test_split()函数将样本划分为训练集和测试集，其中参数测试集比例test_size取0.2，即训练集和测试集比例为8:2。

2.2 数据预处理

数据预处理重点是检测每一个特征是不是有缺失值或违法字符，对不恰当的值进行校正替换。检测样本数据发掘，覆盖类型为室分的小区方位角都是0值，这与实质室分小区为全向覆盖不符，故室分小区的方位角需修正。修正办法如下：若室分小区与宏站邻小区同经纬度，则室分小区取宏站邻小区的方位角；若室分小区与室分邻小区同经纬度，则室分小区方位角取值368︒；若室分小区与邻小区区别经纬度，则室分小区方位角取室分小区与邻小区连线与正北方向的顺时针夹角r（见图1）。

图1. 室分小区方位角定义

设室分小区经纬度（X1，Y1），邻小区经纬度（X2，Y2），详细小区连线夹角r计算公式如下：

图2 室分小区方位角特征预处理

图2给出了室分小区方位角特征预处理过程。

2.3 特征工程

特征工程是设备学习过程的重要环节，样本特征的好坏决定了设备学习性能的上限，而模型只是逼近这个上限罢了。特征工程的重点内容包含特征构造、特征抽取和特征选取。本文的原始特征包含本地/目的小区经纬度、本地/目的小区方位方向、本地/目的小区合计下倾方向及本地/目的小区天线挂高10个维度。为了满足特征选取的需要，这里基于本地/目的小区的经纬度构造额外的特征，重点包含haversine距离、两经纬度的方位角、经纬度PCA分量，最后进行特征选取。

2.3.1 haversine距离

haversine公式是计算球面两点间距离的一种办法，该办法采用了正弦函数，即使距离很小，亦能保持足够的有效数字。haversine距离计算公式如下：

其中，haversine(α)=sin2 (α⁄2)=((1-cos⁡α ))⁄2，R为地球半径，取6 371 km，φ1 、φ2暗示2点的纬度，∆θ暗示2点经度的差值。代码实现如图3所示。

图3 本地/目的小区haversine距离计算

2.3.2 两经纬度的方位角

设本地小区经纬度为（lat1，lng1），目的小区经纬度为（lat2，lng2），两经纬度间的方位角公式计算如下，代码实现如图4所示。

图4 2个经纬度间的方位角计算

2.3.3 经纬度的PCA分量

主成份分析（PCA——Principal Component Analysis）是最广泛的数据压缩算法，重点经过降维能够生成更便于人理解的新特征，加快对样本有价值信息的处理速度。此处对本地/目的小区经纬度4个特征采用PCA进行变换，默认降维后的特征数仍为4（见图5）。

图5 本地/目的小区经纬度的PCA变换

2.3.4 特征/目的关联性分析

特征选取不仅拥有减少特征数量（降维）、减少过拟合、加强模型泛化能力等优点，况且还能够使模型得到更好的解释性，加强对特征和特征值、特征和目的之间关系的理解，加快模型的训练速度得到更好的预测性能。此处采用pandas的关联系数计算函数corr()来分析特征和目的间的关联性（见图6和表2）。

图6 特征和目的间的关联性热力图

表2 特征和目的间的关联系数值

从热力图上能够发掘，部分特征间的关联性过高，这将导致特征间的多重共线性，影响模型效果，这儿剔除关联系数大于0.8的特征（包含本地小区LATI⁃TUDE，本地小区LATITUDE_pca_0，本地小区LONGITUDE），保存与目的关联性最大的特征。

2.3.5 特征标准化

特征标准化便是将某列特征的值缩放到均值为0，方差为1的状态，计算公式为z=((x-μ))⁄σ。标准化的好处是提高模型精度和加快收敛速度。此处运用scikit-learn自带的StandardScaler()类进行转换。

2.4 模型训练

2.4.1 基于交叉验证的回归预测模型选取

设备学习中常用的回归预测模型有线性回归、KNN、随机森林、GBDT和XGBoost等。这儿分别运用这几个模型进行交叉验证打分，选出最好的模型。这些模型的参数都取默认值，交叉验证折数取5，评定标准为平均绝对误差MAE。实验结果显示，最好的模型为XGBoost，平均cross_val_score得分最高为-0.03（见图7）。下面就运用XGBoost模型进行建模训练。

图7 基于交叉验证的回归模型选取

2.4.2 XGBoost算法原理概述

XGBoost算法近年来在工业界和各类数据挖掘竞赛中大放异彩，取得良好的预测效果。与传统的Boosting算法如GBDT比较，XGBoost算法优点在于：GBDT只利用了一阶导数的信息，而XGBoost对损失函数做了二阶泰勒展开，并且在目的函数中加入了正则项，用来权衡目的函数和模型的繁杂程度，防止过拟合；Boosting是串行过程，不可并行化且计算繁杂度较高，亦不适合高维稀疏特征，而XGBoost在特征粒度上可进行并行化计算且思虑了训练数据为稀疏值的状况。该算法原理如下：

XGBoost算法的目的函数包括损失函数L和正则化项Ω：

（8）

按照第t步的新模型的预测值ft (xi )，此时的目的函数可写成：

（9）

利用泰勒公式将目的函数进行泰勒二阶展开，得

（10）

其中gi为损失函数一阶导数，hi为损失函数的二阶导数。当损失函数取平方损失时，目的函数近似为：

（11）

进一步地，基函数取为决策树模型ft (x)=ωq(x) ，q(x)暗示样本x所在的叶子节点，同期设决策树叶子节点数为T,该值决定了决策树的繁杂度，值越大模型越繁杂，此时目的函数的正则项暗示为：

（12）

因为每一个样本x_i最后都是落在叶子节点上，且每一个叶子节点都会包括多个样本，因此呢遍历所有样本x_i求损失函数等价于遍历所有叶子节点求损失函数，设第j个叶子节点包括的样本集合为Ij={i}，则损失函数为：

（13）

为简化公式，定义目的函数为：

（14）

接着对ωj求一阶导数，并使之为0，得叶子节点j对应的权值和最优目的函数为：

（15）

（16）

2.4.3 基于网格搜索的XGBoost模型超参数调节

XGBoost模型的超参数分2类：第1类负责掌控模型的繁杂度，第2类用于增多随机性，从而使得模型在训练时针对噪音不敏锐。下面介绍调参重点关注的超参数：

a) eta，学习率，默认为0.3，范围为 [0,1]。

b) gamma，最小划分损失，它是针对一个叶子节点，当对它采取划分之后，损失函数的降低值的阈值，默认为0。

c) max_depth，每棵子树的最大深度。其取值范围为[0，∞]，0暗示无限制，默认值为6。该值越大，则子树越繁杂；值越小，则子树越简单。

d) min_child_weight，子节点的权重阈值。暗示针对一个叶子节点，当对它采取划分之后，它的所有子节点的权重之和的阈值。该值越大，则算法越保守。默认值为1。

e) subsample，对训练样本的采样比例。取值范围为(0,1]，默认值为1。

f) colsample_bytree，构建子树时，对特征的采样比例。取值范围为(0,1]，默认值为1。

g) lambda，正则化系数（基于weights的正则化），默认为1。该值越大则模型越简单。

h) alpha，正则化系数（基于weights的正则化），默认为0。该值越大则模型越简单。

本文利用scikit-learn库自带的GridSearchCV网格搜索算法来调节XGBoost算法超参数（见图8），候选超参数值集合如下:

图8 基于GridSearchCV的XGBoost模型超参数调节

2.4.4 基于ANR网络切换占比模型的传统网络小区邻区关系预测

对需优化邻区关系的传统网络小区选择5 km范围内的周边小区，按照切换占比模型特征采集数据，形成样本输入模型进行预测。实验结果显示，对现网真实邻区关系命中率为60%，即60%的现网邻区出此刻预测出的占比前50名小区中。

03

总结

传统网络小区邻区优化是网优工作的重点和难点，人工优化办法费时费力。经过引入设备学习算法学习ANR网络的邻区关系创立切换次数占比模型可极重程度模拟真实的传统现网邻区关系状况，极重程度地加强了邻区优化效率和用户网络口碑。

参考文献

［1］工业和信息化部.促进新一代人工智能产业发展三年行动计划（2018-2020）［EB/OL］.［2020-10-21］.http：//www.cac.gov.cn/2017-12/26/c_1122166495.htm.

［2］周晓鹏，李程峻.WCDMA同频邻区漏配多配的测试办法分析［J/OL］.［2020-10-21］.http：//d.wanfangdata.com.cn/conference/7320426.

［3］聂嘉文，宋昭辉，王栋，等.基于拓扑结构进行邻区规划优化的办法：CN201610245047.3［P］.2016-07-27.

［4］czhhh.XGBoost算法原理［EB/OL］.［2020-10-21］.https：//zhuan⁃lan.zhihu.com/p/88966999.

［5］阿泽.最终有人把XGBoost和LightGBM讲明白了，项目中最主流的集成算法！［EB/OL］［.2020-10-21］.https：//mp.weixin.qq.com/s/LoX987dypDg8jbeTJMpEPQ.

［6］王硕然，林华乐，陈爽.基于MR大数据的邻区优化算法应用［J］.中国新通信，2016，18（020）：95-96.

［7］陈奇.移动通信邻区优化系统的设计与实现［D］.大连：大连理工大学，2014.

［8］赵春阳，赵春雷，王蔚.一种基于MRE数据的LTE邻区优化办法科研［J］.移动通信，2016，40（9）：60-64.

［9］郑亚平，贾磊，方路成，等.基于AI的突发人流聚集区域识别与预警办法［J］.电信工程技术与标准化，2020（9）.

［10］王明君.TD-LTE高铁专网优化办法科研［J］.移动通信，2014（19）：67-71.

［11］张功国.基于X2接口TD-LTE系统邻区自优化流程设计［J］.数字技术与应用，2013（3）：174-175.

［12］王新楼，郭超，纪国强.基于MR位置指纹定位的优化算法分析和实践［J］.邮电设计技术，2014（11）：52-56.

作者简介：

李张铮，毕业于大连理工大学，工程师，重点从事无线网络优化工作；

陈锋，毕业于福州农林大学，高级工程师，重点从事无线网络优化工作；

董帝烺，毕业于厦门大学，高级工程师，重点从事WCDMA、LTE的网络优化和NR新技术的科研。

举荐阅读

中讯邮电咨询设计院部分重大工程回顾第1篇中国联通圆满完成庆祝中国共产党成立100周年大会通信保证任务 GSMA官方举办5G共建共享峰会中国联通和中国电信受邀参会并发布主题演讲爱立信和Telstra宣叫作拨打了“世界上最远的5Gtel”

扫描二维码｜关注咱们

头条号：邮电设计技术

官方网站：http://ydsjjs.paperopen.com

编辑：李星初校对：李长青审核：薛海斌

7wu1wm0 · 发表于 2024-9-25 19:53:20

软文发布论坛开幕式圆满成功。 http://www.fok120.com

b1gc8v · 发表于 2024-9-27 04:44:39

哈哈、笑死我了、太搞笑了吧等。

wrjc1hod · 发表于 2024-11-9 06:16:56

谷歌网站排名优化 http://www.fok120.com/

		自动登录	找回密码
密码			立即注册