基于多元高斯分布的数据质量波动监测模型研究
详细信息    查看全文 | 推荐本文 |
  • 英文篇名:Research on data quality fluctuation monitoring model based on multivariate Gaussian distribution
  • 作者:王捷 ; 马红艳
  • 英文作者:WANG Jie;MA Hong-yan;China Mobile Group Guizhou Co., Ltd.;
  • 关键词:多元高斯分布模型 ; 离群点 ; 异常与定位
  • 英文关键词:multivariate Gaussian distribution model;;outliers;;anomalies and localization
  • 中文刊名:DGJB
  • 英文刊名:Telecom Engineering Technics and Standardization
  • 机构:中国移动通信集团贵州有限公司;
  • 出版日期:2019-05-15
  • 出版单位:电信工程技术与标准化
  • 年:2019
  • 期:v.32;No.261
  • 语种:中文;
  • 页:DGJB201905025
  • 页数:4
  • CN:05
  • ISSN:11-4017/TN
  • 分类号:90-93
摘要
数据质量波动的监测有助于发现网络性能瓶颈或性能故障,对网络系统的稳定运行有很大帮助。为了主动发现数据指标中的异常波动现象,本文首先提出了一种多元高斯分布监测模型,用来检测离群点数据。经过数据预处理、模型训练和输出异常与定位等模块,最终本文实现了监测全网数据并筛选输出异常数据及位置的系统算法,最终模型准确率达到90%以上。
        The monitoring of data quality fluctuation is helpful to find network performance bottleneck or performance fault, and it is helpful to the stable operation of network system. In order to detect the abnormal fluctuation in the data index actively, a multivariate Gaussian distribution monitoring model is proposed in this paper to detect outliers. After data preprocessing, model training and outputting anomaly and positioning modules, the system algorithm of monitoring the whole network data and filtering outlier data and location is realized. The accuracy of the model is over 90%.
引文
[1]胡晓洁.正态分布及其扩展综述[J].数学学习与研究,2014(3):92-94.
    [2]傅惠民.多元正态分布整体推断方法[J].航空动力学报,2005,20(6):7-11.
    [3]Banerjee O,Ghaoui L E,d’Aspremont A.Model selection through sparse maximum likelihood estimation for multivariate gaussian or binary data[J]//Journal of Machine Learning Research,2008,9(Mar):485-516.
    [4]Li G,Rai A,Lee H,et al.Operational Anomaly Detection in Flight Data Using a Multivariate Gaussian Mixture Model[C]//PHM Society Conference.2018,10(1).

© 2004-2018 中国地质图书馆版权所有 京ICP备05064691号 京公网安备11010802017129号

地址:北京市海淀区学院路29号 邮编:100083

电话:办公室:(+86 10)66554848;文献借阅、咨询服务、科技查新:66554700