基于数据挖掘的零售业商品销售预测研究
详细信息    本馆镜像全文|  推荐本文 |  |   获取CNKI官网全文
摘要
随着经济全球化的扩展及WTO对我国保护期的结束,外资零售企业将无限制地进入我国,面对巨大的竞争和挑战,如何生存已是我国零售企业面临的重要问题。而作好销售预测及在此基础上作出正确的销售决策是致胜的关键。
     在商品的销售预测中,一般针对商品在将来某个时段的销售状态和销售量进行预测,预测的变量只涉及到商品的销售数量,有极少的一部分考虑到了销售金额,但都忽略了一个最重要的因素,那就是利润,利润是决定零售企业赢利及发展的关键因素。因此,本文在销售预测的输入变量的选取上,除了用到销售数量、销售金额、季节指数等商品属性之外,还选取了利率这一重要变量,增加了预测的准确性。
     本文利用数据挖掘技术,提出了一个新的商品销售预测模型——SPI-M模型,该模型用于零售业商品销售预测,为企业良好经营和决策部门作出重要决策提供帮助。该模型的构建过程是:首先用基于统计学的季节分析模型(S模型)进行销售市场的季节规律分析,计算出商品的季度、月份的季节指数。其次利用数据挖掘技术中的K-均值聚类算法,建立了利率等级模型(P模型),由P模型的输出结果得到销售的利率等级分类。然后将季节指数、利率等级、销售数量、销售金额等作为ID3算法的输入变量来构建决策树模型(I模型),得出历史数据的年、季、月的销售状态,最后利用统计学中的马尔科夫预测模型(M模型)预测商品将来某时段内销售状态的转移情况,而在将来某时段内商品的需求量是以前相同时段相同状态该商品的销售量的同期平均值与平均增长量之和。
     最后本文实现了一个基于SPI-M模型的商品销售预测系统,通过实验对SPI-M模型及单独使用季节分析模型、马尔科夫模型的预测结果进行对比分析,得出了在商品销售预测中,使用SPI-M模型预测准确性更高的结论。
With the expansion of economic globalization and the deadline of protection for our country from the WTO, the foreign-invested retail enterprises will unrestrictedly pour into China, facing those enormous competitions and challenges, how to survive is the most important issue for Chinese retail enterprises have to face with. It is the key to success that making sales forecasts and making the correct marketing decisions on the basis of this.
     In the commodities sales forecasts, the general commodities in the future for a certain period of the sales state and sales volume, the variables involved of forecast only the sale volume of commodities, a small part of taking into account the amount of sales, but has not been the most important factor, that is, profit, profit is the key factor of retail enterprises winning profit and development. Therefore, in this thesis, the sales forecasts for the selection of input variables, in addition to the commodities attribute used in sales volume of commodities and the amount of sales, seasonal index, etc, it also has been selected the important variable profit rates, for an increase of the accuracy of the forecasts.
     Using data mining technology in the thesis, I put forward a new commodities sales forecasting model——SPI-M model, which used in retail commodities sales forecasts help the enterprise operations and decisions-maker make important decisions. The procedure of the SPI-M model construction is: first , we analyse the marketing seasonal laws with the season analysis model (S model) based on statistics, calculate the seasonal index of commodities quarter and month. Second, we establish the profit rate grade model (P model) with the K-means algorithm on data mining technology, which Classifies the grade of profit rate .Third, we build decision trees model (I model) within seasonal index, profit rate grade, sales volume, the amount of sales as input variables of ID3 algorithm, obtain the sales state of yearly, quarterly and monthly historical data. Finally, we forecasted the transfer of sale state of commodity within a certain period in future with Markov model(M model) on statistics, its demand of market in the same period of time in future is the sum of the corresponding period average sales involve and average increasing sales involve in same time before.
     At last, the thesis established a commodity sale forecasting system based on SPI-M model. Meanwhile, we compare and analyse the results of SPI-M model, Season model and Markov model through experiments, and get the conclusion that we can reach higher correctness if we use SPI-M model than rest of forecast model.
引文
[1] 朱明.数据挖掘[M].中国科学技术大学出版社,2002:22-31,67-74,137-142
    [2] [加]Jiawei Han, Micheline Kamber 数据挖掘概念与技术[M] .机械工业出版社,2005
    [3] 曹存根,周志华.神经网络及其应用[M] 清华大学出版社,2002
    [4](美)谭,(美)斯坦巴赫著,范明等译 . 数据挖掘导论[M] . 人民邮电出版社,2006
    [5](美)黑斯蒂等著,范明等译.统计学习基础:数据挖掘、推理与预测[M] .电子工业出版社,2005
    [6] 安淑芝.数据仓库与数据挖掘[M] .清华大学出版社.2005
    [7] 冯萍,宣慧玉.数据挖掘技术及其在营销中的应用[J] .北京轻工业学院学报,2001(1)
    [8] 刘玲梅,孔志周.数据挖掘在销售预测中的应用[J].商业时代2004年17期
    [9] 彭梅.基于马尔可夫链的商品销售预测模型[J] .型达县师范高等专科学校学报,2006,9
    [10] (美)R.A.霍华特著 李为政,徐映波,赖炎连译.动态规划与马尔科夫过程 [M].上海科学技术出版社,1963
    [11] E.B.邓肯著. 马尔科夫过程论基础[M].科学出版社,1962
    [12] 侯振挺, 郭青峰 著. 齐次可列马尔可夫过程[M].科学出版社 ,1979
    [13] 姜启源.数据模型(第三版)[M]高等教育出版社,2003
    [14] 赵静等,数学建模与数学实验(第二版),北京:高等教育出版社,2000
    [15] 高充彦. 服务利润链在零售业中的应用——对两个世界零售巨头的案例分析[J] .管理评论-2004年16卷9期
    [16] 杨杰惠 数据挖掘在超市商品销售预测中的应用研究 [J] . 计算机应用,2000,5
    [17] 邢战雷,杨君岐. 零售企业 MIS 中商品市场规律分析的数据挖掘算法及软件设计[硕士学位论文]. 陕西科技大学,2005
    [18] Chan,P.K.,Stolfo,S.J.,Fan,D.W..Credit card fraud detection using meta-learning:Issues and initial result. Working notes of AAAI Workshop on Fraud Detection and Risk anagement,1997
    [19] 肖劲松,林子禹,毛超.关联规则在在零售商业中的应用[J] . 微型计算机系统, 2002,(3)
    [20] 李儒勋,张宏伟. 基于 BP 的 CRM 系统销售预测的数据挖掘[J] .计算机应用,2004,11
    [21] 叶世绮,郑欣. 销售预测决策支持系统的设计与实现[J] .经济师,2002 年第 12 期
    [22] 赵会杰,瞿有利.通用预测支持系统的设计[J].兵工自动化,2006年第25卷第10期
    [23] 刘东升.商业企业销售预测与决策系统开发[J].商业时代,2006 年 5 期
    [24] 陈发新,李怀祖.市场预测支持系统的预测模型研究[J].中国管理科学,2002,10
    [25] [美]约翰.T.门泽尔,卡罗尔.C.贝恩斯多克 罗玉波,唐立杰,刘静 译. 销售预测方法系统管理[M].人民邮电出版社,2004
    [26] 庄羽, 陈丽珍.我国零售市场业态与规模格局分析[J]. 商业时代,2006 年 12 期
    [27] 闪四清,陈茵,程雁.数据挖掘—概念、模型、方法和算法[M].清华大学出版社,2003
    [28] 邵峰晶,于忠清.数据挖掘原理与算法[M].中国水利邮电出版社,2003
    [29] 刘莉,徐玉生.数据挖掘中数据预处理技术综述[J].甘肃科学学报,2003,1:117-119
    [30] 菅志刚,金旭.数据挖掘中数据预处理的研究与实现[J].计算机应用研究,2004,7: 117-118
    [31] 张慧颖 WTO 三年过渡期结束后中国零售业的竞争态势[J].北方经贸,2005 年 11 期
    [32] 李喆,王仁超,褚春超. 数据挖掘中的数据预处理与维度优化[J].东北林业大学学报,2003,5:70-72
    [33] 毛国君,段立娟,王实.数据挖掘原理与算法[M]. 清华大学出版社,2005
    [34] 王海燕.信息论基础[M].东南大学出版社,2004
    [35] 昝欣,宗鹏,吴祈宗. 高等院校教师流动人才的 Markov-chain 预测模型[J].南京师范大学学报(工程技术版) 2006.9
    [36] 左东广, 韩崇昭, 郑 林 , 朱洪艳, 卞树檀. 基于时变马尔科夫转移概率的机动目标多模型跟踪 [J]. 西安交通大学学报 2003.8
    [37] 陈小平. 艾滋病疗法的评价及疗效的预测 [J].中国性病艾滋病防治,2002
    [38] 陈小平.艾滋病毒研究发某些进展[J].中国性病艾滋病防治第 6 卷第 2 期:121-125 页,2000
    [39] 王红艳等,基于灰色马尔可夫模型的人体健康 PH 值检测[J].微电子学与计算机,第22 卷第 5 期:124-127 页,2005
    [40] 赵艳丽,孙志挥.基于静态马尔可夫链模型的实时异常检测[J].计算机应用 2004.11
    [41] 范为 . 一种马尔科夫使用链模型转移概率自动生成方法[J].中国科技论文在线http://www.paper.edu.cn
    [42] 蔡常丰. 数学模型建模分析[M]. 北京:科学出版社,1995.49 - 66.
    [43] 龚雄兴. 堆与贪心算法[J].现代计算机:下半月版,2006,8: 111-112
    [44] Olivia Parr Rud著,朱扬勇等译.数据挖掘实践[M].机械工业出版社,2003
    [45] 龚雄兴. 人民币利率预测模型研究[J].中国管理科学,2005
    [46] Olcay Taner Yldz,Ethem Alpaydyn.Omni-Variate Decision Trees[J].IEEE Tram.Neural Networks,2001,12:1539-1546
    [47] 王安兴. 利率模型[M].上海财经大学出版社(2007-04 出版)
    [48] 刘晓曙,郑振龙. 马尔可夫状态转换加随机波动瞬时利率模型实证研究[J].金融学(季刊)
    [49] 林海,郑振龙. 中国利率动态模型研究[J].金融学(季刊)
    [50] 石云平,辛大欣.基于 K-means 聚类算法的分析及应用[J].西安工业学院学报
    [51] 王实.数据挖掘中的聚类算法[J].计算机科学,2002
    [52] Ester M,Kriegel H P,Sander J.A density-based algorithm for discovering clusters in large spatial databas—es with noise[J~.Proc 2nd Int Conf on knowledge dis—covery and Data Mining.Portland,1999,20:226.
    [53] Robert Tibshirani, Jertome Friedman 著 范明, 柴玉梅, 昝红英等译.统计学习基础-数据挖掘、推理与预测 [M].电子工业出版社
    [54] 陈翔,刘军丽.应用决策树方法构建评价指标体系[J].计算机应用,2006,2.
    [55] 陈玉婷,王斌等.关联规则挖掘算法介绍[J].计算机技术与发展,2006,5:21-25
    [56] Agrawal R,shafer J.parallel Mining of Association Rules :Design,Implementation,and Experience. Technical Report FJ10004, IBM Almaden Research Center,San Jose,CA 95120, 1996-01.
    [57] 赵群.消除重复数据清理方法的研究[J].福建电脑,2006.4:51-52
    [58]飞思科技产品研发中心编著.SQL Server 2000数据库和数据仓库[M].北京:电子工业出版社,2001.6:333-338
    [59] 张云涛,龚玲.数据挖掘原理与技术[M].北京:电子工业出版社,2004.4:10-16
    [60] 黄解军,潘和平,万幻川. 数据挖掘技术的应用研究 [J] .计算机工程与应用,2003,2
    [61]苏克,戴维森著.朱建秋,蔡伟杰译.可视化数据挖掘:数据挖掘可视化和数据挖掘的技术与工具[M].北京:电子工业出版社,2004.1:71-76
    [62] 黄安民,王君之,王晓旭. 零售企业赢利模式 [M] .中华工商联合出版社,2005