摘要
本文以网络经济论坛为研究对象,提出热点主题挖掘的综合模型,包括:基于迭代聚类的热点主题发现模块,以关注度、相关度、时效性为核心的主题热度评估模块,以及主题的意见挖掘模块。并以某个时间段内天涯论坛中经济论坛的样本数据进行实验研究,从而挖掘出经济论坛热点主题,进而为确定当前的经济热点主题提供依据。实验结果表明,采用该模型热点主题提取的结果能有效反映当前人们所关注的经济问题,意见挖掘结果能在一定程度上反映人们对热点主题的态度,因此,本文提出的热点主题挖掘模型是有效的。
This paper aims to establish a suitable hot topics mining model based on economic BBS, which includes threemodules: a discovery module of spot topic based on iterative clustering; a subject heat evaluation module based on the atten-tion rate, relevancy, timeliness; an opinion mining module that calculating the total positive and the negative opinions.Based on the work above, we do an experiment on the Tianya economic BBS. The result shows, the hot topics extracted canreflect the current concerned economic issues; the opinion mining results can reflect the attitudes of people on the hot top-ics to a certain extent. Therefore, the model of hot topics mining is effective.
引文
1麦林.虚拟社区热点主题意见挖掘模型研究[D].安徽:中国科学技术大学,2009.
2 周旭.BBS热点分析系统研究[D].北京:北京交通大学,2007.
3 唐果,陈宏刚.基于BBS热点话题发现的文本聚类方法[D].重庆:西南大学,2010.
4 姚小娜.BBS热点挖掘主题挖掘与观点分析[D].大连:大连海事大学,2008.
5 张柱山.基于聚类分析的网络论坛热点主题检测[D].哈尔滨:哈尔滨工业大学,2010.
6 骆卫华,于满泉,许洪波.基于多策略优化的分治多层聚类算法的主题发现研究[J].中文信息学报,2006,20(1):28-34.
7 邱立坤,程葳,龙志袆.面向BBS的话题挖掘初探[C].全国第八届计算语言学联合学术会议.北京:清华大学出版社,2005:401-407.
8 曹依灵,许洪波.网络热点信息发现研究[J].通信学报,2007,28(12):81-85.
9 李东方,俞能海,尹华罡.一种Web 2.0环境下互联网热点挖掘算法[J].电子与信息学报,2010,32(5):1141-1145.
10 陈忆金,曹树金,陈桂鸿.网络舆情意见挖掘:用户评论情感倾向分析研究[J].图书情报知识,2013,(6):90-96
11 李存青.中文意见挖掘中的特征词提取以及情感倾向分析[D].重庆:重庆大学,2010.
12 徐琳宏,林鸿飞,杨志豪.基于语义理解的文本倾向性识别机制[J].中文信息学报,2007,21(1):96-100.