摘要
针对目前图书出版选题策划可能会出现依靠主观经验的问题,以及图书选题不能很好地符合当下热点词汇这一潜在问题,通过对图书销售市场的调查研究,本着服务图书出版行业的目的,运用了协同过滤的算法设计了基于数据挖掘的商业智能出版选题系统。首先,对网上图书信息的抓取放入数据库中;其次,过滤得到我们想要的完整的数据;最后,将得到的数据进行协同过滤算法分析。由此可以个性化推荐出版社所需要的关键词以及选题方向,减少出版社工作人员的负担,方便了出版社选题工作的开展。通过图书出版选题预测可以及时了解市场规律,迎合客户的消费观念,提高了出版社的选题效率,减少了人力、财力和物力的消耗。
引文
[1]刘全伟.基于网络爬虫的排行榜系统设计与实现[D].北京:北京邮电大学,2018.
[2]盛亚如,魏振钢,刘蒙.基于主题网络爬虫的信息数据采集方法的研究与应用[J].电子技术与软件工程,2016(7).
[3]洪俊斌.Web应用系统漏洞检测技术研宄与实现[D].广州:广东工业大学,2016.
[4]汪琴,李明.谈树莓派在学生创新教育中的应用[J].中国信息技术教育,2017(5).
[5]姚建盛,李淑梅.Python在科学计算中的应用[J].数字技术与应用,2016(11).
[6]钱程,阳小兰,朱福喜.基于Python的网络爬虫技术[J].黑龙江科技信息,2016(36).
[7]戚利娜,刘建东.基于Python的简单网络爬虫的实现[J].电脑编程技巧与维护,2017(8).
[8]谢克武.大数据环境下基于python的网络爬虫技术[J].电子制作,2017(9).
[9]平凯珂,陈平雁.Python与R语言联合应用的实现[J].中国卫生统计,2017(2).
[10]史梦楚.Python语言的探讨[J].中国新通信,2017(7).
[11]刘焕欣.基于匿名网络的网络爬虫设计与实现分析[J].计算机产品与流通,2017(12).
[12]刘清.主题网络爬虫抓取策略的研究[J].科技广场,2017(4).
[13]贺冠博,苏宇琦,黄源.网络爬虫技术在电力产业中的应用[J].电子技术与软件工程,2017(18).
[14]宋海洋,刘晓然,钱海俊.一种新的主题网络爬虫爬行策略[J].计算机应用与软件,2011(11).
[15]网络爬虫的有关算法[J].黄宇龙.中国新通信,2017(23).