用户名: 密码: 验证码:
基于情报研究室工作的中医药竞争情报监测和采集系统探讨
详细信息    本馆镜像全文|  推荐本文 |  |   获取CNKI官网全文
摘要
竞争情报是近年来广泛应用于经济金融企业、信息科学和电子技术等商业活动领域,并快速向其他领域扩展的一种情报搜集分析方法,促进了所在领域的发展,获得显著的经济和社会效益,是情报研究的一个热点;西方医学的局限性逐渐被发现认识,国内外将中医药等传统补充替代医学作为未来医药发展的一个重要方面,借鉴其他的研究思路与方法,可促进中医药的发展创新;互联网成为学习、科研等人员获取信息的主要渠道,且中医药的信息网络获取方便,信息量大,但更新速度快,寿命短,如何高效、及时的获取并保存所需信息成为一个难题。
     本情报研究室主要负责中医药领域的情报收集分析工作,服务于领导及科研人员,对信息的需求量很大,因而特别重视对网络信息的收集和处理;网络信息更新快,寿命短暂,容易造成情报丢失,需要将有意义的信息及时的采集和保存,以便后期的分析研究。
     本研究的目的是借鉴竞争情报的理念优化中医药情报监测采集工作,引入自动化信息监测与信息采集技术,以便快捷的收集公开发布的中医药相关情报,并进行测试、运用,提高工作效率,以应对飞速增长的中医药及补充替代医学相关信息。
     通过对具有代表性的近五年《中医药国际参考》和《甲型H1N1流感信息专辑》的所收录情报进行采集源分析,总结近年人工收集情报的情报源,寻找规律,对未来其他国家和地区在传统医学和补充替代医学方面科研可能面临的激烈竞争,确定情报源采集网站,依托现有信息所的软硬件设施和网络设备管理人员,选择合适的情报采集方式方法技术,对相关网络资源进行监测和采集。
     1既往情报总结分析及未来情报需求预测
     1.1情报研究室近年情报需求总结
     本情报研究室情报工作涉及面较为宽广,近年出版编辑的主要有:中医药国际参考、应急反应及某些疫情发生发展的中医药治疗信息专辑(包括手足口病,蜱虫病,甲流等疾病)、中医药查新报告等,主要满足中医药工作者的情报需求。其中以《中医药国际参考》和《甲型H1N1流感信息专辑》所跨时间长,内容涉及范围广,最能代表本研究室的所需情报的主要来源。
     内刊《中医药国际参考》为月刊,内容主要为中医药国际新闻,涵盖中医药的国际资讯、科研、会议和其他补充替代医学的科研、发展现状情况等。2006-2010年度的《中医药国际参考》的文章均为本研究室工作人员人工浏览各网站网页所采集编辑,代表了目前国际中医药及其相关情报的主要来源,对其文章来源进行统计除去出访报告和工作简讯,共1450条,来自159个网站。
     分析发现中医药信息具有信息来源整体分布广泛,相对集中的特点,相对集中于:本情报研究室所翻译的外文文章、新华网、世界针灸学会联合会网站、中国中医药报、医药经济报、中国新闻网、大公报、联合日报等几个较大媒体;对其他媒体所发布的零星新闻,进行检索,发现各大新闻网站均有相关报道或转载;对近年来的内容进行大致浏览还发现中医药报道主要涉及香港、台湾地区和日本、韩国、新加坡、美国、欧洲及东南亚一些国家等,这与相关国家的科研和卫生经济发展水平相适应。
     应急反应信息专辑主要涵盖急性传染性疾病的发生、发展、演变及中医药防治信息,代表中医药对该疾病的预见和诊疗过程,对其收集整理有助于探索中医治疗优势疾病和新药开发。对《甲型H1N1流感信息专辑》进行统计分析,流行性传染性疾病的信息来源主要为:世界卫生组织网站、国家卫生部网站、国家疾控中心网站、新华网、路透社、共同社、中国中医药管理局及各地政府和卫生厅网站等。
     在工作中也出现了许多问题:情报越来越多,来源主要为中文网站,人力有限,尤其急性流行性传染性疾病,在获取情报的过程中,将大量的时间耗费在浏览网页,检索和保存所需信息上,对外文文献翻译和获取、分析能力依然不足。
     1.2未来情报需求预测
     随着西方医学局限性逐渐被认知,中医药等其他传统医学重新被重视,近年来得到很大发展,整个产业发展潜力巨大。未来可能和一些国家、地区和企业等在理论、科研、应用及传播方面存在着竞争,需要紧盯世界各大医学院校、医药企业及科研院所的补充替代医学研究、应用方向,为国内医药规划、科研、教育及国际化提供参考。
     1.2.1中医药情报需求分析
     情报采集以应用为主,对中医药情报需求的相关专业和人员会逐渐增多,未来较长时间内,仍以服务中医药专业人士、提供专业中医药情报信息为主,需要保证情报的可信度、实用性和准确性等。
     1.2.2中医药发展竞争对手分析
     中医药在国内的发展历史悠久,但现代化及推广程度尚不够,竞争对手主要为对传统医学和补充替代医学重视、研究及推广应用的国家,比如美国、英国、印度等英语国家,德国、法国等欧洲发达国家及韩国、日本、东南亚各国等亚洲、非洲具有传统医学的国家。
     情报采集重点为各国中医药及其他传统医学和补充替代医学的政策法规、科研、教育、应用等信息,对其进行搜集、整理、及时发布及分析预测,以便为国内中医药研究提供参考。
     2情报源及相关采集网站的确立
     中医药网络资源内容烦杂,表现形式多样,主要包括文本、图形、图像、音频、视频等,主要来源于中医药的管理、医疗、教育、科研、商业等机构。根据其内容质量的权威性、实用性、准确性、时效性、独特性、全面性等分为以下三类:
     2.1图书馆、政府(医药组织、院校)官方网站
     以提供翔实可靠的信息为主,包括图书馆书目书籍资料、政府机构发布的政策法规、院校团体发布的信息、研究机构的最新研究成果等。特点是可靠性高,内容权威,但时效性较差,一般为事件确立、事实认证清楚之后才发布。
     2.2各主流网站、医药报纸,期刊、公司网站及数据库资料
     包括综合门户网站,医学类门户网站发布的有关医学新闻、医药报纸的最新报道,公司企业发布的产品广告、发展战略、投资方向,学术类数据库、专利数据库等信息资源等。特点是可靠性较差,但时效性较强。
     2.3医药论坛博客,社交、私人网站等
     包括医学相关的个人博客信息,以及论坛、BBS、聊天室上传递的各种相关信息,社交网站的个人日记,发言帖等。时效性强,但多为个人观点,不能保证全面客观的描述事实或事件,可信度不高,需去伪存真。
     根据本研究室以往工作的总结及对未来情报的需求,加之中医药领域专业性强、分布相对广泛,因而主要选择前两类网站中的信息源进行采集,根据前五年所统计情况及未来中医药可能面临的竞争和情报需求情况,制定本研究室所需要的竞争情报源采集网站。
     3采集工具的选择及应用
     3.1采集方法分析
     目前世界上对网络信息的采集方法主要是人工采集、网站抓取以及定制信息等。过去情报研究室采用传统的人工方法,程序复杂、烦琐,不但花费大量的时间,而且容易出现差错,已经不能适应未来中医药信息的采集和整理。根据对采集方法的分析,网站抓取具有以下特点:
     (1)采集预警机制:监测互联网相关网站、采集所需信息,并及时呈现给相关工作人员。
     (2)自动化:自动采集信息,能够整合自有和外部网络资源,节省人力及时间。
     (3)自主化:使用者据有控制、使用、改进的权利及能够保证长期使用。
     本所服务器工作稳定,配套设施完备,且系统管理员对服务器的管理运行具有丰富的经验,能够保障断电、断网等紧急情况下服务器的软硬件安全,可以为硬件设备的运行和故障排除提供及时有力的帮助。网站抓取软件能够依托信息所软硬件设施,能够方便、快捷的对采集源网站中医药信息的采集。因此选择网络信息采集软件对采集源网站进行采集。
     3.2软件的选择
     通过以上分析、实地考察、试用,决定采用基于Windows Server 2003操作系统,net 3.5 spl版本开发的情报采集及预警软件,能够很好的兼容本信息研究所的windows服务器,用户界面易于操作,采集类型广泛,不占用太多网络带宽,可为后续开发利用相关分析软件及网页发布系统。
     3.3采集流程
     根据确立的采集源网站确立采集任务,应用计算机智能化技术,将采集任务群自动分配采集站点群,针对不同目标数据源,进行不同的采集技术和方法配置,确立取舍规则,以保证采集数据的完整和干净,对多个目标数据源供采集,将采集的数据结果,处理入库。
     3.4网络信息监测、采集技术
     3.4.1多线程浏览、搜索、下载技术
     线程是在同一时间需要完成多项任务的时候被实现的。多线程是为了使得多个线程并行的工作以完成多项任务,以提高系统的效率
     将软件对每个采集任务可分配的线程数为1-10,充分利用内存和CPU,对所需信息的采集速度进行调整。
     3.4.2节点树深度优先搜索、广度优先搜索技术
     应用节点树深度优先搜索、节点树广度优先搜索技术可实时全面监测跟踪采集源网站的动向信息,及时采集。
     3.4.3更新触发监测技术
     更新触发通过对采集源网站的数据库中的相关内容实现级联更改,保证本地服务器文档与采集源网站文件发布保持同步,及时轻松获得情报信息,监测最新中医药情报,而且可减少搜索和采集程序对服务器资源和网络带宽的占用。
     3.4.4自动去重技术
     通过对URL链和指定页面的位置、时间、内容、等条件的智能化信息分析,对相同内容信息只下载一次,自动摒弃后面的文件,有效防止信息内容的重复情况。
     3.4.5断点续传技术
     指下载文件时,将采集源网站的采集任务(一个文件或一个压缩包)划分为几个部分,每一个部分采用一个线程进行下载,如果碰到网络故障,可以从已经下载的部分开始继续下载以后未下载的部分,而没有必要重头开始下载,节省时间,提高速度。
     3.5防屏蔽机制
     互联网中有很多我们所需要的信息,网站对服务器的采集和监控采取恶意屏蔽措施,使用各种手段限制采集行为。针对主要的防屏蔽技术我们采取对网站进行不规则的模拟型访问;使用随机代理服务器访问网站;url链接去重以避免陷阱环限制采集活动。且采用断点续传技术,在任务被终止时可以较为快速的启动,继续采集信息。
     3.6噪音过滤与移除
     计算机通过对网页内容的重复度计算,纳入高速去重,对网页内容中不可见噪音进行过滤和移除,自动下载有用信息,便于利用、分析。
     3.7情报的保存
     文件的保存考虑到存储时间长,空间足够大,方便后期的处理、利用和防泄漏。因此软件将所采集文档信息均自动以所采集信息的文章标题为文件名,以html格式保存在本地服务器存储空间上,可以方便查看、随时调用及删除和发布。本情报研究室的其他格式信息可以方便的转换为html文件,保存在服务器上相关的文件夹里,可以方便地实现整体调阅、数据挖掘等后期文档处理。其他图片和音视频格式均保存为原网站格式。
     4软件采集测试
     选取具有代表性的世针联网站,对软件的采集步骤进行展示(图示在全文),对其工作动态文件进行采集,人工查看为294篇目。
     设置好软件后,开启服务器自动采集,线程为10,反应间隔为零。一周之后源网站新增篇目0篇,服务器采集结果显示294条目,和原网站显示篇目数相同,对比标题,完全一致,为完全采集;对所采集内容对比,段落一致,源网站文字字体样式丢失,但所采集内容全,未见缺失,噪音较少,达到预期目标,着手批量添加其他采集任务。
     5结论与展望
     本文确定了中医药竞争情报的采集源网站,采用了最新的先进技术对中医药竞争情报监测和采集,提高了整个中医药行业的中医药竞争情报监测和采集水平。
     本文尚需综合情报分析和利用技术,优化扩展系统功能,加强系统推广应用,促进中医药产业迅速、健康发展。
Competitive intelligence is widely used in business fields recent years, such as economic and financial enterprises, information science, electronic technology. It's an intelligence collection method quickly expanding to other areas, and promoting the development of the field, accessing to enormous economic and social benefits. It is a hotspot of intelligence study; Due to the limitations of Western medicine has been found to recognize, Chinese and overseas experts believe that traditional Chinese medicine as a complementary and alternative medicine is an important aspect of future pharmaceutical development. Learning from their research ideas and methods could promote development and innovation of Chinese medicine; Internet has became the primary means of researchers to obtain information, in addition, the network of traditional Chinese medicine Information can be easy got. So how to efficiently, timely access to information needed to be a difficult problem.
     Our Information Center is responsible for intelligence gathering in the field of medicine analysis, providing service for leaders and researchers. Because of the great demand for information, so we attached an importance to the collection and process of network information; Network information's residence time is short, update soon, so it is very important that the meaningful information needs to be collected and saved timely for later analysis and study.
     The purpose of this study is to use the concept of competitive intelligence for the optimization of pharmaceutical intelligence gathering, to collect publicly available relevant information in the field of Chinese medicine efficiently through the software of automated information collection and information monitoring, to respond to the rapid growth of information about Chinese medicine and complementary and alternative medicine by means of testing, application, improving efficiency.
     Methods:Carry on the study of "International Information on Traditional Chinese Medicine "and" A H1N1 Influenza Information Album" of the past five years for the collection of intelligence analysis. Summarize artificial gathered intelligence source in recent years. Seek out regular pattern. For the purpose of facing with other countries and region's intense competition in complementary and alternative medicine, we should determine the intelligence sources and collection sites. Relying on the existing hardware facilities of the Information Research Institute, select the appropriate intelligence collection software to collect and monitor the relevant network resources.
引文
[1]彭靖里.国内外竞争情报研究发展综述[J].情报科学,1985,16[3]:268-271
    [2]李学英.竞争情报的特征与利用[J].情报理论与实践,1995(1).14-16
    [3]赖茂生,等.企业竞争情报体系的建立和发展[C].全国竞争情报与企业发展研讨会会议录.1995
    [4]缪其浩主编.市场竞争与竞争情报[M].北京:军事医学科学出版社,1996
    [5]郭迎萍.利用竞争情报为提高医院核心竞争力服务[J].医学情报工作.2004[5]:321-323
    [6]彭靖里,王晓旭,邓艺.论国内外竞争情报发展与实践的现状和特点[J].云南科技管理,2004(4):9-11
    [7]竞争情报概念.情报理论与实践1995,[1]:10
    [8]吴永臻.竞争情报的基本特点分析[J].情报探索.1996,3[56]:4-5
    [9]李映洲等.论竞争情报的特点[J].情报学报,1996[6]:460-466
    [10]魏同悟.把握企业竞争情报的本质特征提高企业竞争的能力与水平[J]冶金信息导刊,1998[6]:32-36
    [11]彭奋.竞争情报与企业核心竞争力[J].情报探索.2008,9[131]:76-77
    [12]赵黎.21世纪关键信息技术之一——竞争情报[J].2003[3]:55-59
    [13]彭靖里,邓艺,刘建中,杨斯迈.国内外竞争情报产业的发展与研究述评[J].情报理论与实践。
    [14]Metayer E. Demystifying competitive intelligence[J]. Ivey Business Journal.1999[64]:70-74
    [15]缪其浩.竞争情报——国外的发展动向及其对我国的影响[J].医学情报工作.1995,1:2-10
    [16]邱小林.我国竞争情报研究综述[J].情报理论与实践.1999[3]:211-214
    [17]周丽英,韩明杰.高校竞争情报系统的分析与设计[J].农业图书情报学刊.2008,3[3]:91-93
    [18]焦慧敏,唐惠燕、任延安.国内外竞争情报研究与应用综述[J].农业图书情报学刊.2009,3[3]:17-20
    [19]彭靖里,张涌,杨斯迈.论定标比超在竞争情报研究中的应用及策略[J].情报方法.2004,1[10]:4-6
    [20]王知津,张丽丽.竞争情报四分卫法实施及案例分析.[J]情报科学.2008.3[3]:328-336
    [21]陈峰、梁战平.论定标比超方法在企业竞争情报实践中的应用[J].情报学报; 2002,4[2];232-236
    [22]张金山,董光,王微.基于SWOT分析的企业竞争情报获取途径研究[J].情报科学;2009.5[5];672-675
    [23]黄瑞敏.基于SWOT分析的企业竞争情报实例研究[J]现代情报2007.1[1]:191-194
    [24]侯延香.基于SWOT分析法的企业专利战略制定[J].情报科学.2007,1[1]146-151
    [25]宋艳,银路,史忠国.动态战略规划的情景分析法及其给中国企业的思考[J]科技管理研究2008[10]:148-150
    [26]岳珍,赖茂生.国外“情景分析”方法的进展[J].情报杂志.2006[7]:59-60
    [27]樊松林,罗云.PMS数据库的构成与利用[J].情报科学.2002,8[8]:842-845
    [28]姜晓曦.2000-2005年我国竞争情报研究述评[J].情报杂志.2006[10]:109-112
    [29]赵黎.21世纪关键信息技术之———竞争情报[J].计算机与数字工程.2003[3]:55-59
    [30]吴晓伟,宋文官,徐福缘.竞争情报软件发展现状和趋势研究[J]情报技术.2006[6]:2-5
    [31]金学慧、刘细文.国内外典型竞争情报系统软件功能的差异性分析[J]情报杂志20099[9]:102-106
    [32]包昌火.企业竞争情报系统[M].北京:华夏出版社,2002.194
    [33]楚彬彬、阮建海.竞争情报系统要素及影响因素探讨[J].情报杂志.2008[4]:74-76
    [34]王知津主编.《情报学研究生教材竞争情报》[M]科学技术文献出版社,2005.425
    [35]朱礼龙.企业反竞争情报能力及其评价研究[J]情报科学2009.4[4];606-612
    [36]孙志功.医药市场的竞争和我们的对策[J]卫生经济1985[8]:17-18
    [37]陈福季.医学情报研究工作的发展对医学情报研究人员的要求[J]医学图书馆通信1992[2]:68-69
    [38]张莹、李道苹、陈茂盛.竞争情报与医院战略管理[J]医学与社会2005.11[11]:64-65
    [39]张莹.竞争情报与医院战略管理整合研究新视角:应用模式[J]卫生软科学2006.10[6]:503-505
    [40]胡奕、兰小药.国内外药品专利竞争情报研究[J]中华医学图书情报杂志2005.11[6]:9-10
    [41]何玮.医药卫生科技查新过程中的竞争情报服务探讨[J]现代情报2007.5[5]:167-168
    [42]盛梅.基于竞争情报的医院信息化服务[J]预防医学情报杂志2008.5[5]:362-364
    [43]包昌火,谢新洲等.竞争对手分析.竞争情报丛书,北京:华夏出版社,2002
    [44]姜禾,陈方,杨宁.网络信息搜集技能探析[J]现代情报.2009,6[6]:119-121.
    [45]毛玲.规范保存web资源[J]中国辐射卫生.2006.3[15]:51

© 2004-2018 中国地质图书馆版权所有 京ICP备05064691号 京公网安备11010802017129号

地址:北京市海淀区学院路29号 邮编:100083

电话:办公室:(+86 10)66554848;文献借阅、咨询服务、科技查新:66554700