数量特征敏感问题分层随机抽样调查的统计方法及其应用
详细信息    本馆镜像全文|  推荐本文 |  |   获取CNKI官网全文
摘要
目的:在敏感问题的抽样调查中,调查指标涉及个人隐私或者其真实结果不被社会和公众所认同时,被调查者往往会出于抗拒或者隐瞒的心理不愿意给出真实答案或者给出错误答案。随机化应答技术(Randomized Response Technique,RRT)的出现有效解决了这一问题。其最初在1965年由沃纳(Warner)提出,后由Simmons等人进行了改进,出现了多种针对不同类型问题的模型。但要保证敏感问题调查结果的真实性与可靠性还需与科学的抽样方法相结合。在本课题组进行研究之前,国内外对于敏感问题的调查研究局限于简单随机抽样,或调查后仅就单次调查结果进行讨论。本文选定了数量特征敏感问题的无关联、加法、乘法模型与分层抽样方法进行组合,推导出其相关的统计公式,旨在解决敏感问题的复杂抽样问题。并将其应用于北京MSM人群调查当中。并且实现了用EXCEL软件对调查方法和统计公式的蒙特卡洛模拟以评价其信度与效度。为进行敏感问题大规模抽样调查提供简便、科学、可靠的调查方法、统计公式及评价方法。
     方法:在对数量特征问题分层抽样调查的公式推导过程中运用了数理统计学的基本理论和方法。并对北京市城区、近郊、远郊的MSM人群应用数量特征敏感问题随机应答加法模型进行分层随机抽样调查。对调查结果运用EXCEL软件中相关函数、公式和宏进行了模拟调查和计算分析以评价其有效性及可靠性。
     结果:推导出了分层抽样时数量特征敏感问题无关联问题模型、加法模型、乘法模型的总体均值的估计量及其方差的计算公式。在对本文调查方法进行实例应用过程中,调查得出北京市MSM人群首次发生男男性行为的平均年龄为22.07岁;每人每月发生男男性行为的不同性伴数的均值为2.74个;每人每月发生男男性行为次数的均值为4.59次。对基于EXCEL实现的蒙特卡洛模拟抽样调查结果进行了150次模拟样本与模拟总体差异的Z检验,其中142次模拟抽样的结果与模拟总体的差异无统计学意义(P<0.05)。
     结论:
     1.本文所研究的分层随机抽样下数量特征敏感问题RRT模型的调查方法及其统计公式有较高的信度和效度,在对北京市MSM人群进行调查的过程中应用成功。
     2.调查结果提示北京市MSM人群男男性行为存在多性伴的现象,多性伴是MSM人群中艾滋病及性病患病率高于一般人群的原因之一,需引起相关卫生部门的重视。
     3.基于EXCEL软件所实现的蒙特卡洛模拟有简便、上手容易、适合非计算机专业人员使用等优点。
Objective:
     In the survey of sensitive question, when it comes to sensitive problem,respondents often refuse to answer or providing false answer in order to protect theirsecrets. The randomized response technique (RRT) solve this difficult problem. It wascreated by Warner in1965.Then it was improved by Simmons and other people, theycreated multiple kinds of model to solve different kinds of questions. To ensure thevalidity and reliability of survey, RRT must be used with scientific sampling method.Before the study of our project team, researches of randomized response technique(RRT) for sensitive questions were developed and studied with the restriction that thesample was selected through simple random sampling. the discussion just base on thesingle survey. In this paper, we combine the stratified random sampling with doubleirrelevant problem model、additive model、multiply model, derived relevant formulas tosolve complex sampling on sensitive question survey. We also applied these in thesurvey of MSM population in Beijing. What’s more, we use the Excel to apply MonteCarlo simulate in order to assess validity and reliability of our method. In this way, weprovide scientific and effective design on sensitive questions under the condition ofstratified sampling from large population.
     Method:
     When deriving relevant formula, the basic theories and methods of mathematicalstatistics were used. During the survey of MSM population of Beijing urban, peri-urban,sub urban,the additive model of RRT was used.In the process of simulation, functions,formulas and macros of Excel were used to calculate the result and assess the validityand reliability of our method.
     Result:
     The formula were deduced for the estimator of the population proportion and its estimated variance for double irrelevant problem model、additive model、multiplymodel used for sensitive questions survey in stratified sampling. The survey results ofBeijing MSM population are as follows: The average age of first MSM age was22.07.The average number of different sexual partners of MSM was2.74person every monthfor per person. It was4.59times of the number of MSM on average monthly. In the150times Z test of the result of Monte Carlo simulation based on the Excelsoftware,142times test have no statistical significance.
     Conclusion:
     1. The Stratified Random Sampling technology innovation for QuantitativeSensitive Question have meaning. The application in the MSM populationof Beijing is successful.
     2. The survey show that multi sexual partners phenomenon does exist amongthe MSM population of Beijing. Multi sexual partners is one of the reasonthat cause the AIDS and venereal disease rates among MSM higher than inthe general population. This phenomenon should cause the attention of therelated department of health.
     3. The Monte Carlo simulation based on the Excel software is a simple methodto learn and use, especially for the non-computer professionals.
引文
[1].赵雪慧.抽样调查理论和方法的最新进展[J].统计与信息论坛,2003(5):24-27.
    [2].李绍文,李抒敏.抽样调查方法运用中的几个理论问题[J].江苏统计,1996(4):20-21.
    [3].郑温冰,抽样调查在社会研究中应用的若干问题探讨[J].温州职业技术学院学报,2005(03):62-65.
    [4].温长松,试述抽样调查方法在历史研究中的应用[J].沈阳大学学报,2006,18(01);40-41.
    [5].冯士雍,中国抽样调查应用中的若干问题[J].中国统计,2001(11):5-7.
    [6].张泮洲.敏感问题调查技术新探[J].统计研究,2001(11):48-50.
    [7].张泮洲.对敏感问题预警系统建立的研究[J].上海统计,2001(10):26-28.
    [8].Warner S L. Randomized response: a survey technique for eliminating evasiveanswer bias[J]. J Am Stat Assoc,1965,60(309):63-66.
    [9].李绍文,李抒敏.抽样调查方法运用中的几个理论问题[J].江苏统计,1996(4):20-21.
    [10].顾震环,解燕,顾莉洁.随机截尾的Warner与Simmons模型[J].数理统计与管理,2003,22(05):38-42.
    [11].李旭东等,多分类敏感问题RRT的分层抽样统计方法.苏州大学学报(医学版)[J],2009(04):668-670.
    [12].贺志龙等,多项选择敏感问题RRT二阶段抽样的统计方法及应用[J].中国卫生统计,2009(06):580-582.
    [13].高歌,范玉波等,敏感问题Simmons模型的(分层)整群抽样研究[J].中国卫生统计,2008(06):562-564.
    [14].刘雯,高歌,李旭东等,敏感问题Simmons模型的分层随机抽样的统计方法[J].苏州大学学报(医学版),2010(04):759-762.
    [15].于明润等,敏感问题Simmons模型分层二阶段整群抽样的统计方法[J].苏州大学学报(医学版),2009(04):664-667.
    [16].高歌,范玉波,敏感问题改进的随机应答技术模型分层整群抽样研究及应用[J].苏州大学学报(医学版),2008(05):750-754.
    [17].王磊,高歌等,敏感问题双无关问题模型分层二阶段整群抽样的统计方法及应用[J].中国卫生统计,2011(01):37-39.
    [18].刘鹏,高歌等,数量特征敏感问题加法模型二阶段抽样的统计方法及其应用[J].苏州大学学报(医学版),2011(03):384-387.
    [19].王岩,隋思涟,王爱青.数理统计与MATLAB工程数据分析[M].北京,清华大学出版社,2006,10.
    [20]. Cochran W.G.抽样技术.张尧庭,吴辉译[M].北京,中国统计出版社,1987,130.
    [21].李银河著.同性恋亚文化[M].北京:今日中国出版社,1998.440.
    [22].钱跃升,傅继华,毕振强.男男性行为与艾滋病[J].中国艾滋病性病,2006(6):583-584.
    [23].威尔逊.论人的天性[M].贵州人民出版社.1987:132.
    [24].陈勇礼.中国同性恋最新报告[R].
    [25].北京市统计局,国家统计局北京调查总队编.北京统计年鉴.2010[M].北京:中国统计出版社,2010.
    [26].王丽艳,夏冬艳,吴玉华,等.乘数法估计北京、哈尔滨两市男性同性恋人群规模的研究[J].华南预防医学,2006(3):9-11.
    [27].刘利容,刘民,卢红燕,夏东燕.北京市城郊两区娱乐服务场所暗娼艾滋病相关危险行为调查分析[J].中国艾滋病性病,2007(6):532-534.
    [28].杨琦.蒙特卡洛模拟抽样[J].中国卫生统计,1986(03):13.
    [29].王仲奇,宋玉琳等.蒙特卡罗方法的两个基本问题[J].原子核物理评论,2005,22(4):395-397.
    [30]孙振球.医学统计学(第二版)[M].北京:人民卫生出版社,2008:756-759.
    [31] Gerty J.L.M. Lensvelt-Mulders,Joop J.Hox, Peter G.M., Cora J.M.Maas.Meta-Analysis of Randomized Response Research: Thirty-Five Years of Validation[J]. Sociological Methods&Research,2005,33(3):319-348.
    [32]张永青,陆伟,叶冬青.数量特征敏感问题调查技术[J].疾病控制杂志,2003,7(6):542-544.
    [33]国务院防治艾滋病工作委员会办公室,联合国艾滋病中国专题组.中国艾滋病防治联合评估报告(2004)[R].2004.12
    [1]张泮洲.对敏感问题预警系统建立的研究[J].上海统计,2001(10):26-28.
    [2]孙明举,孙山泽.数量特征的随机化回答随机变量加法、乘法模型——随机化调查方法Ⅵ [J].数理统计与管理,2001,20(1):63-64.
    [3]孙山泽,孙明举.数量特征的随机化回答模型(上)——随机化调查方法V[J].数理统计与管理,2000(6):57-59.
    [4] Warner S L. Randomized response: a survey technique for eliminating evasiveanswer bias[J]. J Am Stat Assoc,1965,60(309):63-66.
    [5] Simmons W. R. H D G S. The unrelated question randomized response model[J].Proceedings in the Social Statistics Section,American StatisticalAssociation,1967:65-72.
    [6] Greenberg B G E A. The unrelated question randomized response model:theoreticalframework[J]. Journal of the American Statistical Association,1969,64(6):520-539.
    [7] Greenberg B G A J. A new survey technique and its application in the filed of publichealth[J]. Milbank Memorial Fund Quarterly,1970,48(4):39-55.
    [8] Greenberg B G K R. Application of the randomized response technique in obtainingquantitative date[J]. Journal of American Statistical Association,1971(66):243-250.
    [9] Wg. C. Sampling Techniques[M]. New York:3rd Edition Wiley,1977.
    [10] Mangat Ns S R. An alternative randomized response procedure[J]. Biometrika,1990,77:439-442.
    [11]边重.如何让人讲真话──谈敏感问题的抽样调查[J].数理统计与管理,1986(05):38-40.
    [12]刘隆健.心理卫生调查中对敏感问题的调查技术[J].重庆医科大学学报,1988(03):192-195.
    [13]晓钟.随机化回答技术——沃纳(warner)模型[J].中国统计,1989(07):37-38.
    [14]晓钟.数量特征的随机化回答技术[J].中国统计,1989(09):41-42.
    [15]吴擢春,高尔生,顾杏元,等.敏感问题的调查与统计处理技术(RRT)及其在未婚性行为与人工流产调查上的应用[J].中国卫生统计,1990(06):14-18.
    [16]李裕发.全概率公式在社会敏感问题中的应用[J].工科数学,1994(04):104-107.
    [17]杨海山. Simmons敏感性问题抽样调查误差的估算[J].中国煤炭经济学院学报,1996(02):59-61.
    [18]孔圣元,孟生旺.敏感性问题“随机变量和”回答模型[J].数理统计与管理,1998(02):36-40.
    [19]陈雪如.随机化回答模型中的贝叶斯方法[J].应用概率统计,1999,15(3):329-331.
    [20]章栋恩.随机化应答调查方案的参数估计问题[J].纯粹数学与应用数学,2000,16(2):79-84.
    [21]孙山泽,孙明举,段钢.二项选择敏感性问题调查的基本方法——敏感性问题调查方法(Ⅰ)[J].数理统计与管理,2000(01):58-64.
    [22]孙明举,孙山泽,段钢.二项选择敏感性问题调查的改进方法——随机化调查方法[J].数理统计与管理,2000(02):60-63.
    [23]顾震环,解燕,顾莉洁.随机截尾的Warner与Simmons模型[J].数理统计与管理,2003(05):38-42.
    [24]解燕,顾震环,顾莉洁.关于Simmons模型的几点讨论[J].数理统计与管理,2003(03):47-51.
    [25]完颜华,闫在在. Warner模型中的Jackknife方法[J].河南教育学院学报(自然科学版),2006(03):15-16.
    [26]余喜生,余炳红.一类随机截尾Simmons模型及基于一种模糊均值算法识别分类的应用[J].中国集体经济,2008(27):105-106.
    [27]马岚.解决属性敏感问题调查的新思路[J].统计与决策,2008(4):36-37.
    [28]高歌,范玉波.敏感问题Simmons模型的(分层)整群抽样研究[J].中国卫生统计,2008(06):562-565.
    [29]高歌,范玉波.敏感问题改进的随机应答技术模型分层整群抽样研究及应用[J].苏州大学学报:医学版,2008,28(5):750-754.
    [30]吕端会,傅珏生. Simmons模型的贝叶斯观点[J].苏州大学学报(自然科学版),2009(01):11-15.
    [31]赵馨,闫在在,张景,等. Warner模型中方差估计的随机组方法[J].内蒙古科技大学学报,2010(03):285-288.
    [32]吕恕.有多种备选的敏感问题抽样调查方法分析[J].电子科技大学学报,1994(03):333-336.
    [33]陈雪如.具有多种选择的随机化回答调查法[J].数理统计与应用概率,1998(02):45-49.
    [34]饶贤清,马江山.多项选择的随机化回答模型[J].上饶师范学院学报,2004,24(3):16-18.
    [35]孙明举,段钢,孙山泽.多项选择随机化调查的样本模型[J].数理统计与管理,2000,19(3):61.
    [36]孙明举,孙山泽.多项选择敏感性问题的一样本调查方法--随机化调查方法IV[J].数理统计与管理,2000,19(4):62-63,57.
    [37]王春平,王志锋,张光成.属性特征敏感性问题的设计、分析及评价[J].中国卫生统计,2006,23(1):60-62.
    [38] Jr. Greenberg Bg H D A. Application of the randomized response technique inobtaining quantitative data[Z].1975:66,243-250.
    [39] Himmelfarb S E S. Additive constants model:A randomized response techniquefour eliminating evasiveness to quantitative response questions[Z].1980:87,525-530.
    [40]晓钟.数量特征的随机化回答技术[J].中国统计,1989(9):41-42.
    [41]孙小素.数量特征的随机化回答模型──缩小转换模型随机化回答误差分量的方法[J].山西财经大学学报,1998(4):74-77.
    [42]孙明举,孙山泽.数量特征的随机化回答随机变量加法、乘法模型——随机化调查方法Ⅵ[J].数理统计与管理,2001(1):63-64.
    [43]俞纯权.数量特征敏感性问题调查的两个随机化回答模型[J].统计与信息论坛,2001(5):8-13.
    [44]顾震环.调查敏感性问题数量特征的若干随机化回答方法[D].苏州大学,2003.
    [45]张永青,陆伟,叶冬青.数量特征敏感问题调查技术[J].疾病控制杂志,2003(6):542-544.
    [46]彭德芬,刘芳.数量特征敏感性问题的随机化回答技术[J].华中农业大学学报(社会科学版),2006(2):76-79.
    [47]冀鹏浩,闫在在.数量特征随机化回答模型中的比估计和回归估计方法[J].内蒙古工业大学学报(自然科学版),2009(3):166-176.
    [48]饶贤清.数量特征敏感性问题随机化回答的改进模型[J].数理统计与管理,2010(2):277-280.
    [49] Heimer R. Critical issues and further questions about respondent-driven sampling:comment on Ramirez-Valles, et al.(2005).[J]. AIDS Behav,2005,9(4):403-408,409-413.
    [50] Ramirez-Valles J, Heckathorn D D, Vazquez R, et al. From networks to populations:the development and application of respondent-driven sampling among IDUs andLatino gay men.[J]. AIDS Behav,2005,9(4):387-402.
    [51] Wang J, Carlson R G, Falck R S, et al. Respondent-driven sampling to recruitMDMA users: a methodological assessment.[J]. Drug Alcohol Depend,2005,78(2):147-157.
    [52] Salganik M J. Variance estimation, design effects, and sample size calculations forrespondent-driven sampling.[J]. J Urban Health,2006,83(6Suppl): i98-i112.
    [53] Robinson W T, Risser J M, Mcgoy S, et al. Recruiting injection drug users: athree-site comparison of results and experiences with respondent-driven andtargeted sampling procedures.[J]. J Urban Health,2006,83(6Suppl):i29-i38.
    [54] Tiffany J S. Respondent-driven sampling in participatory research contexts:participant-driven recruitment.[J]. J Urban Health,2006,83(6Suppl):i113-i124.
    [55] Abdul-Quader A S, Heckathorn D D, Mcknight C, et al. Effectiveness ofrespondent-driven sampling for recruiting drug users in New York City: findingsfrom a pilot study.[J]. J Urban Health,2006,83(3):459-476.
    [56] Stormer A, Tun W, Guli L, et al. An analysis of respondent driven sampling withInjection Drug Users (IDU) in Albania and the Russian Federation.[J]. J UrbanHealth,2006,83(6Suppl):i73-i82.
    [57]马小燕,张启云,贺雄,等.同伴推动抽样法调查男男性接触人群艾滋病病毒/性传播疾病感染状况及相关行为[J].中华流行病学杂志,2007(09):851-855.
    [58]马小燕,张启云,赵金扣,等.采用同伴推动抽样法进行男男性接触人群HIV/STD流行病学调查的探索[J].中国艾滋病性病,2007(04):311-313.
    [59]曾鸿,钟蕾.论网络调查与传统调查方法的综合应用[J].工业技术经济,2006,25(12):65-66.
    [60]庞东,王革.对我国网络调查热的冷思考[J].统计与决策,2004(2):47-48.
    [61]曾五一,林飞.网络时代话网络调查[J].中国统计,2002(5):16-17.
    [62]刘玮.论网络调查及其优化措施[J].情报科学,2005,23(2):297-300.
    [63]郭剑,马骏.网络调查在同性恋人群研究中的应用[J].预防医学情报杂志,2006,22(4):498-499.
    [64]徐浪.网络调查中抽样框误差的矫正处理[J].统计与决策,2006(7):35-37.
    [65]朱炜明,林海江,章亚夫,等.浙江省台州市男男性行为者艾滋病病毒/性传播感染的危险行为与性关系网络调查[J].中华流行病学杂志,2008,29(10):994-998.
    [66]陈永泰,何有世.网络调查和传统纸质调查的差异性研究[J].统计与决策,2008(16):32-34.
    [67]王春平,王汝芬,陈祥华.医学定性敏感性问题的研究方法及评价[J].中国医院统计,2005,12(2):118-121.
    [68]王春平,王志锋,张光成.属性特征敏感性问题的设计、分析及评价[J].中国卫生统计,2006,23(1):60-62.
    [69]咸桂彩,杨金梅.调查研究中敏感性问题的”去敏感化”技术述评[J].天津职业技术师范学院学报,2002,12(2):34-37.
    [70]王建华主编,《实用医学科研方法》[M].人民卫生出版社,2003:442-443.
    [71]李灿,辛玲.调查问卷中的敏感性问题设计研究[J].经济师,2007,1:143.
    [72]张泮洲.对敏感问题预警系统建立的研究[J].上海统计,2001,10:26-28.
    [73]张泮洲,谢中才.敏感问题弱转化问卷数学还原模型的构建[J].统计与决策,2004,3:16-17.
    [74] Darrow W W, Jaffe H W, Thomas P A, et al. Sex of interviewer, place of interview,and responses of homosexual men to sensitive questions.[J]. Arch SexBehav,1986,15(1):79-88.
    [75] Komatsu R, Kamakura M, Choi K H, et al. AIDS, HIV and STD among Japaneseand Japanese-Americans in San Francisco, California, USA[J]. Int J STDAIDS,2003,14(10):704-709.
    [76] Stewart K E, Cianfrini L R, Walker J F. Stress, social support and housing arerelated to health status among HIV-positive persons in the deep south of the UnitedStates[J]. AIDS Care,2005,17(3):350-358.
    [77]吴擢春,高尔生,顾杏元等.敏感问题的调查与统计处理技术(RRT)及其在未婚性行为与人工流产调查上的应用[J].中国卫生统计,1990(6):14-18.
    [78]周国宏,李加芙,谢云霞,等.敏感问题的调查与统计处理技术及其在学生考试作弊行为调查上的应用[J].郧阳医学院学报,1997(04):11-14.
    [79]曲书泉,张大鹏,朱昊,等.东北某地男同性恋者性行为及HIV感染流行病学研究[J].中国艾滋病性病,2002(03):145-147.
    [80]许毅,施卫星,胡少华,等.杭州市男性同性恋浮现率调查和人群发生率推算[J].中华预防医学杂志,2004(05):25-27.
    [81]马骏,郭剑.天津市男同性恋人群高危性行为与性病网络调查[J].现代预防医学,2007,34(20):3928-3929,3931.
    [82]高歌,范玉波.敏感问题Simmons模型的(分层)整群抽样研究[J].中国卫生统计,2008(06):562-562.
    [83]高歌,范玉波.敏感问题改进的随机应答技术模型分层整群抽样研究及应用[J].苏州大学学报:医学版,2008,28(5):750-754.
    [84]蔡于茂,刘惠,潘鹏,等.应用同伴推动抽样法对深圳地区男男性接触者AIDS相关知识和危险行为调查[J].华南预防医学,2009(01):4-7.
    [85] Liu P T, Chow L P. The efficiency of the multiple trial randomized responsetechnique[J]. Biometrics,1976,32(3):607-618.
    [86] Chow L P, Gruhn W, Chang W P. Feasibility of the randomized response techniquein rural Ethiopia[J]. Am J Public Health,1979,69(3):273-276.
    [87]李玉龙,王昶飞.随机应答技术在患者对医院工作满意情况调查中的应用[J].中国医院统计,1994(1):10-11.
    [88] Gerty J.L.M. Lensvelt-Mulders,Joop J.Hox, Peter G.M., Cora J.M.Maas.Meta-Analysis of Randomized Response Research: Thirty-Five Years of Validation [J].Sociological Methods&Research,2005,33(3):319-348.
    [89]郑金凤,何家鑫.计划免疫播种率抽样方法研究[J].疾病监测,1993,8(6):155-156.
    [90]黄水平,陆守曾.两计量样本间比较方法的选择[J].中国卫生统计,1992,9(3):26-27.
    [91]王睿,贺佳.随机抽样方法的SAS实现[J].中国卫生统计,2002,24(1):85-93.

© 2004-2018 中国地质图书馆版权所有 京ICP备05064691号 京公网安备11010802017129号

地址:北京市海淀区学院路29号 邮编:100083

电话:办公室:(+86 10)66554848;文献借阅、咨询服务、科技查新:66554700