Optimisation de la constitution de cohortes issues de bases de données médico-administratives : mise à disposition d’un algorithme pour l’intégration et la normalisation des données adapté au Système national d’information inter-régimes de l’assurance maladie (SNIIRAM)
详细信息    查看全文
文摘
Les bases médico-administratives telles que le SNIIRAM sont des sources de données incontournables pour répondre à de nombreuses questions de recherche en santé publique. L’exploitation des données contenues dans ces bases pour constituer des cohortes nécessite des traitements complexes et chronophages. L’objectif de notre travail était de développer et de mettre à disposition un outil permettant d’optimiser la constitution de cohortes issues de bases médico-administratives.

Méthodes

Nous avons développé un algorithme pour extraire, transformer et intégrer différentes sources de données hétérogènes dans un entrepôt de données normalisé. Cet entrepôt est architecturé selon un schéma en étoile correspondant au modèle i2b2. Nous avons ensuite évalué les performances de cet algorithme dans le cadre d’un projet de recherche en pharmaco-épidémiologie utilisant les bases de données du SNIIRAM.

Résultats

L’algorithme développé comprend un ensemble de fonctionnalités permettant la création de scripts SAS. Il permet d’intégrer des données dans un entrepôt normalisé. Dans le cadre de l’évaluation des performances de cet algorithme, nous avons pu intégrer plus de 900 000 000 de lignes provenant du SNIIRAM en moins de 3 heures à l’aide d’un ordinateur de bureau. Nous avons ensuite pu sélectionner les patients de l’entrepôt ainsi obtenu avec des requêtes n’excédant pas quelques secondes.

Conclusion

L’algorithme présenté dans cet article permet de disposer d’un outil performant et compatible avec l’ensemble des bases de données médico-administratives, sans avoir recours à des serveurs de bases de données complexes. Cet outil permet ensuite de simplifier la constitution de cohortes issues de ces bases et, en raison de la normalisation de l’entrepôt de données, facilite le travail collaboratif entre équipes.

© 2004-2018 中国地质图书馆版权所有 京ICP备05064691号 京公网安备11010802017129号

地址:北京市海淀区学院路29号 邮编:100083

电话:办公室:(+86 10)66554848;文献借阅、咨询服务、科技查新:66554700