Fruit d'une observation partagée

youtube
banniere-publications

Structure

 

L’OR2S à l’heure du Big data et du système national des données de santé


Depuis plusieurs années, l’OR2S s’est résolument engagé dans la manipulation de grandes bases de données. L’ « outil de calcul » développé à l’observatoire épouse la logique du Big data en permettant la manipulation de données structurées massives ; mais des bases non structurées, qui sont l’essentiel d’Internet, pourraient aussi être analysées. Ceci nécessiterait un investissement important pour pouvoir les analyser. Cependant les implications du Big data, y compris à l’OR2S, dépassent largement la seule mise en œuvre de nouvelles techniques de recueil de données et de leur analyse car elles impactent aussi très largement la protection des personnes pour les données à caractère personnel.

 

Inconnu du plus grand nombre il y a encore une décennie, le Big data a envahi nos sociétés tout comme notre imaginaire. Datamasse en France, ou données massives au Québec, le Big data est un ensemble de données extrêmement volumineux dont l’ordre de grandeur est passé en quelques années du terabytes au brontobyte, soit un 1 suivi de vingt-sept zéros !...

Aujourd’hui, le Big data est caractérisé par ce qu’il est désormais convenu d’appeler les 5 V : volumétrie, vélocité, variété, validité et valeur.

La volumétrie fait référence aux montagnes de données produites à chaque instant et qui sont véhiculées et partagées via Internet. Sur Facebook, par exemple, circulent chaque jour dix milliards de messages... En 2016, l’humanité crée toutes les minutes autant de données que tout ce qui a été produit jusqu’en 2008 !

Production et analyse des données mettent en exergue la vélocité. L’ordre de grandeur est au pire en seconde, mais le millième ou millionième de seconde est plus approprié. Le recours à des algorithmes élaborés autorise une analyse dans le temps même de la production des données.

La variété des données n’est plus à démontrer : courriels, tweets, photos, vidéos, nombre de pas, tension artérielle...

Il est admis aujourd’hui que 80 % des données ne sont pas structurées dans des bases de données. De fait, leur validité est cruciale. Dans la recherche traditionnelle, les données sont construites à partir de protocoles de recherche et d’outils de recueil validés et à partir d’expériences reproductibles. Avec le Big data, ce contrôle a priori ne ressort plus. La donnée existe par sa production elle-même et sa seule existence lui confère le statut de crédibilité.

Enfin, la valeur se réfère à une évaluation coût-bénéfice : jusqu’à quel point l’analyse des masses monstrueuses de données est-elle rentable pour l’utilisation finale des résultats ?

 

Au-delà de sa réalité matérielle, le Big data est un fait social majeur que les États se mettent à circonscrire. Ainsi, en France, la loi sur la République numérique d’octobre 2016 s’articule autour de deux principes majeurs. Le premier est celui de la circulation des données et du savoir, en organisant non plus la demande à l’accès aux données, mais l’offre et l’ouverture (Open data) des données publiques par la création d’un service public de la donnée. Cela repose sur la notion de données d’intérêt général, sur la facilitation de l’ouverture et de la réutilisation des données des administrations et enfin sur le développement de l’économie du savoir par la publication libre des articles scientifiques.

Le deuxième principe a trait à la protection des citoyens dans la société numérique. Il affirme le principe de neutralité des réseaux et de portabilité des données. Il établit un principe de loyauté des plateformes de services numériques. Le consommateur dispose en toutes circonstances d’un droit de récupération de ses données. Ce principe rejoint le règlement européen relatif à la protection des personnes physiques à l’égard du traitement des données à caractère personnel et à la libre circulation de ces données. La Commission européenne a présenté une proposition de règlement général sur la protection des données, en remplacement de la directive 95/46 CE3 de 1995. À cette époque, ce règlement avait deux objectifs : protéger le droit fondamental à la protection des données et garantir la libre circulation des données à caractère personnel entre les États membres.

Entré en vigueur le 25 mai 2016 et mis en application par les États membres en avril 2018, le nouveau règlement donne beaucoup plus de contrôle aux citoyens européens sur leurs données personnelles et leur utilisation via Internet. Il inclut des dispositions comme le droit à l’oubli, le consentement clair et explicite de la personne concernée quant à l’utilisation de ses données personnelles ou la garantie que les politiques relatives à la vie privée soient expliquées dans un langage clair et compréhensible. Les autorités de protection (les « Cnil européennes ») voient une affirmation de leurs compétences et un renforcement de leurs pouvoirs, notamment répressifs. Le Comité européen de la protection des données (CEPD) sera en charge d’arbitrer les différends entre les autorités et devra élaborer une doctrine « européenne » en la matière.

Le système national des données de santé (SNDS) fait partie de l’univers du Big data. Créé par la loi de modernisation de notre système de santé, le SNDS regroupe les principales bases de données de santé publiques existantes. Il vise l’amélioration des connaissances sur la prise en charge médicale et l’élargissement du champ des recherches, des études et évaluations dans le domaine de la santé. Son décret d’application, entré en vigueur en avril 2017, s’adresse aux personnes dont les données sont susceptibles d’être traitées et aux utilisateurs autorisés à les traiter.

Le système national est une base de données rassemblant des informations sur le parcours de santé : consultations chez les professionnels de santé, prescriptions de médicaments, hospitalisations, causes médicales de décès. L’analyse de ces données devrait permettre d’accroître les connaissances sur le système de santé : parcours de soins des patients, pratiques de prescription des médecins, sécurité sanitaire, etc. L’enjeu est d’améliorer les politiques publiques de santé, l’information des patients et de faire progresser la recherche médicale. Le SNDS a pour finalité la connaissance de la santé, de l’offre de soins, de la prise en charge médico-sociale et de leur qualité, de l’orientation des usagers dans le système de santé, en permettant la comparaison des pratiques de soins, des équipements et des tarifs des établissements et des professionnels de santé. Il participe à la mise en œuvre et à l’évaluation des politiques de santé et de protection sociale, dont les parcours des patients, ainsi qu’à la connaissance des dépenses de santé et médico-sociales. Il informe les professionnels de santé, structures et établissements de santé ou médico-sociaux sur leur activité, et participe à la surveillance, à la veille et à la sécurité sanitaires, en développant l’observation, l’évaluation et la production d’indicateurs relatifs à l’état de santé des populations, dans le temps et dans l’espace.

Enfin, il contribue à la recherche, aux études, à l’évaluation et à l’innovation dans les domaines de la santé et du médico-social.

Les décrets publiés précisent les conditions d’accès au système selon deux modalités. Ils nomment les organismes qui auront un accès permanent aux données pour accomplir une mission de service public. Tous les autres, publics et privés, à but lucratif ou non, pourront accéder ponctuellement au système national des données de santé sur autorisation de la Commission nationale de l’informatique et des libertés (Cnil).

Les organismes qui ont un accès permanent sont peu nombreux et essentiellement nationaux : Agence nationale de sécurité du médicament et des produits de santé (ANSM), Haute Autorité de santé (HAS), Santé publique France, Caisse nationale de la solidarité et de l’autonomie... En région, il s’agit des ARS, ORS, URPS, équipes de recherche de l’Inserm et des CHU..., et ce, pour des niveaux de précision différents.

L’Institut national des données de santé (INDS) enregistrera les demandes et accompagnera les utilisateurs du système.

 

La création du système national des données de santé impose pour les organismes y ayant accès la présence d’un correspondant informatique et libertés (Cil) de la Cnil. Dès la fin des années deux mille, l’OR2S s’est doté d’un Cil afin de pouvoir valider en interne et autoriser les protocoles d’études mises en oeuvre. En avril 2018, le Cil laissera la place au Data protection officer, dont le mandat sera plus étendu. Mais le traitement des bases de données implique aussi un niveau de sécurité des plus exigeants, tant pour l’accès aux serveurs contenant les données que dans l’accès aux locaux. C’est le programme de travail que s’est donné l’OR2S pour les mois à venir.

NOUS CONTACTER

Nous contactez

(*)
Entrée non valide

(*)
Entrée non valide