Pourquoi et comment mutualiser l'entreposage et l'usage de dizaines de millions de données de santé de quatre centres hospitaliers universitaires (CHU) ? C'est toute la réflexion menée depuis deux ans par les Hospices civils de Lyon et le CHU de Grenoble, avec ceux de Saint-Etienne et de Clermont-Ferrand, réunis au sein du groupement de coopération sanitaire des Hôpitaux Universitaires Rhône-Alpes Auvergne (HOURAA).

Lauréats, fin décembre, de la deuxième vague de l'appel à projets « entrepôts de données de santé » (EDS) du plan France 2030 (pour 75 millions d'euros pour les deux vagues) avec dix autres projets, ces établissements se lancent désormais la conception du « Data Hub HOURAA » (D2H) afin de mettre en commun l'ensemble des données médicales, administratives et de recherche des quatre hôpitaux à partir de 2025. Soit des « dizaines de millions de données, rien que pour les HCL qui disposent d'une base de 5 millions de patients », remarque Jean-Christophe Bernadac, directeur des services numériques aux Hospices Civils de Lyon.

Qu'elles se rapportent à la santé (dossiers médicaux des patients, des laboratoires de recherche, administration de médicaments, examens, prévention) ou à la gestion administrative, ces informations resteront hébergées par chaque établissement, tout en étant désormais mises à disposition de l'ensemble des soignants et des chercheurs habilités. Mais aussi des algorithmes.

Car « la donnée est un point de convergence des intérêts. Elle résume beaucoup de choses et va davantage structurer des projets. Nous avons la volonté, tout en restant souverain, d'optimiser la valorisation des données en lien avec les établissements, l'environnement académique et l'écosystème industriel », détaille le Pr. Delphine Maucort-Boulch, spécialisée en Santé publique numérique aux HCL (biostatistiques).

Lire aussi Investissements : ce que contient le nouveau volet régional du Ségur en Auvergne Rhône-Alpes

Massifier la donnée

Ce projet de 9,8 millions d'euros (bénéficiant d'un soutien de moitié de l'Etat) vise en effet à « décloisonner » l'entreposage des données de santé dans chaque établissement, grâce à une gouvernance commune, mais aussi à un espace numérique partagé (hors stockage en propre) et en cours de développement : D2H.

Et ce, grâce à la massification des données détenues par les quatre établissements porteurs du projet selon Jean-Christophe Bernadac :

Massification qui porte « non seulement sur le volume et la quantité de données stockées et traitées, par exemple pour l'imagerie médicale. Mais aussi sur l'intégration de types de données de plus en plus riches », comme des documents textes dont l'IA pourrait extraire et prioriser des informations médicales.

Cette nouvelle architecture entend ainsi servir plusieurs objectifs de santé publique. Dont le premier consiste à soutenir les recherches dites « multicentriques », menées dans plusieurs établissements et parfois à l'échelle nationale.

En effet, « étayer » le nombre de données et donc d'informations permettra d'étendre la portée des projets : « Je pense par exemple à une recherche dirigée par le Pr. Jean-Luc Bosson à Grenoble, évaluant des risques d'événements indésirables liés aux soins à partir des données enregistrées dans les 48 premières heures d'une hospitalisation », souligne le Pr. Maucort-Boulch.

Mais aussi dans les champs de l'infectiologie (Lyon), du sommeil (Grenoble), de la mémoire et de la vieillesse (Lyon), ainsi que d'une recherche régionale sur l'appareil locomoteur après un cancer (les quatre CHU). Sans oublier le projet Orchidée sur la mémoire, porté par Santé publique France, pour lequel les HCL se portent volontaires.

Lire aussi L'analyse des données pour une meilleure prise en charge du patient

Soutenir l'essor de l'IA dans le milieu médical

Le deuxième grand objectif, à la fois à court, mais aussi à moyen et long terme, vise à mieux articuler le parcours patient et les démarches des soignants, notamment en soutenant l'essor de l'intelligence artificielle au sein des hôpitaux.

Le tout dans l'idée d'un « un cercle vertueux » qui, s'il est bien mis en œuvre selon Jean-Christophe Bernadac, consisterait à développer et consolider une chaîne allant « des données de soins vers l'amélioration des pratiques de soins », en passant par l'enrichissement des données et donc des connaissances.

Concrètement, il s'agit de travailler dès aujourd'hui « en amont et en aval » d'une prise en charge selon le directeur des services numériques aux HCL. Par exemple en « désidentifiant des documents » (en les anonymisant) pour permettre leur usage secondaire dans le cadre de la recherche. Ou encore « en triant les informations de santé textuelles contenues dans une prescription ou un courrier médical, afin de souligner les informations importantes pour les médecins ». De même, l'intelligence artificielle peut intervenir comme un outil d'aide au diagnostic, par exemple en pré-identifiant l'emplacement d'organes lors d'une radiographie, dans le champ de l'imagerie médicale.

Des usages qui posent également des questions éthiques et déontologiques : « Ce sont des outils puissants, qui permettent un gain de temps potentiel pour les soignants et une meilleure prise en charge des patients. Il y a bien sûr des enjeux de formation. Comme toute chose, il faut apprendre à accorder une confiance relative à l'intelligence artificielle », ajoute Jean-Christophe Bernadac.

Lire aussi Comment Doctolib justifie le choix du géant américain Amazon pour héberger les données des Français

Thalès et Docaposte à la barre

D'autant qu'un impératif concerne aussi la souveraineté de ces logiciels. Pour cela, les hôpitaux ont opté pour un développement industriel français sur 40 mois, en s'appuyant sur les compétences des équipes des entreprises Thalès et Docaposte, avec qui le projet a été pensé et opéré.

« Nous avons cherché à monter ce projet avec des garanties de fiabilité et d'opérabilité », indique à ce titre Jean-Christophe Bernadac, qui avait déjà participé à la conception d'un premier programme porté individuellement par les HCL, mais finalement mis de côté au profit d'une solution mutualisée.

L'émergence du projet D2H n'a en effet pas été si évidente en Auvergne-Rhône-Alpes : « Au départ, chaque établissement menait son projet, sa solution », remarque en effet le directeur des services numériques des HCL. Les établissements de Lyon et de Grenoble ont finalement été deux « locomotives » : les deux centres hospitaliers disposaient déjà de structures opérationnelles et reconnues par la Commission nationale de l'informatique et des libertés (CNIL) depuis 2017 et 2022, mais aux maturités différentes.

D'où un enjeu de mutualisation, soutenu par le privé : « Les deux industriels souverains, Thalès et Docaposte, nous ont permis de concevoir un outil industriel et réalisable », remarque à nouveau Jean-Christophe Bernadac.

Lire aussiComment Thales souhaite se réinventer à travers son nouveau plan stratégique

Et derrière ce partage de compétences désormais effectif, nul partenariat financier direct : la collaboration porte sur la co-construction de D2H, qui pourra ensuite être commercialisé par les deux entreprises. Même dans d'autres champs d'activités que celui des organisations de santé ?

« Nous travaillons sur des cas d'usage en santé. Cela signifie que pour construire l'outil, nous avons recensé des éléments portant sur le cadre réglementaire et nos besoins. Mais cela ne signifie pas que ces cas ne sont pas transposables à d'autres secteurs d'activités. Seulement, cela nécessiterait beaucoup de travail, car la santé reste le cadre qui structure D2H », retrace le directeur des services numériques, qui développe par ailleurs d'autres solutions logicielles, elles aussi déployées sur l'ensemble des réseaux hospitaliers partenaires.

Car l'idée est aussi de nouer de nouvelles collaborations et, à terme, continuer à nourrir D2H, tant au niveau régional que national, ainsi que dans le champ universitaire. À ce titre, il existe déjà des synergies avec les universités Lyon 1 et Lyon 2, mais aussi d'autres centres hospitaliers et entrepôts de données de santé, « notamment dans le Nord, avec le G4 » (entre les CHU d'Amiens, de Caen, de Lille et de Rouen), pointe le Pr. Maucort-Boulch.

La santé numérique comme « l'une des priorités »

En effet, d'autres groupements hospitaliers interrégionaux ont déjà bénéficié d'un soutien de l'Etat via le plan France 2030. C'est par exemple le cas de la plateforme « Ouest Datahub 2.0 », portée par le groupement HUGO (Hôpitaux universitaires grand ouest), regroupant six CHU dans les régions Bretagne, Pays de la Loire et Centre Val de Loire.

Elle a remporté, avec cinq autres programmes, la première vague de l'appel à projets « Accompagnement et soutien à la constitution d'entrepôts de données de santé hospitaliers » porté par Bpifrance, il y a un an. Afin de constituer, « le premier réseau européen big data en santé » avec ses 2,5 milliards de données structurées, soutient le groupement.

Lire aussi Innovation santé : la France veut se donner les moyens de réindustrialiser

À ce titre, l'Etat soutenait en avril 2023 que la santé numérique « a été identifiée comme une des priorités dans le domaine de la santé », ajoutant y associer « une stratégie d'accélération dédiée, dotée de 718,4 millions d'euros, pour préparer l'avenir, consolider une filière en forte croissance et faire de la France un leader en santé numérique ». Le tout, dans l'idée de passer à la médecine dite « 5P » : « préventive, personnalisée, prédictive, participative et basée sur les preuves ».

Le plan d'ensemble « Innovation santé 2030 », annoncé en juin 2021, est quant à lui doté d'un budget global de 7,5 milliards d'euros, visant notamment à renforcer la capacité de recherche biomédicale, mais aussi investir dans les biothérapies, les maladies infectieuses émergentes, en plus du développement numérique.