Créer un corpus de comptes rendus médicaux validés pour entraîner efficacement l’IA

Proposer, en open source, un corpus de comptes rendus médicaux de patients fictifs, dûment validés par des médecins, afin d’entraîner efficacement l’IA et évaluer les outils développés, tel est le but d’un projet français chapeauté par le Health Data Hub et plusieurs institutions et laboratoires médicaux.
Nom de baptême du projet : Partages.
Initié en avril 2025 et aujourd’hui a mi-parcours, le projet s’est appuyé sur les connaissances et la collaboration quelque 120 médecins et a mené à la création d’un corpus de plus de 6.000 comptes rendus au départ de situations cliniques fictives mais réalistes.
Pour plus d’informations sur la genèse et les résultats déjà obtenus par ce projet, consultez la publication scientifique qui lui a été consacrée en mars 2026.
Source : DSIH.fr
Réponses