Plateforme de Bioinformatique en Psychiatrie et Neurosciences (BIPN)

La Plateforme de Bioinformatique en Psychiatrie et Neurosciences (BIPN) est rattachée à l’INSERM U1266 – Institut de Psychiatrie et Neurosciences de Paris (IPNP). Elle a pour vocation de fournir un accompagnement bioinformatique, méthodologique et analytique aux équipes de recherche développant des projets en psychiatrie, en neurosciences fondamentales et cliniques, ainsi que dans le champ des troubles neurodéveloppementaux. La plateforme intervient de manière transversale dans les projets impliquant des données biologiques à haut débit, qu’il s’agisse de données génétiques, transcriptomiques, épigénomiques, protéomiques ou multi-omiques. Elle accompagne les équipes depuis la phase de conception des projets, en aidant à formuler les questions scientifiques et à définir des stratégies analytiques adaptées, jusqu’au traitement des données, à l’analyse statistique et à l’interprétation biologique des résultats, dans une démarche de qualité scientifique, de reproductibilité et de pérennisation des méthodes.

Sur le plan technique, la plateforme est pilotée par Benjamin DEMAILLE, Responsable Technique de BIPN. Sur le plan scientifique, la coordination est assurée par Nicolas Ramoz, Responsable Scientifique interne à l’IPNP, en collaboration avec Anton Iftimovici, Responsable Scientifique associé au GHU-Paris.

La mission principale de la plateforme BIPN est de formaliser et de structurer les besoins analytiques des équipes de recherche, en lien étroit avec les biologistes, cliniciens et porteurs de projets. Cette mission comprend l’aide au choix des technologies omiques les plus adaptées, la définition des plans d’analyse, l’anticipation des contraintes liées aux volumes de données, à l’hétérogénéité des cohortes, aux effets de lot et aux biais techniques, ainsi que la mise en place de stratégies analytiques robustes et statistiquement pertinentes. La plateforme assure également le traitement, l’analyse et l’intégration de données biologiques complexes, en garantissant la qualité, la traçabilité et la reproductibilité des analyses. Une mission complémentaire essentielle concerne le maintien, le développement et la transmission des outils, des pipelines et des bonnes pratiques en bioinformatique, afin de favoriser la montée en compétence des équipes de l’IPNP et d’assurer la durabilité des analyses produites.

Les activités de la plateforme couvrent un large spectre de la bioinformatique appliquée aux sciences du vivant. En génomique humaine, BIPN accompagne les projets d’études d’association pangénomique, de calcul de scores de risque polygénique et d’analyse de données de séquençage du génome entier. Ces analyses incluent le contrôle qualité des données génotypiques ou de séquençage, la gestion de la structure de population, l’appel, le filtrage et l’annotation des variants, ainsi que l’interprétation biologique des résultats dans des contextes psychiatriques et neurologiques. En transcriptomique, la plateforme prend en charge les analyses de données RNA-seq en bulk et en single-cell, depuis le prétraitement et la quantification des données jusqu’à l’identification de signatures d’expression, l’annotation cellulaire et l’intégration avec d’autres niveaux omiques. La plateforme propose également un accompagnement pour l’analyse de données épigénomiques et méthylomiques, incluant le contrôle qualité, la normalisation, la correction des effets techniques et les analyses différentielles, ainsi que pour l’analyse de données protéomiques et leur intégration dans des approches multi-omiques.

 

Ingénierie des données et analyses reproductibles

 

Un axe central de l’activité de la plateforme concerne l’ingénierie des données et la mise en place d’analyses reproductibles. BIPN assure la structuration et l’urbanisation des données, la conception d’architectures adaptées à des jeux de données hétérogènes et de grande dimension, ainsi que le développement de pipelines d’analyse standardisés, documentés et versionnés. Une attention particulière est portée à la gestion des métadonnées, à la cohérence des formats et à la traçabilité des traitements, afin de faciliter la réutilisation des données et des résultats dans le cadre de projets ultérieurs. Cette approche garantit la robustesse méthodologique des analyses et leur conformité aux exigences actuelles en matière de science reproductible et de bonnes pratiques en bioinformatique.

 

Formation et accompagnement

 

La plateforme accorde une place importante à la formation et à l’accompagnement des utilisateurs. Elle propose un soutien méthodologique continu aux équipes, incluant l’aide à la conception des analyses, la fourniture de scripts et de workflows reproductibles, ainsi que la rédaction de documentation et de tutoriels. La plateforme participe également à la formation des chercheurs, ingénieurs et étudiants aux outils et méthodes de la bioinformatique, dans une logique de transfert de compétences et de renforcement de l’autonomie des équipes de recherche. Ces actions contribuent à diffuser les bonnes pratiques en matière d’analyse de données, de gestion des données et de reproductibilité au sein de l’IPNP.

 

Collaborations

 

La plateforme BIPN collabore étroitement avec plusieurs équipes de recherche de l’IPNP, notamment les équipes Krebs, Gorwood/Ramoz et Oppenheim, ainsi qu’avec le GHU-Paris (site ghu-paris.fr) pour des projets impliquant des données cliniques et biologiques. Elle est également impliquée dans des collaborations nationales et externes, en particulier avec le PEPR-PROPSY, le CNRGH et l’Institut Imagine, ainsi qu’avec des partenaires industriels. Ces collaborations favorisent le développement de projets interdisciplinaires et l’intégration de la plateforme dans des réseaux de recherche de grande envergure.

La plateforme BIPN dispose de moyens techniques dédiés à l’analyse de données biologiques de grande dimension. Elle s’appuie sur une infrastructure de stockage sécurisée d’environ 200 téraoctets, permettant l’archivage et la gestion de jeux de données volumineux tels que les données de séquençage du génome entier, de transcriptomique unicellulaire ou de projets multi-omiques. Les analyses computationnelles sont réalisées sur une station de calcul haute performance de type Mac Studio M3 Ultra, équipée de 32 cœurs CPU et de 512 Go de mémoire vive, complétée par un poste de travail personnel MacBook Pro M4 Max disposant de 128 Go de mémoire vive, utilisé pour le développement, les tests de pipelines et les analyses ciblées. Ces ressources permettent à la plateforme de répondre aux besoins computationnels variés des projets accompagnés tout en favorisant la reproductibilité des analyses.

 

Environnements et outils

 

Les analyses réalisées au sein de la plateforme s’appuient sur des environnements Linux et sur l’utilisation de langages de programmation standards en bioinformatique, notamment R, Python et SQL. La plateforme utilise et maintient des outils largement reconnus par la communauté scientifique, tels que CellRanger pour la transcriptomique unicellulaire, Plink et PRSice2 pour la génétique humaine et les scores de risque polygénique, Minfi pour l’analyse de la méthylation de l’ADN, Salmon pour la quantification rapide et robuste des données de transcriptomique bulk, Bismark pour le traitement des données de bisulfite sequencing, et ENSEMBL-VEP pour l’annotation fonctionnelle des variants. Ces outils sont intégrés dans des workflows reproductibles et documentés, adaptés aux besoins spécifiques des projets menés au sein de l’IPNP et conformes aux standards de la communauté.

La plateforme est ouverte en priorité aux équipes de l’IPNP, ainsi qu’aux partenaires académiques et cliniques dans le cadre de collaborations établies. Les projets sont pris en charge après une phase de discussion permettant de définir les objectifs scientifiques, les données disponibles, les modalités d’analyse et les livrables attendus. Les utilisateurs s’engagent à respecter les règles de fonctionnement de la plateforme, notamment en matière de gestion des données, de confidentialité et de sécurité, conformément aux recommandations institutionnelles de l’Inserm et de l’IPNP.