La Chemoinformatique
Définition
La notion de chemoinformatique a émergé pour la première fois lors du développement d’un médicament en 1998. C’est Franck BROWN qui l’a utilisée comme suit :
"Chemoinformatics is the mixing of those resources information (information technology and management) to transform into data information and knowledge into information intented for the purpose of making better decisions faster in the arena of drug identification and lead optimization".
K. Brown, Annual Reports in Medicinal Chemistry 1998, 33, 375-384
Puis un peu plus tard:
"La chemoinformatique est un terme générique qui regroupe la conception, la création, l'organisation, la gestion, l'extraction, l'analyse, la valorisation, la visualisation et l’utilisation d’information chimique." G. Paris (août 1999 Meeting of the American Chemical Society)
Une définition plus large de la chemoinformatique a ensuite été proposée :
"L'application de méthodes chimiques de l'informatique pour résoudre des problèmes».
J. Gasteiger, ange T. (Eds.), "Chemoinformatics - A Textbook", Wiley-VCH, Weinheim, 2003
Mais la chemoinformatique concrètement c’est quoi ?
La chemoinformatique est une discipline scientifique qui a évolué dans les 10 dernières années à l'interface entre la chimie et l'informatique. Il a été constaté que, dans de nombreux domaines de la chimie, l'énorme quantité de données et d'informations produites par la recherche en chimie ne peut être traitée et analysée que par les méthodes assistées par ordinateur.
Ainsi, les méthodes ont été développées pour la construction des bases de données sur les composés chimiques et leurs réactions, pour la prédiction des propriétés physiques, chimiques et biologiques des composés et des matériaux à l’échelle de l’atome et de la molécule, dans tous les secteurs de l’activité humaine, la conception des médicaments, pour élucider la structure, pour la prévision des réactions chimiques et de la conception de synthèse organique.
La recherche et le développement sont essentiels en chemoinformatique d’une part pour accroître notre compréhension des phénomènes chimiques et d’autre part pour que l'industrie reste compétitive dans une économie mondiale.
C’est une branche de la chimie et/ou de la physico-chimie qui utilise les lois de la chimie théorique exploitées dans des codes informatiques spécifiques afin de calculer structures et propriétés d'objets chimiques (molécules, solides, clusters, surfaces ou autres), en appliquant autant que possible ces programmes à des problèmes chimiques réels.
La frontière entre la simulation effectuée et système réel est bien sûr définie par le niveau de précision requis et/ou la complexité des systèmes étudiés et les théories employées lors de la modélisation. Les propriétés recherchées peuvent être la structure (géométrie, relations entre constituants), l'énergie totale, l'énergie d'interaction, les charges, dipôles et moments multipolaires, fréquences vibrationnelles, réactivité ou autres quantités spectroscopiques, sections efficaces pour les collisions, etc.
La sous-discipline la plus représentée est celle qui s'applique au traitement des configurations électroniques des systèmes.
Les avancées
Développement de sytèmes d'aide à la synthèse
Les difficultés de la synthèse en chimie organique:
Un problème de synthèse est avant tout un probleme de transformation d'une molécule A vers une molécule B, en empruntant une voie réactionnelle souvent à plusieurs étapes. La qualité de cette réaction dépend principalement de trois paramètres:
- Le choix des réactifs
- Le plan de synthèse
- Les conditions expérimentales.
Dès les années cinquante,
Woodward a souligné l'importance de la conception d'un plan dans le processus de la synthèse :
Synthesis must always be carried out by plan, and the synthetic frontier can be defined only in terms of the degree to which realistic planning is
possible, utilizing all of the intellectual and physical tools available [Woodward 56].
Les chimistes ont pour habitude de faire appel à leurs connaissances, leur expérience et surtout à leur intuition afin de concevoir ce plan de synthèse. C'est précisément à ce niveau que l'informatique prend sa place.
En effet, la gestion de la diversité moléculaire et des schémas rationnels est une étape fondamentale dans toute étude et nécessite la constitution d'une chimiothèque, de bases de données riches et complètes référençant non seulement les diverses molécules existentes et leurs propriétés mais aussi étendant les connaissances de l'utilisateur vers les portes d'innombrables réactions possibles.
« Utiliser la diversité moléculaire pour mieux explorer le vivant ».
Voilà un slogan
[académie de Tours] qui résume à lui seul toute la puissance de la chemoinformatique.
Les systèmes d'aide à disposition:
Loin de modélisation moléculaire ou de prédiction de la réactivité basés sur
des calculs numériques, les chimistes ont à leur disposition divers types de systèmes traitant
les données chimiques de manière symbolique pour:
- Trouver une information portant sur des faits connus, ils existent les systèmes d'information chimique qui stockent et retrouvent dans des bases de données une information sur les molécules et les réactions connues.
- Appliquer un mécanisme de raisonnement sur une connaissance dont ils disposent ou produire dynamiquement de nouvelles connaissances(difficulté de rétrosynthese par exemple), ils disposent de systèmes "logiques", dits de Synthèse Assistée par Ordinateur (SAO), qui apportent une aide au raisonnement dans l'élaboration de plans de synthèse ou la simulation de réactions.
Pour plus d'information, lisez
ceci
Pour résumer:
La synthèse organique nécessite un potentiel d'inventivité et de créativité conséquent qui transcende son aspect scientifique et l'élève au rang de l'art. Ainsi, il est improbable qu'avant bien longtemps l'ordinateur puisse concevoir seul de jolies synthèses. Par contre, il a déjà prouvé ses capacités pour manipuler des données chimiques, organiser des connaissances, appliquer des raisonnements et être ainsi un outil efficace susceptible de stimuler l'esprit d'invention des chimistes.
Par ailleurs, les systèmes d'aide à la synthèse sont aussi des outils pédagogiques. Pour vous en convaincre vous pouvez visiter le site de l'académie de
Reims qui est très complet à ce sujet.
La simulation numérique
Imaginez. Lors d'une conférence, grâce à la connexion de son micro-ordinateur sur un grand écran, le chimiste dispose d'un auxiliaire de présentation bien supérieur au rétroprojecteur...
Plus sérieusement, la simulation reste un outil d'aide précieux aux chimistes pour:
- la réalisation de graphiques différents afin d'illustrer les modèles décrits et les confronter aux données expérimentales (avec le logiciel STELLA par exemple)
- la modélisation et l'explication de mécanismes longs et complexes de synthèse
- la recherche d'un protocole expérimentale à l'aide de banques de données riches.
- la recherche rapide des conditions optimales de réaction.
- la visualisation de l'influence de différents paramètres sur les résultats obtenus,
- la possibilité d'aller plus loin en envisageant par exemple des mélanges plus complexes (utilisation de la chimie combinatoire par exemple)
- etc....
Cet outil favorise l'esprit d'initiative et permet la manipulation de modèles dans la limite de leur domaine de validité car en aucun cas la simulation ne peut se substituer totalement à une expérience.
Tous les logiciels de simulation reposent sur l'utilisation d'un modèle, celui-ci devant être nécessairement et nettement explicité dans sa documentation d'accompagnement. Ainsi l'utilisateur peut tenir compte des limites d'application et garder un esprit suffisamment critique lors de son utilisation.
Ces logiciels n'ont pas non plus pour but la " découverte " ou la " vérification " d'une loi puisqu'ils ne font que restituer le modèle introduit.
Générateur d'arômes alimentaires
La chimie combinatoire:
La chemoinformatique peut être appliquée dans n'importe quel domaine de la chimie, depuis la chimie analytique( chimie des solutions, récations cinétiques, etc...) à la chimie organique(synthese de réactions, mécanismes,etc...). En outre, elle a une importance particulière le développement des médicaments.
La première étape de la découverte d'un médicament consiste souvent à tester systématiquement de grandes collections de composés chimiques différents. Alors que le chimiste fait réagir un produit A sur un produit B pour obtenir la molécule A-B, la chimie combinatoire utilise une famille de produits A, appelés synthons (A1, A2, ..., An) et les fait réagir sur une famille de synthons B (B1, B2, ..., Bn), et ainsi de suite. Ainsi on obtient un mélange de produits en une seule opération. La difficulté principale est l'obtention de ces différents produits en quantité équivalente au sein du mélange.
Plus généralement, si on emploie N réactifs à chaque étape et qu'il y a n étapes, le nombre final de molécules obtenues sera de Nn. Ce mélange est appelé bibliothèque.
Actuellement deux axes d'application pour la synthèse combinatoire apparaissent intéressants.
- la synthèse de molécules organiques en grand nombre et de grande diversité chimique. Par exemple, une réaction chimique décrite va être effectuée avec de multiples réactifs. Ces produits très différents sont testés et peuvent éventuellement permettre de découvrir une molécule avec une propriété intéressante. Cette diversité chimique issue de la synthèse combinatoire permet d'atteindre de nouvelles espèces chimiques qui peuvent être le départ pour une étude plus approfondie.
- l'optimisation rapide d'une molécule qui présente déjà une réactivité chimique intéressante. En effet, la synthèse d'un grand nombre de composés issus d'un squelette chimique commun permet de parcourir rapidement les modifications stériques et/ou fonctionnelles qui pourraient accroître sa réactivité chimique (noté QSAR: Quantitative structure-activity relationship ).
Le système d'exploitation de la chimie combinatoire est identique dans le secteur alimentaire. Un logiciel GénérateuR d'Arôme ALimentaire (GRAAL) a d'ailleurs vu le jour.
Calculs de mécanique quantique
L'essor de la chimie numérique:
Le terme de chimie théorique peut être défini comme "la description mathématique de la chimie", tandis que la chimie numérique est habituellement utilisée lorsqu'une méthode mathématique est suffisamment bien développée pour être automatisée puis implémentée dans un code de calcul.
Ainsi, les chimistes numériciens peuvent appliquer simplement les codes et méthodologies existants pour des problématiques chimiques spécifiques. Plusieurs secteurs majeurs de la chimie numérique peuvent être distingués :
- la prédiction de structures moléculaires, cristallines, ou autres états stables ou méta stables de systèmes physicochimiques par la détermination des forces appliquées.
- l'accumulation et la recherche de données sur des systèmes chimiques (base de données chimiques).
- l'identification les corrélations entre structure chimique et propriétés démontrées par le système étudié
- les approches numériques d'aide à la synthèse de différents composés.
- les approches numériques à la conception de systèmes chimiques interagissant de manière spécifique avec d'autres systèmes (comme par exemple la conception de médicaments).
La structure des molécules
La détermination par le calcul de la structure d'une molécule s'est considérablement développée et a permis de mieux comprendre la théorie de la structure moléculaire. Il est en effet théoriquement possible de calculer toutes les propriétés d'une molécule à partir de la connaissance de sa composition et de la résolution de l'équation de Schrödinger.
Les méthodes de résolution sont principalement :
Les banques de données pour la chimie
...Un concentré d'informations...
La chemo-informatique permet d'approvisionner les chimistes en logiciels afin de les aider dans leurs recherches.
La première catégorie de logiciels sont les banques de données : ensemble structuré et organisé permettant le stockage de grandes quantités d'informations afin d'en faciliter l'exploitation.
Autres logiciels pour la chimie
Les logiciels de calculs sont très utiles pour faciliter la vie des chimistes :
- ASV : Calcul analytique des surfaces et volumes de Van der Waals
- RADI : Sphère minimale et coefficients de forme
Viennent ensuite les logiciel qui permettent de mieux comprendre la chimie, Il y a d'une part les logiciels d'analyses qui aident à reconnaître la molécule (formule brute, structure, configuration spatiale, ...) et d'autre part les logiciel de géomètrie qui permettent aux chimistes de visualiser la molécule sous sa véritable forme et ainsi de mieux comprendre les mécanismes ou les propriétés.
- EPIOS : Elucidation structurale en RMN-13C
- Logiciels pour la RMN : RMN1, RMN2, RELAX, CHAINE, ECHANGE
- Logiciels pour la RPE : HRESOL, RIGMAT, DISTRIB, MULTIP, BIRAD, HAMILTON, BRNDF, FNJP, LQCR
- QCM : Chiralité et symétrie quantitatives
- ISIDA : In SIlico Design and Data Analysis
- FRAMES : FRamework for Atomic, Molecular and Extended Systems
Les derniers logiciels sont de loin les plus innovants et les plus impressionnants, en effet, ceux-ci aident à la synthèse : ils sont programmés pour connaître les réactions qui peuvent se produire, il peuvent ainsi générer des structures moléculaires et même permettre de développer des arômes artificiels
- ALSAS : Atelier Logiciel pour le développement de Systèmes d'Aide à la Synthèse
- COSYMA : COnception de Synthèses par Méthode Analogique
- GASP : Générateur Automatique de Structures Polycycliques.
- GRAAL : Générateur d'Arômes Alimentaires (chimie combinatoire)
- GRAMS : Générateur de Réseaux pour l'Apprentissage de Méthodes de Synthèse
- HOLOWIN : Aide a la synthèse
Les laboratoires de recherche
Il existe un certain nombre de laboratoires qui utilisent la chemoinformatique. En voici quelques uns :
Laboratoire de Pharmacologie de la faculté de médecine à Limoges : Ils utilisent la chemoinformatique pour la modélisation moléculaire grâce à certains logiciels comme :
- ChemSketch (Editeur de formules en 2D et 3D, Optimisation géométrique par mécanique moléculaire grâce au langage de programmation ChemBasic)
- RasMol (Visualiseur de molécules)
- Chime (Plug-in pour Netscape ou Internet Explorer. Même principe que RasMol, avec des options supplémentaires comme le potentiel de lipophilie)
- MOPAC (Calculs quantiques semi-empiriques)
- Open Babel (Convertisseur de fichiers de coordonnées moléculaires)
- Tinker (Ensemble très complet de programmes pour la mécanique et la dynamique moléculaires)
- PovChem (Permet de créer des images de molécules en 3D par la technique du "tracé de rayons" à l'aide du logiciel POV-Ray)
- Vega (Ce programme permet de calculer un grand nombre de propriétés moléculaires (volume, lipophilie...), d'analyser des trajectoires de dynamique moléculaire et de réaliser divers traitements sur les fichiers de coordonnées)
- MMTK (Molecular Modelling Toolkit est une extension du langage Python permettant de créer des programmes de dynamique moléculaire, il requiert les extensions Numeric Python et Scientific Python)
- VMD (Visual Molecular Dynamics est un Visualiseur de trajectoires de dynamique moléculaire. Le site présente en outre une très belle collection d'images et d'animations)
- EPI Suite (Ensemble de programmes permettant de calculer diverses propriétés physiques telles que le coefficient de partage octanol/eau).
Le Centre Documentaire Informatique Enseignement Chimie : Créé en 1977 par Daniel Cabrol-Bass dans le cadre du groupe ReCoDiC (Recherches Coopératives en Didactique de la Chimie, réseau subventionné par le Ministère de l'Éducation Nationale et dissous en 1985) il possède des activités de développement et de distribution de documents informatiques et multimédias d'enseignement de la Chimie. Le CDIEC a établi des coopérations avec des centres similaires aux USA (Seraphim Project, Madison, Michigan) et en Grande-Bretagne (CVC, Southampton) pour faire connaître les réalisations francophones et effectuer des traductions de logiciels anglophones. Le centre est parti prenante du projet Européen "Multimédia Ressources in Chemistry". Il diffuse des logiciels comme Autoformation à la Spectrométrie Infra Rouge, Autoapprentissage à la Résonance Magnétique Nucléaire du H (Remano Web).
Groupe Informatique et Chimie du laboratoire de physique quantique de l’université Paul Sabatier de Toulouse dirigé par Stefano Evangelisti
Groupe de recherche Informatique et Chimie du LIRMM (Laboratoire d'Informatique, de Robotique et de Microélectronique de Montpellier)
Laboratoire sur la Représentation et le Traitement de l’Information Chimique de l'Université de Nice Sophia-Antipolis : DIDAC, EURISKO !, EXP'A.I.R., REMANO Win, Autoformation à la RMN (RMN H Théorie, RMN H Delta, RMN H Couplages), TOP. D’autres réalisations sont par ailleurs distribuées par les éditions Jériko : Apprentissage de la spectrométrie Infra Rouge, Interprétation des spectres Infra Rouge.
Les débouchés et les entreprises qui recrutent
La chemo-informatique? C'est traiter des données, les analyser, modéliser, surtout se former...
Oui, mais après, pour travailler où? Dans quels secteurs? Dans quelles entreprises?
Parce que cette science est encore méconnue du public et incomprise par bon nombre de chimistes dits " purs et durs ", voici une petite liste de quelques entreprises qui recrutent dans ce domaine.
Vous verrez, leurs noms vous diront surement quelque chose et les salaires...Hé bien, ils parlent d'eux même...
Les Secteurs
Nulle crainte à ce sujet les amoureux de la chimie retombent dans leurs filières de prédilection:
- Laboratoire de recherche en Chimie Pharmaceutique
(Recherche et Développement)
- Laboratoire d'analyse et qualité.
- Secteur Agroalimentaire
- Secteur de la Cosmétologie
Les Entreprises associées:
- INERIS: Institut National de l'EnviRonnement et des rISques est un établissement public à caractère industriel et commercial placé sous la tutelle du MEEDDAT (Ministère de l'Ecologie, de l'Environnement, du Développement Durable et de l'Aménagement du Territoire). Il réalise ou fait réaliser des études et des recherches permettant de prévenir les risques que les activités économiques font peser sur la santé, la sécurité des personnes, des biens et de l'environnement.
- CNRS : Centre National de la Recherche Scientifique
- Nestlé : Premier groupe alimentaire mondial, composé de 17 centres de recherche, 3500 chercheurs de plus de 70 nationalités différentes, 1 milliard d'euros consacrés à la recherche et au développement chaque année...
- L'Oréal : Groupe industriel français spécialisé dans la cosmétique et la beauté.
- ChemCad : PME implanté à Obernaé (France) qui commercialise des logiciels et des bases de donnés pour la chimie, la physico-chimie, la spectroscopie, la biochimie et l'élaboration de solutions d'entreprise.