Blog: Utilisation des réseaux de neurones artificiels pour l’optimisation de réactions chimiques

  1. Home
  2. > Blog
  3. > Utilisation des réseaux de neurones artificiels pour l’optimisation de [...]

by: AZUAJE Johander, PULIDO Tiago Track "Chemoinformatics for Organic Chemistry", Lisbon – Strasbourg, 2022

De nos jours, la planification de la synthèse assistée par ordinateur (CASP) connaît un regain d’intérêt, visant à faciliter l’évaluation de la faisabilité des réactions chimiques proposées et la recherche d’éventuelles voies de rétrosynthèse.

Une équipe de chercheurs a proposé une alternative aux méthodes existantes, en essayant de dépasser leurs limites. Ils affirment que l’outil créé, basé sur des techniques d’apprentissage automatique, peut effectuer des prédictions, avec des résultats précis, en tenant compte de la compatibilité des réactifs et du contexte chimique: catalyseur(s), solvant(s), réactif(s) et température.

Cet outil a utilisé la base de données Reaxys, qui contient plus de 53 millions d’enregistrements chimiques, pour l’entraînement. Mais tous ces enregistrements n’ont pas été utilisés ; en fait, seuls 11 millions d’enregistrements ont été utilisés. Seules les réactions chimiques comportant une seule étape et un seul produit ont été prises en compte, les réactions sans informations sur les conditions ont été ignorées, de même que les réactions comportant jusqu’à deux solvants et réactifs. Tous les composés métalliques ont été considérés comme des catalyseurs.

La structure du modèle de prédiction considère les prédictions relatives au catalyseur, au(x) réactif(s) et au(x) solvant(s) comme un problème multiclasse, tandis que la prédiction de la température est un problème de régression. Le modèle prend l’empreinte digitale moléculaire du produit et l’empreinte digitale moléculaire de la réaction comme entrées, la réaction étant calculée comme la différence entre les empreintes digitales moléculaires du produit et du (des) réactif(s). Le modèle produit une liste de suggestions comprenant le catalyseur, le(s) réactif(s) et le(s) solvant(s), et enfin la température.

Le modèle a été développé en utilisant les réactions organiques les plus courantes. Après validation, il a été testé avec 1 million de réactions arbitraires. Le modèle a été capable de prédire les réactifs en fonction du contexte chimique, d’identifier et de suggérer le type de catalyseur nécessaire. Il est également capable d’identifier la stéréosélectivité dans les réactions et de suggérer des conditions spécifiques qui n’affectent que des groupements déterminés dans les molécules. En outre, il a été signalé que même lorsque les composés suggérés ne sont pas identiques à ceux de la littérature, ils présentent une grande similitude chimique et fonctionnelle avec ces derniers.

Figure 1 Some examples of comparison between experimental chemical context and condition with prediction by the model. Black text represents the experimental condition, and blue text represents the predictions (1)

Les outils assistés par l’IA deviennent de plus en plus populaires, et il est fascinant de découvrir certains de ces outils appliqués à la chimie. La solution présentée dans l’article en question est intéressante, mais elle présente des limites fondamentales, par exemple l’utilisation d’une base de données qui n’est pas conçue pour être lue par un ordinateur et la simplification excessive des données. De nouveaux développements sont nécessaires pour que ce type d’approche devienne la norme dans la synthèse organique moderne.

References
1. Gao, H., Struble, T. J., Coley, C. W., Wang, Y., Green, W. H., & Jensen, K. F. (2018). Using machine learning to predict suitable conditions for organic reactions. ACS central science, 4(11), 1465-1476 (https://doi.org/10.1021/acscentsci.8b00357).