close
ChimieSciences

Les chimistes organiques devraient adopter l’apprentissage automatique même si son fonctionnement ne peut pas être entièrement connu

Classiquement, une boîte noire est un système dont les entrées sont contrôlées ou connues, et dont les sorties peuvent être récoltées, mais dont le fonctionnement interne reste un mystère. Prenez la recherche Google – nous savons peut-être à peu près comment cela fonctionne, mais les détails de l’algorithme de recherche sont gardés secrets pour le public. Mais quand la chimie organique rencontre l’informatique, on a parfois l’impression de vouloir tout savoir – les boîtes noires peuvent être perçues comme un outil frustrant et méfiant.

Il est juste de dire que parfois, une compréhension globale nous permet de contrôler toutes les variables pour éviter les problèmes. En tant qu’étudiant, j’ai exprimé des inquiétudes concernant les résultats d’un exercice de calcul, à rejeter avec “mais l’ordinateur dit que c’est ce que vous devez faire”. Trois mois de travail acharné plus tard, nous, les chimistes de synthèse, avons eu raison quand il a été découvert que grâce à une erreur informatique dans un système auquel nous ne pouvions pas accéder directement, nous avions en effet travaillé sur les mauvais composés pendant tout ce temps. Depuis, j’ai eu une dose rigoureuse de scepticisme pour les méthodes hors de notre contrôle !

Bien que la prudence soit de mise, il faut aussi se souvenir de la thermodynamique de premier cycle, où l’on apprend à traiter délibérément les systèmes chimiques comme des boîtes noires, leur complexité réduite à quelques paramètres fondamentaux – faute de quoi nous sommes incapables de calculer leurs propriétés. Pour les systèmes les plus complexes, une compréhension claire du fonctionnement du système doit être un substitut suffisant pour connaître les voies exactes pour parvenir à notre réponse. Je pense en particulier aux méthodes d’apprentissage automatique : des systèmes dont le contenu est pratiquement inconnaissable et dont le raisonnement peut ne pas avoir de sens pour les utilisateurs humains. Cependant, faire un acte de foi est très inconfortable pour les chimistes organiques, qui sont habitués à avoir autorité et à raisonner même sur la structure atomique. Bien que nous n’ayons jamais à l’esprit tous les détails d’un réseau neuronal individuel, nous pouvons apprendre comment il fonctionne, comment il a été créé et quels paramètres il a été autorisé à exploiter. Une compréhension élémentaire des outils et une certaine confiance dans des collaborateurs experts nous permettent de réduire les préoccupations dans les méthodes abstraites.

À un certain niveau, les humains résument presque tout ce que nous utilisons. Chaque fois que vous utilisez un LC-MS en tant que chimiste synthétique, vous n’avez pas besoin de parcourir mentalement une compréhension de base des polarités relatives, de l’absorption UV et de l’ionisabilité de vos substrats. Se référer simplement à votre composé en tant qu’aniline tertiaire fournit suffisamment d’informations pour qu’un utilisateur expérimenté puisse s’attendre à un certain résultat. Ces abstractions peuvent même être directement codées en dur ; par exemple, vous pouvez avoir des méthodes génériques polaires et apolaires configurées sur l’instrument. Il existe d’innombrables exemples populaires de reconnaissance plus facile d’un concept lorsque nous lui donnons un nom – peut-être que les réactions de nom sont un cas – ainsi que des exemples négatifs, tels que voir quelqu’un qui ressemble à un ” voyou ” et établir faussement un lien mental avec trouble-fête. La capacité d’abstraction du public est également un outil utile lors de la présentation de résultats complexes : la narration de données permet à un présentateur de construire des briques de données individuelles dans des structures conceptuelles, aidant le public à sentir qu’il a moins de concepts individuels à comprendre.

Les abstractions sautent à la non-interprétabilité humaine lorsqu’elles impliquent des calculs à la vitesse de l’ordinateur ou trop de variables. Heureusement, les ordinateurs excellent dans ces domaines, mais cela peut être un choc lorsque les méthodes ne rentrent plus dans un cerveau humain. Je visualise ces assistants surhumains comme étant une autre couche au-dessus du cerveau, un peu comme un ordinateur portable transmettant des calculs à un cluster de superordinateurs, puis récupérant les résultats.

Et c’est là l’avantage : certains systèmes que nous ne comprenons pas vraiment sont meilleurs que nous dans ce qu’ils font. Bien que l’apprentissage automatique soit encore un outil émergent lorsqu’il est appliqué à la chimie organique, notamment en raison de nos ensembles de données relativement petits, sa puissance est évidente de notre utilisation quotidienne de la reconnaissance faciale sur nos appareils à la reconnaissance vocale sur nos assistants domestiques. (Cela dit, l’apprentissage automatique est soumis aux mêmes biais que sa formation : il peut abuser d’un catalyseur incontournable ou, plus alarmant, lutter davantage avec des tons de peau plus foncés sur des images humaines.) entreprises est la fréquence à laquelle l’apprentissage automatique est également utile dans la chimie. En fin de compte, ce qui compte, c’est de savoir si les résultats fonctionnent de manière vérifiable, plutôt que de savoir comment nous y sommes arrivés, bien que cela puisse être difficile à avaler. Nous devons faire un acte de foi et nous rappeler que nous, les chimistes organiques, ne sommes pas capables de tout comprendre.

Le célèbre monde pas si humble de la chimie organique est endommagé par notre ego et notre manque de volonté de nous soumettre à la puissance supérieure de l’abstraction. Nous pourrions rendre notre domaine plus fort et plus utile, et comme tout chimiste informatique vous le dira, les processus de boîte noire ne doivent pas nécessairement se faire au détriment des informations globales.

Tags : editor take
Sciences et Technologies