Le criblage virtuel est une méthode puissante qui remplace les processus expérimentaux en laboratoire pour identifier des candidats potentiels à des médicaments. Contrairement aux tests expérimentaux à haut débit, le criblage virtuel permet d'explorer un nombre beaucoup plus grand de composés dans un laps de temps raisonnable, tout en réduisant les coûts. Cependant, même si cette approche est prometteuse, elle repose sur des algorithmes sophistiqués et des stratégies de filtrage pour garantir que seuls les composés les plus prometteurs soient retenus pour des tests plus approfondis.

Le criblage virtuel basé sur les ligands est particulièrement adapté lorsque la structure tridimensionnelle de la cible n'est pas disponible. Dans ce cas, les stratégies de criblage par similarité et de filtrage de composés permettent d'identifier rapidement des candidats potentiels en s'appuyant sur des informations chimiques et biologiques existantes. Le processus commence souvent par un filtrage des composés indésirables, selon des critères tels que leur toxicité, leur complexité ou leur capacité à se lier efficacement à la cible souhaitée.

L'une des premières étapes essentielles dans le criblage virtuel est le filtrage des composés "non-drogues". Ce filtrage repose sur des critères simples mais efficaces, tels que la règle de Lipinski, qui stipule qu'un composé doit respecter certaines caractéristiques de taille et de polarité pour être considéré comme "druggable" ou apte à devenir un médicament. Cependant, ces critères ne sont pas absolus. En réalité, environ 16 à 20 % des médicaments oraux disponibles sur le marché ne respectent pas ces règles. Par conséquent, des méthodes supplémentaires, telles que les critères de Veber ou les filtres de Ghose, peuvent être appliquées pour affiner le processus de sélection.

Après avoir appliqué ces premiers filtres, une autre approche de criblage très utile est la recherche de similarité. Cette méthode repose sur l'idée que des composés ayant des structures chimiques similaires à un composé actif connu auront de grandes chances d'avoir des propriétés thérapeutiques semblables. La recherche de similarité consiste donc à comparer la structure chimique de millions de composés avec celle du composé cible pour en identifier de nouveaux qui pourraient avoir des activités biologiques similaires. En combinant ces informations avec des modèles de prédiction, il est possible d'établir des priorités dans le criblage de composés.

L’un des avantages majeurs du criblage virtuel est qu’il permet d’examiner des bibliothèques de composés très étendues, de l'ordre de milliards de molécules, bien au-delà de ce que les méthodes expérimentales traditionnelles peuvent traiter. Par ailleurs, contrairement aux tests expérimentaux, cette approche ne nécessite pas de laboratoire physique et est donc beaucoup plus rentable. Cependant, l'enrichissement des résultats demeure un défi. Le but d’un criblage virtuel efficace est de réduire le nombre de composés à tester tout en maximisant la probabilité d'identifier des candidats efficaces. Un bon criblage virtuel augmente considérablement la proportion de composés actifs dès les premières étapes, ce qui permet de réduire les coûts des tests expérimentaux.

Les stratégies de criblage virtuel basées sur les ligands sont également complétées par des techniques plus avancées, comme le docking moléculaire, qui permet d’évaluer la manière dont un composé pourrait se lier à une cible protéique. Ce processus peut être suivi de simulations de dynamique moléculaire (MD), bien que ces dernières soient souvent limitées à un petit nombre de composés en raison de leur coût computationnel élevé.

Le criblage virtuel, dans sa forme la plus simple, est une technique accessible qui repose sur des modèles simples pour trier une large base de données de composés. Cependant, à mesure que l'on entre dans des processus plus complexes, comme le docking et les simulations MD, la charge computationnelle augmente. Les pipelines de criblage sont souvent hiérarchiques, traitant initialement un grand nombre de composés de manière rapide et peu coûteuse, avant de se concentrer sur un sous-ensemble plus restreint pour des analyses plus approfondies.

Au-delà des méthodes techniques de filtrage et de recherche de similarité, il est important de considérer les limitations de ces approches. Bien qu'elles permettent d'identifier des candidats intéressants, elles ne peuvent pas remplacer les tests expérimentaux en laboratoire, nécessaires pour valider les hypothèses générées par les modèles computationnels. De plus, la dépendance à des bases de données existantes et à des informations structurées de manière précise impose des contraintes sur la diversité des composés que l’on peut tester. Les avancées dans le domaine de la biologie structurale et l’amélioration de la qualité des modèles informatiques permettront sans doute d’étendre encore l’utilité du criblage virtuel dans la découverte de médicaments.

Comment identifier des composés actifs à travers la recherche de similarité et la modélisation basée sur les ligands ?

La recherche de similarité est une approche puissante qui permet d'identifier des composés ayant des propriétés similaires à celles d'un composé actif déjà connu. Intuitivement, les composés présentant des structures ou des propriétés semblables à celles du composé actif ont une probabilité plus élevée d’être également actifs. Cela s'applique particulièrement dans le contexte de la recherche de médicaments, où la recherche de composés présentant des structures similaires à un médicament actif déjà approuvé peut offrir des résultats intéressants.

Lorsqu'on dispose de plusieurs composés actifs connus, une autre approche complémentaire consiste à mener une recherche pharmacophorique basée sur les ligands. Dans cette méthode, nous prenons la liste de composés actifs et générons des configurations possibles de leur forme en trois dimensions, afin de tenter de faire correspondre ces configurations pour repérer les caractéristiques structurelles communes. Cette approche permet d’identifier des motifs structuraux récurrents parmi des composés aux structures diverses mais ayant un effet biologique similaire. En attribuant un score à ces caractéristiques communes, il devient possible de rechercher dans une bibliothèque de composés inconnus ceux qui possèdent ces traits structuraux à fort score.

Cependant, si nous disposons à la fois de composés actifs connus et de composés inactifs, nous pouvons alors utiliser des méthodes d'apprentissage automatique. L’objectif est de former un modèle qui puisse établir une corrélation entre les caractéristiques structurales des composés présents dans notre ensemble de données et leur activité. Si ce modèle parvient à distinguer correctement les composés actifs des inactifs, il est probable qu'il puisse être appliqué à de nouveaux composés non inclus dans le jeu de données d’apprentissage. Les modèles d'apprentissage automatique utilisés pour prédire l'activité des composés sont parfois appelés modèles QSAR (quantitative structure-activity relationship) — bien que tous les modèles QSAR ne soient pas nécessairement basés sur l'apprentissage automatique. Le terme QSPR (quantitative structure-property relationship) est plus général, car il fait référence à l’établissement d’une relation entre la structure moléculaire et toute propriété moléculaire, pas seulement l’activité.

Il est à noter qu'une question naturelle à ce stade concerne la manière dont on détermine la similarité structurelle. Cette question sera approfondie plus tard dans le chapitre. En ce qui concerne les stratégies basées sur les ligands, l'apprentissage automatique devient applicable lorsque nous avons des exemples de composés des deux classes, active et inactive. Lorsque nous ne disposons que de composés actifs, les stratégies de recherche sont plus appropriées. Une classe positive fait référence à un composé qui est "positif" pour la propriété évaluée, qu’il s’agisse d’activité, de toxicité, ou d’une autre caractéristique.

Dans la pratique, il est courant d'utiliser plusieurs méthodes de criblage virtuel, les unes après les autres, de complexité croissante. Cette approche est connue sous le nom de criblage virtuel hiérarchique. À chaque étape, des structures sans intérêt sont éliminées, jusqu’à ce qu’il reste un ensemble de structures candidates. Par exemple, on peut d’abord utiliser des filtres basés sur des règles pour éliminer rapidement les candidats les plus inappropriés, suivis par un criblage virtuel basé sur les ligands, qui permet de détecter de manière plus nuancée les composés actifs. Les composés restants peuvent ensuite être soumis à des méthodes plus rigoureuses et intensives, telles que le dockage protéine-ligand ou les simulations de dynamique moléculaire, avec un ou plusieurs cibles d’intérêt.

En plus de l’évaluation de l’activité d’un composé, les méthodes de criblage virtuel sont également extensibles aux tâches de prédiction des propriétés ADMET (absorption, distribution, métabolisme, excrétion, et toxicité). Par exemple, les filtres peuvent identifier des composés qui, indépendamment de leur activité contre la cible, manquent d'autres qualités essentielles à un médicament. Les filtres "drug-likeliness" (par exemple, la règle des cinq de Lipinski) aident à déterminer si un composé possède la taille, la solubilité et la perméabilité appropriées pour une administration orale ou une biodisponibilité. Il est important de souligner que ces filtres sont souvent des lignes directrices, plutôt que des restrictions strictes. Bien qu’ils permettent de gagner du temps et des ressources, ils peuvent être trop restrictifs et éliminer des molécules potentiellement utiles. Il existe de nombreuses variantes de filtres adaptés à différents contextes, et il est aussi possible d’adapter le nombre de filtres à signaler. Une stratégie de filtrage plus conservatrice pourrait impliquer l'expertise d’un chimiste médicinal, qui pourrait réexaminer les molécules rejetées et sauver celles qui présentent un potentiel. En revanche, si des spécialistes ne sont pas disponibles, une stratégie de filtrage plus libérale pourrait être adoptée.

Prenons l'exemple de la recherche de composés antipaludiques. La malaria est une maladie parasitaire potentiellement mortelle qui touche des millions de personnes dans le monde, principalement dans les régions tropicales et subtropicales. La recherche de médicaments antipaludiques repose souvent sur l’étude de différentes cibles protéiques au sein de Plasmodium falciparum, le principal vecteur de la malaria. Cependant, l’adaptabilité de P. falciparum à développer des résistances aux médicaments est une menace croissante, et de nouveaux traitements doivent constamment être mis au point. Une campagne de criblage virtuel pour identifier de nouveaux candidats antipaludiques pourrait commencer par un large éventail de molécules provenant de diverses bibliothèques chimiques disponibles, comme celles issues du dépôt PubChem, puis utiliser des ressources complémentaires comme la boîte à malariens, qui contient des composés actifs contre P. falciparum.

Pour identifier des composés prometteurs, une recherche de similarité peut être réalisée pour croiser une bibliothèque chimique diversifiée avec la boîte à malariens. Cette recherche permet de filtrer rapidement les composés potentiellement inactifs ou non pertinents, réduisant ainsi le nombre de molécules à tester en laboratoire. Ce processus d’identification est fondamental pour la découverte de nouveaux traitements, mais il est nécessaire de rappeler que la recherche de similarité, bien qu'efficace, ne doit pas se limiter à la structure seule. La capacité de prédire l’activité biologique à partir des structures moléculaires requiert une compréhension approfondie de la chimie médicinale et de la biologie des cibles, et l’expertise d’un chimiste médicinal ou d’un pharmacologue peut être déterminante pour affiner les choix de molécules prometteuses.