Bio-informatique en oncologie

HISTORIQUE

  • 1920 H. Winkler (Hambourg), le génome est l'ensemble des déterminants héréditaires (gènes) propres à une espèce donnée .
  • 1944 L’ADN est le support de l'hérédité
  • 1953 Structure de l'ADN(J Watson, F Crick, R Franklin, M Wilkins)
  • 1972 ADN recombinant(P Berg)
  • 1977 Séquençage d'ADN (W Gilbert, F Sanger)
  • 1983 Polymerase Chain Reaction(K Mullis)
  • 1984 YACs, Séquence du virus d'Epstein-Barr, 170 kb
  • 1987 Séquenceurs automatiques (L Hood)
  • 1990 Logiciel d'alignement BLAST (Lipman, Myers et al) - Logiciel GRAIL pour identification de gènes
  • 1992 Carte physique des chromosomes humains Y (MIT) et 21 (CEPH, Evry)
  • 1995 Séquence complète de Haemophilus influenzae (C Venter, TIGR)Carte physique du génome humain (MIT et Généthon)
  • 1996 Séquence complète de la levure
  • 1997 séquençage d'Escherichia coli
  • 1998 Séquençage de C. elegans (959 cellules)
  • 2000 Arabidopsis thaliana; Drosophila melanogaster (Venter, TIGR)
  • 2000 Séquence partielle (Celera; Human Genome Program) du génome humain
  • 2004 Séquence complète (Human Genome Program) du génome humain
  • 2010 Métagénomique

Le génome

C'est l'ensemble de l'information héréditaire d'un organisme. Cette information est présente, en totalité, dans chacune des cellules de l'organisme.
Lorsqu'une cellule se divise l'information est copiée et transmise aux deux cellules filles.
Le génome, de plus, contient toutes les instructions nécessaires au développement, au fonctionnement, au maintien de l'intégrité et à la reproduction des cellules et de l'organisme.

Le séquençage du génome...

200320152020
  • Séquençage du génome humain
  • 3 milliards €
  • 13 ans d'efforts à un consortium international !
  • Coût du séquençage divisé par 3 millions !
  • Lecture de l'ADN
  • 1000 €
  • 3 heures
  • Séquençage l'ADN de tout un chacun
  • 23andme™ (Google)
  • 100 €
  • 10 minutes

La génomique

C'est la science qui étudie le génome.

Le génome c'est l’ensemble du matériel génétique d’un individu ou d’une espèce, encodé dans son ADN.
Chez l’homme, ce matériel génétique est organisé sous la forme de chromosomes. Le génome peut être comparé à une encyclopédie dont les différents volumes seraient les chromosomes. Les gènes seraient les phrases contenues dans ces volumes et ces phrases seraient écrites dans un langage génétique représenté par quatre bases (adénine, cytosine, guanine et thymine), abrégées en ACGT.

Périmètre

C'est une science qui regroupe diverses approches d’analyse qui permettent de comprendre la constitution, l’organisation et le fonctionnement du génome.
Ces recherches contribuent à répondre à de multiples questions biologiques qui prennent en considération l’ensemble des gènes (génome) du patrimoine de l’organisme étudié.

 

Next generation sequencing

LA BIO-INFORMATIQUE

Le séquençage fait appel à la bioinformatique qui permet d'effectuer des séries d’opérations statistiques et mathématiques successives. Elle permet d’extraire, à partir d’une grande quantité de données brutes, des résultats exploitables en clinique ou en recherche.

LE SÉQUENÇAGE DE L'ADN ET LE RÉALIGNEMENT

Il est réalisé à partir de très petits fragments d'ADN permettant leur lecture par les capteurs de l’appareil de séquençage (reads). Des centaines de millions de ces fragments, provenant de la séquence analysée sont alors assemblés sur le modèle d’un génome humain de référence. Cette étape, nommée réalignement des bases, est fondamentale.

L’approche initiale employée par le Human genome project, il y a 20 ans,  nécessitait la reconstruction progressive d’une carte du génome en passant par des segments de taille intermédiaire qui étaient manuellement séparés et ordonnés. Ce processus long et complexe a pu être supprimé par des algorithmes mathématiques qui assemblent directement les courtes séquences.

L'ANALYSE FINALE

Après la reconstruction de la séquence, une comparaison au génome « normal » de référence par de nouveaux algorithmes permet de déterminer la présence de variations et de voir s’il s’agit d’une mutation somatique, propre à une tumeur, ou d’un polymorphisme naturellement présent dans la population.

VERS DE NOUVELLES CLASSIFICATION DES CANCERS

LES CLASSIFICATIONS BIO-MOLÉCULAIRES DES CANCERS

Dans de nombreux cancers, la classification clinico-pathologique a été progressivement enrichie par l’intégration de données moléculaires, classification bio-moléculaire, comme la présence de certaines mutations prédictives de réponse au traitement, ou des altérations chromosomiques ayant un impact pronostique majeur.

La classification bio-moléculaire repose sur l’analyse de nombreux paramètres, comme le profil des mutations, l’activité (expression) des gènes ou les altérations structurelles des chromosomes. Ces éléments ne peuvent pas être reconnus directement par le pathologiste ou le clinicien et nécessitent un traitement bio-informatique.

L'EXEMPLE DU CANCER DU SEIN

Six sous-types moléculaires de cancer du sein ont été définis par en 20017. Cette classification est désormais intégrée aux recommandations internationales. Les auteurs ont analysé, sur 85 échantillons tumoraux, les données d’expression de 8102 gènes. Un algorithme bio-informatique a permis de sélectionner 427 gènes potentiellement informatifs et, en fonction de leur profil d’expression. Les échantillons ont été classés de manière hiérarchique.
Cette approche de classification, nommée hierarchical clustering, permet d’identifier des groupes distincts intrinsèquement homogènes, et elle a révélé six sous-types de cancer du sein.

LES AUTRES TYPES DE CANCERS

Cancer colorectal 4 sous-types moléculaires [Consensus Molecular Subtypes (CMSs)]

CMS1 (MSI), CMS2 (canonique), CMS3 (metabolique), et CMS4 (mesenchymateux)

Cancer de la prostate 7 sous-types

4 : gènes de fusion de la famille des facteurs de transcription ETS (ERG, ETV1, ETV4 et FLI1)
3 : mutations des gènes SPOP, FOXA1 et IDH1
MAIS 25 % des cancers inclassables

Cancers du poumon non à petites cellules

Reclassement des carcinomes à grandes cellules en adénocarcinomes ou carcinomes épidermoïdes,
Identification de plusieurs « drivers » oncogéniques plus fréquents chez les non-fumeurs (EGFR, ALK, ROS1, HER2, BRAF…)  gènes dont les altérations génomiques, exclusives les unes des autres, activent de façon constitutive des voies de signalisation pour lesquelles les cellules tumorales ont une addiction

Cancers épidermoïdes du poumon et des voies aérodigestives supérieures (VADS)

Poumon (classical, primitive, basal and secretory) - VADS (atypical, basal, classical, mesenchymal)

 

Les signatures moléculaires

LE CONTEXTE

La recherche d’éléments objectifs pour anticiper quel patient bénéficiera d’un traitement est fondamentale et ceci sur plusieurs plans.
De ce fait, une recherche intense a eu comme but d'identifier des biomarqueurs pronostiques et / ou prédictifs.

UNE "SIGNATURE"

Le terme « signature » décrit la construction d’un modèle regroupant plusieurs caractéristiques moléculaires ou clinico-pathologiques permettant de répondre à cette question.

EXEMPLES

Pour le cancer du sein une "signature" de 21 gènes explorée par OncotypeDX™

Les auteurs ont identifiés  250 gènes candidats. Ils ont ensuite rechercher des corrélations, rétrospectivement, entre l’expression de ces gènes et le risque de récidive, à partir des données de trois essais cliniques. Seize gènes reliés au cancer et cinq de référence ont été sélectionnés, puis une équation a été construite afin de calculer un score de rechute à partir d’un échantillon tumoral.
Cette signature a ensuite été validée comme élément pronostique.

Pour d'autres types de cancers

De nombreuses recherches pour découvrir de nouvelles signatures pour d'autres types de cancer.

Pour prévoir l'efficacité d'un traitement

Actuellement, avec le "boom" de l'immunothérapie, un effort important est actuellement réalisé pour identifier des biomarqueurs prédictifs de réponse à l’immunothérapie.

 

 

Les tests prédictifs du cancer du sein (signatures génomiques)

Signatures génomiques

Analyse génomique

Intérêt prédictif

Indications

Oncotype DX®

21 gènes RT-PCR
Tissu fixé
Analyse centralisée

Récidive à 10 ans

 3 groupes : bas (RS < 18), intermédiaire, élevé (RS ≥ 30)

Pronostic et choix thérapeutique pour les CS RH+

MammaPrint®

70 gènes puce à ADN
Tissu frais, ou fixé
Analyse centralisée

2 catégories de pronostic : bon ou mauvais

Test pronostique

Patientes < 61 ans CS stade I/II, < 5cm, N0 ou N 1 à N3)

Prosigna®

 

Gènes de PAM50 
Tissu fixé
Analyse décentralisée

Classe les CS en luminal A, B, HER2 et basal)
Score de rechute à 10 ans

3 groupes de risque

Patientes ménopausée de stade précoce, RH+, traitées par hormonothérapie seule

EndoPredict®

11 gènes RT-PCR
Tissu fixé
Analyse décentralisée

Rechute précoce et tardive ; patientes en bas risque ou risque élevé

Facteur pronostique chez les patientes RH+, HER2− et traitées par CT puis hormonothérapie

MapQuant®

France

97 gènes RT-PCR
Tissu frais
Analyse centralisée

Tumeurs qui expriment les RH

Complète l’évaluation du grade histologique pour les cas équivoques

Breast Cancer Index®

Ratio HOXB13/IL17BR et du MGI
Tissu fixé
Analyse centralisée

Risque de récidive métastatique précoce (< 5 ans) et tardive (> 5 ans)

Stratification du risque chez les patientes RH+ et N0

La médecine personnalisée à besoin de biomarqueurs…

DiagnostiquesPronostiquesPrédictifs
  • Détecter précocement un cancer asymptomatique
  • Critères : sensibilité et spécificités élevées
  • Un fois le stade connu de la maladie
  • Prédire l’evolution y compris le risqué de récidives
  • Prédire avant l'initiation d'un traitement l’efficacité du protocole thérapeutique
  • Prédire qui répondra et qui ne répondra pas au traitement

 

Ce pas de la science fiction !

La reclassification moléculaire de certains cancers est intégrée aux recommandations thérapeutiques internationales
(exemple du cancer du sein)

De nombreuses signatures moléculaires, pronostiques ou prédictives sont développées pour aider à la décision, sont en cours de validation

Le séquençage de nouvelle génération est l'outil essentiel ...

 

Mise à jour

12 mai 2020