Communication scientifique
Séance du 19 juin 2007

Génomique somatique et pronostic des cancers colorectaux

MOTS-CLÉS : analyse expresion gene. pronostic. tumeurs du colon/génétique
Gene expression profiling in colon cancer
KEY-WORDS : colonic neoplasm/ genetics. gene expression profiling. prognosis

Alain Barrier, Pierre-Yves Boelle, Antoinette Lemoine, Antoine Flahault**, Sandrine Dudoit****, Michel Huguier*

Résumé

Dans les cancers coliques sans métastase ganglionnaire, l’identification de nouveaux facteurs pronostiques permettrait de mieux adapter les indications d’une chimiothérapie adjuvante. Le but de ce travail était d’étudier les possibilités offertes dans ce sens par la génomique. Cinquante tissus tumoraux cryo-conservés de malades opérés depuis plus de cinq ans ont été étudiés. Vingt-cinq malades ont développé une récidive métastatique et 25 sont restés sans récidive. Des échantillons d’acide ribonucléique ont été extraits et hybridés sur des puces à oligonucléotides. Mille six cents divisions aléatoires des 50 malades, en groupes d’entrainement et de validation, ont été considérées. Pour chacune de ces divisions, un indicateur pronostique a été construit à partir du groupe d’entrainement (sélection des 30 gènes les plus différemment exprimés chez les malades ayant ou non récidivé, analyse linéaire discriminante), puis ses performances prédictives ont été évaluées sur le groupe de validation. Les performances observées pour l’ensemble des indicateurs pronostiques étaient de 76 % pour l’exactitude, de 85 % pour la sensibilité, et de 68 % pour la spécificité. Un total de 6 124 gènes ont été sélectionnés dans au moins un des 1 600 prédicteurs et 55 gènes ont été sélectionnés plus de cent fois. Les résultats de cette étude suggèrent principalement la possibilité de prédire le pronostic des cancers coliques sans métastase ganglionnaire par une approche de génomique fonctionnelle. Ils suggèrent également la grande variabilité, en terme de composition, des indicateurs pouvant être proposés.

Summary

Identification of new prognostic factors for colon cancer with no lymph node involvement may improve the selection of patients for adjuvant chemotherapy. The aim of this study was to assess the possibility of using gene expression profiling for this purpose. Fifty patients operated on for stage II colon cancer were included. Twenty-five of these patients relapsed, while the other 25 remained disease-free for at least 5 years. MRNA was extracted from fresh-frozen biopsies and hybridized to the Affymetrix GeneChip HGU133A®. One thousand six hundred random splits of the 50 patients into a training set and a validation set were considered. For each split, a prognostic combination was derived from the training set (selection of the 30 genes most differentially expressed between patients who recurred and those who did not, by linear discriminant analysis), and its prognostic performance was assessed with the validation set. On average, accuracy was 76 %, sensitivity 85 %, and specificity 68 %. A total of 6 124 genes were included in at least one of the 1 600 predictive combinations, and 55 genes were included in more than 100 combinations. This study supports the possibility of predicting the prognosis of non-metastatic colon cancer by tumor gene expression profiling. It also shows the highly variable gene composition of predictive combinations.

L’incidence des cancers colorectaux augmente. En France, le nombre de nouveaux cas par an est estimé à 36 000 [1]. En l’absence de métastases viscérales, le traitement initial est l’exérèse chirurgicale. Ensuite, s’il existe des métastases ganglionnaires, des essais randomisés ont clairement montré qu’une chimiothérapie adjuvante à base de 5-fluorouracile, augmentait la survie et devait être systématiquement proposée en l’absence de contre-indication [2]. En revanche, en l’absence de métastases ganglionnaires, si les trois-quarts des malades sont guéris par la seule exérèse chirurgicale, un quart pourrait bénéficier d’une chimiothérapie adjuvante. Cependant, en l’absence de preuve par un essai randomisé, l’utilité d’une chimiothérapie reste très controversée [3, 4].

Il serait donc utile d’identifier des facteurs pronostiques plus fins que le seul envahissement ganglionnaire afin de mieux adapter les indications d’une chimiothé- rapie adjuvante.

Jusqu’à présent, les résultats les plus intéressants ont été observés avec le statut micosatellitaire des tumeurs [5]. Mais les tumeurs à microsatellites instables, qui sont de meilleur pronostic que les autres, ne représentent que 15 % de l’ensemble des tumeurs colorectales ce qui limite l’utilité pratique de ce facteur pronostique.

La génomique offre une autre possibilité grâce aux progrès technologiques en biologie moléculaire à grande échelle, notamment les puces à ADN qui rendent possible l’analyse simultanée de l’expression de milliers de gènes d’un système biologique très complexe comme un échantillon tissulaire. Rappelons que ces puces à ADN sont des supports sur lesquels sont disposés de manière ordonnée des milliers de séquences d’ADN ( sondes ). Lors de l’hybridation, ces sondes sont mises en contact avec des fragments d’acide nucléique extraits de l’échantillon à analyser
( cibles ). Une application est l’étude du transcriptome qui consiste à mesurer simultanément le niveau d’expression de plusieurs milliers de gènes dans un échantillon par l’hybridation d’ARN rétrotranscrits et marqués sur des sondes spécifiques fixées sur la puce. Il convient ensuite d’avoir la maîtrise du traitement biostatistique des dizaines de milliers de données ainsi recueillies.

Les premières études par les puces à ADN ont consisté à retrouver, au niveau du transcriptome, des différences phénotypiques déjà connues, comme pour les leucé- mies aigües myéloblastiques et lymphoblastiques [6]. Il a été ensuite suggéré que l’analyse du transcriptome permettait d’établir des profils d’expression capables de prédire le pronostic de certains cancers, en particulier du sein, du poumon et des lymphomes [7-9].

Les études sur les cancers colorectaux sont plus récentes. Nous avons fait une première étude sur des prélèvements de tumeurs et de muqueuses saines de malades opérés qui a suggéré qu’une approche de génomique fonctionnelle était susceptible de prédire le pronostic des cancers non métastasés (stades II et III) [10]. Une seconde étude a confirmé ces premières données et nous a fait proposer une méthode permettant de sélectionner les paramètres à utiliser, notamment le nombre de gènes informatifs pour construire un prédicteur pronostique [11]. Wang et al. ont montré la possibilité de prédire le pronostic des cancers coliques sans envahissement ganglionnaire (stade II) et ont proposé un indicateur pronostique de 23 gènes [12].

Les buts de ce travail étaient de construire un indicateur du pronostic des malades opérés d’un cancer colique de stade II et d’en évaluer les performances prédictives, mais également d’apprécier les performances du prédicteur proposé par Wang et al .

[12].

MATÉRIEL ET MÉTHODES

Le matériel d’étude était constitué par une banque de tissus cryo-conservés, commencée dés 1996, et constituée de tissu tumoral et de muqueuse saine chez des malades opérés de cancers colorectaux. Le consentement des malades pour faire une étude génomique de ces tissus a été recueilli. Parmi les prélèvements de tissu tumoral, 50 ont été sélectionnés correspondant à des cancers qui n’avaient ni métastase ganglionnaire, ni instabilité de microsatellites. Il s’agissait de 25 malades qui ont fait une récidive métastatique et de 25 malades en vie, sans récidive dans les cinq premières années post-opératoires.

Des échantillons d’acide ribonucléique (RNA) ont été extraits du tissu tumoral et hybridés sur des biopuces à oligonucléotides développées par la société Affymetrix ® et contenant 22 283 séquences (HGUI 133A). La normalisation des données a été réalisée selon la méthode RMA ( Robust Multichip Average ) [13].

Une validation croisée (de type Monte Carlo) a été utilisée [14]. Mille six cents divisions aléatoires des cinquante échantillons en deux groupes, un groupe d’entraî-
nement de taille n et un groupe de validation de taille (50 — n ), ont été réalisées. Seize valeurs pour n ont été considérées (10, 12, …, 40) avec, pour chacune de ces valeurs, 100 divisions aléatoires. Pour chacune des 1 600 divisions, une signature pronostique a été établie, à partir du groupe d’entraînement, en sélectionnant les 30 gènes les plus différemment exprimés chez les malades ayant récidivé et chez ceux qui n’avaient pas récidivé. Un indicateur pronostique utilisant une analyse diagonale discriminante linéaire a ensuite été construit, puis utilisé pour prédire l’évolution des (50 — n ) malades de l’échantillon de validation correspondant.

La comparaison des évolutions prédites et des évolutions observées a permis de mesurer l’exactitude, la sensibilité et la spécificité du modèle. Les compositions des 1.600 indicateurs pronostiques, isolés à chacune des étapes de la validation croisée, ont été comparées.

En utilisant les mêmes divisions aléatoires des 50 malades, les performances prédictives de la signature pronostique proposée par Wang et al. ont été évaluées sur nos malades et comparées à celles de la signature pronostique des 30 gènes sélectionnés [12].

RÉSULTATS

Les performances moyennes observées pour l’ensemble des 1 600 indicateurs pronostiques étaient de 76 % pour l’exactitude, de 85 % pour la sensibilité, et de 68 % pour la spécificité. Les performances prédictives moyennes augmentaient avec la taille du groupe d’entraînement (Figure 1). Pour une taille donnée des groupes d’entraînement, il existait une grande variabilité des performances prédictives (Figure 2).

Un total de 6 124 gènes ont été sélectionnés dans au moins un des 1 600 prédicteurs ;

3.080 de ces 6 124 gènes ont été sélectionnés une seule fois et 5 564 (91 %) l’ont été dix fois ou moins. Cinquante-cinq gènes ont été sélectionnés plus de 100 fois et seulement 14 plus de 500 fois. Le gène le plus fréquemment sélectionné était présent dans 1 176 des 1 600 signatures pronostiques (74 %).

Une signature pronostique a été établie à partir des 50 malades en prenant les 30 gènes les plus différemment exprimés chez les malades ayant récidivé et chez ceux étant restés en vie sans récidive. Sa composition est donnée dans le Tableau I.

L’exactitude moyenne de la signature pronostique proposée par Wang et al. était de 67 % pour l’ensemble des 1 600 divisions de malades [12]. Elle augmentait avec la taille du groupe d’entraînement : 63 % pour les échantillons de 10 malades et 71 % pour les échantillons de 40 malades.

FIG. 1. Performances prédictives moyennes.

Pour chacune des 16 valeurs possibles de n (10, 12, …, 40), il a été réalisé 100 divisions aléatoires des 50 malades en un groupe d’entraînement de n malades et un groupe de validation de (50 — n ) malades. Pour chacune de ces divisions, un indicateur pronostique a été construit sur le groupe d’entraînement puis évalué sur le groupe de validation. La figure montre, pour chaque valeur de n , l’exactitude moyenne, la sensibilité moyenne, et la spécificité moyenne observées pour les 100 indicateurs. Les performances prédictives moyennes augmentaient avec la taille du groupe d’entraînement.

DISCUSSION

Si le principe de la technologie des puces à ADN est relativement simple, son utilisation pratique l’est beaucoup moins. Depuis la planification d’une étude jusqu’à l’interprétation des résultats, près de quarante étapes doivent se succéder [15]. Chacune de ces étapes peut être à l’origine de malfaçons et doit faire l’objet d’un choix, allant de celui des puces que l’on utilise jusqu’aux différentes étapes du traitement biostatistique des données. La technologie ne datant que d’une dizaine

FIG. 2. Exactitude pronostique.

Pour chacune des 16 valeurs possibles de n (10, 12, …, 40), il a été réalisé 100 divisions aléatoires des 50 malades en un groupe d’entraînement de n malades et un groupe de validation de (50 — n ) malades. Pour chacune de ces divisions, un indicateur pronostique a été construit sur le groupe d’entraînement puis évalué sur le groupe de validation. La figure montre, pour chaque valeur de n , l’exactitude moyenne, l’exactitude minimale, et l’exactitude maximale observées pour les 100 indicateurs.

d’années, il n’y a pas encore de standard d’étude clairement établi. De trop nombreuses études souffrent d’imprécisions méthodologiques [16]. Elles expliquent, par exemple que, dans les cancers du sein, des résultats ou des interprétations soient parfois contradictoires [17]. Néanmoins, les pièges techniques sont aujourd’hui mieux connus et les méthodes pour les éviter se sont développées.

La dégradation biologique rapide des prélèvements, en particulier celle des ARNm, explique qu’il convienne d’être très rigoureux sur leurs modalités de conservation (durée d’ischémie inférieure à 15 min et délai de congélation inférieur à 5 min). Il est

TABLEAU I. — Composition de la signature pronostique établie à partir des 50 malades.

Affymetrix GenBank Nom du gène probe ID Accession No Gènes surexprimés chez les malades sans récidive 221943-x-at AW303136 ribosomal protein L38 213642-at BE312027 ribosomal protein L27 213350-at BF680255 ribosomal protein S11 202028-s-at BC000603 ribosomal protein L38 212044-s-at BE737027 ribosomal protein L27a 212952-at AA910371 calreticulin 216246-at AF113008 ribosomal protein S20 218157-x-at NM-020239 CDC42 small effector 1 213826-s-at AA292281 H3 histone, family 3A 200630-x-at AV702810 SET translocation (myeloid leukemia-associated) 210231-x-at D45198 SET translocation (myeloid leukemia-associated) 216609-at AF065241 thioredoxin 202648-at BC000023 ribosomal protein S19 212953-x-at BE251303 calreticulin 214001-x-at AW302047 214041-x-at BE857772 ribosomal protein L37a 213879-at AV726646 SMT3 suppressor of mif two 3 homolog 2 (yeast) 200908-s-at BC005354 ribosomal protein, large, P2 209327-s-at BC000587 mannan-binding lectin serine peptidase 1 (C4/C2 activating component of Ra-reactive factor) 205302-at NM-000596 insulin-like growth factor binding protein 1 Gènes surexprimés chez les malades ayant récidivé 205550-s-at NM-004899 brain and reproductive organ-expressed (TNFRSF1A modulator) 213893-x-at AA161026 POM121 membrane glycoprotein (rat) 210243-s-at AF038661 UDP-Gal : betaGlcNAc beta 1,4- galactosyltransferase, polypeptide 3 212608-s-at W85912 nudix (nucleoside diphosphate linked moiety X)-type motif 3 36554-at Y15521 acetylserotonin O-methyltransferase-like 219481-at NM-024525 tetratricopeptide repeat domain 13 209221-s-at AI753638 oxysterol binding protein-like 2 212500-at AL049319 chromosome 10 open reading frame 22 219038-at NM-024657 MORC family CW-type zinc finger 4 212435-at AA205593 tripartite motif-containing 33 parfois nécessaire de contrôler la pureté de la cellularité et/ou de recourir à des techniques de microdissection.

Le nombre de prélèvements à inclure dans une étude de génomique n’a fait l’objet de publications que très récemment [18, 19]. L’augmentation du nombre de prélèvements et le caractère équilibré des groupes qui sont comparés permettent d’augmenter la puissance d’une étude. Cependant, en pratique, le nombre d’inclusions est déterminé par la disponibilité du matériel d’étude mais surtout par des impératifs financiers — le coût d’une puce fabriquée par la synthèse d’oligonucléotides est
actuellement de l’ordre de 1.500 euros (incluant la préparation et la réalisation si l’on dispose pas d’une plate-forme).

Les différentes étapes biologiques — préparation des puces, préparation des cibles, hybridation avec ses phases d’incubation et de lavage — nécessitent des protocoles et des réalisations minutieux en disposant de contrôles de qualité.

Une fois obtenues, les données expérimentales peuvent être résumées dans un tableau indiquant le nombre d’échantillons inclus dans l’étude et le nombre de séquences nucléotidiques présentes sur la puce à ADN. Ces données peuvent être analysées selon plusieurs stratégies grâce à des logiciels spécifiques de chacune :

recherche de gènes différemment exprimés, classification non supervisée ou classification supervisée. Nous avons choisi cette dernière méthode. Le principe général est l’utilisation des mesures d’expression génique d’un échantillon pour prédire son appartenance à telle ou telle classe qui peut être, par exemple, un sous-groupe particulier d’une maladie ou l’efficacité d’un traitement.

Le principe général de ce type d’études est de construire un prédicteur pronostique sur un groupe de malades (« groupe d’entraînement ») et d’en évaluer les performances en l’appliquant sur un groupe indépendant de malades (« groupe de validation ») afin de comparer les évolutions prédites et réellement observées. Le protocole d’étude le plus simple (validation simple) consiste à générer, de façon aléatoire, à partir de l’ensemble des malades, un seul groupe d’entraînement et un seul groupe de validation. Ce protocole, trop fréquemment utilisé, ne permet pas d’évaluer l’influence de la division aléatoire initiale des malades sur les résultats obtenus (composition et performances du prédicteur). Une validation croisée de type Monte-Carlo, comme celle que nous avons utilisée, consiste à générer aléatoirement, à partir de l’ensemble des malades, plusieurs centaines ou milliers de paires de groupes d’entraînement et de validation. Pour chacune de ces paires, un indicateur pronostique est construit, toujours de la même façon, à partir des malades du groupe d’entraînement, puis est évalué sur les malades du groupe de validation correspondant. Ce protocole permet une estimation honnête des performances de la méthode de prédiction (moyenne des performances des indicateurs pronostiques), mais permet également d’appréhender l’influence de la composition du groupe d’entraînement sur celle de la signature pronostique.

La construction d’un prédicteur pronostique comprend deux choix arbitraires :

celui d’une règle de classification et celui d’une méthode de sélection des gènes, dits « informatifs », qui vont composer la signature pronostique. Comme règle de classification, nous avons choisi une analyse linéaire discriminante ; cette méthode, proche de celle utilisée par Golub et al [6], a l’avantage de sa simplicité (avec des temps relativement rapides de calculs) et a des performances voisines de celles de techniques beaucoup plus complexes [20]. Pour sélectionner les gènes informatifs, nous avons comparé, pour chaque gène, les mesures d’expression chez les malades ayant récidivé et chez ceux sans récidive (test t de Student) et, en nous basant sur nos résultats antérieurs [11], retenu les trente gènes ayant la valeur statistique la plus élevée.

Les résultats que nous avons observés suggèrent l’intérêt de l’analyse du transcriptome pour la prédiction du pronostic des malades opérés d’un cancer du colon non métastasé. Cette conclusion est partagée par trois autres études récemment publiées.

Comme dans notre travail, l’étude de Wang et al a inclus des prélèvements tumoraux provenant de malades sans métastases ganglionnaires [11]. Une signature pronostique de vingt-trois gènes a été établie sur un groupe d’entraînement ; appliquée à un groupe indépendant de validation, elle a prédit correctement l’évolution chez 78 % des malades. Une deuxième étude a inclus des cancers colorectaux avec et sans métastases ganglionnaires [21]. Les auteurs concluaient à la supériorité de la classification moléculaire par rapport à la classification anatomo-pathologique pour prédire le pronostic. Enfin, la troisième étude a porté sur 25 malades avec métastases ganglionnaires [22]. Elle a montré avec une signature de 17 gènes une exactitude prédictive d’apparition ou non de métastases avec un recul de cinq ans de 88 %.

Les résultats observés dans notre étude suggèrent également la très grande variabilité, en terme de composition, des indicateurs pronostiques. Il semble exister en fait des milliers d’indicateurs possibles avec des performances pronostiques similaires.

L’absence de gènes communs entre notre signature pronostique et celle proposée par Wang et al. [12] n’est donc pas surprenante. Cela pourrait faire conclure à un manque de reproductibilité de la technique et partant, à l’absence d’intérêt de son utilisation en pratique clinique. Toutefois, il convient de bien séparer les notions de reproductibilité en termes de composition des signatures pronostiques et de reproductibilité en termes de performances prédictives. Ainsi, en utilisant la signature proposée par Wang et al. [12] pour prédire le pronostic de nos malades, nous avons trouvé une exactitude pronostique d’environ 70 %. Cette variabilité doit, en fait, être juste considérée comme le prix à payer pour le très grand nombre de variables étudiées par les puces à ADN et le nombre d’échantillons analysés qui est comparativement faible.

Certains auteurs estiment que l’application clinique de l’étude du transcriptome pourrait être rapide [23]. Néanmoins, il reste à valider les résultats obtenus sur des séries plus importantes par des études prospectives et à préciser les modalités d’utilisation d’une classification pronostique génomique… L’expérience des cancers du sein montre que ces étapes sont longues et difficiles à franchir.

La multiplication d’études sur un petit nombre de malades aurait plus d’inconvé- nients que d’intérêts en plus de leurs coûts : elle risquerait de faire proposer de nouvelles signatures pronostiques très différentes les unes des autres et de renforcer la conviction de l’impossibilité d’utiliser cette technique en pratique courante. Dans l’immédiat, une collaboration des différentes équipes semble souhaitable sinon indispensable afin de ne pas reproduire pour les cancers du côlon les errances actuellement constatées pour les cancers du sein. En effet, l’identification de signatures stables nécessiterait des études portant sur plusieurs centaines, voire quelques milliers de patients [24].

Il conviendrait également de standardiser les analyses bioinformatiques : normalisation, présélection initiales des séquences, sélection des gènes informatifs compo-
sant la signature pronostique, méthode de classification… La comparaison de différentes techniques sur un même jeu de données permettrait de dégager quelques standards d’analyse.

Pour estimer réellement les performances d’un indicateur pronostique, il faut l’appliquer à un deuxième jeu de données totalement indépendant (validation externe). C’est ce que nous avons essayé de faire avec la signature pronostique identifiée dans le travail de Wang et al, mais ne disposant pas des données brutes et des valeurs affectées aux constantes de leur formule, il n’était pas possible d’évaluer les performances de l’indicateur qu’ils ont proposé [12].

Enfin, pour envisager l’utilisation de ces indicateurs pronostiques en pratique clinique, il serait souhaitable de comparer sur les mêmes matériels d’étude d’une part les résultats obtenus sur des plate-formes de technologie différentes, d’autre part sur des plate-formes différentes utilisant la même technologie.

En conclusion, l’étude du transcriptome des cancers colorectaux grâce à des puces à ADN peut faire espérer une évaluation pronostique plus fine que celle dont nous disposons actuellement. Cela permettrait de mieux poser les indications et les contre-indications d’une chimiothérapie adjuvante afin d’améliorer le pronostic chez les uns et d’éviter une chimiothérapie inutile avec toutes ses contreparties chez les autres.

REMERCIEMENTS

A. Barrier a reçu une bourse de la Fondation de France et de la Fédération nationale de lutte contre le cancer. Ce travail a été réalisé grâce à une subvention de l’Institut JD Gladstone et le Centre général de recherche clinique de l’hôpital général de San Francisco ainsi que de l’Institut de Californie pour la recherche biomédicale. Nous remercions C Tse et D Brault (Service de biochimie, hôpital Tenon, Paris) qui se sont occupés du recueil et de la conservation des prélèvements.

BIBLIOGRAPHIE [1] BOUVIER A.M., REMONTET L., JOUGLA E. et al . — Incidence of gastrointestinal cancers in

France.

Gastroenterol. Clin. Biol ., 2004, 28 , 877-881.

[2] GILL S., LOPRINZI C.L., SARGENT D.J. et al. — Pooled analysis of flurorouracil-based adjuvant therapy for stage II and III colon cancer : who benefits and by how much ?

J. Clin. Oncol ., 2004, 22 , 1797-1806.

[3] SOBRERO A. — Should adjuvant chemotherapy become standard treatment for patients with stage II colon cancer ? For the proposal. Lancet Oncol. , 2006, 7 , 515-516.

[4] KOHNE C.H. — Should adjuvant chemotherapy become standard treatment for patients with stage II colon cancer ? Against the proposal. Lancet Oncol. , 2006, 7 , 516-517.

[5] PARC Y., GUEROULT S., MOURRA N. et al . — Prognostic significance of microsatellite instability determined by immunohistochemical stenting of MHL1 in sporadic T3N0M0 colon cancer.

Gut , 2004, 53 , 371-375.

[6] GOLUB T.R., SLONIM D.K., TAMAYO P . et al . — Molecular classification of cancer : class discovery and class prediction by gene expression monitroing.

Science , 1999, 286 , 531-537.

[7] VAN’T VEER L.J., DAI H., VAN DE VIJVER M.J. et al. — Gene expression profiling predicts clinical outcome of breast cancer.

Nature , 2002, 415 , 530-536.

[8] BEER D.G., KARDIA S.L.R., HUANG C. et al . — Gene expression profiles predict survival of patients with lung adenocarcinoma.

Nat. Med ., 2002, 8 , 816-824.

[9] ROSENWALD A., WRIGHT G., CHAN W.C. et al. — The use of molecular profiling to predict survival after chemotherapy for diffuse large B-cell lympoma.

N. Engl. J. Med ., 2002, 346 , 1937-1947.

[10] BARRIER A., BOELLE P.Y., LEMOINE A. et al. — Gene expression profiling of nonneoplastic mucosa may predict clinical outcome of colon cancer patients.

Dis. Colon. Rectum ., 2005, 48 , 2238-2248.

[11] BARRIER A., LEMOINE A., BOELLE P.Y. et al. — Colon cancer prognosis prediction by gene expression profiling.

Oncogene , 2005, 24 , 6155-6164.

[12] WANG Y., JATKOE T., ZHANG Y. et al. — Gene expression profiles and molecular markers to predict recurrence of Dukes’B colon cancer.

J. Clin. Oncol ., 2004, 27 , 1564-1571.

[13] IRIZARRY R.A., GAUTIER L., COPE L. —

The analysis of gene expression data : methods and software. Parmigiani G, Garrett ES, Irizarry RA, Segler SL eds. Springers : New York, 102-9.

[14] DUDOIT S., SCHAFFER J.P., BOLTRICK J.C. — Multiple hypothesis testing in microarray experiments. Statistical Science , 2003, 18 , 71-103.

[15] IMBEAUD S., AUFFRAY C. — « The 39 steps » in gene expression profiling : critical issues and proposed best practices for microarray experiments. Drug Discov . Today , 2005, 1 , 1175-1182.

[16] JAFARI P., AZUAJE F. — An assessment of recently published gene expression data analyses :

reporting experimental design and statistitcal factors . BMC Medical Informatics and Decision making , 2006, 6 , 27.

[17] EIN-DOR L., KELA I., GETZ G . et al. — Outcome signature genes in breast cancer : is there a unique set ?

Bioinformatics 2005, 21, 171-178.

[18] HU J., ZHOUR F., WRIGHT F.A. — Practical FDR-based sample size calculation in microarray exeriments. Bioinformatics , 2005, 21 , 3264-3272.

[19] TIBSJIMARI R. — A simple method for assessing sample sizes in microarray experiments.

BMC

Bioinformatics, 2006, 7 , 106.

[20] DUDOIT S., FRIDLAND J., SPEED T.P. — Comparison of discriminant methods for the classification of tumors using gene expression data. J. Am. Statist. Assoc ., 2002, 97 , 77-87.

[21] ESCHRICH S., YANG I., BLOOM G. et al . Molecular staging for survival prediction of colorectal cancer patients.

J. Clin. Oncol ., 2005, 23 , 3226-3235.

[22] ARANGO D., LAILHO P., KOKKO A. et al. — Gene-expression profiling predicts recurrence in

Dukes’C colorectal cancer.

Gastroenterology , 2005, 129 , 874-884.

[23] ALVARADO M.D., JENSEN E.H., YEATMAN T.J. — The potential role of gene expression in the management of primary and metastatic colorectal cancer. Cancer Control ., 2006, 13 , 27-31.

[24] EIN-DOR L., ZUK O., DOMANY E. — Thousands of samples are needed to generate a robust gene list for predicting outcome in cancer. P.N.A.S. , 2006, 103 , 5923-5928.

DISCUSSION

M. Raymond ARDAILLOU

Pourrait-on choisir les gènes informatifs sur des critères physiologiques (gènes intervenant dans la multiplication cellulaire) ? Serait-il possible de quantifier l’expression du gène informatif choisi (par RT-PCR) pour fixer un seuil quantitatif dont le choix permettrait de définir la sensibilité et la spécificité les meilleures ?

Il serait effectivement possible de tester les performances pronostiques de signatures géniques comprenant des gènes informatifs identifiés par une autre méthode que les puces à ADN. Ainsi, l’étude de signatures incluant des gènes sélectionnés car ayant un rôle physiologique connu dans les cancers du côlon pourrait être intéressante. La RT-PCR permet d’obtenir des mesures quantitatives relativement précises, mais limitées à un petit nombre de gènes. A l’inverse, la technologie des puces à ADN permet d’obtenir des mesures grossières d’un très grand nombre de gènes. Quelle que soit la technologie utilisée, il est possible, en modifiant les pondérations, de construire des modèles optimisant leurs performances prédictives.

M. Pierre GODEAU

Avez-vous envisagé une étude prospective pour évaluer l’efficacité ou la non efficacité d’une chimiothérapie dans les cas où l’étude génomique laisse prévoir une évolution défavorable ?

Les résultats présentés doivent tout d’abord être confirmés, rétrospectivement, sur une série indépendante de malades (validation externe). Si tel était le cas, l’étape suivante consisterait effectivement en une étude prospective randomisée évaluant l’efficacité de la chimiothérapie chez le sous-groupe de malades de stade II ayant un profil génomique de mauvais pronostic.

M. Jean-Yves LE GALL

Avez-vous vérifié systématiquement la sélection de gènes informatifs par PCR quantitative ? A-t-on une réplication de l’instabilité des microsatellites dans 15 % des cancers colorectaux non HMPCC ?

La PCR quantitative permet d’obtenir des mesures d’expression plus précises que les puces à ADN, mais pour un nombre plus limité de gènes. Dans la présente étude, mille six cents signatures de trente gènes ont été identifiées. Il était donc impossible de vérifier systématiquement ces signatures par PCR quantitative. En revanche, il serait sans doute intéressant d’étudier les mesures d’expression des trente gènes sélectionnés sur les cinquante malades par PCR quantitative.

M. Philippe JEANTEUR

Je suis frappé par la forte représentation, que vous avez d’ailleurs bien soulignée, des protéines ribosomales parmi les gènes surexprimés. Ce qu’on observe ici est donc vraisemblablement le témoin d’une activité prolifératrice, reflet du processus cancéreux mais non causale dans ce processus. Devant cette spécificité limitée au regard du mécanisme moléculaire sous-jacent au développement de ces tumeurs, ne peut-on se demander s’il n’y aurait pas de recouvrement avec des critères de prolifération, histologiques par exemple, plus faciles à mettre en œuvre ?

Parmi les trente gènes sélectionnés sur la totalité des cinquante malades, la majorité sont effectivement des témoins de l’activité prolifératrice des tumeurs. L’étude de critères histologiques de prolifération et leur comparaison avec les profils d’expression des gènes informatifs auraient sans doute été intéressantes.

M. Daniel JAECK

Des informations concernant les deux groupes de patients étudiés devraient préciser le degré de différenciation des tumeurs primitives, leur localisation : rectale, colique droite ou colique gauche, qui sont autant de variables influençant la signature génomique de ces cancers. De plus, l’administration éventuelle d’une chimiothérapie mérite d’être signalée, car elle a une certaine influence sur la récidive tumorale. En raison d’une part de l’hétérogénéité des patients et de leur tumeur, du nombre relativement faible de patients dans chaque groupe, est-il possible de tirer des conclusions significatives susceptibles d’une application pratique clinique ?

Aucun des malades inclus dans cette étude n’avait reçu de chimiothérapie adjuvante. La localisation droite ou gauche des tumeurs (les tumeurs rectales étaient exclus), et leur degré de différenciation ne variaient pas significativement entre les deux groupes de malades (malades sans récidive à cinq ans, et malades avec récidive). Le coût élevé de la technologie (de mille à mille cinq cents euros par prélèvement) explique le nombre relativement faible (quelques dizaines) de malades inclus dans les séries actuellement publiées. Les résultats présentés sont très intéressants, mais naturellement devront être confirmés sur des nombres beaucoup plus importants de malades, avant d’envisager une application clinique pratique.

M. Jacques BATTIN

Votre situation de cancer avec ou sans métastases peut être expliquée par la théorie de Knudson élaborée à partir du modèle du rétinoblastome qui est, soit unilatéral et sporadique ou bilatéral et d’hérédité dominante. Pour expliquer ces deux phénotypes, Knudson fait intervenir une ou deux mutations concomitantes, l’une germinale, l’autre somatique. Qu’en pensez-vous ?

Il est effectivement possible que cette théorie puisse s’appliquer également aux cancers du côlon.


* Service de chirurgie digestive, hôpital Tenon, Paris. Université P et M Curie. 4 rue de la Chine, 75020, Paris. E.mail : michel.huguier@tnn.aphp.fr ** INSERM (U707). Épidémiologie. Systèmes d’information et modélisation Université P et M Curie, Paris. *** INSERM (U602). Micro-environnement et physiopathologie de la différenciation. Université Paris XI, Villejuif. **** Division of biostatistics, University of California, Berkeley, USA. Tirés-à-part : Professeur Michel HUGUIER, même adresse. Articla reçu le 22 janvier 2007, accepté le 2 avril 2007.

Bull. Acad. Natle Méd., 2007, 191, no 6, 1091-1103, séance du 19 juin 2007