Évaluation des thérapeutiques en psychiatrie : essais thérapeutiques et évaluation des psychothérapies – Académie nationale de médecine

to that used for somatic diseases. Particularly strong similarities exist with the approaches used to evaluate surgical treatments.

INTRODUCTION

L’évaluation des thérapeutiques à l’aide d’essais cliniques est aujourd’hui considé- rée comme une évidence. La sortie récente d’une expertise INSERM [1] sur l’évaluation des psychothérapies a cependant relancé la polémique sur l’applicabilité de ces essais cliniques à la psychiatrie, et en particulier à l’évaluation des psychothérapies. Des personnages importants de notre pays ont à ce sujet pris position en affirmant que « la souffrance psychique n’est ni évaluable, ni mesurable » [2].

L’objectif est ici de montrer que c’est l’évaluation d’une thérapeutique en général qui pose problème (problème qui n’est d’ailleurs pas encore totalement réglé), le domaine de la psychiatrie et des psychothérapies en particulier a certes des spécificités, c’est incontestable, mais elles ne sont somme toute que marginales Pour atteindre cet objectif nous allons considérer successivement quatre grands types de problèmes méthodologiques inhérents à l’évaluation de toute thérapeutique [3] : la définition des traitements à comparer, la définition des critères d’inclusion et d’exclusion des patients pris en charge, la définition des critères d’efficacité et la comparabilité des différents groupes de traitement.

Définition des traitements à comparer

Contrairement à ce que l’on pense souvent, la définition des traitements à comparer pose souvent problème dans les essais cliniques, y compris en médecine somatique :

en cancérologie par exemple, les pratiques de références ne sont pas toutes consensuelles, doit-on comparer un nouveau produit à une première, deuxième, troisième ligne de chimiothérapie(s), et à quelle posologie ? Doit-on associer au médicament une radiothérapie ou une chirurgie ?

Pour une thérapeutique psychiatrique, la question prend souvent la même allure.

Pour une psychothérapie, la situation est peut-être encore plus complexe : il existe plusieurs centaines d’approches psychothérapeutiques ; à la limite chaque psychothérapeute pratique sa propre forme de thérapie. Certes cela complique singulièrement la méthodologie. Il n’y a pourtant là rien de rédhibitoire, en effet : — l’hétérogénéité des pratiques n’est tout de même pas totale, il existe bien un noyau commun aux différentes thérapies comportementales et cognitives, il en est de même pour les thérapies psychanalytiques brèves ; — les psychothérapies ne sont pas les seules thérapeutiques à présenter cette spécificité : les chirurgiens ont une pratique qui s’inscrit aussi dans la singularité, personne ne considère cependant que les interventions chirurgicales ne peuvent (ou ne doivent) pas être évaluées ; — si évaluer une psychothérapie impose effectivement de définir, avec un
minimum de précision, les cadres thérapeutiques à comparer, l’expérience prouve qu’un tel effort de mise à plat des pratiques est souvent salutaire et source de progrès.

Définition des critères d’inclusion et d’exclusion

Cette question renvoie à la notion de phénotype clinique, de maladie. On remarquera à ce propos que la nature catégorielle des phénotypes ou des maladies n’est pas une évidence ; en effet, les processus physiopathologiques sous-jacents aux maladies obéissent souvent à une logique dimensionnelle. Il en est d’ailleurs de même pour de nombreux troubles : l’asthme, la dépression, l’arthrose de hanche peuvent être considérés avec une gradation d’intensité. Cela peut se concevoir également pour des pathologies cancéreuses, où les formes in situ , voire les simples dysplasies, peuvent être considérées comme d’intensité intermédiaire.

En fait, c’est la thérapeutique, et non la physiopathologie, qui a dicté le caractère catégoriel des maladies. Si, dans l’arthrose de hanche, on peut envisager un continuum d’intensité de la pathologie (correspondant à un continuum de destruction du cartilage), la décision de poser une prothèse totale de hanche ne pourra être, elle, que binaire, donc catégorielle. Ainsi, c’est dans le but de faciliter la normalisation de la décision thérapeutique que la nosographie médicale est construite sur la base de catégories.

La caractérisation des maladies, la définition de critères diagnostiques est une tâche qui passionne les cliniciens et l’on dispose aujourd’hui, en médecine somatique comme en psychiatrie, de systèmes critériologiques opérationnels, sinon consensuels. On pensera par exemple à la Classification internationale des maladies (CIM) de l’Organisation mondiale de la santé (OMS). Les sociétés savantes sont aussi très actives dans ce domaine, on pensera ici à l’ American College of Rheumatology et à sa liste bien connue de onze critères pour établir un diagnostic de lupus érythémateux disséminé. L’ American Psychiatric Association a élaboré, quant à elle, un Diagnostic and Statistical Manual (DSM) lui aussi très utilisé.

Si ces systématisations manquent souvent de finesse dans l’explicitation des tableaux cliniques, elles ont la vertu d’homogénéiser les diagnostics et sont de ce fait très utiles pour la recherche. Qui plus est, elles bénéficient généralement d’un minimum de validation expérimentale, sur la base d’une bonne homogénéité des patients au sein des catégories diagnostiques choisies et d’une capacité discriminante intéressante en termes de choix thérapeutique et de pronostic.

Ces classifications doivent cependant éviter le piège de l’excès d’académisme. Les noms des maladies sont en effet non seulement utilisés par les acteurs de la recherche clinique et épidémiologique, mais aussi par les médecins praticiens et par les citoyens. Il est indispensable que ces derniers ne perdent pas complètement leurs repères à l’occasion d’une évolution de la nosographie. On pensera à ce propos à la quasi-disparition des notions de névrose et de psychose dans le DSM.

Revenons maintenant à notre question : quels patients doit-on inclure dans les études d’évaluation des thérapeutiques psychiatriques ? Pour les études médicamenteuses, les critères du DSM sont généralement utilisés tels quels, ils ont le mérite d’être le plus souvent simples et raisonnables. En ce qui concerne les psychothérapies, il faut d’une part utiliser des critères de sélection compatibles avec les cadres conceptuels que les psychothérapeutes utilisent au quotidien, il faut en outre que ces critères soient suffisamment reproductibles. La tâche est d’autant plus ardue que des cadres psychothérapeutiques différents peuvent s’intéresser à des aspects différents de la souffrance psychique : symptômes ou mal être existentiel par exemple ;

ils relèvent donc potentiellement de critères de sélection différents. De prime abord le challenge est impossible à tenir. En pratique les critères du DSM sont généralement utilisés ici aussi. On pourrait sûrement espérer mieux. Ces critères ont cependant l’avantage de permettre les comparaisons de résultats d’études réalisées dans des pays différents, ils sont par ailleurs assez efficaces pour caractériser les pathologies psychiatriques les plus classiques (troubles dépressifs, anxieux, schizophréniques).

Au demeurant, cela n’empêche pas de promouvoir la réalisation d’études où les critères d’inclusions seraient moins standardisés et plus proches de ceux utilisés « en situation réelle ». L’évaluation du médicament évolue d’ailleurs actuellement dans cette direction, en psychiatrie ainsi que dans les pathologies somatiques.

La définition des critères d’efficacité

Il est d’usage de considérer que les critères d’efficacité utilisés dans les essais portant sur des pathologies psychiatriques sont subjectifs, alors qu’ils seraient objectifs dans les essais portant sur des pathologies somatiques. C’est en réalité inexact.

Dans l’asthme, par exemple, les critères d’efficacité des thérapeutiques sont actuellement le VEMS (Volume expiré maximum seconde) et la qualité de la vie. Ces deux types de critères correspondent à deux situations fort différentes. Dans le premier cas il s’agit effectivement d’une variable biologique objective, dans le second cas il s’agit par contre d’un concept subjectif assez vague. Les notions de subjectivité et d’objectivité introduites ici le sont d’ailleurs bien à propos : le terme « subjectif » est en effet défini comme « ce qui concerne le sujet en tant qu’être conscient » [4] ; on oppose ainsi classiquement la subjectivité (relative au sujet pensant), à l’objectivité (relative à l’objet pensé). Le VEMS est bien relatif au poumon et à son fonctionnement (objet pensé), la qualité de la vie, elle, ne peut être que celle d’un sujet pensant.

Une question se pose d’ailleurs à ce stade : en recherche médicale, les mesures subjectives peuvent-elles revendiquer un statut de scientificité comparable à celui des mesures objectives ?

Cette question peut apparaître très ambitieuse, il est cependant possible d’y répondre « oui » sans trop de difficultés [5]. En effet, les préjugés souvent rencontrés du type : « les mesures subjectives sont peu reproductibles », « on ne sait jamais vraiment ce qui est mesuré », ne résistent pas longtemps à la critique : à l’argument « les mesures subjectives sont peu reproductibles », on objectera que la pression
artérielle mesurée manuellement au brassard (mesure objective) est réputée pour sa non-reproductibilité, alors que des mesures subjectives, si elles sont réalisées dans des conditions méthodologiques rigoureuses, peuvent montrer des niveaux d’accord inter juges élevés [6] ; l’argument « avec une mesure subjective, on ne sait jamais vraiment ce qui est mesuré » est plus délicat à réfuter. Si l’on prend l’exemple de la tristesse, il est vrai que cette caractéristique subjective est difficilement définissable.

Le dictionnaire Le Robert propose ainsi : la tristesse est un « état affectif, pénible, calme et durable ». Or, si cette définition correspond bien à de la tristesse, elle correspond aussi au remords. Le point important est cependant que malgré cette difficulté de définition, il est évident pour toute personne parlant français que les mots « tristesse » et « remords » ont un sens différent. Ceci prouve bien l’existence d’un sens précis à attribuer au mot « tristesse ». A l’opposé, le temps est une notion objective mesurée quotidiennement, mais comment définir le temps ? On ne sait, au bout du compte, pas nécessairement mieux ce que l’on mesure quand on mesure certaines caractéristiques objectives que lorsqu’on mesure certaines caractéristiques subjectives.

À la lumière de ces réflexions, nous constatons donc que si l’on entend parfois à propos de l’évaluation des thérapeutiques en psychiatrie, et en particulier des psychothérapies, que « la souffrance psychique ne peut se mesurer », il s’agit là d’un malentendu (doublé parfois d’une attitude défensive vis-à-vis de la chose numérique). La souffrance psychique ne peut se résumer à un nombre, bien évidemment.

Par contre, il nous arrive tous les jours de considérer que « Mme X va beaucoup mieux » ou que « Mme X va plus mal ». Plutôt que de se limiter à de tels qualificatifs, on peut aussi tenter de représenter numériquement l’amélioration ou la dégradation de Mme X. Ces évaluations numériques ont pour avantage de faciliter la comparaison de groupes de patients, elles ont pour principal inconvénient de ne pas être congruentes avec nos représentations habituelles de l’état psychique de nos patients.

Bien sûr, la prudence s’impose lors du choix et de l’interprétation de telles mesures qui, on ne le répètera jamais assez, ne sont que de simples représentations du niveau de souffrance psychique (par exemple) du sujet. Rappelons enfin que la question du critère d’efficacité se pose de façon toute aussi aiguë dans les spécialités somatiques :

que vaut une augmentation de survie de trois mois quand elle est au prix d’un traitement entraînant pendant six mois des effets secondaires majeurs ? Rappelons aussi que si le nombre est définitivement considéré par certains comme incompatible avec les problématiques de santé mentale, rien ne les empêche d’utiliser des critères d’évaluation moins controversés comme la survenue d’une rechute, d’une tentative de suicide ou d’une hospitalisation.

La comparabilité des différents groupes de traitement

Dans un essai thérapeutique, la comparabilité des groupes de sujets est traditionnellement garantie par le recours à la statistique ainsi que par l’attribution aléatoire des traitements à comparer. Ce tirage au sort, utile car il permet d’éliminer la quasi
totalité des sources de bais, peut poser problème : les patients ne sont a priori pas neutres vis-à-vis des différentes modalités de prise en charge psychothérapeutiques.

Ne pas les laisser libres de leur choix, c’est interférer avec le processus de soins et donc modifier potentiellement son efficacité. Il y a du vrai dans un argument de ce type. Cependant, d’une part il est des situations où cette source de biais n’est plus un problème : si une thérapie clairement étiquetée n’est pas plus efficace à court, moyen et long terme qu’une absence de prise en charge, on ne peut pas évoquer le problème de la randomisation pour expliquer cette absence d’effet, car le tirage au sort devrait logiquement dégrader davantage, par dépit, les patients qui ne bénéficient pas de la prise en charge patentée. D’autre part, si le tirage au sort est considéré comme insupportable, il est toujours possible de réaliser des études non randomisées : les résultats sont plus délicats à interpréter, les analyses sont plus complexes, mais c’est incontestablement bien mieux que de ne rien faire.

Conclusion

L’évaluation d’une thérapeutique est toujours un problème complexe, qui ne possède, en médecine somatique comme dans le domaine des thérapeutiques psychiatriques médicamenteuses ou des psychothérapies, aucune solution définitive.

L’étude de cas cliniques, de trajectoires de patients en cours de thérapie est parfois source de renseignements intéressants, elle ne peut cependant se substituer à la comparaison de groupes de patients pris en charges selon des modalités différentes.

Il arrive que les limites méthodologiques que nous venons d’examiner rendent l’interprétation des résultats difficile, voire impossible. Il arrive tout aussi souvent que, malgré ces mêmes limites, les conclusions soient claires. Par ailleurs, l’évaluation des thérapeutiques en médecine somatique, en particulier les prises en charge chirurgicales, posent elles aussi question ; personne ne remet pourtant en doute l’utilité des essais cliniques dans ces spécialités. Il faut donc arrêter de se plaindre, à juste titre pourtant, de la place honteuse des psychothérapies dans le système de soin français. Il faut plutôt mettre en place des protocoles d’évaluation compatibles avec les pratiques psychothérapeutiques françaises pour prouver leur valeur à la collectivité et en tirer les conclusions politiques qui s’imposent quant à la nécessité de les prendre en charge par la collectivité.

BIBLIOGRAPHIE [1] INSERM. — Psychothérapies, trois approches évaluées, Editions Inserm, 568 pages, février 2004.

[2] DOUSTE-BLAZY P. — Discours du 4 février 2005, http : //www.sante.gouv.fr/htm/actu/33-050204 pdb.htm [3] FALISSARD B. — Comprendre et utiliser les statistiques dans les sciences de la vie, 3ème édition, 380 pages, Masson, 2005.

[4] ROBERT P. — Le nouveau Petit Robert, Dictionnaires le Robert, Paris, 1996.

[5] FALISSARD B. — Mesurer la subjectivité en santé : perspective méthodologique et statistique, Masson, Paris, 2001.

[6] LOZE J.Y., FALISSARD B., LIMOSIN F., RECASENS C., HORREARD AS., ROUILLON F. — Validation of a new doagnostic for DSM IV axis I disorders. Int. J. Methods Psychiatr. Res., 2002, 11 (3), 134-41.

DISCUSSION

M. Jacques BATTIN

Que pensez-vous de la validité des questionnaires sur la qualité de vie, que l’on a été amené à utiliser, y compris chez l’enfant, lors d’essais cliniques ?

Les mesures de qualité de vie ont été un réel progrès dans le domaine des essais thérapeutiques, notamment dans le champ des maladies chroniques sévères. Ces instruments ont cependant des limites importantes, la principale étant que le vocable de « qualité de vie » est souvent abusif. Si l’on est modeste quant à la signification réelle des mesures utilisées à partir de ces instruments, les inconvénients sont alors inférieurs aux avantages.

M. Jean-Roger LE GALL

Il existe des études en réanimation sur la qualité de vie des survivants. Quelles échelles utiliser ? Les échelles dites ‘‘ objectives ’’ ne sont-elles pas complémentaires des échelles ‘‘ subjectives ’’ ?

Les échelles de qualité de vie utilisées en réanimation posent des problèmes méthodologiques très particuliers (je pense par exemple aux patients intubés, pour lesquels le remplissage d’un questionnaire est impensable). Ces échelles sont en tout état de cause complémentaires de mesures plus objectives.

M. Charles HAAS

Je vois une difficulté aux essais thérapeutiques chez les malades psychiatriques : c’est celle du ‘consentement éclairé ’’. Pouvez-vous nous renseigner sur ce point ?

C’est un problème réel. Des chercheurs ont d’ailleurs travaillé sur ce point dans le but de construire un instrument sensé mesurer l’aptitude d’un patient à donner son consentement. On remarquera par ailleurs que ce problème ne touche pas seulement la psychiatrie (je pense aux patients en réanimation par exemple).

M. Bernard HILLEMAND

Quelle est la valeur des questionnaires visant à établir des échelles quantitatives utilisables pour les comparaisons lors des essais en double aveugle et donc quel est leur intérêt ?

La valeur des questionnaires les plus utilisés est globalement bonne. Il faut cependant faire attention à la façon dont ces questionnaires sont utilisés (explication aux patients, etc.) M. Jean-Baptiste PAOLAGGI

Est-il conceptuellement valable d’élaborer et de pratiquer des essais thérapeutiques pour apprécier l’efficacité des antidépresseurs dans certaines pathologies douloureuses, en particulier en rhumatologie ?

De mon point de vue il est conceptuellement valable de réaliser de tels essais, à la condition d’être bien au clair quant au rôle du produit dans une telle situation (effet antalgique et n’agissant pas sur la pathologie sous jacente).

M. Jean-Pierre OLIE

Pensez-vous que l’on pourra encore longtemps se passer de la prise en compte d’indices paracliniques pour les essais thérapeutiques en psychiatrie ?

Il est incontestable que les indices paracliniques (imagerie, etc.) permettront de faire progresser les essais thérapeutiques en psychiatrie. Il me semble cependant que ces indices devront rester longtemps des indices secondaires.

M. Jacques-Louis BINET

Combien d’essais thérapeutiques sont menés en France en psychiatrie et comment notre pays se classe-t-il par rapport aux autres nations ?

Dans le champ des essais médicamenteux, ces essais existent mais sont rares, paradoxalement en partie du fait de la qualité du système de soin français (les patients sont d’autant moins enclins a entrer dans un essai que le système de soin est bien fait). Dans le champ des psychothérapies, le retard est considérable, comme l’indique la récente expertise collective de l’Inserm sur la question.

Bull. Acad. Natle Méd., 2006, 190, no 6, 1131-1138, séance du 13 juin 2006