Comment savoir si un article scientifique est pertinent pour ma pratique clinique ?  

Comment savoir si un article scientifique est pertinent pour ma pratique clinique ?  

Mis à jour le 7 mai 2025

Un article de Anthea Sutton et Beverly Coghlan qui dévoilent les secrets pour savoir lire un article scientifique de manière critique, publié dans EMDR Therapy Quarterly. 

Article publié en anglais – accès libre en ligne

Pourquoi une évaluation critiques des recherches publiées est-elle nécessaire ? 

Si l’on en croit Ioannidis (2014), seuls 15 % des recherches en matière de santé sont utiles ; le reste est considéré comme « inutile » en raison de problèmes liés à la conception des études, à leur pertinence pour les parties prenantes et à d’autres questions de qualité. Vos compétences en matière d’évaluation critique des recherches augmentent la probabilité pour vous de trouver les 15 % utiles.

L’évaluation critique garantit la rigueur et la fiabilité scientifiques, aide à identifier les biais et les erreurs et, en fin de compte, améliore la prise de décision fondée sur des preuves. La figure 1 présente une hiérarchie acceptée de la production de preuves.

À presque tous les niveaux, il existe une liste de contrôle appropriée pour évaluer la qualité et la robustesse d’une recherche, ainsi que son applicabilité pratique à votre travail avec vos patients.

Comment procéder à une évaluation critique ? 

Une évaluation critique commence par une question ou un problème clinique ou axé sur la recherche. À partir de là, nous pouvons rechercher des articles pertinents, dont la pertinence peut généralement être discernée à partir du résumé. Afin de garantir une évaluation approfondie, une liste de contrôle d’évaluation critique appropriée, pertinente pour la conception de l’étude de l’article de revue choisi, peut être utilisée. Celle-ci fournira des questions qui nous guideront tout au long de l’article et nous aideront à comprendre la recherche. 

Ces listes de contrôle sont disponibles auprès de plusieurs organisations différentes, telles que :

Si ces listes peuvent sembler intimidantes au premier abord, elles rendent la recherche plus significative. Avec la pratique, parcourir la liste et noter la recherche devient une seconde nature, et nous sommes mieux à même de repérer les recherches qui ne sont pas solides ou applicables à notre population de patients. Il est important de noter que lors de la réalisation d’examens systématiques ou de méta-analyses, il est essentiel de noter les recherches incluses à l’aide d’une liste de contrôle standardisée.

Biais de recherche

Le biais dans la recherche désigne une erreur systématique qui peut survenir lors de la conception, de la conduite ou de l’interprétation d’une étude, conduisant à des conclusions inexactes. Les listes de contrôle pour l’évaluation critique sont essentiellement conçues pour identifier les biais potentiels. Plus le risque de biais est élevé, moins les résultats sont fiables.

Biais de sélection

Le biais de sélection peut être réduit en veillant à ce que les participants soient répartis de manière aléatoire entre les interventions et que cette répartition soit correctement dissimulée. Cela devrait garantir que les groupes étudiés sont similaires au départ et que les données démographiques de base et la gravité de la maladie ou du trouble sont consignées. Des analyses en intention de traiter (ITT) doivent également être réalisées. Cela signifie que les analyses doivent porter sur tous les participants, qu’ils aient terminé l’intervention ou l’aient abandonnée pour quelque raison que ce soit.

Biais de performance

Le biais de performance peut être minimisé en veillant à ce que le prestataire de soins et les participants ignorent les interventions dont ils bénéficient. Cela est difficile à réaliser dans le cadre d’études psychothérapeutiques, et il faut garder à l’esprit que la norme de référence largement acceptée pour les études cliniques (l’essai contrôlé randomisé en double aveugle) a été développée pour tester des substances pharmacologiques et non des thérapies psychologiques interpersonnelles.

Biais de détection

Le biais de détection peut être minimisé, même lorsque l’étude n’est pas en double aveugle, en aveuglant les évaluateurs des résultats.

Biais d’attrition

Le biais d’attrition fait référence à la tolérance globale d’une intervention et doit être signalé pour tous les participants qui n’ont pas terminé l’étude, quelle qu’en soit la raison, ainsi que pour les différences d’attrition entre les groupes étudiés.

Biais de financement

Le biais de financement peut être minimisé en déclarant la source de financement et tout conflit d’intérêts des chercheurs.

Connaissances pratiques en statistique 

Bien sûr, il est nécessaire d’avoir des connaissances pratiques en statistiques pour comprendre que les tests statistiques appliqués sont appropriés aux données et pour comprendre la signification des chiffres.

Valeurs p

En bref, les valeurs p nous aident à déterminer la signification des résultats. Des valeurs p inférieures ou égales à 0,05 indiquent que le résultat est probablement exact, tandis que des valeurs p supérieures à 0,05 sont considérées comme un indicateur de résultat peu fiable. Par exemple, une valeur p faible de 0,03 indique que si l’étude était répétée 100 fois, dans trois cas, le résultat serait dû à une erreur d’échantillonnage aléatoire ou au hasard, et dans 97 cas, il serait dû à un effet réel observé.

Intervalles de confiance

Les intervalles de confiance (IC) sont souvent utilisés dans les essais contrôlés randomisés (ECR) et les méta-analyses. Ils servent à indiquer la variation des résultats et le degré de confiance que nous pouvons accorder à ces derniers. Les IC indiquent le résultat moyen/global ainsi que les limites supérieure et inférieure. Nous ne nous attendrions pas à obtenir le même résultat si nous menions une expérience 100 fois, mais un intervalle de confiance nous indique la variation à laquelle nous pouvons nous attendre et le degré de confiance que nous pouvons accorder à ce résultat. Ce degré de confiance est généralement exprimé en pourcentage (90, 95 ou 98 %). Cela signifie que pour obtenir un résultat fiable et exploitable, nous souhaitons idéalement un intervalle de confiance étroit (c’est-à-dire une faible variation entre les études) avec un pourcentage de confiance élevé.

Puissance

Dans le domaine de la recherche en santé, il est important de s’assurer que les études ont une forte probabilité de détecter des résultats significatifs. Il convient donc de calculer la puissance afin de déterminer le nombre de participants nécessaires pour mettre en évidence un effet.

Taille de l’effet

La taille de l’effet quantifie la différence entre le groupe d’intervention et le groupe témoin. Le calcul de la taille de l’effet nous aide à comprendre si une intervention est cliniquement significative et statistiquement significative. Il permet de comparer des études avec des échantillons de tailles ou des méthodes différentes. Comme nous le savons tous, dans la recherche en santé mentale, même de petits effets peuvent avoir une importance clinique considérable. Les tailles d’effet sont généralement exprimées comme suit : petite (0,2-0,5), moyenne (0,5-0,8) et grande (supérieure à 0,8).

Mettre l’analyse critique en pratique

Pour consolider leurs acquis, les participants au webinaire ont été invités à critiquer l’article le plus cité dans la littérature sur l’EMDR, l’étude de Francine Shapiro publiée en 1989, qui a été citée 544 fois. La question posée était la suivante : « Comment cet article se positionne-t-il aujourd’hui, étant donné qu’il a été publié il y a 36 ans ? »

Nous avons examiné la liste de contrôle CASP RCT et avons conclu ensemble que, compte tenu de la valeur p très frappante pour l’EMD par rapport au groupe témoin (baisse de p < 0,001 avant et après le traitement pour le SUD contre p > 0,05 pour le groupe témoin), nous pouvions considérer ces résultats comme suffisamment sérieux pour mener d’autres études, ce que Shapiro a clairement fait. Mais à en juger par nos normes actuelles, le risque de biais dans cette étude est élevé, notamment parce que, comme le souligne Shapiro elle-même, « l’expérimentatrice et l’auteure étaient une seule et même personne ».

Les compétences en matière d’évaluation critique sont précieuses pour nous, non seulement en tant que scientifiques-praticiens, mais aussi dans notre vie quotidienne. Nous sommes constamment bombardés d’informations sur des produits, des interventions ou des traitements accompagnés d’allégations cliniques farfelues, mais formulées de manière pseudo-scientifique. Il suffit de regarder l’industrie du « bien-être » pour en trouver des exemples, et souvent, nos patients nous présentent ces informations comme des faits. Il peut être utile de pouvoir démystifier ces affirmations de manière neutre et scientifique. Mais surtout, ces compétences peuvent nous faire gagner du temps (compte tenu de la quantité d’informations disponibles) et nous aider à améliorer notre jugement clinique.

La figure 3 fournit des ressources supplémentaires pour vous aider à développer vos compétences en matière d’analyse critique. La vidéo est particulièrement utile, car elle rend l’ensemble du processus de lecture (et d’analyse) d’un article beaucoup moins intimidant.

En savoir plus 

La bibliothèque Francine Shapiro 

La base de données des publications EMDR UK qui comprend uniquement les articles qui ont été évalués par des pairs ; elle surveille également automatiquement les rétractations, les supprime et les remplace par un avis de rétractation. Mais, comme l’ont découvert les participants au webinaire, l’évaluation par les pairs ne garantit pas nécessairement la qualité et la robustesse de la recherche.

Aller plus loin 

M’inscrire Vous avez une question ?