Técnicas para estimar la estabilidad de una escala de medición en salud

Miguel Ángel Simancas-Pallares, Edwin Herazo, Adalberto Campo-Arias

Resumen


 Introducción: la estabilidad de las escalas para medición de diferentes condiciones de salud es necesaria e imprescindible antes de su aplicación en poblaciones específicas.

Objetivo: describir las pruebas estadísticas de uso frecuente para estimar la estabili­dad de una escala de medición en salud.

Materiales y método: se llevó a cabo una revisión narrativa de la literatura impresa y electrónica desde el año 1965 aproximadamente, hasta la primera semana de enero de 2014.

Resultados: el desempeño psicométrico de una escala se centra en la medición de la validez y la confiabilidad. Sin embargo, el análisis de la confiabilidad test-retest (apli­cación múltiple de un instrumento con un intervalo de tiempo definido) pocas veces se informa. La medición de la estabilidad se basa en la aplicación de pruebas como t de Student, correlación de Pearson, coeficiente de correlación intraclase, coeficiente de correlación y concordancia de Lin o el coeficiente de concordancia de Bland y Altman. Los aspectos a tener en cuenta para la utilización de alguna de estas pruebas están en el tamaño de la muestra y la comprobación de supuestos de normalidad, entre otros.

Conclusión: la estabilidad se debe cuantificar para una escala en diferentes poblacio­nes. Cada prueba estadística a utilizar muestra ventajas y desventajas, de acuerdo a las características de la prueba. Probablemente, los valores similares en los diferentes coeficientes garantizan la estabilidad de una escala de medición en salud. Rev.cienc. biomed. 2016;7(1):104-111.

PALABRAS CLAVE

Psicometría; Escalas; Reproducibilidad de resultados; Revisión.

 

SUMMARY

Introduction: the stability of the measurement scales for different health conditions is necessary and essential before its application in specific populations.

Objective: to describe statistical tests commonly used to estimate the stability of a health measuring scale

Methods: it was conducted a narrative review with electronic and printed literature from 1965 to the first week of January 2014.

Results: the psychometric performance of a scale focuses on the validation and re­liability measurement. However, the stability analysis (multiple applications of an ins­trument with a defined time interval) is not reported. Stability measurement can be performed applying statistical tests such as t Student, Pearson correlation, intraclass correlation coefficient, Lin’s concordance correlation coefficient or Bland-Altman concor­dance coefficient. The points that should be present for the use of any of these tests are sample size, assumptions of statistical normality, etc.

Conclusion: the scale stability should be quantified in different populations. Each sta­tistical tool shows advantages and disadvantages according to its methodological as­sumptions. Probably, similar values in different tests ensure the scale stability to mea­sure in the health area. Rev.cienc.biomed. 2016;7(1):104-111.

KEYWORDS

Psychometrics; Scales; Reproducibility of results; Review.


Texto completo:

Sin título

Referencias


Gómez C, Ospina MB. Desarrollo de cuestionarios, adaptación y validación de escalas. En: Ruiz A,

Morillo LE. Epidemiología clínica. Bogotá: Editorial Médica Panamericana; 2004. p. 163-180.

Sánchez R, Echeverry J. Validación de escalas de medición en salud. Rev Salud Pública. 2004; 6:

-318.

Cepeda MS, Pérez A. Estudios de concordancia. En: Ruiz A, Morillo LE. Epidemiología clínica. Bogotá:

Editorial Médica Panamericana; 2004. p. 293-307.

Gliner JA, Morgan GA, Harmon RJ. Measurement reliability. Journal of the American Academic of

Child & and Adolescent Psychiatry. 2001; 40: 486-488.

Adcock R, Collier D. Measurement validity: A shared standard for qualitative and quantitative research.

American Political Science Association. 2001; 95: 529-546.

Morgan GA, Gliner JA, Harmon RJ. Measurement validity. Journal of the American Academic of

Child & Adolescent Psychiatry. 2001; 40: 729-731.

Kaplan RM, Saccuzzo DP. Pruebas psicológicas. Sexta edición. México: Thompson; 2006. p. 132-156.

Lamprea JA, Gómez-Restrepo C. Validez en la evaluación escalas. Rev Colomb Psiquiatr. 2007; 36:

-348.

Rodríguez MA, Lopera J. Conceptos básicos en la validación de escalas en salud mental. Rev CES

Med. 2002; 16 (2): 31-39.

Roberts P, Priest H, Traynor M. Reliability and validity in research. Nursing Standard. 2006; 20: 41-45.

Cronbach J. Coefficient alpha and the internal structure of test. Psychometrika. 1951; 16: 297-334.

McDonald RP. Theoretical foundations of principal factor analysis and alpha factor analysis. Br J

Math Stat Psychol. 1970; 23: 1-21.

Cortina JM. What is coefficient alpha? An examination of theory and applications. J Appl Psychol.

; 78: 98-104.

Streiner DL. Being inconsistent about consistency: When coefficient alpha does and doesn’t matter.

J Pers Assess. 2003; 80: 217-222.

Campo-Arias A, Oviedo HC. Propiedades psicométricas de una escala: la consistencia interna. Rev

Salud Publica. 2008; 10: 831-839.

Hulley SB, Cummings SR. Planning the measurement: precision and accuracy. In: Hulley SB, Cummings

SR. Designing clinical research. An epidemiologic approach. Baltimore: Williams & Wilkins;

p. 31-41.

Cervantes VH. Interpretaciones del coeficiente de alpha de Cronbach. Avances en medición. 2005;

: 9-25.

Oviedo HC, Campo-Arias A. Aproximación al uso del coeficiente alfa de Cronbach. Rev Colomb

Psiquiatr. 2005; 34: 572-580.

Blacker D, Endicott J. Psychometric properties: concepts of reliability and validity. In: Rush AJ,

Pincus HA, First MB, Zarin DA, Blacker D, Endicott J, et al. Handbook of psychiatric measures.

Washington: American Psychiatric Association; 2002 (CD-ROM).

Campo-Arias A, Herazo E. Concordancia intrae interobservador. Rev Colomb Psiquiatr. 2010; 39:

-431.

Strickland OL. Impact of unreliability of measurements on statistical conclusion validity. J Nurs

Meas. 2005; 13: 83-85.

Sánchez R, Gómez C. Conceptos básicos sobre validación de escalas. Rev Colomb Psiquiatr. 1998;

: 121-130.

Student. The probable error of a mean. Biometrika. 1908; 6: 1-25.

Pearson K. Determination of the coefficient of correlation. Science. 1909; 30: 23-25.

Shrout PE, Fleiss JL. Intraclass correlations: uses in assessing rater reliability. Psychol Bull. 1979;

: 420-428.

Lin LI. A concordance correlation coefficient to evaluate reproducibility. Biometrics. 1989; 45: 255-268.

Bland JM, Altman DG. Statistical methods for assessing agreement between two methods of clinical

measurement. Lancet. 1986; 1: 307-310.

Cepeda MS, Pérez A. Estudios de concordancia. Métodos para determinar la intercambiabilidad

entre diferentes sistemas de medición en la práctica clínica. En: Ruiz A, Gómez C, Londoño D. Investigación

clínica: Epidemiología clínica aplicada. Bogotá: Centro Editorial Javeriano, CEJA; 2001.

p. 287-301.

Yen M, Lo LH. Examining test-retest reliability: an intra-class correlation approach. Nurs

Res. 2002; 51: 59-62.

Rasch D, Kubinger KD, Moder K. The two-sample t test: pre-testing its assumptions does

not pay off. Statist Paper. 2011; 52: 219-231.

O’Neil ME, Mathews KL. Levene tests of homogeneity of variance for general block and

treatment designs. Biometrics. 2002; 58: 216-224.

Katz MH. Study design and statistical analysis. A practical guide for clinicians. Cambridge:

Cambridge University Press; 2009. p. 79-84.

Pagano RR. Estadística para las ciencias del comportamiento. 7a edición. México: Thompson;

p. 339.

Norman GR, Streiner DL. Bioestadística. Madrid: Mosby/Doyma libros; 1996. p. 171-172.

Coe R, Meriño C. Magnitud del efecto: Una guía para investigadores y usuarios. Rev Psicol.

; 21: 147-177.

Ledesma R, MacBeth G, Cortada N. Tamaño del efecto: Revisión teórica y aplicaciones con

el sistema estadístico ViSta. Rev Latinoam Psicol. 2008; 40: 425-439.

Durlak JA. How to select, calculate, and interpret effect sizes. J Pediatr Psychol. 2009; 34:

-928.

Bland JM, Altman DG. Validating scales and indexes. Br Med J 2002; 324: 606-607.

Katz MH. Multivariable analysis. Second edition. Cambridge: Cambridge University Press; 2006.

Cortés E, Rubio J, Gaitán H. Métodos estadísticos de evaluación de la concordancia y reproducibilidad

de pruebas diagnósticas. Rev Colomb Obstet Ginecol. 2010; 61: 247-255.

Spearman C. Correlation calculated from faulty data. Br J Psychol. 1910; 3: 271-295.

Lin L I-K. Assay validation using the concordance correlation coefficient. Biometrics. 1992;

: 599-604.

Costa-Santos C, Antunes L, Souto A, Bernades J. Assessment of disagreement: A new

information-based approach. An Epidemiol. 2010; 20: 555-561.

Carrasco JL, Jover L. Métodos estadísticos para evaluar la concordancia. Med Clin. (Barc)

; 122 (supl. 1): 28-34.

Camacho-Sandoval J. Coeficiente de concordancia para variables continuas. Acta Med Costarric.

; 50: 211-212.

Watson PF, Petrie A. Method agreement analysis: A review of correct methodology. Theriogenology.

; 73: 1167-1179.

Dewé W. Review of statistical methodologies used to compare (bio)assays. J Chromatog.

; 877: 2208-2213.

Khawaja IS, Olson EJ, van der Walt C, Bukartyk J, Somers V, Dierkhising R, et al. Diagnostic

accuracy of split-night polysomnograms. J Clin Sleep Med. 2010; 6: 357-362.

Bland JM, Altman DG. Comparing methods of measurement: why plotting difference against

standard method is misleading. Lancet. 1995; 346: 1085-1087.

Bland JM, Altman DG. Measuring agreement in method comparison studies. Stat Methods

Med Res. 1999; 8: 135-160.

Hopkins WG. Bias in Bland-Altman but not regression validity analyses. Sportscience. 2004;

: 42-46.

Hanneman SK. Design, analysis, and interpretation of method-comparison studies. Adv Crit

Care. 2008; 19: 223-234.

Myles PS, Cui J. Using the Bland-Altman method to measure agreement with repeated measures

(editorial). Br J Anest. 2007; 99: 309-311.

Mantha S, Roizen MF, Fleisher LA, Thisted R, Foss J. Comparing method of clinical measurement:

reporting standards for Bland and Altman analysis. Anesth Analg. 2000; 90:

-602.

Schmidt ME, Steindorf K. Statistical methods for the validation of questionnaires. Methods

Inf Med. 2006; 45: 409-413.

Barrera M. Diferencias estadísticamente significativas vs. relevancia clínica. Rev CES Med.

; 22: 89-96.

Camacho PA, Rueda-Jaimes GE, Latorre JF, Navarro-Mancilla ÁA, Escobar M, Franco JA.

Validez y confiabilidad de la escala del Center for Epidemiologic Studies-Depression en estudiantes

adolescentes de Colombia. Biomédica. 2009; 29: 260-269.

Muñiz J. Medición de lo psicológico. Psicothema. 1998; 10: 1-21.

Porras V, Lafaurie GI. Evaluación crítica de riesgo. Aplicación de la medicina basada en la

evidencia. Validez interna. Análisis del método. Parte I. Validación de encuestas de riesgo.

Rev Cient. 2004; 10: 68-72.

Cook DA, Beckman TJ. Current concepts in validity and reliability for psychometric instruments:

Theory and application. Am J Med. 2006; 119: 166.e7-16.

Alarcón AM, Muñoz S. Medición en salud: Algunas consideraciones metodológicas. Rev Med

Chile. 2008; 136: 125-130.

Pasquali L. Psychometrics. Rev Esc Enferm USP. 2009; 43: 992-999.


Enlaces refback

  • No hay ningún enlace refback.


Revista Ciencias Biomedicas
ISSN 2215-7840 / ISSN-e 2389-7252

Universidad de Cartagena
Facultad de Medicina Zaragocilla cra 50C # 24-120

6698177-6698178

correo-e:revistacienciasbiomedicas@unicartagena.edu.co