You are on page 1of 10

DETERMINACIÓN DEL TAMAÑO MUESTRAL – MARTA GARCÍA-GRANERO MÁRQUEZ

DETERMINACIÓN DEL TAMAÑO MUESTRAL

Consideraciones previas

Tanto en tests de hipótesis como en estimación por intervalo, el tamaño de las muestras utilizadas, n,
es responsable de la potencia y precisión de los resultados obtenidos:
x1  x 2
(x  ) t n1n22 
IC100(1   )% : ( x  Z / 2 s n ) t n1  1 1
s s p2(  )
n n1 n 2

Una de las preguntas que se plantean con mayor frecuencia en la planificación de un estudio
estadístico, y también una de las más difíciles de responder es: ¿cuántas observaciones se deben
efectuar? Cuanto mayor sea el tamaño de la muestra o la longitud del experimento, más precisas
serán las estimaciones de los parámetros y de sus diferencias. La dificultad está en decidir qué grado
de precisión se debe pretender. Por otro lado, antes de emprender una investigación costosa, puede
ser interesante determinar el tamaño de muestra necesario, porque si éste resulta estar más allá de
las posibilidades de la investigación, puede desistirse de ella antes de iniciarla.

En la actualidad, el cálculo del tamaño de muestra se considera imprescindible en los protocolos de


investigación (aunque en un estudio realizado por el New England Journal of Medicine, se observó
que muchos estudios, publicados en revistas de prestigio, carecían del tamaño de muestra necesario
para detectar diferencias significativas, aunque en muchos casos, con un tamaño más adecuado, se
podrían haber detectado).

Otro uso importante del cálculo de tamaño muestral es a la inversa: para calcular la potencia con un
tamaño de muestra determinado. Después de realizar una investigación con su análisis estadístico, si
éste resulta no significativo, averiguar, a la vista de los resultados obtenidos, qué potencia tenía el
estudio. Proporciona una medida de lo fiable que es la ausencia de significación que ha salido.
Habitualmente, se encuentra que la potencia es muy baja, lo que lleva a pensar que quizás con un
tamaño de muestra superior, los resultados habrían sido significativos.

En cualquier caso, hay que tener presentes los siguientes hechos:


 Las cifras de tamaño muestral obtenidas son siempre orientativas, nunca exactas.
 Serán tanto más ajustadas a la realidad cuanto mejores sean las suposiciones a priori.
 Pequeños cambios en las expectativas pueden producir grandes cambios en el tamaño muestral
estimado.
 La máxima potencia se obtiene con tamaños iguales por grupo: si se asignan individuos en dos
grupos con una razón superior a 2:1, habrá grandes pérdidas de potencia.

1
DETERMINACIÓN DEL TAMAÑO MUESTRAL – MARTA GARCÍA-GRANERO MÁRQUEZ

El tamaño de muestra en la estimación por intervalo

Recordemos que unastimación por intervalo da un rango de valores posibles para el parámetro,
vinculados a un valor de probabilidad de éxito. Se llama intervalo del 95% de confianza (IC 95%) a
aquel que tiene una probabilidad del 95% de incluir al parámetro entre sus límites. El cálculo del
intervalo se basa en la distribución muestral del estadístico (media o proporción).

Para determinar el tamaño de muestra, hay que contestar previamente a tres preguntas:
a) qué variabilidad tienen los datos (caso de una media), o en torno a qué valor está la
proporción a estimar
b) qué precisión se requiere,
c) y qué confianza se quiere tener en la respuesta.

Se requiere algo de información previa. Para ello puede recurrirse a información ya existente sobre
la variable, o si no la hay, al resultado de tomar una pequeña muestra piloto.

I. Estimación por intervalo de una media (o diferencia en muestras apareadas)

La fórmula para obtener el tamaño muestral deseado es la siguiente:


e
IC100(1   )% : ( x  Z / 2 s n ) Z2 / 2 2
n
e2

- Z  / 2 vale 1.96 si la confianza es del 95%; 2.58 si es del 99% y 3.29 si es del 99.9%.
-  2 es una estima de la varianza de la variable.
- e es la precisión (amplitud del intervalo) requerida.

Se realiza un estudio piloto tomando las pulsaciones de 10 estudiantes de Medicina,


previo a un estudio más amplio. Si en ese estudio se desean estimar las pulsaciones de
modo que el intervalo de confianza al 95% respecto a la media sea equivalente a ±2
latidos por minuto ¿cuántos estudiantes se requieren? El estudio piloto arrojó una
desviación típica de 8.67 latidos por minuto.

Z2 / 2 2 1.96 2 ·8.67 2


n   72.19  73
e2 22

II. Estimación por intervalo de una proporción

El cálculo de n es similar al realizado para el caso de una media:


e
Z 2 / 2 p(1  p) Z2 / 2
IC100(1   )%=p  Z / 2 p•(1-p) n n
n e2
o bien 4e 2

- Z  / 2 vale 1.96 si la confianza es del 95%; 2.58 si es del 99% y 3.29 si es del 99.9%.
- e es la precisión requerida.

2
DETERMINACIÓN DEL TAMAÑO MUESTRAL – MARTA GARCÍA-GRANERO MÁRQUEZ

- Se requiere conocer p antes de haber tomado la muestra. Soluciones:


- Utilizar información ya existente (a partir de la bibliografía o de una muestra piloto) para obtener
un valor aproximado.
- Sustituir el producto p(1-p) por el máximo valor que puede alcanzar, 1/4 (cuando p=q=1/2). Es
una solución muy conservadora que da valores de n muy superiores a los realmente necesarios.

Se intenta estimar la incidencia de bajas laborales por enfermedad común en centros


hospitalarios públicos mediante un intervalo del 95% de confianza. Se sospecha que ésta
podría estar en torno al 50%, y se desea una precisión de 2%.

Z2 / 2 p(1  p) 1.96 2 0.50·(1  0.50)


n   2401
e2 0.02 2

III. Factor de corrección por población finita

Hasta ahora se ha considerado que la población a muestrear es de tamaño indeterminado (o infinito).


Cuando se conoce el tamaño de la población, y el tamaño muestral calculado supone al menos un
5% del total. Se puede calcular un factor de corrección de población finita una vez que se ha
calculado el tamaño inicial de la muestra (n0):

El tamaño de muestra en los tests de hipótesis


Intervienen más factores que en la estimación por intervalo:

a) Asunciones realizadas y DMR (Diferencia Mínima Relevante)

Se requiere tener un conocimiento previo (aproximado) del valor de determinados parámetros, como
la variabilidad. El concepto de DMR se refiere a qué magnitud de diferencia merece la pena detectar
como significativa. Esta diferencia puede estar o no estandarizada (d de Cohen).

DMR (  2  1 )
d 
D.típ. 

Hay que ser realistas y no esperar encontrar diferencias “enormes”. Lo más usual es trabajar con
diferencias estandarizadas de 0.3  ; 0.5  o 0.8 

3
DETERMINACIÓN DEL TAMAÑO MUESTRAL – MARTA GARCÍA-GRANERO MÁRQUEZ

Situación irreal Situación más realista

b) Riesgos inevitables pero asumibles (antes del experimento)

REALIDAD
DECISIÓN H0 verdadera H0 falsa
OK Riesgo 
H0 no rechazada F-
(1-) Error tipo II
Riesgo  OK
H0 rechazada F+ (1-)
Ha aceptada Error tipo I POTENCIA

Riesgo alfa: Probabilidad de aceptar Ha siendo falsa (falso positivo). Puede tomar como valores
0.05, 0.01 y 0.001. En la elección del valor de  influyen factores como: posibilidad de repetir el
ensayo (único o múltiples) y la postura que se adopta ante la investigación (conservadora o
arriesgada).

ELECCIÓN DE 

0.01 0.05

Único Ensayo Múltiples

Conservadora Posición Arriesgada

Riesgo beta: Probabilidad de aceptar (no rechazar) H0 siendo falsa (falso negativo). Suele tomar
como valores 0.20, 0.10 y 0.05.

A medida que los riesgos alfa y beta disminuyen, el tamaño de muestra aumenta.

c) Aproximación a la experimentación

 Aproximación exploratoria (buscando diferencias): contraste bilateral.


 Aproximación pragmática (buscando superioridad): contraste unilateral.

El tipo de contraste afecta al tamaño de muestra necesario, de modo que si el contraste es


unilateral se requieren menos individuos.

4
DETERMINACIÓN DEL TAMAÑO MUESTRAL – MARTA GARCÍA-GRANERO MÁRQUEZ

I. Test de hipótesis de una media (o diferencia en muestras apareadas)

La fórmula para el cálculo del tamaño muestral es la siguiente:


2
 (Z  Z  ) 
2
 (Z  Z  )   Z2 
n       /2 
 
 1  0   d   4 

- Z  y Z  son valores que dependen de la potencia y significación requeridas (ver anexo).


-  es una estima de la desviación típica de la variable.
- 1   0 es la diferencia relevante que se desea detectar.

Se desea estudiar la eficacia de la hidroclorotiacida en la reducción de la presión arterial


sistólica en un diseño de datos pareados. A partir de un estudio piloto se encuentra que
la desviación típica del cambio en la tensión arterial es de 13.1 mmHg. ¿Cuántos
pacientes se necesitan para estudiar la eficacia del fármaco en una prueba bilateral con
un =0.05 y =0.10 (potencia del 90%)? Se considera clínicamente relevante un
descenso de 10 mmHg en la presión arterial.

 1.96  ( 1.282) ·13.1


2 2
 (Zα  Zβ )σ   1.962 
n     18.04  19     20
 4 
 μ1  μ0   10  0  

El tamaño muestral subestima ligeramente el real, ya que se utiliza la distribución Z en vez de la t de


Student con n-1 grados de libertad. Las tablas de Jacob Cohen y algunos programas, como
MorePower, utilizan un factor de corrección, que para alfa=0,05 supone añadir 1 al cálculo.

II. Test de hipótesis de una proporción

La fórmula para el tamaño muestral requerido es la siguiente:

2
 Z   0 (1   0 )  Z   1 (1   1 ) 
n 
 1   0 

La incidencia de bajas por dolor de espalda entre el personal hospitalario es muy


elevada, en torno al 60%. Se quiere poner en marcha un programa de detección y
control que se espera logre reducir esta incidencia a un 40%. ¿Qué tamaño de muestra
debería tomarse con estas condiciones?: =0.05; =0.10. Prueba unilateral.

2 2
 Z 0 (1  0 )  Z  1(1  1)  1.645 0.6·(1  0.6)  ( 1.282) 0.4·(1  0.4) 
n      51.4  52
 1  0   0.6  0.4 

III. Test de hipótesis de una diferencia de medias independientes

Tamaño muestral por grupo:


2 2
 (Z  Z  )   (Z  Z  )   Z2 
nG  2    2     /2 
 4 
 2  1   d  

5
DETERMINACIÓN DEL TAMAÑO MUESTRAL – MARTA GARCÍA-GRANERO MÁRQUEZ

Se desea comparar la función pulmonar de dos grupos de trabajadores: expuestos a


Cadmio por inhalación y no expuestos, mediante el volumen espiratorio forzado (VEF).
Según trabajos previos, la desviación estándar del VEF es de 0.5 l. Se utiliza un nivel de
significación bilateral del 0.05 y se requiere una potencia del 80% para detectar una
diferencia en las medias de ambos grupos de 0.25 l. ¿Cuántos individuos debe haber en
cada grupo?

 1.96  ( 0.842)·0.5 
2 2
 (Z  Z  )   1.962 
nG  2    2   62.8  63  
   64  64 en tabla de Cohen
  2  1   0.25   4 

Es preferible, siempre que se pueda, escoger tamaños muestrales iguales para ambos grupos. Si eso
no es posible, entonces hay que reemplazar el valor obtenido inicialmente, nG, por n1 y n2, calculados
mediante las siguientes fórmulas:
n1=nG*(k+1)/(2*k) y n2=nG*(1+k)/2

Donde k es la razón entre ambos tamaños muestrales (n2/n1).

Esto hace que el tamaño total requerido sea mayor. Por ejemplo, si en este mismo estudio prevemos
que será difícil localizar sujetos expuestos al Cadmio, podemos plantear el diseño con dos controles
por cada caso (K=2). El tamaño requerido por grupo pasa a ser entonces 48 y 96 sujetos,
respectivamente, lo que hace un total de 144 sujetos, en vez de 126.

IV. Test de hipótesis de una diferencia de proporciones

Aproximación normal

Cuando se cumplen las condiciones de aplicación de la prueba de 2 para una prueba 2x2, la fórmula
que permite calcular el tamaño muestral por grupo es la siguiente:
2
 Z 2(1   )  Z   1 (1   1 )   2 (1   2 ) 
nG  
 1   2 

Se cree que existe una diferencia en la incidencia de baja por enfermedad común entre
los trabajadores que viven cerca del lugar de trabajo y los que viven a más de 10 Km de
distancia. De los datos preliminares se calcula que estas incidencias podrían estar en
torno al 30%, en los residentes cerca del lugar de trabajo y en torno al 50%, en los
residentes a distancia. Se quiere detectar la diferencia con un nivel de significación
bilateral del 5% y con una potencia del 90%, ¿cuántos trabajadores se deberían incluir
en cada grupo?
2
 Z 2(1   )  Z   1 (1   1 )   2 (1   2 ) 
nG  
 1   2 
2
1.96 2·0.4·(1  0.4)  ( 1.282 ) 0.3·(1  0.3)  0.5·(1  0.5) 
   124.03  124
 0. 5  0. 3 

6
DETERMINACIÓN DEL TAMAÑO MUESTRAL – MARTA GARCÍA-GRANERO MÁRQUEZ

Aproximación del arcoseno

Proporciona estimaciones precisas basadas en el cálculo de la probabilidad exacta de Fisher en


proporciones pequeñas (por debajo del 20%). La fórmula que permite calcular el tamaño muestral por
grupo es la siguiente:
Z  Z  2
nG 

2x arcoseno  1  arcoseno  2 
2

Aproximación de Poisson

En proporciones por debajo del 5% se prefiere la utilización de la distribución de Poisson. La fórmula


que permite calcular el tamaño muestral por grupo es la siguiente:

Z  Z  2 ( 1   2 )
nG 
 1   2 2

Recordemos que es preferible, siempre que se pueda, escoger tamaños muestrales iguales para
ambos grupos. Si eso no es posible, entonces hay que corregir el valor obtenido inicialmente, nG,
mediante las siguientes fórmulas:
n1=nG*(k+1)/(2*k) y n2=nG*(1+k)/2

Donde k es la razón entre ambos tamaños muestrales (n2/n1).

Esto hace que el tamaño total requerido sea mayor.

V. Cálculo del tamaño muestral para tablas de contingencia (test de independencia)

Cohen ofrece también tablas para calcular tamaños muestrales en tablas de contingencia. La medida
de la magnitud del efecto más utilizada en estos casos es el coeficiente phi de Cramer. Como Stata
no incluye procedimientos de cálculo de tamaño muestral en tablas de contingencia, habría que
recurrir a otros programas, como el gratuito G*Power.

VI. Cálculo del tamaño muestral requerido para la prueba log-rank

La escala de la izquierda da la potencia del test para los niveles de significación 0.01 y 0.05. La
escala central da el número total de eventos (muertes) requeridos. La escala de la derecha muestra
el cambio en supervivencia, expresado, bien como porcentaje de cambio de la mediana, o como
hazard ratio: ln(sup. Menor)/ln(sup. mayor). La línea que une a la altura requerida de las escalas
izquierda (potencia/significación) y derecha (magnitud de efecto), nos da en la línea central el
número de eventos necesarios para esas condiciones. El número total de pacientes se calcula
dividiendo el número de eventos requerido por la mortalidad promedio: [1 – (0.2+0.342)/2, en este
ejemplo].

7
DETERMINACIÓN DEL TAMAÑO MUESTRAL – MARTA GARCÍA-GRANERO MÁRQUEZ

La imprecisión del nomograma, más que un inconveniente, es un recordatorio de que las cifras de
tamaño muestral son sólo orientativas, no exactas.

(Fayers PM, Machin D. Sample size: how many patients are necessary? Br J Cancer 1995; 72: 1-9)

VII. Consideraciones finales

Los cálculos para una y dos medias asumen en todo momento que el análisis es por vía paramétrica
(asumen normalidad). Aunque es difícil saber a priori el impacto de una falta de normalidad en la
potencia del estudio, conviene aumentar un 15% el tamaño final si se anticipa no normalidad.

Son tamaños finales, no iniciales: si se anticipan pérdidas en seguimiento (p%), hay que aumentar el
tamaño muestral inicial: Ni=n/[1-(p/100)].

8
DETERMINACIÓN DEL TAMAÑO MUESTRAL – MARTA GARCÍA-GRANERO MÁRQUEZ

Si el tamaño muestral está limitado a priori:

 Justificarlo (presupuesto, disponibilidad de sujetos ...)


 Dado n disponible, calcular la magnitud de efecto detectable
 ¿Es razonable? (literatura científica ...)  continuar estudio
 No es realista  descartar estudio, limitar objetivos ...
 Tratar de ampliar el tamaño, reducir varianzas (diseño) ...

VIII. Potencia de un contraste: cálculo de potencia post-hoc

A partir de las fórmulas anteriores se puede despejar beta, y averiguar, tras la realización de un test
de hipótesis, que potencia tenía éste para detectar una diferencia de una determinada magnitud. Por
ejemplo, si en un estudio de dos grupos independientes, con tamaños muestrales de 9 sujetos por
grupo, se encontró una d=0.94 (xT=115, xC=90, Sp=26.5), pero el test de 2 colas con un alfa=0.05
dio no significativo (p=0.063). Podemos preguntarnos si el test tenía suficiente potencia para detectar
una d de Cohen tan grande (superior a 0.8):

. sampsi 115 90, sd(26.5) alpha(0.05) n1(9) n2(9)

Estimated power for two-sample comparison of means

Test Ho: m1 = m2, where m1 is the mean in population 1


and m2 is the mean in population 2
Assumptions:

alpha = 0.0500 (two-sided)


m1 = 115
m2 = 90
sd = 26.5
sample size n1 = 9
n2 = 9

Estimated power:

power = 0.5165

Vemos que la potencia es claramente inferior a 80%.Sin embargo, los resultados obtenidos deben
ser interpretados siempre con prudencia.

9
DETERMINACIÓN DEL TAMAÑO MUESTRAL – MARTA GARCÍA-GRANERO MÁRQUEZ

Anexo

10

You might also like