El papel de la estadística en la ciencia
La estadística es la aplicación científica de los principios matemáticos a la recogida, el análisis y la presentación de datos. Los estadísticos contribuyen a la investigación científica aplicando sus conocimientos matemáticos y estadísticos al diseño de encuestas y experimentos; a la recogida, el tratamiento y el análisis de los datos; y a la interpretación de los resultados.
La estadística es una ciencia matemática, por lo que el gusto y la aptitud para el pensamiento matemático es un ingrediente crucial. El campo de la estadística, al igual que otras áreas de las matemáticas aplicadas, suele atraer a quienes se interesan por el análisis de patrones en los datos: desarrollar, comprender, abstraer y empaquetar métodos analíticos para su uso general en otras áreas temáticas. La estadística es también, por definición, una ciencia de la información. El uso imaginativo de la potencia de cálculo y de los nuevos entornos informáticos impulsa gran parte de la investigación actual, por lo que un interés por la computación y/o la informática también puede ser un punto de partida para un estadístico.
Técnicas estadísticas
La ciencia moderna se basa a menudo en afirmaciones de significación estadística y probabilidad. Por ejemplo: 1) los estudios han demostrado que la probabilidad de desarrollar un cáncer de pulmón es casi 20 veces mayor en los fumadores que en los no fumadores (ACS, 2004); 2) existe una probabilidad significativa de que se produzca un impacto catastrófico de un meteorito en la Tierra en algún momento de los próximos 200.000 años (Bland, 2005); y 3) los primogénitos varones presentan puntuaciones en las pruebas de CI 2,82 puntos más altas que los segundos, una diferencia que es significativa con un nivel de confianza del 95% (Kristensen y Bjerkedal, 2007). Pero, ¿por qué los científicos hablan en términos que parecen oscuros? Si el consumo de cigarrillos provoca cáncer de pulmón, ¿por qué no decirlo simplemente? Si debemos establecer inmediatamente una colonia en la luna para escapar del desastre extraterrestre, ¿por qué no informar a la gente? Y si los niños mayores son más inteligentes que sus hermanos pequeños, ¿por qué no hacérselo saber?
La razón es que ninguna de estas últimas afirmaciones refleja con exactitud los datos. Los datos científicos rara vez conducen a conclusiones absolutas. No todos los fumadores mueren de cáncer de pulmón: algunos deciden dejar de fumar, reduciendo así su riesgo, algunos fumadores pueden morir prematuramente de enfermedades cardiovasculares o distintas del cáncer de pulmón, y algunos fumadores pueden simplemente no contraer nunca la enfermedad. Todos los datos presentan variabilidad, y el papel de la estadística es cuantificar esta variabilidad y permitir a los científicos hacer afirmaciones más precisas sobre sus datos.
Ejemplos de estadísticas en la ciencia
Las opiniones sobre la estadística en la investigación y el mundo académico rara vez se han visto con buenos ojos, al menos al principio. A menudo, al no poder disfrazarse de nada más que de “más matemáticas”, los estudiantes en ciernes que se incorporan a la educación terciaria han intentado eludir la estadística como la peste. Sin embargo, el desprecio y la aversión a la estadística son sin duda preocupantes para los educadores y los profesionales del sector, especialmente en los círculos de STEM. ¿Cómo se puede descuidar algo tan crítico para ayudar a los estudiantes a desarrollar habilidades de razonamiento cuantitativo, obtener herramientas para hacer inferencias, evaluar limitaciones, detectar errores e incertidumbre de los datos, de manera que se puedan formar decisiones y/o conclusiones?
Una de las formas en las que la estadística ha entrado en los libros buenos de la gente es a través del feliz matrimonio entre la informática y la estadística. El mundo de la estadística y el de la informática han colisionado y se han fundido a medida que la práctica de la estadística se ha trasladado a nuestros dispositivos electrónicos en forma de programación. Lenguajes como R y Python son algunos de los lenguajes de programación de más rápido crecimiento y uso en los últimos 5 años. El uso de R ha crecido especialmente en los círculos académicos, ya que la computación estadística es una habilidad muy buscada y el dominio de R o Python es ahora deseado por muchos empleadores, especialmente para aquellos que siguen carreras en STEM. Las pruebas estadísticas han recorrido un largo camino desde el principio y el aprovechamiento del poder y la utilidad de los ordenadores sólo hará que avance e influya en otros de forma más rápida y eficiente.
Estadísticas informáticas
La ciencia moderna se basa a menudo en afirmaciones de significación estadística y probabilidad. Por ejemplo: 1) los estudios han demostrado que la probabilidad de desarrollar un cáncer de pulmón es casi 20 veces mayor en los fumadores que en los no fumadores (ACS, 2004); 2) existe una probabilidad significativa de que se produzca un impacto catastrófico de un meteorito en la Tierra en algún momento de los próximos 200.000 años (Bland, 2005); y 3) los primogénitos varones presentan puntuaciones en las pruebas de CI 2,82 puntos más altas que los segundos, una diferencia que es significativa con un nivel de confianza del 95% (Kristensen y Bjerkedal, 2007). Pero, ¿por qué los científicos hablan en términos que parecen oscuros? Si el consumo de cigarrillos provoca cáncer de pulmón, ¿por qué no decirlo simplemente? Si debemos establecer inmediatamente una colonia en la luna para escapar del desastre extraterrestre, ¿por qué no informar a la gente? Y si los niños mayores son más inteligentes que sus hermanos pequeños, ¿por qué no hacérselo saber?
La razón es que ninguna de estas últimas afirmaciones refleja con exactitud los datos. Los datos científicos rara vez conducen a conclusiones absolutas. No todos los fumadores mueren de cáncer de pulmón: algunos deciden dejar de fumar, reduciendo así su riesgo, algunos fumadores pueden morir prematuramente de enfermedades cardiovasculares o distintas del cáncer de pulmón, y algunos fumadores pueden simplemente no contraer nunca la enfermedad. Todos los datos presentan variabilidad, y el papel de la estadística es cuantificar esta variabilidad y permitir a los científicos hacer afirmaciones más precisas sobre sus datos.