EL PENSAMIENTO ESTADÍSTICO

"El pensamiento estadístico será un día tan necesario para el ciudadano eficiente como la capacidad de leer y escribir."

H.G. Wells.

Existen dos formas principales de pensamiento lógico, la deducción y la inducción. La primera se debe principalmente a los griegos, que fueron los primeros en ver claramente la gran potencia de proponer axiomas o hipótesis generales y deducir de ellos una ordenación útil de proposiciones implicadas por ellos. El pensamiento inductivo, no comenzó a constituir una herramienta sistemática del hombre hasta la última parte del siglo XVIII. La inducción procede en la dirección opuesta a la deducción. Partiendo de hechos experimentales, nos conduce a inferir conclusiones generales.

Francis Bacon fue el primero que subrayó adecuadamente los métodos inductivos como base del procedimiento científico, pero no fue sino en 1763 cuando el clérigo Thomas Bayes construyó la primera base matemática de esta rama de la lógica. A fin de formarnos una idea de lo que hizo Bayes consideremos un ejemplo que es, por supuesto, artificioso. Supongamos que tenemos una caja cerrada que contiene un gran número de bolas blancas y negras. No conocemos la proporción de bolas blancas y negras, pero tenemos alguna razón para pensar que existe la probabilidad 2/3 de que hay tantas bolas blancas como negras en la caja. Entonces tomamos la caja, sacamos una muestra de bolas y encontramos que 3/4 de la muestra son negras. Ahora bien, antes de sacar esta muestra nos inclinábamos fuertemente a pensar que la mezcla desconocida era mitad de blancas y mitad de negras. Después de haber tomado la muestra, claramente deberíamos cambiar nuestra idea y comenzar a inclinarnos hacia la opinión de que las bolas negras superan en número a las blancas que hay en la caja. Bayes elaboró un teorema que indica exactamente cómo deberían ser modificadas las opiniones mantenidas, antecedentemente a los experimentos, por razón de la evidencia del muestreo. Aunque la utilidad de este teorema mismo ha resultado ser muy limitada, éste fue el comienzo de toda la teoría moderna de la estadística, y así el comienzo de una teoría matemática del razonamiento inductivo.

¿Cómo es esto?, podrá decirse. ¿Es la Estadística algo tan general y profundo? ¿No es la Estadística meramente el nombre de una información numérica con la cual los publicistas tratan de convencernos y a veces nos confunden?

La palabra Estadística tiene dos significados algo diferentes. En el uso más familiar es cierto que la Estadística significa simplemente información numérica, ordenada en tablas o en gráficas. En este sentido decimos que el Almanaque Mundial contiene una gran cantidad de estadísticas útiles; pero más ampliamente, y más técnicamente, la Estadística es el nombre de la ciencia y del arte que trata de la inferencia incierta, la cual usa los números para obtener algún conocimiento acerca de la naturaleza y de la experiencia.

Lo importante del razonamiento inductivo se basa en el hecho de que, dejando a un lado excepciones triviales, los sucesos y los fenónemos de la naturaleza son demasiado multiformes, demasiado numerosos, demasiado extensos o demasiado inaccesibles para permitir una observación completa. Como hizo observar el autor de Eclesiastés, "No hay hombre alguno que no pueda conocer la obra que Dios hace desde el principio hasta el fin". No podemos medir los rayos cósmicos en todas partes y en cada instante. No podemos ensayar un nuevo medicamento en todas las personas. No podemos comprobar cada una de las granadas y las bombas que fabricamos, entre otras razones porque no quedaría ninguna por usar. Así hemos de contestarnos con muestras. Las medidas obtenidas en cada experimento científico constituyen una muestra del conjunto ilimitado de mediciones que resultarían si uno realizase el mismo experimento una y otra vez indefinidamente. Este conjunto total de mediciones potenciales se suele denominar la Población. Casi siempre se interesa uno en la muestra solamente en cuanto es capaz de revelar algo acerca de la población de la cual procede.

Las cuatro cuestiones principales que uno se pregunta acerca de las muestras son las siguientes:

¿Cómo se puede describir la muestra de forma útil y clara?
A partir del conocimiento de esta muestra, ¿cómo se deben inferir de la mejor manera posible conclusiones que se refieran a la población total?
¿Hasta qué punto son de fiar estas conclusiones?
¿Cómo se deberían tomar las muestras a fín de que puedan ser tan iluminadoras y tan de garantía como sea posible?

Es evidente que el estadístico nunca puede afirmar con certeza (al 100%) cómo es la población original, mediante un mero muestreo, porque las demás variarán. Si, por ejemplo, vamos sacando muestras de una mezcla que contenga 70% de bolas blancas y 40% de bolas negras, en modo alguno obtendremos esta relación de 70 a 40 de bolas blancas a negras en cada una de las muestras que tenemos. Sin embargo, para una cierta población y con métodos adecuados de muestreo es posible elaborar teóricamente el esquema de variación de las muestras. Este conocimiento del esquema de variabilidad de muestras da al estadístico un firme apoyo. Le permite considerar las muestras y obtener conclusiones acerca de la población original.

Debemos recordar ahora que la Estadística trata de conclusiones inciertas. No podemos esperar que el estadístico llegue a una conclusión absolutamente firme. Lo que podemos esperar es que nos proporcionen una respuesta doble a nuestra cuestión. Una parte de su respuesta puede ser: "Mi estimación mejor es.....". La otra parte inevitable de su respuesta es : "El grado de confianza que usted está justificado en dar mi estimación es ....".

Por Warren Weaver

Matemáticas en el Mundo Moderno

Selecciones de Scientific American