5 de septiembre de 2019
¿Son realmente predecibles los rebaños humanos?
Por: Ian Stewart - Traducción y edición de Ricardo Montaño Sánchez
En la novela Fundación de Isaac Asimov (1951), el matemático Hari Seldon pronostica el colapso del Imperio Galáctico utilizando la psicohistoria: un cálculo de los patrones que ocurren en la reacción de la masa de la humanidad a los eventos sociales y económicos. Inicialmente sometido a juicio por traición, debido a que su predicción según las autoridades fomentó dicho colapso, a Seldon se le permite establecer un grupo de investigación en un planeta aislado. Allí, investiga cómo minimizar la destrucción y reducir el período subsiguiente de anarquía de 30,000 años a solo 1,000.
A pesar de los caprichos del libre albedrío y las circunstancias, el comportamiento humano en masa es mucho más predecible de lo que nos gusta imaginar
En la novela Fundación de Isaac Asimov (1951), el matemático Hari Seldon pronostica el colapso del Imperio Galáctico utilizando la psicohistoria: un cálculo de los patrones que ocurren en la reacción de la masa de la humanidad a los eventos sociales y económicos. Inicialmente sometido a juicio por traición, debido a que su predicción según las autoridades fomentó dicho colapso, a Seldon se le permite establecer un grupo de investigación en un planeta aislado. Allí, investiga cómo minimizar la destrucción y reducir el período subsiguiente de anarquía de 30,000 años a solo 1,000.
Asimov sabía que predecir eventos políticos a gran escala durante períodos de milenios no es realmente posible. Pero la incredulidad desaparece si se estamos leyendo ciencia ficción. A ningún aficionado a la literatura de Jane Austen le molesta que le digan que Elizabeth Bennet y el Sr. Darcy en realidad no existían, que es ficción literaria. Asimov fue lo suficientemente inteligente como para saber que tal pronóstico, por muy preciso que sea, es vulnerable a cualquier gran perturbación que no se haya anticipado, ni siquiera en principio. También entendió que los lectores que felizmente se tragaban la psicohistoria, se darían cuenta de lo mismo.
La serie de la Fundación es notable por concentrarse en las maquinaciones políticas de los grupos de poder, en lugar de producir páginas y páginas de batallas espaciales entre vastas flotas armadas hasta los dientes, los protagonistas reciben informes regulares de tales batallas, pero la descripción está lejos de ser un tratamiento tipo Hollywood. La trama, como afirmó el propio Asimov, se basa en el libro de Edward Gibbon, La historia de la decadencia y la caída del Imperio Romano (1776-89) y en una clase magistral sobre planificación en una escala épica para la incertidumbre. Todo ministro, alto funcionario y todo político, debería estar obligado a leerlo.
¿Y qué es eso de la psicohistoria?
La psicohistoria, es un método ficticio para predecir el futuro de la humanidad, lleva una técnica matemática hipotética a los extremos, para lograr un efecto dramático. Pero, para tareas menos ambiciosas, usamos la idea básica todos los días; por ejemplo, cuando un gerente de un supermercado calcula cuántas bolsas de harina colocar en los estantes, o un arquitecto evalúa el tamaño probable de una sala de reuniones cuando diseña un edificio. El personaje de Seldon fue en cierta medida inspirado por Adolphe Quételet, uno de los primeros en aplicar las matemáticas a la conducta humana. Quételet nació en 1796 en Gante, en los Países Bajos, ahora Bélgica. Las obsesiones de hoy, con las promesas y los peligros de los “grandes datos” y la inteligencia artificial, son descendientes directos de la creación de Quételet. Él no lo llamó psicohistoria, por supuesto. Lo llamó física social.
Final del formulario
Las herramientas y técnicas básicas de estadística nacieron en las ciencias físicas, especialmente la astronomía. Se originaron en un método sistemático para extraer información de observaciones sujetas a errores inevitables. A medida que crecía la comprensión de la teoría de la probabilidad, algunos pioneros extendieron el método más allá de sus límites originales. Las estadísticas se hicieron indispensables en biología, medicina, gobierno, humanidades, incluso a veces en las artes. La persona que encendió la mecha era un matemático puro convertido en astrónomo, uno que sucumbió al canto de sirena de las ciencias sociales.
Quételet llegó a la posteridad la constatación de que, a pesar de todos los caprichos del libre albedrío y las circunstancias, el comportamiento de la humanidad a granel es mucho más predecible de lo que nos gustaría imaginar. No perfectamente, de ninguna manera, sino, como dicen, ‘lo suficientemente bueno para el trabajo del gobierno’. También nos dejó dos ideas específicas: l’homme moyen , el ‘hombre promedio’, y la ubicuidad de la distribución normal de probabilidad, más conocida como la curva de campana. Ambas son herramientas útiles que abrieron nuevas formas de pensar y que tienen fallas serias si se toman demasiado literalmente o se aplican demasiado.
Un número básico tiene un fuerte efecto en todo lo que sucede y sucederá en un país: su población
En ese momento, los astrónomos eran pioneros en el uso de la teoría de la probabilidad para mejorar las mediciones de las órbitas planetarias a pesar de los inevitables errores de observación. Aprender estas técnicas de los expertos provocó una obsesión de por vida con la aplicación de la probabilidad a los datos estadísticos. Para 1826, Quételet era corresponsal regional de la oficina de estadísticas del Reino de los Países Bajos.
Si no sabes cuántas personas tienes, es difícil planificar. Puede hacer una estimación, pero podría terminar gastando una gran cantidad de dinero en infraestructura innecesaria, o subestimando la demanda y causando una crisis. Este es un problema con el que todas las naciones aún lidian.
La forma natural de saber cuántas personas viven en su país es contarlas. Sin embargo, hacer un censo no es tan fácil como parece. Las personas se mueven y se esconden para evitar ser condenados por delitos o para evitar pagar impuestos. En 1829, el gobierno belga estaba planeando un nuevo censo y Quételet, que había estado trabajando en cifras históricas de población, se unió al proyecto. “Los datos que tenemos en la actualidad solo pueden considerarse provisionales y necesitan corrección”, escribió. Un censo completo es caro, por lo que tiene sentido estimar los cambios de población entre los censos. Sin embargo, no puede salirse con las estimaciones por mucho tiempo, y un censo cada 10 años es común. Quételet instó al gobierno a realizar un nuevo censo, para obtener una línea de base precisa para estimaciones futuras. Sin embargo, Regresó de París con una idea interesante, una idea que obtuvo del gran matemático francés Pierre-Simon de Laplace. Si funcionara, ahorraría mucho dinero.
La crítica de Baron de Keverberg a los planes de Quételet para el censo belga de 1829 tuvo un efecto útil: alentó a Quételet a recopilar grandes cantidades de datos y analizarlos hasta su muerte. Quételet pronto pasó de contar personas a medir personas. Durante ocho años, recopiló datos sobre tasas de natalidad, tasas de mortalidad, matrimonio, fecha de concepción, estatura, peso, fuerza, tasa de crecimiento, embriaguez, locura, suicidio, crimen. Preguntó sobre su variación con la edad, el sexo, la profesión, la ubicación, la época del año, el estar en prisión, el hospital. Siempre comparó solo dos factores a la vez, lo que le permitió dibujar gráficos para ilustrar las relaciones. Publicó sus conclusiones en Sur l’homme et le développement de ses facultés: ou, Essai de physique sociale (1835), que apareció en inglés como Tratado sobre el hombre y el desarrollo de sus facultades (1842).
Cada vez que Quételet se refería al libro, usaba el subtitulo “físico social” . En 1869, para una nueva edición, cambió su título y subtitulo anteriores, haciendo de la Física Social el título principal. Sabía lo que había creado: un análisis matemático de lo que es ser humano. O, al menos, aquellas características de la humanidad que pueden ser cuantificadas.
El concepto en el libro que atrapó la imaginación del público, y nunca lo abandonó, es el del hombre promedio. En la medida en que su concepto tenía algún sentido, Quételet era consciente de que también era necesario considerar a la mujer promedio, al niño promedio y, para varias poblaciones, a diferentes instancias de todo esto. Al principio, notó que sus datos para atributos como la altura o el peso (debidamente restringidos a un solo género y grupo de edad) tendían a agruparse en torno a un solo valor. Si dibujamos los datos como un gráfico de barras, la barra más alta se encuentra en el centro, mientras que las otras se inclinan hacia afuera a cada lado. Presenta la forma característica de una curva de campana, ya conocida por los matemáticos, como reconoció Quételet. Toda la forma es aproximadamente simétrica, por lo que el pico central, que representa el valor más común, también es el valor promedio.
Las tablas y los gráficos están muy bien, pero Quételet quería un resumen rápido, uno que transmitiera el punto principal de una manera vívida y memorable. Entonces, en lugar de decir “el valor promedio de la curva de campana para las alturas de una clase de hombres humanos mayores de 20 años es de 1.74 metros”, prefería: “el hombre promedio (en esa clase) tiene una altura de 1.74 metros”. Entonces podría comparar hombres promedio en diferentes poblaciones. ¿Cómo se compara el soldado de infantería belga promedio con el granjero francés promedio? ¿Es ‘él’ más bajo, más alto, más liviano, más pesado o más o menos igual? ¿Cómo se compara ‘él’ con el oficial militar alemán promedio? ¿Cómo se compara el hombre medio en Bruselas con su contraparte en Londres? ¿Qué pasa con la mujer promedio? ¿Niño promedio? ¿Qué hombre promedio de un país es más probable que sea un asesino o una víctima? O ser un médico, dedicado a salvar vidas. En lugar de un suicidio, ¿intentó acabar con el suyo? Se necesita un hombre promedio diferente (o mujer o niño) para cada atributo. Como Stephen Stigler lo puso en The History of Statistics (1986), Quételet consideró que “el hombre promedio era un dispositivo para suavizar las variaciones aleatorias de la sociedad y revelar las regularidades que iban a ser las leyes de su” física social “.”
El hombre medio de Quételet debía evitarse.
Después de 1880, las ciencias sociales comenzaron a hacer un uso extensivo de las estadísticas, especialmente la curva de la campana. Francis Galton fue un pionero en el análisis de datos en el pronóstico del tiempo y descubrió la existencia de anticiclones. Galton produjo el primer mapa del tiempo, publicado en The Times en 1875, y estaba fascinado por los datos numéricos del mundo real y los patrones matemáticos ocultos en ellos. Cuando Charles Darwin publicó Sobre el origen de las especies.(1859), Galton comenzó un estudio de la herencia humana. ¿Cómo se relaciona la altura de un niño con la de los padres? ¿Qué pasa con el peso, o la capacidad intelectual? Galton adoptó la curva de campana de Quételet, usándola para separar poblaciones distintas. Si los datos mostraban dos picos, en lugar del pico único de la curva de campana, Galton argumentó que la población afectada debe estar compuesta por dos subpoblaciones distintas, cada una siguiendo su propia curva de campana.
Galton se convenció de que los rasgos humanos deseables son hereditarios, una deducción de la teoría evolutiva, pero que Darwin rechazó. Galton, en su libro Hereditary Genius (1869) invocó estadísticas para estudiar la herencia del genio y la grandeza, con lo que hoy aparece una curiosa mezcla de objetivos igualitarios (‘cada muchacho [debería tener] una oportunidad de mostrar sus habilidades y, si es altamente dotado, habilitado para lograr una educación de primera clase y una entrada en la vida profesional ‘) y el fomento del “orgullo de la raza”. En sus investigaciones sobre la facultad humana y su desarrollo (1883), Galton acuñó el término “eugenesia”, abogando por recompensas financieras para alentar el matrimonio entre familias de alto rango o intelecto. Quería criar personas con habilidades supuestamente superiores. La eugenesia tuvo su día en los años 20 y 30, pero rápidamente cayó en desgracia debido a los abusos generalizados, la esterilización forzada de los pacientes mentales y el engaño nazi de una raza magistral, por ejemplo. Hoy en día, la eugenesia es considerada racista. Contraviene la Convención de las Naciones Unidas para la Prevención y la Sanción del Delito de Genocidio y la Carta de los Derechos Fundamentales de la Unión Europea. Sin embargo, la idea nunca ha desaparecido por completo.
¿Podemos saber quién va a ganar?
Independientemente de lo que podamos pensar del carácter de Galton, su contribución a las estadísticas es innegable. Para 1877, había inventado el análisis de regresión, que calcula la relación más probable entre diferentes cantidades. Esto llevó a otro concepto central en las estadísticas: la correlación, que evalúa el grado de relación entre los conjuntos de datos, por ejemplo, el nivel de tabaquismo y la incidencia de cáncer de pulmón. Galton discutió ejemplos, como la relación entre la longitud y la altura del antebrazo, en 1888. El matemático inglés y bioestadista Karl Pearson convirtió la idea en una fórmula matemática, el coeficiente de correlación. Como se señala a menudo, la correlación no es causalidad, pero a menudo es un indicador útil de causalidad potencial .
En 1824, el Aru Pennsylvanian realizó una encuesta para tener una idea de si Andrew Jackson o John Quincy Adams serían elegidos presidente de los Estados Unidos. La encuesta mostró 335 votos para Jackson y 169 para Adams. Jackson ganó el voto popular (y electoral). Desde entonces, las elecciones han atraído a los encuestadores de opinión. Por razones prácticas, las encuestas muestrean solo una pequeña sección de votantes. La pregunta matemática obvia es: ¿qué tamaño debe tener la muestra para obtener resultados precisos? La misma pregunta es importante en la realización de censos, los ensayos médicos de un nuevo medicamento y muchos otros esfuerzos.
Hasta hace poco, los encuestadores utilizaban mayormente muestras aleatorias. La Ley de Números Grandes, descubierta por Jacob Bernoulli alrededor de 1684 y publicada en su épica Ars Conjectandi (1713), o ‘El arte de la conjetura’, nos dice que, si la muestra es lo suficientemente grande, el valor promedio de esa muestra es ‘casi seguro’ tan cerca como deseamos al verdadero promedio. Pero esto no nos dice cuán grande debería ser “lo suficientemente grande”. Un resultado más sofisticado, el teorema del límite central, utiliza una curva de campana para relacionar la media muestral con la media real y para calcular el tamaño de muestra más pequeño que debería funcionar.
Las redes sociales han cambiado la forma en que se llevan a cabo muchas encuestas. Las encuestas de Internet bien diseñadas han vuelto al enfoque de Laplace. Utilizan un panel representativo de individuos cuidadosamente seleccionados. Pero muchas encuestas simplemente permiten que cualquiera que quiera votar lo haga, ni aleatorio ni representativo. Estas encuestas están mal diseñadas, ya que las personas con opiniones sólidas tienen más probabilidades de votar, muchas personas ni siquiera conocen la encuesta y es posible que algunas no tengan conexión a Internet. Es probable que las encuestas telefónicas también sean sesgadas porque muchas personas no contestan a las personas que llaman con frialdad o se niegan a responder a un encuestador cuando se les pide una opinión. En esta era plagada de estafas, es posible que ni siquiera estén seguros de que la llamada sea una encuesta genuina. Algunas personas no tienen teléfono. Algunos no le dicen a los encuestadores sus verdaderas intenciones, por ejemplo, podrían no estar dispuestos a decirle a un extraño que planean votar por un partido extremista. Incluso la forma en que se formula una pregunta puede afectar la respuesta de las personas.
Los patrones de comportamiento humano se pueden extraer de los registros de compras con tarjeta de crédito, llamadas telefónicas y correos electrónicos.
Las organizaciones de votación utilizan una variedad de métodos para tratar de minimizar estas fuentes de error. Muchos de estos métodos son matemáticos, pero también se consideran factores psicológicos y otros. La mayoría de nosotros sabemos de historias donde las encuestas han indicado con confianza el resultado incorrecto, y parece que está ocurriendo con más frecuencia. A veces se invocan factores especiales para “explicar” por qué, como un repentino cambio de opinión o personas que mienten deliberadamente para hacer creer a la oposición que va a ganar y volverse complaciente. Sin embargo, cuando se realiza de manera competente, el sondeo tiene un historial general bastante bueno. Proporciona una herramienta útil para reducir la incertidumbre. Las encuestas de salida, donde se pregunta a las personas por las que votaron poco después de emitir su voto, suelen ser muy precisas y dan el resultado correcto mucho antes de que el recuento oficial de votos lo revele.
Hoy en día, el término ‘física social’ ha adquirido un significado menos metafórico. El rápido progreso en la tecnología de la información ha llevado a la revolución del “big data“, en la que se pueden obtener y procesar cantidades gigantescas de información. Los patrones de comportamiento humano se pueden extraer de los registros de compras con tarjeta de crédito, llamadas telefónicas y correos electrónicos. Las palabras que se vuelven cada vez más comunes en las redes sociales, como “demagogo” durante las elecciones presidenciales de 2016 en los EE. UU., pueden ser pistas de problemas políticos candentes.
El desafío matemático es encontrar formas efectivas de extraer patrones significativos de masas de información no estructurada, y se están aplicando muchos métodos nuevos, incluidos algunos que se originaron en la física misma. Por ejemplo, las teorías de cómo las moléculas de gas rebotan entre sí se han adaptado para predecir cómo las multitudes de personas se mueven en grandes edificios o complejos, como un parque olímpico. Los desafíos sociales y políticos son garantizar que no se abusen de tales métodos. Con la creciente introducción de métodos nuevos y poderosos, la física social ha recorrido un largo camino desde que Quételet se preguntó por primera vez cómo descubrir cuántas personas vivían en Bélgica, sin contarlas realmente.
Este es un extracto adaptado del libro ‘Do Dice Play God? Las matemáticas de la incertidumbre’ (2019) por Ian Stewart, publicado por Basic Books en septiembre de 2019.