En 1981, cuando yo tenía nueve años, mi padre me llevó a ver Indiana Jones y los cazadores del arca perdida. Aunque tuve que entrecerrar los ojos durante algunas de las escenas de miedo, me encantó, sobre todo porque me sentía bastante seguro de que el personaje de Harrison Ford estaba basado en mi padre. Mi padre era paleontólogo en la Universidad de Chicago y yo había hecho varias excursiones con él a las montañas Rocosas, donde parecía transformarse en un superhéroe con martillo de piedra. Esa ilusión se desvaneció unos años más tarde, cuando descubrí a qué se dedicaba en realidad: lejos de invertir su tiempo en escalar peligrosos acantilados y desenterrar dinosaurios, Jack Sepkoski pasó la mayor parte de su carrera profesional frente a una computadora, construyendo lo que se convertiría en la primera base de datos completa sobre el registro fósil de la vida. Los análisis que hicieron él y sus colegas revelaron nuevos conocimientos sobre fenómenos como la diversificación y la extinción, y cambiaron la forma de trabajar de los paleontólogos, pero su labor era lo más lejano que hay en el mundo a la de Indiana Jones. Las historias entrelazadas de mi padre y su disciplina incluyen lecciones para la era actual del análisis algorítmico y la inteligencia artificial (IA), y apuntan a la manera cuantitativa en la que “vemos” los datos. Mi padre formaba parte de un grupo de innovadores en paleontología que se identificaban como “paleobiólogos”, lo que significa que abordaban su ciencia no como una rama de la geología, sino como el estudio de la biología y la evolución de la vida pasada. Desde la época de Charles Darwin, la paleontología (en especial el estudio de los invertebrados marinos que constituyen la mayor parte del registro) implicaba tareas descriptivas, como la clasificación o la correlación de los fósiles con las capas de la Tierra, lo que se conoce como estratigrafía. Algunos paleontólogos de invertebrados también estudiaban la evolución, pero con frecuencia estos estudios eran considerados por los biólogos evolutivos y genetistas como poco más que una “colección de sellos”.
El uso de computadoras para analizar grandes conjuntos de datos cambió esta imagen, sobre todo porque permitió a paleontólogos como mi padre y su colega David Raup, también de la Universidad de Chicago, sacar a la luz patrones de la historia de la vida que solo surgieron en marcos temporales muy largos. Una de sus contribuciones más destacadas fue el descubrimiento de que la vida ha experimentado grandes y catastróficas extinciones masivas al menos cinco veces en la historia de la Tierra (por eso, ahora muchos se refieren a la biodiversidad actual como la “sexta extinción”). A mediados de la década de 1980, lo que comenzó como un pequeño movimiento iconoclasta había alcanzado un éxito bastante asombroso. En 1984, se presentó un momento reivindicativo cuando el genetista inglés John Maynard Smith (notoriamente escéptico respecto al valor de la paleontología para el análisis evolutivo) publicó un ensayo en la revista Nature en el que invitaba a los paleontólogos a la “mesa de honor” de la biología evolutiva (una referencia a la práctica de las universidades Oxford y Cambridge, conocidas en conjunto como Oxbridge, de sentar a los estudiantes y profesores en una plataforma elevada en el refectorio). La paleobiología analítica, basada en datos, de la que mi padre fue pionero, se ha convertido en una industria artesanal. Al igual que en la genómica se utilizan algoritmos para automatizar el análisis de datos, un grupo de investigadores de la Universidad de Wisconsin-Madison anunció un proyecto llamado “PaleoDeepDive”:
[Un] sistema estadístico de lectura y aprendizaje automatizado para encontrar y extraer datos de incidencia de fósiles de la bibliografía científica.
El éxito de la paleobiología ha sido paralelo a la llegada de la informática y el internet, y parece un ejemplo evidente del impacto determinante de la tecnología en la ciencia. Si este enfoque es tan antiguo, ¿por qué los paleontólogos fueron tratados como “coleccionistas de sellos” durante tanto tiempo, y por qué la paleobiología moderna fue considerada “revolucionaria”? Las computadoras tienen un papel importante en esta historia, pero no necesariamente tan determinante como parece a primera vista. Aunque Heinrich G. Bronn y otros abogaron por una estrategia analítica a lo largo del siglo XIX, esta no logró imponerse. Algunos paleontólogos se opusieron a hacer afirmaciones teóricas extensas basadas en lo que era (ciertamente, en aquella época) un registro muy fragmentario; otros rechazaron el enfoque basado en datos porque sus resultados a menudo chocaban con la expectativa darwiniana de un desarrollo evolutivo gradual e ininterrumpido (apuntando en cambio a un ritmo irregular en el desarrollo de la vida). No obstante, la paleobiología moderna tuvo éxito donde Bronn y otros fracasaron, por dos razones; en primer lugar, en la década de 1970 algunos biólogos (y en especial paleontólogos como Stephen Jay Gould) se mostraron mucho más receptivos a cuestionar las conjeturas evolutivas gradualistas de Darwin. Gould, quien fue el mentor de mi padre en la Universidad de Harvard, promovió la teoría del “equilibrio puntuado”, es decir, la idea de que los linajes persisten durante largos periodos con muy pocos cambios, “puntuados” por temporadas de evolución acelerada. Asimismo, las extinciones masivas documentadas por mi padre y otros llevaron a revisar la creencia darwinista de que la diversidad de la vida ha sido básicamente estable a lo largo de la historia geológica. En segundo lugar, y de manera más general, la cultura ha cambiado significativamente. Sí, las computadoras han permitido hacer análisis estadísticos más veloces y potentes que los que eran posibles con lápiz y papel, pero lo más importante es que han cambiado nuestra manera de “ver” los datos. A principios del siglo XIX, gráficas como las de Bronn (u otros tipos de visualizaciones, como las gráficas de líneas) eran más o menos novedosas y su ubicuidad aún no estaba establecida; sin embargo, en nuestra época se da por sentado que la mejor manera de entender fenómenos complejos y de gran escala consiste en “hacer” números mediante computadoras y proyectar los resultados en forma de resúmenes visuales. Esto no es algo malo, pero plantea algunos desafíos. En muchos campos científicos, desde la genética hasta la economía, pasando por la paleobiología, se deposita una especie de confianza implícita en las imágenes y los algoritmos que las producen. Con frecuencia, quienes los observan casi no tienen ni idea de cómo se construyeron. La complejidad de las computadoras ha convertido el análisis de datos en una caja negra, algo a lo que es difícil que los humanos puedan echarle un ojo. Al mismo tiempo, los informáticos como mi padre han alcanzado un nuevo estatus cultural: aunque no sean Indiana Jones, siguen teniendo un tipo de poder y autoridad al que la mayoría de nosotros no podemos acceder.
Selección de un texto publicado originalmente en Aeon el 12 de febrero de 2018. Disponible aquí.
Imagen de portada: Charles R. Knight, Hadrosáuridos, 1897