Hoy tenemos con nosotros a Cristina Munilla, científica de datos que ha tenido la amabilidad de colaborar con nosotros en el Proyecto Psicoda. En primer lugar, quiero agradecerte la buena voluntad a la hora de realizar esta entrevista, estoy seguro de que tus aportaciones serán útiles e inspiradoras para otras personas. Sin más dilación comenzamos la entrevista.
¿Podrías contarnos a qué te dedicas exactamente?
Soy bióloga especializada en la rama medioambiental. Tras terminar la carrera estuve trabajando como bióloga marina. Yo siempre he sido una persona muy analítica, de modo que poco a poco y sin quererlo me fui metiendo en el mundo del científico de datos. Desde hace más de 3 años ejerzo como tal, y mi trabajo actualmente está enfocado en la gestión de los recursos hídricos, así como en el análisis de posibles necesidades futuras en este sector y procesos de optimización en dicha gestión.
Excelente, actualmente la disciplina en la que desarrollas tu trabajo se caracteriza por ser una disciplina horizontal, es decir, que tendrá y está teniendo impacto en prácticamente todas las áreas de nuestra vida cotidiana. La unión del Big Data y la Psicología podría ser una de las interrelaciones más prometedoras y enriquecedoras de este siglo XXI. ¿No te parece?
Desde luego que sí. Es curioso que muchas veces se habla de lo que el Big data puede aportar a la disciplina A o B, pero es que en el caso de la psicología yo no me quedaría sólo con lo que el Big data puede aportar sino también con lo que la psicología puede y va a aportar al Big data.
Por ponerte un ejemplo cotidiano con el que espero, los lectores se vean identificados: cualquiera que tenga una cuenta Amazon, habrá notado la presencia de una sección que si no recuerdo mal se llama “Sugerencias para ti”. Estas sugerencias se generan en base a tu historial de compras y de búsquedas. Si esto lo enfocamos desde la perspectiva de la psicología, no deja de ser un análisis de preferencias y de comportamientos de cada individuo. Al final, la psicología como ciencia es una disciplina que hace un gran énfasis en las teorías comportamentales, así como en la investigación empírica.
Tradicionalmente, en investigación, se tienen que definir unos objetivos de estudio y proponer un diseño experimental que eventualmente nos permita satisfacer esos objetivos. Parte importante de este diseño experimental va a ser definir y delimitar los datos que se necesitan, así como su apropiada recolección. Claro, la cantidad de datos que podemos recolectar va a estar limitada por los recursos del estudio, pero a su vez necesitamos que los resultados del estudio sean robustos. Es por ello habitual que el diseño experimental incluya una etapa en la que se realice un análisis del mínimo tamaño necesario de la muestra, así como la composición que ésta ha de tener para que sea representativa de la población que se pretende estudiar. Este proceso es importantísimo porque de las conclusiones que se deriven de un determinado estudio llevarán consigo la implementación de unas medidas.
Con el boom del Big data ocurre el proceso inverso, resulta que en muchas ocasiones no tenemos control sobre qué datos tenemos y/o cómo han sido recolectados. No obstante, disponemos de prácticamente un número ilimitado de datos que se generan cada segundo. Esta altísima disponibilidad presenta oportunidades sin precedentes para comprender y profundizar el comportamiento humano. Es aquí cuando podemos preguntarnos, ¿qué podemos hacer con estos datos? Y, por supuesto, esto ya está siendo aprovechado en números proyectos de investigación en el área de la psicología como, por ejemplo, en el estudio de las dinámicas de grupo. Precisamente, una de las grandes ventajas del Big data y su aplicación a las ciencias del comportamiento es que se puede recibir datos de manera continua sin necesidad de atosigar a los individuos con encuestas que necesitan ser contestadas, es decir, los usuarios no necesitan realizar de manera consciente ningún procedimiento para que los datos sean recogidos y posteriormente tratados y analizados.
Parece ser que una aplicación derivada de esta fusión podría ser el diagnóstico en enfermedades mentales, así como la búsqueda de patrones de personalidad que nos permitan hacer ciertas predicciones desde una perspectiva macro. ¿Crees que esto es posible? ¿Cómo crees que se llevará a cabo y que nos influirán en nuestra vida cotidiana estos avances?
En el caso más concreto de las enfermedades mentales, tenemos el potencial de abrir la puerta a nuevos métodos de prevención, diagnóstico y terapias. Uno de los problemas de las enfermedades mentales precisamente es que no son fáciles de categorizar, comprender o comunicar. En muchas ocasiones, las personas afectadas pueden esperar meses incluso años antes de recibir un diagnóstico apropiado para ellos. A través del uso de grandes bases de datos se pueden identificar patrones que son difíciles de detectar por medio de las técnicas tradicionales y por lo tanto acelerar ese diagnóstico o detectar factores de riesgo de manera mucho más temprana.
Otro de los desafíos de las enfermedades mentales es que el tratamiento en muchas ocasiones no es tan directo como en otras enfermedades físicas. Por ejemplo, un dolor de cabeza puede ser directamente tratado con paracetamol o ibuprofeno. Pero en el caso concreto de ciertas enfermedades mentales puede llevar varios intentos encontrar el tratamiento específico que funciona para una determinada persona. Es decir, es un planteamiento de prueba y error. Una de las expectativas del Big data es que ofrece la posibilidad de encontrar patrones de respuesta a distintos tratamientos de tal forma que se podría predecir qué tratamientos tendrían mayor eficacia para cada caso particular. De hecho, en esta área ya hay numerosos estudios que están en marcha.
Y el impacto en la vida cotidiana pues será importante en un futuro no muy lejano. Actualmente ya estamos viviendo el surgimiento de Apps para dispositivos móviles que serán de aplicación en psicología. Por poner algunos ejemplos, SenseStress es una aplicación que se instala en el móvil y que permite detectar de manera automatizada el estrés basándose únicamente en la voz. Este tipo de aplicación nos puede ayudar a ser más conscientes de las situaciones cotidianas que nos generan estrés y, por tanto, nos puede ayudar a lidiar de manera más efectiva con el mismo. Otra App interesante en desarrollo es MoodRhythm que permite monitorizar el sueño. Esto es especialmente importante en personas con trastornos del sueño, y algunos trastornos del estado del ánimo donde la calidad y regularidad del sueño juega un papel muy relevante.
Estas son aplicaciones de reciente o actual desarrollo, pero ya hay muchas otras que han entrado a formar parte de nuestra rutina. Por ejemplo, en el ámbito femenino, ya está totalmente normalizado el uso de aplicaciones para monitorizar la menstruación. Estas aplicaciones van haciendo análisis con tus propios datos y cuantos más datos se introduzcan, más precisos son los resultados. En base a estos análisis la app te va notificando las anomalías que detecta y que pueden ayudar a identificar problemas de manera temprana. Estas predicciones no sólo se limitan a eventos como el inicio o la duración de la menstruación o días de ovulación, sino que también predicen los distintos estados de ánimo en base a los patrones analizados previamente.
Cuando hablamos de los procesos de recogida de datos, de su posterior tratamiento y análisis parece que nos encontramos con ciertas reticencias por parte de algunos sectores basadas en prejuicios, estereotipos y miedos, relativos al control que los “recolectores” pueden estar haciendo. ¿Debemos preocuparnos a este respecto?
Este de hecho es un tema muy interesante. El Big Data es una disciplina horizontal como bien comentabas que puede ser aplicada a prácticamente todos los sectores de una u otra manera, obteniendo beneficios importantes tal y como comentábamos en la pregunta anterior. No obstante, no está exento de amenazas, existiendo una base real para que estos avances nos inquieten. Posiblemente debido a estas amenazas, los avances tecnológicos en el Big data, podrían verse ralentizados.
¿Cuáles son las amenazas?
¿Cuáles son las amenazas? Bueno pues la primera y posiblemente una de la más importantes es el tema de los datos personales. Ya habrás oído en numerosas ocasiones la frase “Si no pagas por un producto el producto eres tú” en lo que respecta a los datos personales. Ante esto, muchas veces me decía a mí misma: “Bueno, vale tienen mis datos, pero la verdad es que mis datos no son muy interesantes, así que no veo cómo esto me puede perjudicar”. Al final lo que se ve es que los anuncios que te salen en el buscador son servicios o productos que realmente te interesan más, entonces “¿qué más da?”. Seguramente, algunos lectores se sientan identificados, sin embargo, esto va mucho más allá de los anuncios personalizados.
Me explico de manera sucinta: uno de los riegos en esta recogida masiva de datos lo constituyen los perfilados. Los perfilados utilizan información que hemos generado y cedido por ejemplo a través del uso apps en el móvil y pueden servir para hacer análisis predictivos que permitan tomar decisiones sobre la adecuación de un usuario para, por ejemplo, acceder a un trabajo, un préstamo o una tarjeta de crédito. Otro ejemplo, pueden ser los datos generados por las apps de salud, o lo wearables, dispositivos que pueden monitorizar nuestra actividad diaria, nuestros datos cardiacos como pulsaciones, presión sanguínea o calidad del sueño, que pueden ser de interés a compañías aseguradoras del ámbito sanitario. Esto se conoce como discriminación predictiva y puede implicar la toma decisiones que afectan negativamente a un usuario.
A esto debemos añadirle el hecho de que en muchas ocasiones estos algoritmos ¡están sesgados! ¿Por qué? Sencillamente, porque los propios datos están sesgados, porque ya de por sí pueden reflejar desigualdades que ya existen en la sociedad. Cuando damos estos datos a un algoritmo, aprende los patrones, tanto si nos gustan como si no. Y de hecho, los repite. Se hace por tanto necesario que las personas que tratan los datos y que generan estos algoritmos tengan una comprensión lo más profunda posible del campo en el que desarrollan su actividad. No sólo es importante entender los datos utilizados para entrenar los algoritmos, sino también de los no utilizados, es decir, los que faltan. ¡Y claro, esto muchas veces es muy complicado! Ya no se trata de que alguien quiera defraudar, ocultar o simular, que por supuesto, habrá gente que anteponga sus intereses a los colectivos y realice este tipo de conductas, es que, además, en la mayoría de las ocasiones el problema está en que nosotros mismos no somos conscientes de dichos sesgos. Si se sabe que hay un sesgo en los datos entonces se pueden tomar medidas para corregirlo, pero cuando no se sabe que lo hay, aparece el problema.
Un ejemplo real, una conocida empresa puso en marcha el desarrollo de un programa informático que permitiera agilizar el proceso de reclutamiento de personal para encontrar talentos. El algoritmo asignaba puntuaciones a los currículos enviados, y los 5 con mayor puntuación eran seleccionados. ¿Cómo conseguía esto el algoritmo? Se utilizaron como datos de entrenamientos currículos enviados en los últimos 10 años y utilizaba los datos de candidatos pasados exitosos para encontrar patrones y similitudes. Un año más tarde, los ingenieros se dieron cuenta que el algoritmo discriminaba negativamente a las mujeres ¿Por qué? Sencillamente, porque los datos usados para entrenar el algoritmo eran predominantemente de hombres. El algoritmo aprendió el sesgo y lo replico, excluyendo currículos que contenían la palabra “Mujer” o que había ido a colegios femeninos. Como vemos aquí el problema radicó en que no se fue consciente de la existencia de dicho sesgo. Una vez fue detectado, los ingenieros introdujeron las correcciones apropiadas para que el algoritmo dejase de replicar el indeseado sesgo.
Se observa que el problema de los perfilados tiene mucha tela. Pero además es que estos perfiles pueden también incluir preferencias políticas, tendencias sexuales, religiosas, etc. Quizá, esto no supone una preocupación “top 10” de las personas en ciertos países, como España, pero es que el uso inapropiado de esta información en ciertos países supone un peligro MUY real.
Otro aspecto, que a mí personalmente, me parece que puede ser muy peligroso es el uso de estos datos en campañas de manipulación de masas. La información de nuestro perfil puede ser utilizada no sólo para generar anuncios personalizados sino también, otro tipo de información como la propaganda electoral dirigida a grupos o individuos concretos. Recientemente se ha visto un aumento de las conocidas fake news, perfiles ideológicos falsos, que son generados mediante inteligencia artificial y que se destinan a generar desinformación con el objetivo de manipular la opinión publica. En los últimos años además se ha visto un auge de estas campañas de desinformación y numerosos escándalos han saltado a los tabloides.
Como puedes observar, el tema de la protección de los datos personales es un pilar clave para el desarrollo del Big Data. Por suerte, se están empezando a implementar las medidas necesarias para defender y asegurar la protección de datos personales en el contexto del Big Data. Sin ir más lejos en mayo de 2018 entro en vigor el Reglamento General de Protección de Datos (más conocido como RGPD) que además es norma “erga omnes” es decir, es jerárquicamente superior a las normativas nacionales. Este reglamento está destinado a dar a los ciudadanos europeos el control sobre cómo y para qué fines se tratan sus datos personales. Es un Reglamento que incorpora obligaciones y derechos que son de lo más vanguardista. Por poner un ejemplo, todas las empresas que hagan algún tratamiento de datos personales de ciudadanos europeos están en la obligación de cumplir con el Reglamento independientemente de en qué lugar se encuentre dicha empresa. También se redefinen conceptos interesantes como el consentimiento, entendiéndose por tal, la manifestación de voluntad libre, específica, informada e inequívoca por la que una persona acepta, ya sea mediante una declaración o una clara acción implícita, el tratamiento de sus datos personales. Es decir, se elimina de raíz el consentimiento tácito del estilo “Si en el plazo de un mes no obtenemos respuesta, entendemos que es un sí”. Se limita el uso de datos personales a los fines estrictamente relacionados con el cumplimiento de un contrato o servicio. El uso de estos datos para cualquier otro fin está prohibido si no se cumplen ciertos supuestos.
También creo que el auge de las fake news va a ayudarnos a fomentar que desarrollemos nuestra capacidad crítica. Que no demos por sentado la autenticidad de la primera noticia que abrimos en el móvil, sino que nos informemos y contrastemos dicha información. Creo que este es un fenómeno que yo, por lo menos, ya estoy empezando a percibir con más frecuencia, tanto en mí misma como en las personas que me rodean. Especialmente, durante el confinamiento, hemos podido apreciar cómo Whatsapp ha sido uno de los mayores canales de difusión de este tipo de prácticas (fake news) mediante el uso de las cadenas. Yo he recibido muchísimas, pero también he recibido mensajes del tipo “te mandé el otro día esta noticia, acabo de enterarme que es falsa”. En definitiva, empieza a tomar conciencia real del impacto que puede tener esta desinformación y la responsabilidad que tenemos cada uno cuando contribuimos a la difusión de bulos. Yo creo que no hay mejor oportunidad para apreciar el lado positivo de una práctica tan potencialmente peligrosa.
También mencionaba antes como los algoritmos repiten los sesgos de los datos. Esto puede ser peligroso si es usado de manera inapropiada como ya comentaba antes, pero también estos sesgos pueden usarse para poner de manifiesto las injusticias o desigualdades sociales que hay y que muchas veces no queremos ver o sencillamente estamos tan acostumbrados a verlas que somos incapaces de reaccionar. Sólo cuando uno es consciente del problema puede empezar a poner soluciones al mismo.
Estupendo, nos sentimos muy afortunados de poder escuchar un mensaje así de esperanzador por tu parte. Vayamos ahora al tema de la aplicación de algunos conceptos clave en áreas como la educación y uno de los temas clave en Psicología: el aprendizaje. Conceptos como machine learning, deep learning, inteligencia artificial… ¿Qué aplicaciones crees que podrían tener estos conceptos por ejemplo en la mejora del aprendizaje en niños y adolescentes? ¿Y en adultos?
Desde luego para la enseñanza personalizada tiene mucho interés. Es decir, una enseñanza que se adapte a las necesidades del alumno. Quizás en matemáticas un alumno particularmente tenga una capacidad muy alta y puede ir a un ritmo mayor que la media y sin embargo en otra materia que requiera un mayor uso de competencias lingüísticas, quizá este alumno necesite más tiempo o un tipo de enseñanza con otras características e incluso, desde otras orientaciones teóricas.
Creo que, el Big data podría jugar un papel clave en la identificación de necesidades de aprendizaje específicas. Existen bastantes ejemplos de aplicaciones de móviles (por ejemplo, de aprendizaje de idiomas) que utilizan en cierta medida estos planteamientos.
¿Algún consejo para las futuras generaciones?
Bueno en este ámbito yo daría tanto un consejo a las futuras generaciones como a las actuales. El sector del Big data junto con el desarrollo tecnológico, se está desarrollado a velocidades de vértigo. Prácticamente, vemos como día a día vamos incorporando más de estas tecnologías a nuestras vidas. Incluso los sectores más reticentes, son seducidos por estas tendencias de uno u otro modo.
Desde mi punto de vista, estos avances, están trayendo muchas cosas positivas tanto a nivel individual como a nivel social. Pero también trae consigo riesgos, y si queremos disfrutar plenamente y con seguridad de las oportunidades que nos brinda, necesitamos aprender nuevos conceptos y procesos, por ejemplo, comprender quién tiene y como se tratan nuestros datos personales. Algo así como una “cultura básica relativa a los datos y su uso”.
En resumen, el ámbito del Big data tiene muchísimas posibilidades, potencial de traer muchas cosas positivas a nivel social e individual, en todo tipo de ámbitos: salud, medio ambiente, desarrollo de alternativas sostenibles para mitigar el cambio climático, creación de puestos de trabajo, más control sobre la salud, mejoramiento de los métodos de aprendizaje en niños y adultos, y sobre todo ayudar a fomentar la capacidad crítica y de cuestionar las cosas.
Muchas gracias Cristina, por compartir y acercar este ámbito tan interesante a las personas ajenas a él. Somos conscientes de la dificultad que entraña el explicar de una manera sencilla y accesible para todos, conceptos tan abstractos como los expuestos aquí. Como director de este proyecto quiero agradecerte personalmente la implicación, el tiempo y el esfuerzo invertido en hacer que una disciplina que tiene tanto que decir, pueda llegar a todos los hogares. Ojalá podamos contar contigo en muchas otras ocasiones en el futuro. Muchas gracias de nuevo, ha sido un honor y un placer escucharte.
Entrevista realizada para el Proyecto Psicoda por Javier Barragán, 1 de julio de 2020