Ratitas vs. Demonios

 Mario H. Vázquez

Cuando pensamos en combatir seres de terror pueden venir a nosotros imágenes de películas o evocaciones de libros que hemos leído, pero desde el 2009 un juego nos introdujo la noción de que las plantas sirven en caso de ataques de hordas de zombies, entonces, si las plantas pueden ayudarnos contra los zombies, no es descabellado pensar que unas simples ratitas puedan hacerle frente a unos demonios, para ser más específico los demonios de DOOM.

A finales del año pasado publicamos un post sobre un investigador que entrenó ratas para jugar DOOM 2 en Realidad Virtual, consiguiendo que se movieran y dispararan a los enemigos que aparecían en la pantalla y si bien esto es muy interesante (ya quisiera ver a un perro jugar Call of Duty o Ghost of Tsushima) hay mucha ciencia y detalles específicos detrás de este suceso, por eso en esta ocasión intentaré desmenuzar de la forma más accesible el proceso que se llevo acabo para hacer que estas ratitas comenzaran a jugar DOOM.

(Este post se centrará en dos posts del sitio de Viktor Tóth, citados al final)

Romero durante una sesión de entrenamiento en DOOM


Un poco sobre el Condicionamiento

Para empezar a explicar el proceso que se usó con las ratas, tenemos que revisar las bases del condicionamiento, esto porque esta tarea no es algo común dentro del repertorio conductual de las ratas (nunca las he visto jugar algún videojuego, aunque si vi a una cocinar una vez jeje). 

Iván Pávlov (1849-1936) padre del condicionamiento

Los primeros estudios de condicionamiento con animales fueron realizados por Iván Pavlov, en 1902 el fisiólogo ruso decidió investigar la salivación en los perros al ser alimentados, y se dió cuenta que los perros comenzaban a salivar desde que escuchaban a las personas que los alimentaban acercarse, desde ahí surgió la idea de que un estímulo ajeno a uno innato de un animal, podía incitar una respuesta innata en el mismo animal. Pavlov continuó su estudio con los perros, hasta llegar al punto en el que los perros salivaban con tan solo escuchar el sonido de un metrónomo que había sido presentado antes de que los perros recibieran alimento (durante un periodo de condicionamiento). A esto se le conoce como "Condicionamiento Clásico".


 
Edward Thorndike (1874-1949) desarrollador de la teoría del Conexionismo y B.F. Skinner (1904-1990) pionero del Conductismo Radical

Posteriormente el trabajo de Edward Thorndike profundizaría más en el concepto del aprendizaje animal, lo que derivaría a su vez, en la teoría del Conexionismo y un entendimiento mucho más profundo del aprendizaje, no solamente de especies no humanas. Junto con el trabajo de Thorndike, B.F. Skinner trabajó el Condicionamiento Operante, bajo esta variante del condicionamiento las conductas que se desean reforzar son seguidas por un estímulo positivo y las que se desean extinguir son seguidas por un estímulo negativo (cuando se usan ratas bajo este esquema se les proporciona comida como refuerzo positivo y una pequeña descarga eléctrica en el piso de su caja). Estos estudios fueron definiendo más lo que se conocía del aprendizaje, desde las formas múltiples de reforzamiento, modificación de conductas y hasta su implicación en el campo de la educación.


De roedores y DOOM

Pasando a la parte central de este escrito, hablemos un poco de lo que el neuroingeniero Viktor Tóth realizó con 3 ratitas Long Evans de 8 semanas de edad, las cuales entrenó durante 6 semanas por las noches, dedicando una hora a cada rata. Para iniciar cualquier experimento/entrenamiento los animales deben acostumbrarse al contacto humano, pues obviamente ninguna rata va a actuar como lo haría normalmente con un ser que acaba de conocer e intenta manipularla tanto.


Las 3 ratas del experimento: Romero, Carmack y Tom

Pasadas dos semanas de aclimatación, el investigador usó una semana adicional para lograr que las ratas se quedaran lo más quietas posible para ponerles las pecheras / arneses que se usaron para mantenerlas sujetas y sobre una esfera que serviría para entrenar el movimiento, para acostumbrarlas a la esfera se utilizó otra semana, en esta fase el neuroingeniero usó comida para bebé administrada en un pequeño compartimiento sobre la esfera, al usar comida para bebé se utilizó el beneficio adicional del olor, una vez que las ratas se aclimataron a la esfera, la comida para bebé se sustituyó por agua azucarada.

Fotografía del área de entrenamiento, con la pantalla, la esfera de registro de movimiento, el brazo de sujeción con el botón de disparo y la computadora que iniciaba el protocolo.

Para un entorno que requiere movimiento el uso del arnés y la esfera sobre la cuál las ratas se mueven es sumamente útil, permite que los animales se muevan de una forma más "libre" y por las características del movimiento en el juego el uso del registro de movimiento usando la esfera es la mejor opción. 

En experimentos de este tipo se busca que el roedor se adapte al elemento que usará para moverse, en ocasiones son rodillos o en este caso una esfera con registro de movimiento en 360 grados.

Una vez que las ratitas se habituaron a estar sobre la esfera, vino la parte más interesante, Tóth pasó 11 días entrenando a las ratitas al entorno virtual de DOOM, en esta parte del experimento hay que indicar unas cuantas cosas. Primero en el aprendizaje espacial, es común que en experimentos con roedores se utilicen laberintos para investigar memorización de rutas, planeación y estrategias de resolución, ya sean en formato físico o en realidad virtual.


Ejemplos de laberintos citados por Viktor Tóth en su primer artículo explicando su uso en estudios del comportamiento con roedores. Adicionalmente se muestra una versión más simpe de un mapa de DOOM.

Este experimento plantea una situación inicial de este tipo para los roedores, pues aunque le pongamos el nombre DOOM 2 el entorno digital de movimiento, es similar al usado en estudios de desplazamiento en laberintos digitales (solo digamos que decoramos de forma diferente las paredes...con un poco de sangrita jaja) y adicionalmente agregamos puertas en los pasillos, las cuáles para el caso de DOOM requieren únicamente que la rata "choque" con ellas para abrirlas, y se refuerza el uso de las puertas proporcionando el agua azucarada como reforzador de la conducta de "abrir la puerta".

Ejemplo de un pasillo simplificado de DOOM para su uso condicionando una rata. Indicando con verde la posición de inicio, con rojo la ubicación de un enemigo y en el extremo derecho la puerta de salida.

Ya que las ratas se mueven en el entorno y abren puertas, se introducen los enemigos para que la rata ahora dispare a los enemigos cuando aparezcan frente a ella, al igual que con la puerta se refuerza una conducta especial que hace que las ratas disparen, para este experimento en específico el arnés que tienen las ratas está sujeto a un brazo de aluminio, que funciona como una palanca que activa un botón cuando el animal se incorpora un poco, para lograr que esto suceda cada que se aparezca un enemigo, el brazo cuenta con un mecanismo que realiza esta acción por la rata, estos pequeños apoyos son usados para que la rata aprenda que el movimiento que en un inicio fue "forzada" a hacer conlleva un beneficio (agua azucarada) y termina con la acción de disparar a un enemigo en la pantalla. Pasados algunos ensayos las ratas asocian la aparición de un enemigo con obtener la recompensa al dispararle.

Acercamiento al brazo metálico con el arnés y gancho que sujetan a las ratas. en la parte superior izquierda se indica la ubicación del botón que inicia el disparo.


Esto puede sonar muy simple, pero requiere muchas sesiones de repetición y reforzamiento para que al final la rata pueda disparar a un enemigo que aparece en la pantalla.


¿Ratitas a streaming?

De las 3 ratas usadas en el experimento una (llamada Romero) sobresalió más en general que otras y es la que el investigador muestra como ejemplo en sus videos de Youtube. En el artículo de la realización del experimento el neuroingeniero usa únicamente el condicinamiento, aunque en un artículo anterior menciona todo el protocolo que usaría, incluyendo la implantación de un equipo de codificación y estimulación de señales cerebrales en la rata, esto para que la rata no reciba únicamente un reforzador en forma de agua azucarada o comida y además se proporcione un "mapeo" adecuado de las áreas utilizadas por la rata para la ejecución de esta tarea. 

Video de ejemplo de Romero durante una sesión de "juego" de DOOM (del canal de Viktor Tóth)

Esta variante aún más compleja del protocolo requiere de una inversión más grande y es una de las razones que permitieron plantear la idea de que se comenzara a hacer streaming de las ratas jugando y conseguir donaciones para financiar el protocolo complejo, esta alternativa aún se estaba considerando pues como se ve en los videos del sitio de Tóth las ratas aún no alcanzaban una etapa de juego completamente fluida y natural, que es una de las misiones principales del protocolo.


Muestra de una sesión de entrenamiento de movimiento en DOOM (del canal de Viktor Tóth)

Al final del segundo artículo de Tóth se muestran los resultados generales y él nos comenta más del tardado proceso que fue llevar a las ratas al punto de desplazarse por un entorno virtual (en este caso las ratas únicamente caminaban en línea recta y abrían puertas) y realizar un disparo a un enemigo, teniendo esto en cuenta y con un tiempo limitado Tóth dejó el protocolo hasta esa fase. Adicionalmente Tóth nos menciona que lo demandante de la presencia del investigador, hacia que la opción de un protocolo más "independiente" tampoco fuera viable.

Este intento de Tóth por enseñar a unas ratas a jugar DOOM abre la puerta a pensar en alternativas de realidad virtual como medios para realizar investigaciones y de esta forma, en palabras de Tóth, hacer que los problemas de ciertas investigaciones por conseguir equipos sofisticados y costosos cambien a ser cuestiones de desarrollo de un software (que en mi experiencia puede ser una misión mucho más fácil).

¿Creen que algún día lleguemos a ver a una ratita matando demonios y haciendo streams? 👿💀🐀🐁



Referencias

Tóth V. (2020) A Neuroengineer's guide on training rats to play DOOM. Recuperado el 3 de Enero de 2022. Mindsoft. https://medium.com/mindsoft/rats-play-doom-eb0d9c691547

Tóth V. (2021) Rats in Doom VR. Recuperado el 5 de Enero de 2022. Mindsoft. https://medium.com/mindsoft/rats-in-doom-eb6c52c73aca

Comentarios

Entradas populares