Ratitas vs. Demonios
Mario H. Vázquez
Cuando pensamos en combatir seres de terror pueden venir a nosotros imágenes de películas o evocaciones de libros que hemos leído, pero desde el 2009 un juego nos introdujo la noción de que las plantas sirven en caso de ataques de hordas de zombies, entonces, si las plantas pueden ayudarnos contra los zombies, no es descabellado pensar que unas simples ratitas puedan hacerle frente a unos demonios, para ser más específico los demonios de DOOM.
A finales del año pasado publicamos un post sobre un investigador que entrenó ratas para jugar DOOM 2 en Realidad Virtual, consiguiendo que se movieran y dispararan a los enemigos que aparecían en la pantalla y si bien esto es muy interesante (ya quisiera ver a un perro jugar Call of Duty o Ghost of Tsushima) hay mucha ciencia y detalles específicos detrás de este suceso, por eso en esta ocasión intentaré desmenuzar de la forma más accesible el proceso que se llevo acabo para hacer que estas ratitas comenzaran a jugar DOOM.
(Este post se centrará en dos posts del sitio de Viktor Tóth, citados al final)
Un poco sobre el Condicionamiento
Para empezar a explicar el proceso que se usó con las ratas, tenemos que revisar las bases del condicionamiento, esto porque esta tarea no es algo común dentro del repertorio conductual de las ratas (nunca las he visto jugar algún videojuego, aunque si vi a una cocinar una vez jeje).
Los primeros estudios de condicionamiento con animales fueron realizados por Iván Pavlov, en 1902 el fisiólogo ruso decidió investigar la salivación en los perros al ser alimentados, y se dió cuenta que los perros comenzaban a salivar desde que escuchaban a las personas que los alimentaban acercarse, desde ahí surgió la idea de que un estímulo ajeno a uno innato de un animal, podía incitar una respuesta innata en el mismo animal. Pavlov continuó su estudio con los perros, hasta llegar al punto en el que los perros salivaban con tan solo escuchar el sonido de un metrónomo que había sido presentado antes de que los perros recibieran alimento (durante un periodo de condicionamiento). A esto se le conoce como "Condicionamiento Clásico".
Posteriormente el trabajo de Edward Thorndike profundizaría más en el concepto del aprendizaje animal, lo que derivaría a su vez, en la teoría del Conexionismo y un entendimiento mucho más profundo del aprendizaje, no solamente de especies no humanas. Junto con el trabajo de Thorndike, B.F. Skinner trabajó el Condicionamiento Operante, bajo esta variante del condicionamiento las conductas que se desean reforzar son seguidas por un estímulo positivo y las que se desean extinguir son seguidas por un estímulo negativo (cuando se usan ratas bajo este esquema se les proporciona comida como refuerzo positivo y una pequeña descarga eléctrica en el piso de su caja). Estos estudios fueron definiendo más lo que se conocía del aprendizaje, desde las formas múltiples de reforzamiento, modificación de conductas y hasta su implicación en el campo de la educación.
De roedores y DOOM
Pasando a la parte central de este escrito, hablemos un poco de lo que el neuroingeniero Viktor Tóth realizó con 3 ratitas Long Evans de 8 semanas de edad, las cuales entrenó durante 6 semanas por las noches, dedicando una hora a cada rata. Para iniciar cualquier experimento/entrenamiento los animales deben acostumbrarse al contacto humano, pues obviamente ninguna rata va a actuar como lo haría normalmente con un ser que acaba de conocer e intenta manipularla tanto.
Pasadas dos semanas de aclimatación, el investigador usó una semana adicional para lograr que las ratas se quedaran lo más quietas posible para ponerles las pecheras / arneses que se usaron para mantenerlas sujetas y sobre una esfera que serviría para entrenar el movimiento, para acostumbrarlas a la esfera se utilizó otra semana, en esta fase el neuroingeniero usó comida para bebé administrada en un pequeño compartimiento sobre la esfera, al usar comida para bebé se utilizó el beneficio adicional del olor, una vez que las ratas se aclimataron a la esfera, la comida para bebé se sustituyó por agua azucarada.
Para un entorno que requiere movimiento el uso del arnés y la esfera sobre la cuál las ratas se mueven es sumamente útil, permite que los animales se muevan de una forma más "libre" y por las características del movimiento en el juego el uso del registro de movimiento usando la esfera es la mejor opción.
En experimentos de este tipo se busca que el roedor se adapte al elemento que usará para moverse, en ocasiones son rodillos o en este caso una esfera con registro de movimiento en 360 grados.
Una vez que las ratitas se habituaron a estar sobre la esfera, vino la parte más interesante, Tóth pasó 11 días entrenando a las ratitas al entorno virtual de DOOM, en esta parte del experimento hay que indicar unas cuantas cosas. Primero en el aprendizaje espacial, es común que en experimentos con roedores se utilicen laberintos para investigar memorización de rutas, planeación y estrategias de resolución, ya sean en formato físico o en realidad virtual.
Este experimento plantea una situación inicial de este tipo para los roedores, pues aunque le pongamos el nombre DOOM 2 el entorno digital de movimiento, es similar al usado en estudios de desplazamiento en laberintos digitales (solo digamos que decoramos de forma diferente las paredes...con un poco de sangrita jaja) y adicionalmente agregamos puertas en los pasillos, las cuáles para el caso de DOOM requieren únicamente que la rata "choque" con ellas para abrirlas, y se refuerza el uso de las puertas proporcionando el agua azucarada como reforzador de la conducta de "abrir la puerta".
Ya que las ratas se mueven en el entorno y abren puertas, se introducen los enemigos para que la rata ahora dispare a los enemigos cuando aparezcan frente a ella, al igual que con la puerta se refuerza una conducta especial que hace que las ratas disparen, para este experimento en específico el arnés que tienen las ratas está sujeto a un brazo de aluminio, que funciona como una palanca que activa un botón cuando el animal se incorpora un poco, para lograr que esto suceda cada que se aparezca un enemigo, el brazo cuenta con un mecanismo que realiza esta acción por la rata, estos pequeños apoyos son usados para que la rata aprenda que el movimiento que en un inicio fue "forzada" a hacer conlleva un beneficio (agua azucarada) y termina con la acción de disparar a un enemigo en la pantalla. Pasados algunos ensayos las ratas asocian la aparición de un enemigo con obtener la recompensa al dispararle.
Esto puede sonar muy simple, pero requiere muchas sesiones de repetición y reforzamiento para que al final la rata pueda disparar a un enemigo que aparece en la pantalla.
¿Ratitas a streaming?
De las 3 ratas usadas en el experimento una (llamada Romero) sobresalió más en general que otras y es la que el investigador muestra como ejemplo en sus videos de Youtube. En el artículo de la realización del experimento el neuroingeniero usa únicamente el condicinamiento, aunque en un artículo anterior menciona todo el protocolo que usaría, incluyendo la implantación de un equipo de codificación y estimulación de señales cerebrales en la rata, esto para que la rata no reciba únicamente un reforzador en forma de agua azucarada o comida y además se proporcione un "mapeo" adecuado de las áreas utilizadas por la rata para la ejecución de esta tarea.
Esta variante aún más compleja del protocolo requiere de una inversión más grande y es una de las razones que permitieron plantear la idea de que se comenzara a hacer streaming de las ratas jugando y conseguir donaciones para financiar el protocolo complejo, esta alternativa aún se estaba considerando pues como se ve en los videos del sitio de Tóth las ratas aún no alcanzaban una etapa de juego completamente fluida y natural, que es una de las misiones principales del protocolo.
Al final del segundo artículo de Tóth se muestran los resultados generales y él nos comenta más del tardado proceso que fue llevar a las ratas al punto de desplazarse por un entorno virtual (en este caso las ratas únicamente caminaban en línea recta y abrían puertas) y realizar un disparo a un enemigo, teniendo esto en cuenta y con un tiempo limitado Tóth dejó el protocolo hasta esa fase. Adicionalmente Tóth nos menciona que lo demandante de la presencia del investigador, hacia que la opción de un protocolo más "independiente" tampoco fuera viable.
Este intento de Tóth por enseñar a unas ratas a jugar DOOM abre la puerta a pensar en alternativas de realidad virtual como medios para realizar investigaciones y de esta forma, en palabras de Tóth, hacer que los problemas de ciertas investigaciones por conseguir equipos sofisticados y costosos cambien a ser cuestiones de desarrollo de un software (que en mi experiencia puede ser una misión mucho más fácil).
¿Creen que algún día lleguemos a ver a una ratita matando demonios y haciendo streams? 👿💀🐀🐁
Referencias
Tóth V. (2020) A Neuroengineer's guide on training rats to play DOOM. Recuperado el 3 de Enero de 2022. Mindsoft. https://medium.com/mindsoft/rats-play-doom-eb0d9c691547
Tóth V. (2021) Rats in Doom VR. Recuperado el 5 de Enero de 2022. Mindsoft. https://medium.com/mindsoft/rats-in-doom-eb6c52c73aca
Comentarios
Publicar un comentario