IA y APP INVENTOR
2. Un marco para la enseñanza de la Inteligencia Artificial
2.4. 4 Aprendizaje (I)
4 Aprendizaje (I)
3ª idea fundamental: Los ordenadores pueden aprender a partir de datos.
Los algoritmos de aprendizaje automático permiten a las computadoras crear sus propias representaciones utilizando datos de entrenamiento.
Muchas áreas de la IA han progresado significativamente en los últimos años gracias a la tecnología de aprendizaje automático, pero para que el enfoque tenga éxito se necesitan enormes cantidades de datos. Por ejemplo, el Open Image Dataset V4, que se utiliza para entrenar muchos sistemas de reconocimiento de imágenes, contiene 9 millones de imágenes de entrenamiento y 30 millones de etiquetas o categorías clasificables. Para poder procesar esta cantidad tan grande de datos se requiere contar con una potencia informática que no estaba disponible hace unos años. Y este es uno de los problemas que tienen los sistemas de aprendizaje automático, ya que para producir resultados precisos suelen requerir ser entrenados con muchos ejemplos. Y la recolección y preparación de estos ejemplos de entrenamiento suele ser muy costosa.
Juguemos un poco con algunos sistemas de IA que se basan en aprendizaje automático para que veamos de lo que son capaces. Además de Quickdraw, que ya conocemos, os proponemos que juguéis con los siguientes clasificadores que han sido entrenados usando aprendizaje automático:
Sentimientos: https://www.uclassify.com/browse/uclassify/sentiment/es
Este clasificador determina si un texto es positivo o negativo. Puede clasificar tanto frases cortas o párrafos más largos que escribas tú mismo, o bien le puedes pasar la url de Tweets, estados de Facebook, publicaciones de blog, reseñas de productos, etc. para que las clasifique y nos diga si es un texto positivo o negativo. Para entrenar el sistema se han usado 2,8 millones de documentos.Género: https://www.uclassify.com/browse/uclassify/genderanalyzer_v5/es
Este clasificador intenta averiguar si un texto ha sido escrito por un hombre o una mujer. En su entrenamiento se han usado 11.000 artículos de blogs (5.500 blogs escritos por mujeres y 5.500 por hombres). Si se usan textos largos ofrece mejores resultados.
Como el aprendizaje automático se basa precisamente en aprender a partir de ejemplos, es muy importante que durante la recopilación y preparación de los datos de entrenamiento se tomen medidas para tratar de evitar al máximo la introducción de sesgos, puesto que en caso de que se introduzcan el sistema va a reproducir estos sesgos.
Para entender cómo funcionan los sesgos de los sistemas de IA podemos jugar con un sistema de traducción automática como el de Google (https://translate.google.com/). Probemos por ejemplo a traducir la frase “the teacher is great” de inglés a español.
¿Cómo traduce Google “teacher”, como “profesora” o como “profesor”? ¿Por qué lo traduce por “profesor” y no por “profesora” cuando en España el número de profesoras es mayor que el de profesores en todos los niveles educativos? ¿Acaso es que el traductor de Google es machista?
Evidentemente el sistema de IA no ha sido construido a propósito para ser machista, pero debe haber sido entrenado con textos, quizás antiguos, en los que aparecían más profesores que profesoras, y por eso lo traduce de este modo.
Este tipo de cuestiones de sesgos que pueden aparecer en los datos de entrenamiento son muy importantes, como discutiremos en la sección de Impacto de la IA. Y si no, que se lo pregunten a Microsoft y a su chatbot Tay que, tras unas horas en funcionamiento y aprendiendo a través de conversaciones con usuarios en Twitter, comenzó a hacer comentarios xenófobos y bárbaros, de manera que tuvo que ser desconectado. Y si la historia de Tay te ha llamado la atención, no te pierdas este artículo otro artículo que presenta más ejemplos de escándalos mediáticos de sistemas de IA.
Para saber más | |
|