2. Un marco para la enseñanza de la Inteligencia Artificial

2.2. 2 Percepción

2 Percepción

1ª idea fundamental: Los ordenadores perciben el mundo utilizando sensores

La percepción es el proceso de extraer información a partir de señales sensoriales. La capacidad que tienen los ordenadores para "ver" y "escuchar" lo suficientemente bien como para resultar de utilidad a las personas es uno de los logros más importantes de la IA. Para ello, los ordenadores hacen uso de diferentes tipos de sensores, como micrófonos, cámaras, medidores de distancia, de luminosidad o temperatura, entre otros muchos.

Sin embargo, es importante comprender que, por ejemplo, la percepción de un ordenador del lenguaje hablado o de la imagen visual, requiere contar con un amplio conocimiento del dominio. Así, para entender una frase hablada no solo se deben conocer los sonidos del idioma sino también su vocabulario, gramática y patrones de uso. Y, mientras el ordenador no disponga de tal conocimiento, el reconocimiento de voz realizado por una máquina no puede acercarse a la precisión del nivel humano. Sin embargo, ya se han alcanzado niveles altos de precisión en otros dominios, y todo parece indicar que los sistemas van a mejorar mucho en los próximos años.

Para ilustrar el modo en que las máquinas “ven”, se puede visualizar este vídeo de un coche autónomo, en el que es posible observar en detalle las imágenes captadas por las cámaras del coche en cada momento, y cómo el sistema de IA de reconocimiento de imágenes va detectando e identificando las diferentes señales, coches, peatones, etc. con las que se cruza.

Propuesta: actividad desenchufada

¿Cómo conduce un coche autónomo? 

Con esta actividad se pretende ilustrar cómo los sistemas de IA hacen uso de sensores para captar señales del mundo y tomar decisiones en consecuencia. Para ello, un grupo de tres estudiantes van a simular ser un coche autónomo: uno de ellos será el sistema central de IA que recibe las señales de los sensores y toma decisiones, los otros dos serán sensores, uno la cámara izquierda y otro la cámara derecha.
Para comenzar se tapan los ojos y si es posible, los oídos, del “conductor”, que solamente podrá tomar decisiones en función de las señales que le lleguen de sus dos “sensores”.
A continuación se dibuja una carretera en el suelo con tiza, que comenzará con una recta y tendrá luego curvas a derecha o a izquierda intercaladas con otras rectas.
Tras colocar al “conductor” en la recta inicial, éste comienza a andar. Los dos “sensores” tienen que tratar de guiarlo por el camino, tocando al “conductor” en el hombro de su lado para avisarle de que, si sigue recto, se va a salir de la carretera por el lado correspondiente. De esta manera el “conductor” puede girar para el lado contrario.
 ¿Llegarán sanos y salvos a su destino? sonrisa



Como ejemplo de una máquina que reconoce frases habladas por una persona, puede usarse “Web Speech API Demonstration” (es necesario utilizar el navegador Google Chrome):


Tras seleccionar en la parte inferior de la página el idioma en el que vas a hablar, tan solo hay que pulsar sobre el botón del micrófono de la parte superior derecha, y ya puedes comenzar a hablar. En la caja de texto se mostrará por escrito la frase que el ordenador ha entendido al escucharte hablar.