lunes, 1 de noviembre de 2010

Limitaciones del perceptron simple

Si alguno se dio cuenta, en el código de ejemplo anterior no es posible replicar todas las funciones lógicas.
De hecho, examinando la formula de salida del perceptron, por simplicidad a dos entradas:


Podemos ver que si ponemos el limite de la salida a 0, osease, justo al punto en el cual cambia de valor la salida se obtiene una ecuación del tipo:


Que es la ecuación de una recta genérica. Es decir, lo que este arriba de esa recta cuenta como una salida y lo que este abajo cuenta como otra salida ( digamos para el ejemplo 0 y 1 ).


Como se puede ver en las figuras, la función OR puede ser separada por una linea, teniendo los ejes como las entradas y los puntos proyectados como las salidas. Lo mismo ocurre en funcionen tipo AND y NAND o NOR. Sin embargo eso no es posible en la función XOR, que como se ve en la figura, debe ser separado por un mínimo de 2 lineas, o ser encerrado en un ovalo. Esto no es posible de hacer con un perceptron simple.
Por hacer un poco de historia digamos que Marvin Minsky e Seymour Papert demostraron este hecho, lo que causo que el interés por la investigación del perceptron menguara rápidamente.
De hecho para eliminar este problema es necesario agregar mas capas a la red neuronal, así aparece el MLP ( multilayer perceptron: perceptron multicapa ) que es una evolucion del perceptron simple y que además elimina grandes problemas del perceptron como el de la separación lineal.

No hay comentarios:

Publicar un comentario en la entrada