viernes, 19 de noviembre de 2010

Tipo de salida del MLP y su uso

Como dijimos antes el el perceptron multicapa los elementos de entrada y los de la capa oculta deben tener una función de transferencia que no sea lineal, entonces solo nos queda como opción la sigmoide y la tangente hiperbólica.
Sin embargo la salida puede tener una función lineal o no lineal, segun el uso que se le da a la red.
Como sabemos las funciones sigmoidal y tangentoide son funciones limitadas en su conjunto imagen para valores del dominio en todo el campo real ( sus valores van de 0 a 1 para la sigmoidal y de -1 a 1 para la tangente hiperbólica ), en cambio una recta adquiere todos los valores de salida en el campo real.
Esto puede ser útil en muchos casos, como ejemplos tenemos para las redes con salida no lineal la posibilidad de representar la salida en "porcentajes" ( un ejemplo de uso real seria en mecánica, una viga en ciertas condiciones de presión/tracción, a que punto esta respecto la tensión de ruptura de la viga ) o también en la clasificación de patrones con salidas discretas "si" o "no" ( en medicina son ampliamente usadas las redes neuronales en la clasificación de tejidos, de modo que se puede reconocer si es tejido cancerigeno o no ). Una cosa que vale decir acerca del uso de estas redes para el calculo de porcentajes es que son muy imprecisas a valores cercanos a los limites, ya que las funciones usadas tienen como limites esos valores, pero nunca los alcanzan.
El perceptron multicapa puede ser usado con salidas continuas en el caso del calculo del valor de una función compleja ( no me refiero a números complejos, que sea claro ) la cual puede adoptar valores relativamente grandes. Con frecuencia se usan para las predicciones meteorológicas o en predicciones económicas.
En todo caso el uso que se le puede dar a una red neuronal es muy amplio, en campos como la medicina, meteorología y economía ( con los ejemplos anteriores ), reconocimiento de patrones ( actualmente hay software que reconoce la escritura usando redes neuronales ) y biometria.

En las dos siguientes entregas desarrollaremos en código en C++ para tratar de simular el funcionamiento del MLP, explicando un nuevo método que usaremos, en el cual no simularemos cada neurona sino la red completa.

No hay comentarios:

Publicar un comentario