1 Lógica difusa La teoría básica de los sistemas expertos está

Lógica difusa
La teoría básica de los sistemas expertos está referida a la evaluación de sistemas binarios, es
decir que solo pueden evaluados como verdaderos o falsos. En el caso de la lógica difusa el
adjetivo ``difuso'' se debe a que en esta lógica, los valores de verdad son no-deterministas y
tienen, por lo general, una connotación de incertidumbre. Un vaso medio lleno,
independientemente de que también esté medio vacío, no está lleno completamente ni está
vacío completamente. Qué tan lleno puede estar es un elemento de incertidumbre, es decir, de
difusidad, entendida esta última como una propiedad de indeterminismo. Ahora bien, los
valores de verdad asumidos por enunciados aunque no son deterministas, no necesariamente
son desconocidos. Por otra parte, desde un punto de vista optimista, lo difuso puede
entenderse como la posibilidad de asignar más valores de verdad a los enunciados que los
clásicos ``falso'' o ``verdadero''. Consecuentemente, las lógicas difusas son tipos especiales de
lógicas multivaluadas.
La lógica difusa tiene como base los denominados conjuntos difusos y posee un sistema de
inferencia basado en reglas de producción de la forma “SI antecedente ENTONCES
consecuente”, donde los valores lingüísticos del antecedente y el consecuente están definidos
por conjuntos difusos. La lógica difusa puede ser vista como un lenguaje que permite trasladar
sentencias sofisticadas en lenguaje natural a un lenguaje matemático formal.
Los sistemas basados en lógica difusa se han empleado con éxito en campos tales como
control automático, clasificación, soporte de decisión, sistemas expertos y visión
computarizada. A causa de su naturaleza multidisciplinaria, el sistema de inferencia difusa es
conocido bajo distintas denominaciones, tales como sistema difuso basado en reglas (Rule
Based Fuzzy System), sistema experto difuso (fuzzy expert system), controlador lógico difuso
(fuzzy logic controller) y también sencillamente sistema difuso.
En lo que sigue usaremos los términos fuzzy y difusa como sinónimos de manera indistinta de
modo de estar familiarizados con la denominación en ingles por ser de uso frecuente.
Un ejemplo comparativo
Para ilustrar como es un sistema de inferencia basado en lógica difusa, se discuten a
continuación dos modos diferentes de resolver un mismo problema. Una es una solución
convencional, dada por un sistema lineal y el otro por un sistema de lógica difusa.
El problema consiste en determinar el valor “correcto” para una propina que se debe abonar en
función de algunas características del servicio recibido. Básicamente, se trata de evaluar
cuando debería ser la propina, dado un número entre cero y diez que representa la calidad del
servicio recibido. Un valor promedio de propina por comida se estima en un 15 % del total de la
cuenta pero en realidad la propina a entregar debería variar en función de la calidad del
servicio recibido.
Comenzamos con la relación más sencilla posible. Podemos decidir que siempre entregaremos
una propina del 15% del total de la cuenta con lo que tendríamos lo siguiente:
1
Podemos plantear las siguientes reglas de producción:
Si servicio es <= 3,
propina = (0.10/3)* servicio + 0.05;
else si servicio <= 7,
propina = 0.15:
else si servicio <= 10,
propina = (0.10/3)* (servicio – 7) + 0.15;
Supongamos que ahora queremos también considerar la calidad de la comida para fijar el valor
de la propina. Podríamos proponer la siguiente fórmula:
Propina = 0.20 /20 * (servicio + comida) + 0.05;
La solución Fuzzy
Sería deseable plantear la solución del problema en términos que permitan capturar la esencia
del mismo. Particularmente sería deseable eliminar factores arbitrarios. La esencia del
problema es que:
1) Si el servicio es pobre luego la propina es poca
2) Si el servicio es bueno luego la propina es media
3) Si el servicio es excelente luego la propina es generosa
Si quisiéramos incluir la incidencia de la calidad de la comida solo agregamos algunas reglas:
4) Si la comida es rancia luego la propina es poca
5) Si la comida es deliciosa luego la propina es generosa
Podemos combinar las dos listas de reglas en una sola
1) Si el servicio es pobre o la comida es rancia luego la propina es poca
2) Si el servicio es bueno luego la propina es media
3) Si el servicio es excelente o la comida es deliciosa luego la propina es generosa
2
Si damos ahora significado matemático a las variables lingüísticas (que significa una propina
media?) obtendremos un sistema de inferencia basado en lógica difusa.
Observaciones:
Se ha mostrado una solución mediante una relación lineal por trozos para resolver el problema
planteado. Si bien funciona, una vez escrito su código no resulta directamente entendible. Si la
lógica difusa nos permite escribir un código para que la solución resulte más fácil de interpretar,
entonces estamos diciendo que su contribución radica en la posibilidad de escribir un código
ventajoso en algún aspecto.
Como el sistema difuso esta de algún modo basado en sentencias de “sentido común”,
podremos también agregar más sentencias al final de la lista que moldearán más
apropiadamente la forma de la función. Es decir que entre las ventajas de este código estará la
de una modificación más sencilla.
También el mantenimiento del código será más simple debido a que claramente se puede
desacoplar en diferentes reglas sencillas. La noción de una propina alta, medio o baja podrá
cambiar día a día, ciudad por ciudad o país por país pero la lógica subyacente será posible
recalibrar rápidamente el sistema sin necesidad de reescribir reglas y código.
Una visión general de un sistema de inferencia difusa
Comenzaremos con un panorama general de un sistema basado en lógica difusa para luego
discutir componentes. La esencia de un sistema fuzzy es mapear un espacio de entrada en uno
de salida. El mecanismo primario para lograrlo es la inferencia basada en reglas.
Todas las reglas se evalúan en paralelo, su orden no tiene importancia. Las reglas en lógica
difusa se refieren a variables y adjetivos que califican a esas variables. Antes de discutir la
construcción del sistema que interpreta reglas que emplean adjetivos, necesitamos definir los
términos que planeamos usar y los adjetivos que los describen.
Esto quiere decir que si quisiéramos discutir acerca de “cuan fría esta el agua” debemos
considerar el rango de temperatura posible para el agua así como el significado de la palabra
fría.
La idea tras un sistema de inferencia difusa es interpretar los valores de un vector de entrada y
basado en un conjunto de reglas, asignar valores al vector de salida.
CASO GENERAL
Entrada
Salida
Interpretación
Asignación
CASO ESPECÍFICO
Servicio
Propina
Pobre, Bueno o Excelente
Baja, Media o Generosa
Conjuntos difusos
Consideremos por ejemplo el conjunto de las personas jóvenes, asumiendo que nuestra
percepción de una persona joven es alguien que tiene una edad no mayor a 20 años, entonces
según la teoría clásica el conjunto se define de la siguiente manera:
Joven = { x / edad(x) <= 20 }
O sea la relación de pertenencia a este conjunto Joven es la siguiente según la lógica
tradicional:
3
Joven(x) = 1 si edad (x) <= 20
Joven(x) = 0 si edad (x) > 20
el cual asigna el valor de 1 cuando un elemento pertenece al conjunto de las personas jóvenes,
y 0 sino. Esta función característica puede ser vista como una función de membresía para el
conjunto joven, definiendo el conjunto joven.
Sin embargo, una persona que tenga un poco más de 20 años reclamará que se considera una
persona joven con un alto grado de pertenencia, por lo tanto la definición del conjunto joven
usando una frontera tan marcada no es la manera más apropiada. La idea fundamental que
existe detrás de la teoría de conjuntos difusos es una visión diferente de la noción de
membresía y consiste en que los elementos pueden pertenecer a más de un conjunto con
cierto grado de pertenencia. En nuestro ejemplo, podemos decir que una persona de 21 años
pertenece al conjunto de joven pero con un grado de 0,9. Por lo tanto la función de membresía
podría ser:
µ joven(x) =
1 si edad(x) <= 20
1 – ((edad(x) -20)/10)
Ahora el conjunto joven contiene a personas entre 20 y 30 años con un grado de membresía
que decrece linealmente.
En aplicaciones reales la forma de las funciones de membresıa está usualmente restringida a
ciertas clases de funciones que pueden estar especificadas con pocos parámetros. A
continuación se muestran las formas más usadas de funciones de membresía: trapezoidal,
triangular, Gaussiana y singleton
4
Reglas Si – Entonces
Los conjuntos difusos y los operadores difusos son los verbos y sujetos de la lógica fuzzy. Una
regla difusa toma la forma:
Si X es A luego Y es B
Donde A y B son valores lingüísticos definidos por conjuntos difusos sobre los rangos X e Y
respectivamente.
La primera parte de la regla es el antecedente o premisa, mientras que la parte final es el
consecuente. Por ejemplo:
Antecedente
Consecuente
Si el servicio es bueno luego la propina es media
X
A
Y
B
Notar que el antecedente (servicio) es una interpretación que retorna un numero entre 0 y 1,
mientras que el consecuente es una sentencia que asigna el conjunto fuzzy completo B a la
variable de salida Y. De modo que la palabra “es” es empleada de dos modos diferentes
dependiendo si aparece en el antecedente o en el consecuente.
La interpretación de estas reglas comprende distintas partes:
1) Evaluación del antecedente (lo que implica la aplicación de operadores difusos)
2) Aplicación del resultado al consecuente (implicación)
En el caso de la lógica binaria, las reglas si-luego son sencillas. Si la premisa es verdadera,
luego la conclusión es verdadera. Pero si relajamos las restricciones de la lógica binaria y
permitimos que el antecedente sea una sentencia fuzzy, tendremos que considerar como
influye esto en la conclusión. En general podríamos expresar que si el antecedente es
verdadero en alguna medida de pertenencia, luego el consecuente se también verdadero en el
mismo grado.
El antecedente de una regla puede estar compuesto de múltiples partes:
Si el cielo es gris y el viento es fuerte y la presión está descendiendo, luego ……
En cuyo caso todas las partes del antecedente son calculadas simultáneamente y resueltas
como un número simple empleando operadores lógicos. El consecuente también puede tener
múltiples partes.
Si la temperatura es baja luego la válvula de agua caliente está abierta y la válvula de agua fría
está cerrada
En cuyo caso todos los consecuentes son afectados igualmente por el resultado del
antecedente. Debemos también considerar como afecta el antecedente al consecuente. En
lógica difusa el consecuente especifica un conjunto difuso para la salida. La función de
implicación modifica luego al conjunto difuso en el grado especificado por el antecedente.
Los medios más usuales para modificar el conjunto de salida difuso son truncamiento (función
mín), donde el conjunto difuso es recortado o escalación usando la función producto.
Siguiendo con nuestro ejemplo:
5
Si el servicio es excelente OR la comida es deliciosa luego la propina es generosa
excelente
deliciosa
0.7
0.0
FUZIFICACION DE ENTRADAS
Servicio -> 0.0
Comida  0.7
µ(servicio) = 0.0
µ(comida) = 0.7
Si (0.0 OR 0.7) luego propina = generosa
0.7
0.7
OPERADOR OR
0.0
MAX
Max (0.0 , 0.7) = 0.7
Si (0.7)
luego
propina = generosa
OPERADOR
DE
0.7
IMPLICACION
MIN
Min (0.7 , generosa)
propina (fuzzy)
Etapas para la aplicación de las reglas de lógica difusa
1) Paso I: Fuzzificacion de las entradas. Se deben resolver todas las sentencias en el
antecedente en función de su grado de membresía entre 0 y 1. Si el antecedente tiene
solo un componente este es el grado de soporte del consecuente
2) Paso II: Aplicación de los operadores difusos: Si existen múltiples partes en el
antecedente se aplican los operadores fuzzy y se resuelve el antecedente como un
número entre 0 y 1. Este es el grado de soporte de la regla.
3) Paso III: Aplicación de la implicación: Se emplea el grado de soporte de la regla
para conformar el conjunto fuzzy de salida. El consecuente de una regla fuzzy asigna
un conjunto fuzzy completo a la salida. Si el antecedente es solo parcialmente cierto,
luego el conjunto fuzzy de salida es truncado según el método de implicación.
4) Paso IV: Agregación: En general una sola regla no es muy útil, sino que se requieren
dos o más reglas que interactúen entre ellas. La salida de cada regla es un conjunto
fuzzy, pero en general se necesita que la salida sea en definitiva un número.
5) Paso V: Defuzificación: Para obtener este número, primero los conjuntos fuzzy de
salida de cada regla se amalgaman en un único conjunto. Luego este conjunto es
defuzificado, o resuelto de modo de obtener un número como valor de salida.
La naturaleza de las reglas es un importante aspecto de los sistemas de lógica difusa. Estos
sistemas permiten variar suavemente desde regiones donde el comportamiento del sistema es
dominado por unas y otras reglas.
El ejemplo visto al comienzo consta de tres reglas, para cada una de las cuales debe realizarse
la difusión inicial para cada adjetivo o conjunto difuso. Esta fuzificación inicial debe ser
realizada antes de aplicar las reglas.
6
Regla 1: Si el servicio es pobre o la comida es mala
Entrada 1
Luego la propina es baja
Servicio 0 -10
∑
Regla 2: Si el servicio es bueno
Entrada 2
Salida
Luego la propina es media
Comida 0 -10
Regla 3: Si el servicio es excelente o la comida es
deliciosa
Luego la propina es generosa
Las entradas son
números en un
rango específico
Todas las reglas son
evaluadas en paralelo
Los resultados de las
reglas con combinados
y defuzificados
La red de inferencia difusa requiere de una fuzificación de las variables de entrada (servicio y
comida) para que los números obtenidos a partir de éstas sean ingresados a la red.
Vamos a ver paso por paso con el ejemplo con el que venimos trabajando.
Paso I: Fuzificación
El primer paso es tomar las entradas y determinar el grado en el cual ellos pertenecen a cada
uno de los conjuntos difusos a través de funciones de membresía o pertenencia. La entrada es
siempre un valor numérico limitado al universo de discurso de la variable de entrada (en este
caso el intervalo entre 0 y 10) y la salida es un grado difuso de pertenencia, un número en el
intervalo entre 0 y 1.
La comida es deliciosa
Entrada = 8 = 0.7
0.7
Entrada
8
Paso II: Aplicación del operador difuso
Una vez que las entradas han sido fuzificadas conocemos el grado en el cual cada parte del
antecedente ha sido satisfecho para cada regla. Si el antecedente de una regla dada ha sido
dividido en más de una parte se debe aplicar un operador difuso para obtener un número que
representa el resultado del antecedente de esta regla.
Las entradas del operador difuso son dos o más valores de pertenencia desde las variables de
entrada fuzificadas. La salida es un único valor de verdad.
Existen distintos métodos que en general con conjunciones (mínimo, producto y truncamiento)
disyunciones (máximo, amplificación y adición) y negación.
A continuación se grafica el proceso para la función OR (max). Evaluamos el antecedente de la
regla 3 para el cálculo de la propina. Los antecedentes arrojan los valores de pertenencia 0.0 y
0.7 respectivamente. El operador OR selecciona el máximo de ambos valores 0.7 y la
operación para la regla esta completada.
7
ANTECEDENTE
Fuzificación de entradas Operador OR (max)
CONSECUENTE
Operador de implicación (min)
0.7
0.0
Servicio es excelente OR comida es deliciosa
Servicio = 3
Entrada 1
Propina generosa
Resultado implicación
Comida = 8
Entrada 2
Fuzificación, disyunción e implicación
Paso III: Aplicación del método de Implicación
El método de implicación se define como la conformación del consecuente (un conjunto fuzzy)
basado en el antecedente (un número). La entrada para la implicación es un número dado por
el antecedente y la salida es un conjunto fuzzy. La salida se obtiene para cada regla por
separado.
Algunos métodos podrían ser min (mínimo) que trunca el conjunto fuzzy y prod. (producto) el
que amplifica el conjunto de salida fuzzy.
1 Fuzificación
de entradas
2 Aplicación de operadores
difusos
Pobre
3 Aplicación de métodos
de implicación
Rancia
1
Servicio es pobre o comida rancia
propina baja
bueno
2
Servicio es bueno
propina media
delicioso
excelente
3
Servicio es excelente o comida deliciosa
Servicio = 3
Entrada 1
propina generosa
Comida = 8
Entrada 2
8
Las reglas se evalúan individualmente para obtener el valor de la implicación. Luego deben
asociarse los conjuntos de salida obtenidos para cada regla.
Paso IV: Agregación
Agregación es el proceso de unificar las salidas para cada regla uniendo los procesos
paralelos. Es decir se combinan las salidas en un único conjunto difuso preparándolas para el
paso final que es la defuzificación.
La entrada para la agregación es la lista de salidas truncadas (o modificadas por la implicación)
retornadas por el proceso de implicación para cada regla. La salida de este proceso es un
conjunto difuso para cada variable de salida.
La agregación es conmutativa, luego el orden en que se ejecutan las reglas no es relevante.
El proceso de agregación consiste en tomar un único conjunto de salida para todo el sistema a
partir de los conjuntos de salida de cada regla.
Paso V: Defuzificación
¨La entrada para el proceso de defuzificación es el conjunto difuso agregado (el conjunto difuso
unificado de salida) y la salida debe ser un número.
Entonces dado un conjunto difuso que engloba un rango de valores de salida se requiere
obtener un único número. Un popular método de defuzificación es el cálculo del centroide, el
cual retorna el centro de un área bajo una curva.
La defuzificación tiene lugar en dos pasos distintos. Primero las funciones de pertenencia son
escaladas de acuerdo a sus posibles valores, luego estas son usadas para calcular el centroide
de los conjuntos difusos asociados.
Un diagrama de inferencia difusa completo se vería de la siguiente manera:
Si
y
Si
luego
y
Entrada 1
luego
Entrada 2
9
Otro ejemplo:
Logica de conducción de un automóvil considerando la velocidad y la distancia entre autos
Reglas:
Regla 1: Si la distancia entre autos es corta y la velocidad es baja mantener la velocidad
Regla 2: Si la distancia entre autos es corta y la velocidad es alta reducir la velocidad
Regla 3: Si la distancia entre autos es larga y la velocidad es baja aumentar la velocidad
Regla 4: Si la distancia entre autos es larga y la velocidad es alta mantener la velocidad
corta
baja
larga
10
20
alta
30
30
50
70
velocidad
distancia
reducir
-20
-10
mantener
aumentar
0
10
20
aceleracion
Regla 1
corta
baja
10
15
mantener
distancia
30
30
velocidad
aceleracion
60 70
Regla 2
corta
10
alta
15
distancia
30
30
velocidad
10
60 70
reducir
aceleracion
Regla 3
larga
10
15
distancia
30
baja
aumentar
velocidad
30
60 70
aceleracion
Regla 4
larga
10
15
distancia
30
alta
velocidad
30
60
70
mantener
aceleracion
Por ejemplo si la distancia es 15 metros y la velocidad es 60 km, el resultado es:
reducir
mantener
-10
0
aumentar
10
aceleracion
Reducir la velocidad un poco
Heurística y lógica difusa
En IA, se observa a veces cierta tendencia a asociar el concepto de heurística a los
procedimientos de búsqueda. Sin embargo dado que su significado general puede aplicarse a
otras áreas de la IA.
El caso de los sistemas de inferencia difusa se hace particularmente evidente esta situación. Si
nos detenemos a pensar en el ejemplo explicado existen varios puntos oscuros en lo que hace
a su validación a través de un método formal.
Por ejemplo, el tipo de función de membresía de los adjetivos empleados en las reglas debe
ser propuesta por el diseñador del sistema, también los valores particulares, es decir las
pendientes y curvaturas de las funciones de pertenencia, y también el método de defuzificación
como así también los métodos de implicación a usar en el sistema.
Todo esto evidencia una fuerte naturaleza heurística de los sistemas de inferencia difusa, lo
que hace que en algunos ámbitos se cuestionen los fundamentos de diseño y la construcción
de estos sistemas.
11