1 / 58

Sesión 13: Técnicas Alternativas

Sesión 13: Técnicas Alternativas. A. D. H. C. B. F. Técnicas Alternativas. Se han desarrollado algunas técnicas numéricas para manejo de incertidumbre que no siguen los axiomas de probabilidad. Entre éstas se encuentran: Métodos empíricos o ad-hoc Teoría de Dempster-Shafer

benjy
Download Presentation

Sesión 13: Técnicas Alternativas

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. Sesión 13: Técnicas Alternativas A D H C B F

  2. Técnicas Alternativas • Se han desarrollado algunas técnicas numéricas para manejo de incertidumbre que no siguen los axiomas de probabilidad. Entre éstas se encuentran: • Métodos empíricos o ad-hoc • Teoría de Dempster-Shafer • Lógica difusa • Métodos aproximados Incertidumbre - T.A., L.E. Sucar

  3. Técnicas Alternativas • Algunas técnicas se pueden ver como casos especiales o extensiones de probabilidad • Técnicas que se reducen a casos especiales de probabilidad • Método de factores de certeza (MYCIN) • Método de pseudo-probabilidades subjetivas (Prospector) • Técnicas que extienden a probabilidad: • Teoría de Dempster-Shafer Incertidumbre - T.A., L.E. Sucar

  4. Técnicas empíricas Las primeras técnicas que surgen, cuando menos dentro del área de sistemas expertos, son técnicas empíricas o ad-hoc orientadas a resolver aplicaciones específicas y sin un fuerte fundamento teórico. Las más conocidas son las que corresponden a dos de los primeros sistemas expertos: Incertidumbre - T.A., L.E. Sucar

  5. PROSPECTOR (exploración minera) • MYCIN (diagnóstico de enfermedades • infecciosas en la sangre) Incertidumbre - T.A., L.E. Sucar

  6. Sistemas basados en reglas En sistemas basados en reglas se tiene en general una estructura similar a la siguiente: Incertidumbre - T.A., L.E. Sucar

  7. Si: se observa cierta evidencia E Entonces: se concluye cierta hipótesis H con probabilidad (certeza, ...) P De aquí surgen varias interrogantes: • ¿Cómo obtener estas medidas? • ¿Cómo combinar estas medidas? • ¿Cómo interpretar estas medias? Incertidumbre - T.A., L.E. Sucar

  8. MYCIN Las técnicas desarrolladas en MYCIN y Prospector son similares, ambas consideran sistemas basados en reglas a los que se les adicionan Factores de Certeza o Probabilidades Subjetivas, respectivamente. Veremos brevemente el método de MYCIN. Incertidumbre - T.A., L.E. Sucar

  9. Técnica de Factores de Certeza • Los autores de MYCIN dicidieron no aplicar probabilidad porque: • “... requiere de grandes cantidades de datos o numerosas aproximaciones y suposiciones” • Desarrollaron una técnica alternativa basada en factores de certeza (medidas no probabilistas) y técnicas para combinarlas Incertidumbre - T.A., L.E. Sucar

  10. Medidas básicas • MB[h,e] – incremento de la creencia en la hipótesis h dada la evidencia e • MD[h,e] – incremento en la no-creencia en la hipótesis h dada la evidencia e • Se pueden combinar en una sola medida, el factor de certeza: CF = MB – MD 0 £MB,MD £ 1  CF : [-1, +1] Incertidumbre - T.A., L.E. Sucar

  11. MYCIN define un Factor de Certeza que se asocia a cada regla y cada evidencia, y se definen un conjunto de reglas para combinar estos factores. Incertidumbre - T.A., L.E. Sucar

  12. Redes de Inferencia • Un conjunto de reglas se pueden ver como una “red de inferencia” • Por ejemplo: • R1: si A y B entonces C • R2: si C entonces D • R3: si F entonces D • R4: si D entonces H A D H C B F Incertidumbre - T.A., L.E. Sucar

  13. Redes de Inferencia A • Tipos de combinaciones: • Conjunción/disjunción • Serie • Paralelo C B C D H C F Incertidumbre - T.A., L.E. Sucar

  14. Reglas de combinación 1. Propagación (fprop) o reglas en serie: 2. AND (conjunción), OR (disjunción) de evidencias: Incertidumbre - T.A., L.E. Sucar

  15. 3. Co-Conclusión (fco) o reglas en paralelo: Incertidumbre - T.A., L.E. Sucar

  16. R1: IF A and (B or C) Then H cf 0.8 R2: If D and F Then B cf 0.6 R3: If F or G Then H cf 0.4 R4: If A Then D cf 0.75 R5: If I Then G cf 0.3 Ejemplo Se conoce: CF(A,Ev) = 1, CF(C,Ev) = 0.5, CF(F,Ev) = 0.7, CF(I,Ev) = -0.4 Incertidumbre - T.A., L.E. Sucar

  17. CF(A,Ev) = 1, CF(C,Ev) = 0.5, CF(F,Ev) = 0.7, CF(I,Ev) = -0.4 Ejemplo CF A 0.75 C H-1 D 0.6 0.8 B F H H-2 I G 0.4 0.3 Incertidumbre - T.A., L.E. Sucar

  18. CF(A,Ev) = 1, CF(C,Ev) = 0.5, CF(F,Ev) = 0.7, CF(I,Ev) = -0.4 Ejemplo CF A 0.75 C H-1 D 0.6 0.8 B F H H-2 I G 0.4 0.3x0=0 Incertidumbre - T.A., L.E. Sucar

  19. CF(A,Ev) = 1, CF(C,Ev) = 0.5, CF(F,Ev) = 0.7, CF(I,Ev) = -0.4 Ejemplo CF A 0.75 C H-1 D 0.6 0.8 B F 0.7 H H-2 0 G 0.4 Max[0.7,0]x0.4=0.28 Incertidumbre - T.A., L.E. Sucar

  20. CF(A,Ev) = 1, CF(C,Ev) = 0.5, CF(F,Ev) = 0.7, CF(I,Ev) = -0.4 Ejemplo CF 0.75x1=0.75 A 0.75 C H-1 D 0.6 0.8 B F 0.7 H H-2 0.28 Incertidumbre - T.A., L.E. Sucar

  21. CF(A,Ev) = 1, CF(C,Ev) = 0.5, CF(F,Ev) = 0.7, CF(I,Ev) = -0.4 Ejemplo CF A C H-1 0.75 D 0.6 0.8 B 0.7 F Min[0.75,0.7]x0.6=0.42 H H-2 0.28 Incertidumbre - T.A., L.E. Sucar

  22. CF(A,Ev) = 1, CF(C,Ev) = 0.5, CF(F,Ev) = 0.7, CF(I,Ev) = -0.4 Ejemplo CF min[1,max[0.5,0.42]]x0.8=0.4 A C H-1 0.8 0.42 B H H-2 0.28 Incertidumbre - T.A., L.E. Sucar

  23. CF(A,Ev) = 1, CF(C,Ev) = 0.5, CF(F,Ev) = 0.7, CF(I,Ev) = -0.4 Ejemplo CF 0.4 H-1 H H-2 0.28 0.4+0.28-(0.4)(0.28)=0.568 Incertidumbre - T.A., L.E. Sucar

  24. Aplicación - MYCIN • Ejemplo de regla de MYCIN: SI la clase de organismo es gram positivo & la morfología del organismo es coco & la forma de crecimiento es cadenas ENTONCES la identidad del organismo es estreptococo (CF=0.7) Incertidumbre - T.A., L.E. Sucar

  25. Ventajas • Modularidad • Simplicidad computacional • Resultados comparables con expertos en aplicación médica (MYCIN) • Poco sensitivo a los valores de los CF´s (variación de +/- 0.2) Incertidumbre - T.A., L.E. Sucar

  26. Desventajas: Aunque pretendía apartarse de probabilidad, se ha demostrado [Heckerman 86] que la técnica de MYCIN corresponde a un subconjunto de probabilidad con una serie de suposiciones implícitas: Incertidumbre - T.A., L.E. Sucar

  27. La evidencia es condicionalmente • independiente de la hipótesis y su negación. • La red de inferencia debe corresponder a un • árbol para que los resultados sean • coherentes. • Las fórmulas para conjunción y disjunción • (min y max ) sólo son válidas si uno de los • términos es subconjunto del otro. Incertidumbre - T.A., L.E. Sucar

  28. Estas suposiciones no son válidas en muchas aplicaciones por lo que el método de MYCIN no se puede generalizar. Incertidumbre - T.A., L.E. Sucar

  29. Teoría de Dempster-Shafer

  30. Antecedentes • Teoría para representar y combinar “grados de creencia”.   • Esta teoría se desarrollo básicamente como una alternativa (extensión) a teoría de probabilidad ya que los autores consideraban que ciertas situaciones no eran representadas adecuadamente con dicha teoría. En especial dos aspectos: • • Representación de ''ignorancia" • • Representación de creencia NO asignada Incertidumbre - T.A., L.E. Sucar

  31. Ejemplo • Se tiene una moneda y dos situaciones distintas: • La moneda es “normal” por lo que tiene la misma probabilidad de cada lado • Se sabe que la moneda esta cargada con una mayor probabilidad de uno de los lados, pero no se sabe cual ni cuanto • Con probabilidades ambas situaciones se representan igual – P=0.5, no hay forma de distinguir ignorancia de igual probabilidad Incertidumbre - T.A., L.E. Sucar

  32. Diferencias con Probabilidad • La teoría de DS difiere en dos aspectos básicos de la teoría clásica de probabilidad: • Los grados de creencia se asignan a subconjuntos en lugar de a elementos individuales del dominio de referencia. • El axioma de aditividad no se forza, sino se substituye por una desigualdad. Incertidumbre - T.A., L.E. Sucar

  33. Diferencias con Probabilidad Estas diferencias tiene dos importantes implicaciones:  1.- La creencia en una proposición y su complemento NO necesariamente suman “1”.  2.- Se diferencia ignorancia de probabilidades iguales, dando la creencia no asignada al conjunto de todas las hipótesis. Incertidumbre - T.A., L.E. Sucar

  34. Fundamentos Teóricos La teoría de DS requiere de un conjunto de hipótesis exclusivas y exhaustivas: Θ - marco de dicernimiento 2Θ - conjunto de todos los subconjuntos de Θ En base a esto se definen dos medidas: • asignación básica de probabilidad (bpa) • función de creencia (Bel) Incertidumbre - T.A., L.E. Sucar

  35. Asignación básica de probabilidad (bpa) • Representa la porción de creencia asignada exactamente a un elemento A (subconjunto de Θ), sin incluir la creencia asignada sus subconjuntos. bpa=m(A): 2Θ ->[0,1] • Debe satisfacer las siguientes propiedades: 1 >= m(A) >= 0 (1) m(ø) = 0 (2) Σm(A)=1 (3) Incertidumbre - T.A., L.E. Sucar

  36. Ejemplo • Para el ejemplo de la moneda Θ = {águila, sol} 2Θ = [ {águila,sol}, {águila}, {sol}, Æ ] • Caso 1: igual probabilidad m({águila}) = 0.5, m({sol}) = 0.5 • Caso 2: completa ignoranica m({águila,sol}) = 1 Incertidumbre - T.A., L.E. Sucar

  37. Función de creencia (Bel) • Es la creencia total en el conjunto A, incluyendo la creencia asignada propiamente a A, así como la de todos sus subconjuntos: Bel(A)=Σm(B), B Í A • Se puede demostrar que Bel satisface las siguientes propiedades: Bel(ø) = 0 Bel(Θ) = 1 Bel(A1ÈA2) >= Bel(A1) + Bel(A2) - Bel(A1ÇA2) Incertidumbre - T.A., L.E. Sucar

  38. Función de creencia (Bel) • Para una hipótesis sencilla (un solo elemento) se tiene que: Bel(A)=m(A) • Para el ejemplo de la moneda: • Caso 1: • Bel({águila,sol}) = 0.5 + 0.5 = 1 • Bel({águila}) = m({águila}) = 0.5 Incertidumbre - T.A., L.E. Sucar

  39. Regla de Dempster • Para combinar distintas evidencias se calcula su suma ortogonal, aplicando lo que se conoce como la regla de Dempster, y obteniendo un nuevo grado de creencia (m) basado en la evidencia combinada: • Esta formula la podemos interpretar de la siguiente forma: • La evidencia E1 asigna la creencia ml al subconjunto Al • La evidencia E2 asigna la creencia m2 al subconjunto B1 • Entonces el producto de ambas (ml * m2) nos da la creencia en su intersección - A Incertidumbre - T.A., L.E. Sucar

  40. Regla de Dempster • La creencia total en A es simplemente la suma de las creencia asignadas de esta forma, es decir, la suma de la creencia de todas la intersecciones entre los conjunto Ai y Bj que den como resultado A. • Surge un problema si alguna de las intersecciones de el conjunto vacío, ya que no se puede asignar creencia a dicho conjunto (implicaría que la suma de bpa no sea l). Para resolver este caso hay que normalizar los bpa, es decir, inflar las creencias de los demás subconjuntos en forma proporcional a la creencia asignada al conjunto vacío. Incertidumbre - T.A., L.E. Sucar

  41. Regla de Dempster • Entonces la regla de Dempster en su forma general es: • Los nuevos valores de Bel para cada hipótesis son calculados de la misma forma, sumando los bpa's. Incertidumbre - T.A., L.E. Sucar

  42. Ejemplo • Si hubiera dos evidencias (expertos lanza monedas) respecto a la moneda cargada: • m1(A) = 0.7, m1(Θ) = 0.3 • m2(S) = 0.6, m2 (Θ) = 04 • Entonces: m2 \ m1 {A} 0.7 {Θ} 0.3 {S} 0.6 {Æ} 0.42 {S} 0.18 {Θ} 0.4 {A} 0.28 {Θ} 0.12 Incertidumbre - T.A., L.E. Sucar

  43. Ejemplo • Normalizando: • k = 0.42  1-k = 0.58 • Entonces: • m1 Ä m2({S}) = 0.18 / 0.58 = 0.31 • m1 Ä m2({A}) 0.28 / 0.58 = 0.483 • m1 Ä m2({Θ}) 0.12 / 0.58 = 0.207 Incertidumbre - T.A., L.E. Sucar

  44. Posibilidad • Mientras que Bel nos da la cantidad de creencia en cierta hipótesis, otra medida denominada la posibilidad (plausibility – Pl) indica la máxima creencia que pudiera asignarse a la hipótesis. La posibilidad se define como: P1(A) = 1-Bel(~A) • Bel da la creencia mínima y P1 la creencia máxima. Ambas definen un intervalo de creencia: [Bel(A), P1(A)] Incertidumbre - T.A., L.E. Sucar

  45. Posibilidad • El rango dentro del cual estaría la creencia en A de acuerdo a la evidencia conocida. La diferencia entre Bel y Pl nos indica la ignorancia, es decir, la creencia que NO ha sido asignada ni a la hipótesis ni a su complemento (o demás hipótesis). Incertidumbre - T.A., L.E. Sucar

  46. Ejemplo • Para el caso anterior: • Pl({A}) = 1 – 0.310 = 0.690 • Pl({S}) = 1 – 0.483 = 0.517 • Entonces: • A: [0.483 0.690] • S: [0.310 0.517] Incertidumbre - T.A., L.E. Sucar

  47. Otro Ejemplo • Consideremos una aplicación médica en la que hay cuatro posibles enfermedades (hipótesis): • Hepatitis (h/hep) • Cirrosis (c/cirr) • Cálculos en la vesícula (v/gall) • Pancreatitis (p/pan) Incertidumbre - T.A., L.E. Sucar

  48. Ejemplo Médico • Marco de dicernimiento (hipótesis) - jerarquía: Incertidumbre - T.A., L.E. Sucar

  49. Ejemplo Médico - subconjuntos Incertidumbre - T.A., L.E. Sucar

  50. Ejemplo Médico • Evidencia 1: intrahepática – 0.6 • Evidencia 2: no hepatitis – 0.7 Incertidumbre - T.A., L.E. Sucar

More Related