高级人工智能

高级人工智能 第九章解释学习史忠植中国科学院计算技术所高级人工智能-解释学习史忠植

内容提要 9.1 概述 9.2 解释学习模型 9.3 解释泛化学习方法 9.4 全局取代解释泛化方法 9.5 解释特化学习方法 9.6 解释泛化的逻辑程序 9.7 基于知识块的SOAR系统 9.8 可操作性标准 9.9 不完全领域知识下的解释学习高级人工智能-解释学习史忠植

9.1 概述 • 基于解释的学习： • 一种从单个观察中抽象出通用规则的方法 • 目标是下次可以快速地解决类似的问题 • 记忆——通过保存结果和避免从零开始解决问题来提高速度 • 更进一步EBL从观察到规则高级人工智能-解释学习史忠植

解释学习 解释学习(Explanation-Based Learning, 简称EBL)是一种分析学习方法，在领域知识指导下, 通过对单个问题求解实例的分析, 构造出求解过程的因果解释结构, 并获取控制知识,以便用于指导以后求解类似问题。高级人工智能-解释学习史忠植

解释学习 1983年美国Illinois大学的DeJong提出。 1986年, Mitchell, Keller 和 Kedar-Cabelli 提出了解释的泛化(Explanation-Based Generalization, 简称EBG)的统一框架, 1986年DeJong 和Mooney提出全局取代解释泛化Explanation Generalization using Global Substitutions, 缩写EGGS) 方法 1987年卡耐基-梅隆大学的Minton 和 Carbonell提出解释特化 (Explanation-Based Specialization，简写EBS)学习方法高级人工智能-解释学习史忠植

为什么要用EBL • 解释为什么一个想法是好的比提出一个想法容易得多 • 一旦理解了一件事，就可以泛化并重用于其它情况 • 从例子中抽象出通用规则 • 通过对一棵证明树的常量变量化, EBL可以同时创建两棵证明树高级人工智能-解释学习史忠植

基本的EBL • 给定一个例子，使用背景知识构建一棵证明树 • 同时，为可变化的目标构建一棵泛化证明树 • 构建一条新规则（叶子 => 根） • 去掉所有与目标中变量真正无关的条件高级人工智能-解释学习史忠植

解释学习 (1)通过分析一个求解实例来产生解释结构; (2)对该解释结构进行泛化, 获取一般的控制规则。高级人工智能-解释学习史忠植

解释的含义 • 对所产生的结论的推理过程作详细说明，以增加系统的可接受性； • 对错误决策进行追踪，发现知识库中知识的缺陷和错误的概念； • 对初学的用户进行训练。高级人工智能-解释学习史忠植

解释的方法 • 预制文本法。预先用自然语言写好，并插入程序中； • 执行追踪法。遍历目标树，通过总结与结论相关的目标，检索相关规则，以说明结论是如何得到的； • 策略解释法。明确表示控制知识，即用元知识概括地描述，与领域规则完全分开。从策略的概括表示中产生解释，能为用户提供问题求解策略的解释。高级人工智能-解释学习史忠植

EBL的效率 • 选择一条通用规则 • 太多规则 -> 推理太慢 • 目标驱动 - 极大地提高了速度 • 尽可能的通用 • 可操作性 - 一个子目标是可操作的，意思是容易解决 • 可操作性和通用性之间的平衡 • 对EBL学习效率的实验分析高级人工智能-解释学习史忠植

9.2 解释学习模型 概念描述空间概念空间例子空间 D1 不可操作的 I1 C1 I2 I3 可操作 D2 解释学习的空间描述高级人工智能-解释学习史忠植

可操作特性 系统可变性粒度确定性 GENESIS 动态二进制不保证 LEX2 动态二进制不保证 SOAR 动态二进制不保证 PRODIGY 静态连续不保证 MetaLEX 动态连续保证高级人工智能-解释学习史忠植

解释学习的模型 N 结果是否可操作 Y EXE 概念描述的转换 D1 D2 KB PS 高级人工智能-解释学习史忠植

9.3 解释泛化学习方法 解释泛化学习问题： • 已知： • 目标概念 • 训练例 • 领域理论 • 可操作性标准 • 欲求： • 训练实例的泛化，使之满足以下条件 • 是目标概念的充分概念描述 • 满足可操作性标准高级人工智能-解释学习史忠植

EBL方法 • 解释 • 利用领域理论知识解释为什么训练例满足目标概念的定义 • 泛化 • 确定解释成立的最通用的条件高级人工智能-解释学习史忠植

例子 • 目标概念：一对物体<x,y>，SAFE-TO-STACK(x,y)，其中STACK(x,y)NOT(FRAGILE(y))∨LIGHTER(x,y)。 • 训练实例： • ON(OBJ1,OBJ2) • ISA(OBJ1,BOX) • ISA(OBJ2,ENDTABLE) • COLOR(OBJ1,RED) • COLOR(OBJ2,BLUE) • VOLUME(OBJ1,1) • DENSITY(OBJ1,.1) • … 高级人工智能-解释学习史忠植

例子 • 领域知识： • VOLUME(p1,v1)∧DENSITY(p1,d1)→WEIGHT(p1,v1*d1) • WEIGHT(p1,w1)∧WEIGHT(p2,w2)∧LESS(w1,w2)→LIGHTER(p1,p2) • ISA(p1,ENDTABLE)→WEIGHT(p1,5)(default) • LESS(.1,5) • … • 可操作标准：概念定义必须要用描述实例中的谓词，或者选自领域知识易于评测的谓词。 • 确定： • 训练实例的泛化是对目标概念给以充分定义，并且满足可操作性标准。高级人工智能-解释学习史忠植

SAFE-TO-STACK(OBJ1,OBJ2)解释树 SAFE-TO-STACK(OBJ1,OBJ2) LIGHTER(OBJ1,OBJ2) WEIGHT(OBJ1,.1) LESS(.1,5) WEIGHT(OBJ2,5) VOLUME(OBJ1,1) DENSITY(OBJ1,.1) ISA(OBJ2,ENDTABLE) 高级人工智能-解释学习史忠植

SAFE-TO-STACK(OBJ1,OBJ2)解释的泛化过程 SAFE-TO-STACK(x,y) R1: SAFE-TO-STACK(p1,p2) {x/p1,y/p2} LIGHTER(p1,p2) LIGHTER(x,y) R2: LIGHTER(p1,p2) {x/p1,y/p2} WEIGHT(p1,w1) LESS(w1,w2) WEIGHT(p2,w2) WEIGHT(x,w1) LESS(w1,w2) WEIGHT(y,w2) R3: WEIGHT(p1,v1*d1) R4: WEIGHT(p2,5) {x/p1,v1*d1/w1} {y/p2,5/w2} VOLUME(p1,v1) DENSITY(p1,d1) ISA(p2,ENDTABLE) VOLUME(x,v1) DENSITY(x,d1) LESS(v1*d1,5) ISA(y,ENDTABLE) 高级人工智能-解释学习史忠植

解释与泛化交替进行 • 问题的逻辑描述 • 逻辑的表示方法使EBG的语义更为清楚，为学习提供了方便的语言环境 • 产生解释结构 • 从目标开始反向推理，分解目标。应用规则时，同时将规则应用到变量化的目标概念上，这样就同时生成了解释结构和泛化的解释结构 • 生成控制规则 • 将泛化的解释结构的所有叶结点的合取作为前件，以定点的目标概念为后件，略去解释结构的中间部件，生成泛化的产生式规则。高级人工智能-解释学习史忠植

9.4 全局取代解释泛化方法 1986年DeJong和Mooney提出全局取代解释泛化方法。在EBG方法中，通过实例解释结构的目标概念回归，忽略析取实现泛化。高级人工智能-解释学习史忠植

初始世界模型： • 目标公式： STRIPS的例子高级人工智能-解释学习史忠植

STRIPS采用的操作符 高级人工智能-解释学习史忠植

三角表 高级人工智能-解释学习史忠植

STRIPS的解释泛化算法 for each equality between pi and pj in the explanation structure do let  be the MGU of pi and pj for each pattern pk in the explanation structure do replace pk with pk  高级人工智能-解释学习史忠植

STRIPS的解释泛化算法 • STRIPS 使用具有三角表的解释泛化算法生成泛化操作符 • 对整个泛化表用变量代替常量。 • 根据两条标准约束表: 一个是保持操作符之间的依赖关系; 另一个是泛化表中的操作符前提条件可被证明, 这与原来规划中前提条件证明一样。通过泛化处理, 高级人工智能-解释学习史忠植

泛化三角表 高级人工智能-解释学习史忠植

EGGS方法 DeJong 等的学习方法是学习图式(schemata)。图式的核心思想是构造系统知识时, 要将为了达到一定目标的相关知识放在一个组。图式是一种操作符的偏序集, 简单的图式因果地连在一起。EGGS采用动态的可操作性准则, 当系统学到了一个概念的一般化图式后,该概念就可操作了。高级人工智能-解释学习史忠植

EGGS问题描述 给定： • 领域理论： • 领域中对象的种类和特性的定义 • 一组关于对象特性和相互关系的推理规则 • 一组问题求解的操作和已知的泛化图式 • 目标：目标状态的一般规约。 • 初始世界状态：关于世界及其特性的规约。 • 观察到的操作/状态序列。确定 • 达到目标状态的一个新模式高级人工智能-解释学习史忠植

泛化过程的形式化描述 EGGS 在泛化过程中始终维护两个独立的置换表, SPECIFIC 和 GENERAL。 SPECIFIC 用于对解释结构的置换, 以得到对具体实例的解释, 而 GENERAL 置换得到泛化的解释。假设是 SPECIFIC 置换, 是 GENERAL置换, 那么, 泛化过程的形式化描述如下：高级人工智能-解释学习史忠植

泛化过程的形式化描述 for each equality between expression and in the explanation structure: if is the antecedent of a domain rule and is the consequent of a domain rule then let = the most general unifier of and let = (* update SPECIFIC substitution) let = the most general unifier of and let = (* update GENERAL substitution) else let = the most general unifier of and let = (* update SPECIFIC substitution) 高级人工智能-解释学习史忠植

EGGS解释泛化算法(Mooney, 1986) let be the null substitution {}. for each equality between and in the explanation structure do: let be the result of applying to . let be the result of applying to . let be the MGU of and . let be . for each pattern in the explanation structure do: replace with . 高级人工智能-解释学习史忠植

The EGGS Algorithm (Mooney, 1986) bindings = { } FOR EVERY equality between patterns P and Q in explanation DO bindings = unify(P,Q,bindings) FOR EVERY pattern P DO P = substitute-in-values(P,bindings) Collect leaf nodes and the goal node 高级人工智能-解释学习史忠植

9.5 解释特化学习方法 从多种目标概念学习，其解释过程是对每个目标概念进行详细描述。解释过程结束后，把得到在有关目标概念的描述转换成一条相应的控制规则。可以用这些规则来选择合适的节点、子目标、算子及约束。较好地克服了EBG方法中过分一般化的缺点。高级人工智能-解释学习史忠植

PRODIGY体系结构 控制知识问题领域知识抽象生成器 EBL 用户问题问题求解器派生重演规划库多级抽象层次 PS跟踪实验派生抽取外部处理求解高级人工智能-解释学习史忠植

PRODIGY的学习 • 解释过程 • 如果概念是原语，则不改变返回。 • 访问识别器，取出规则；获得子概念，特化子概念；重命名变量；置换并简化。 • 返回。 • 学习控制规则 • 由成功概念学到preference rules； • 由失败概念学到rejection rules； • 由其它选择都失败学到selection rules； • 知识表示 • 领域层公理 • 构筑层公理高级人工智能-解释学习史忠植

9.6 解释泛化的逻辑程序 工作原理归结原理：设两个短句C1、C2无公共变量，L1和L2分别是C1和C2的两个文字，若L1和¬L2存在一个最一般的合一置换，那么子句（C1-L1) (C2-L2)就是两个子句C1和C2的归结式。高级人工智能-解释学习史忠植

Turbo Prolog的合一算法 • 自由变量可以和任意项合一。合一后该自由变量约束为与之合一的项。 • 常量可与自身或自由变量合一。 • 若两个复合项的函子相同且函子所带参量个数一样，则这两个复合项可以合一的条件是：所有子项能对应合一。约束变量要用合一后的约束值替换。高级人工智能-解释学习史忠植

解释泛化的逻辑程序设计 • 解释 • 合一算法作为基础，用Prolog谓词来完成 • 把领域理论用内部数据库的形式存储。 • 泛化 • 包括常量用变量代替、新项合成等工作。 • 解释和泛化交叉进行高级人工智能-解释学习史忠植

Prolog简单的元解释器 prolog(Leaf): -clause(Leaf, true). prolog((Goal, Goal2)): - prolog(Goal1), prolog(Goal2). Prolog(Goal): - clause(Goal, Clause), prolog(Clause). 高级人工智能-解释学习史忠植

EBG程序 prolog_ebg(X_Goal, X_Gen, [X_Goal], [X_Gen]: -clause(X_Goal, true). prolog_ebg((X_Goal, Y_Goal), (X_Gen, Y_Gen), Proof, GenProof):- prolog_ebg(X_Goal, X_Gen, X_Proof, X_GenProof), prolog_ebg(Y_Goal, Y_Gen, Y_Proof, Y_GenProof), concat(X_Proof, Y_Proof, Proof), concat(X_GenProof, Y_GenProof, GenProof). prolog_ebg(X_Goal, X_Gen, [Proof], [GenProof]):- clause(X_Gen, Y_Gen), copy((X_Gen: -Y_Gen), (X_Goal: -Y_Goal)), prolog_ebg(Y_Goal, Y_Gen, Y_Proof, Y_GenProof), concat([X_Goal], [Y_Proof], Proof), concat([X_Gen], [Y_GenProof], GenProof). 高级人工智能-解释学习史忠植

自杀 目标概念：suicide(x) 领域理论：一组子句或称规则。 suicide(x)：-kill(x,x). kill(A,B)：-hate(A,B), possess(A,C), weapon(C). hate(A,A)：-depressed(A). possess(A,C)：-buy(A,C). weapon(Z)：-gun(Z). 训练例：一组事实子句。 depressed(john). buy(john,gun1). gun(gun1). suicide(john). 可操作性标准：暂时简单地处理为静态标准。 operational(depressed). operational(gun). operational(buy). 高级人工智能-解释学习史忠植

suicide(john)的解释结构 suicide(john) kill(john,john) hate(john,john) possess(john,gun1) weapon(gun1) depressed(john) buy(john,gun1) gun(gun1) 高级人工智能-解释学习史忠植

goal concept suicide(x) suicide(a) R1 x/a kill(a,a) kill(x,x) R2 kill(A,B) {x/A,x/B} hate(A,B) possess(A,C) weapon(C) hate(x,x) possess(x,C) weapon(C) R3 hate(A,B) R4 possess(A,C) R5 weapon(C) x/A x/A,Z/C Z/C depressed(A) buy(A,Z) gun(Z) depressed(x) buy(x,Z) 目标概念suicide(x)的泛化过程高级人工智能-解释学习史忠植

9.7 基于知识块的SOAR系统 记忆块：用一种符号来标记另一些符号的存储结构模型。 SOAR的学习机制：由外部专家的指导来学习一般的搜索控制知识。外部指导可以是直接劝告，也可以是给出一个直观的简单问题。系统把外部指导给定的高水平信息转化为内部表示，并学习搜索记忆块。高级人工智能-解释学习史忠植

记忆块机制 产生式存储器对象优先工作存储器管理器工作存储器语境站决策过程 SOAR的体系结构高级人工智能-解释学习史忠植

Problem-Space Search • Problem space: • Start state, goal state • Operators (actions that transform state) • Soar assumption: every cognitive behavior can be characterized as search for a sequence of operators leading from a start state to a goal state • Routine behavior • Problem-solving • Meta-cognition / search control • “Universal weak method” 高级人工智能-解释学习史忠植

Impasse-driven deliberation and learning • Soar’s standard process for selecting action includes several intermediate decision points • If each such decision is completely determined by existing productions, the action is “routine” • Underdetermined decisions (zero or multiple conflicting productions) create an “impasse” • Results in deliberation (e.g. problem space search) • Results in learning a new rule that prevents impasse in future similar situations 高级人工智能-解释学习史忠植

Production Memory East North South Working Memory Processing Input Propose Operator Input Output Propose Operator Compare Operators Apply Operator Output Select Operator Compare Operators Apply Operator Select Operator If operator <o1> will move to a empty cell --> operator <o1> < If operator <o1> will move to a bonus food and operator <o2> will move to a normal food, --> operator <o1> > <o2> If an operator is selected to move <d> --> create output move-direction <d> If cell in direction <d> is not a wall, --> propose operator move <d> move-direction North North > East South < North > East South > East North = South 高级人工智能-解释学习史忠植 This slide borrowed from John Laird

高级人工智能

高级人工智能

Presentation Transcript