19-7 框架语义学(AGI基础理论)
《智能的理论》全书转至目录不同AGI的研究路线对比简化版《AGI具身智能路线对比》欢迎各位参与讨论、批评或建议。一格语法格语法是由语言学家Charles J. Fillmore1966196819711977a于20世纪60年代中后期提出的著名理论Fillmore是乔姆斯基的学生而格语法也是转换生成句法的一个重要分支。与转换生成句法一样格语法理论认为语言分为深层结构和表层结构深层结构在格语法中称为底层结构通过将深层结构转换为表层结构可以生成句子。不同的是生成转换句法主张语义和句法相互独立仅从句法内部成分如主语、宾语的关系推导句子。而Fillmore认为仅仅从句法层面去研究深层结构是不足的。考察例子1。例1A组句1“Bill open the door.”句2“the key open the door.”B组句1王刚 走路句2王刚 涨潮上面的例子存在两个问题第一在A组句子中它们的语法结构都是“主语谓语宾语”。但对两个句子进行进一步分析Bill和the key虽然都是主语但是它们与open的关系是不同的Bill是open动作的发出者而the key是动作所使用的工具。那么为什么语义关系上存在差距的名词成分都能做主语呢第二对比A组为什么B组两个句子的语法结构都是“主语谓语”但是在B组在为什么只有第一句是合法的而第二句不合法为了解决这些问题Fillmore主张应该进一步探究动词和名词之间深层的语义关系将深层格引入到转换生成句法中对其进行修正。1.总体介绍格语法包括基本部分、词汇部分和转换部分三个操作模块如图1所示。基础部分有基础规则这些基础规则可以生成前底层结构在词汇部分对前底层结构中插入从词库中取出的词汇使其转换为后底层结构在转换部分通过转换规则形成表层结构即句子。这些不同的模块将会在下面详细介绍。图12.基础部分基础部分是格语法的第一步它包含三条规则第一条S-MP。其中S表示句子格语法认为一个句子应该由情态M和命题P组成。其中情态M包括说话者的情绪、立场、语气、观点、时态、肯定与否定等。英语中的助动词、情态动词和时态等便属于此。第二条P-VC1C2...Cn一个命题P应该包含一个谓述V对应句子中的谓语加上若干个深层格CiC是语法格英文Case的缩写i表示序号。第三条CKNP其中K称为格标记有连接谓词的功能。它由介词构成也可以不出现在句子中NP是名词短语。那么深层格是什么呢传统语法中的格指的是名词或者代词的一种变化形式表明该词与句子其他词的关系如同样表示我主格“i”宾格“me”所有格“my”等。这类格在格语法中被称为表层格格语法中的格是指深层格。深层格是名词短语的一种标记如同主语宾语一样表明了该名词短语与动词之间的句法和语义关系。下面列举主要的10个深层格施事格AAgentive表示动作发出者。如“Bill opened the door.”中的“Bill”此处施事格A的格标记K未出现在句子中只有名词短语Bill。客体格OObjective又称受事格或宾格表示由动作的接受者。如“Bill opened the door.”中的“the door”。伴随格CComitative表示与施事共同完成的动作的伴随者。如“She solve this problem with Mary.”中的“with Mary”with为格标记KMary为名词短语NP。受益格BBenefactive表示动作的服务对象。如“She give a book to Bill.”中的“to Bill”。处所格LLocative又称方位格表示由动作发生的处所。如“She is cooking in the kitchen.”中的“in the kitchen”。使成格FFactitive表示动作后所形成的事物或者动作的结果。如“She made some meat pie.”中的“some meat pie”。与格DDative又称承受格表示动作或状态所影响的事物。如“He has grown tall.”中的“he”。源处格SSource表示动作所作用事物的来源。如“I borrowed a car from Ben.”中的“from Ben”。目标格GGoal又称终点格表示动作所作用事物的终点。如“I sold a black dress to Mary.”中的“to Mary”。工具格IInstrumental施事借以引起行为的无生命的客体。如“Bill opened the door whit a key”中的“whit a key”。要注意的是深层格的清单并不确定在格语法的发展史中深层格一直处于变化当中比如Fillmore在1966年提出了8个深层格到了1968年变为10个1971年为9个1977年剩下4个...。下面使用一个例子说明如何通过基本规则生成前底层结构例2例2流程S-MP第一条规则M-PastPast表示过去时态P-VC1C2C3第二条规则Ci-KiNPi第三条规则为了省略使用i表示1,2,3NP1-Det1N1Det表示限定词如定冠词NP2-Det2N2NP2-N3整合得S-Past V K1 Det1N1 K2 Det2N2 N3前底层结构S一共包含一个过去时态的谓述并含有三个名词短语。3.词汇部分经过基础部分得到了前底层结构。前提层结构包括一个情态一个谓语还有若干个深层格。到了在词汇部分会根据前底层结构从词库里取出相应的词并进行词汇插入得出后底层结构。词库的词分为名词短语和谓语分别与前提层结构的深层格和谓语对应。词库是语言词汇的集合其中每个词都有它的特征。名词短语的词汇特征除了有语义、句法和语音方面的特征还包括它们深层格的特征。比如street的深层格特征是[Locative]缩写为[L]“Locative\L”表示处所格“”表示street拥有这个格如果是“-”则表示没有。谓语确定格框架。格框架表示后底层结构中谓词与深层格的组合关系。每个谓词都有若干个格框架因此每个谓词都可以形成不同的句型。格框架可以表示为V[— C1C2C3]V表示为谓词“—”表示格框架有一个动词Ci可以表示为深层格A、O、I、...“A”、“O”和“I”分别表示施事格、客体格和工具格的英文缩写。下面举例说明左边是句子右边是谓词对应的格框架the door opened open[— O]The boy open the door open[— AO]The wind open the door open[— IO]The boy opened the door with key open[— AOI]第一句的open格框架只有一个客体格第二句的open格框架包含一个施事格和客体格...。从四个格框架中可以看出客体格对于open的格框架是必须的而其他是可以省略的。因此open的格框架可以用 [— OAI]代表以上四个格框架其中括号表示括号内的深层格不是必须的。词汇插入首先从词库中取出对应格框架并填入前底层结构谓语的位置。格框架中的深层格与前底层结构的各深层格对应然后根据这些深层格再从词库中取出对应的名词短语。以下面为例说明前表层结构为S- Past V A O I- Past V K1 Det1N1 K2 Det2N2 K3 N3假设句子为“The boy opened the door with key”根据前表层结构从词库中提取open的格框架open[— AOI]从词库中提取包含施事格AK1 Det1N1的名词短语 the boyK1省略提取包含客体格OK2 Det2N2的名词短语the doorK2省略提取包含工具格IK3 N3的名词短语with key。4.转换部分转换部分与转换生成句法相似即根据转换规则将后底层结构转换为表层结构。转换规则大致包括移动、删除、插入、复写等这里不打算罗列具体的转换规则只使用一个例子说明具体转换是如何操作的。如图2图中的Past表示过去时态它属于情态M。图a表示句子的深层结构图b-e表示其转换过程。其中图b表示施事格前置图c表示表示删除主语的前置语“by”格标记图式d表示删除客体格的前置语图e表示将情态与动词谓述合并最终表现出句子的表层结构。一个后底层结构可以通过不用的转换模式生成不同的表层结构。如图f和图g这些表层结构共享同一个深层结构图a。图2a图2b图2c图2d图2e图2f图2g5.小结最后回答一下开头的问题。对于A组Bill和the key分别是open的施事格和工具格根据open的格框架施事格和工具格作为主语都是被允许的。而B组王刚分别是两个句子的施事格“走路”的格框架允许施事格成为主语所以第一个句子合法而“涨潮”的格框架不允许施事格成为主语因此第二句不合法。格语法虽然解释了不少问题但是它同样也存在问题。首先由于语义的复杂性语言学家们无法列出一张完整的深层格清单。其次在一些情况下人们无法确定名词短语在句子中的深层格。比如“车撞在了树上”这句话中“车”这个词到底是施事还是工具或者受事。二框架语义学鉴于格语法的种种问题Fillmore于上个世纪70年代中后期开始了框架语义学的研究并于1982年正式提出Fillmore197519761977b1977c1892。自此他的理论正式从形式主义走向认知主义从心智主义走向经验主义。1.框架的定义吴志杰和王育平2006框架指的是一种概念结构。任何一个概念的理解都必须依赖于框架。我们以一个具体的例子来认识框架语义理论对概念的处理方法。《现代汉语词典》是这样解释”直径“这个概念的“连接圆周上两点并且通过圆心的直线段叫圆的直径”。直径是一条直线段但不是一条普通的直线段它连接圆周上两点并且通过圆心也就是说对直径的定义依赖于对圆的结构的理解。我们可以用下图3表示出我们在理解直径时对圆这个背景知识的依赖关系。图3换句话说直径与圆这两个概念是紧密联系在一起的这种紧密相连的关系应该在概念结构中得到表现。Fillmore把直径与圆之间的这种关系称为概念显像与框架的关系。在框架语义理论里显像指代词语象征的概念相当于我们以往所说的指称意义所以又经常被称为概念显像框架则用来指代理解概念显像所需的背景知识或概念结构也可以看成是概念显像所蕴涵的背景知识或概念结构。Fillmore曾经这样定义框架这个概念“当使用框架这个术语时我心里想到的是一个互相联系的概念体系对这个体系中任何一个概念的理解都必须依赖对其所属的整个结构的理解”。值得一提的是,词语所表示的概念包括概念显像与框架这两个部分传统的对概念的定义方法往往只关注概念显像而忽略框架这一部分从而凸现对概念的认识与理解离不开其相关的背景知识或概念结构。因此概念显像是不足以定义一个词语概念的它必须和框架联系在一起两者都是一个概念不可分割的组成部分。当然一个框架可以十分复杂因此其所能支撑的概念显像也可以很多。例如圆这个框架就可以覆盖很多的概念显像直径、半径、圆心、圆周等。作为一种概念结构框架是对世界的表征。场景指语言之外的真实世界如物、事件、状态、行为、变化和人们对真实世界的记忆、感觉、知觉等。场景可以是事件、物体、行为、变化、状态等它包含若干个参与者。每个框架都有其对应的场景如“教育-学习”框架和“教育-学习”场景。框架的框架角色与场景中的元素存在一一对应的关系。如老师、学生等它们即属于框架角色也属于真实世界的场景参与者。2.框架构成一个框架由词元和框架元素构成框架元素又分为核心框架元素和非核心框架元素。词元指的是激活框架的词。一个框架可以被多种不同的词元激活。比如对于“写”框架动词“写”就是这个框架的词元“书写”也是这个框架的词元。再如“听”、“看”、“尝”、“观看”等是“自主感知”框架的词元。除了动词可以作为框架的词元名词和形容词也能作为词元如“报复”名词性的是“报复”框架的词元“睡着的”是“睡觉”框架的词元。词元可以类比为格语法中的动词它的作用是激起一个场景框架。框架元素对应场景中的参与者。其中核心框架元素是一个框架在概念理解上的必有成分它们在不同的框架中类型和数量不同显示出框架的个性。非核心框架元素并不显示框架的个性表达时间空间、环境条件、原因、目的等外围语义成分并作为框架的补充。在“写”框架中参与者包括“人”、“尖锐的工具”、“平面”和“痕迹”等。它们类比于格语法的深层格。如果框架元素对于框架的概念理解是必须的那么它就是核心元素否则为非核心元素。显然在“写”框架中“人”、“尖锐的工具”、“平面”和“痕迹”均会出现在写这么一个场景中因此它们都是核心元素。而写的“时间”和“地点”等是非核心元素。对于名词“文本”框架而言只有“文本”是核心元素其他“作者”、“材料”、“标题”、“受众”、“创作时间”等都是非核心元素。3.透视域句子是对场景的描述。当人们说出一个词、短语、句子或者一段话时都是在确定一个场景并且这句话仅仅强调或突出场景部分的参与者这体验在场景中的参与者并不会全部都出现在句子中。在描述场景时仅有部分参与者出现在句子中而其余没出现。为了解释这种不对称问题Fillmore提出了底层结构和透视域两个概念。底层结构即框架或概念结构它包含了一个框架中所有的框架元素对应场景中所有的参与者。而透视域的作用在于从底层结构中选择部分框架元素这些被选择的框架元素用于构成句子。使用买卖场景作为说明一场交易中一个有四个参与者包括卖家、买家、商品和货币。在框架语义学的概念中其底层结构包括卖家、买家、商品和货币四个框架角色。而透视域可以对底层结构进行选择比如“卖家卖了一台电视”这句话选择了卖家和商品而“小明花费了100元买了一台电视机”这句话则选择了买家、商品和货币。4.配价句子生成那么框架是如何对句子进行构建的呢框架语义理论继承于格语法与格语法有很多相似之处。如果将框架类比为格语法那么框架的词元可以类比于格语法的谓词框架元素类比于深层格与格语法的一个不同是框架除了可以用动词确定也可以用名词和形容词确定而配价模式类比于格框架如“open[— AOI]”。配价则可以理解为词元与被选择框架元素的搭配这些搭配模式是生成句子的基础且框架中每个词元可能拥有多个配件模式。在格框架中可以填入相应的词便可得到句子如“open[— AOI]”格框架中当“A”填入“the boy”“O”填入“the door ”“I”填入“with key”再经过转换就可以得到“The boy opened the door with key”。相同的框架的配价模式与此类似在配价模式填入相应的词也可以得到相应的句子。例如词元“写”能激活起这么一个框架场景一个人拿着一个尖锐的工具在一个平面上移动并在该平面上留下痕迹。这个场景有四个参与者分别为“人”、“尖锐的工具”、“平面”和“痕迹”。这样一个框架具有不同的配价模式而不同配价模式有不同框架元素及其组合方式并填入相应的值就能得到不同的句子显然框架元素与对应词是一对上-下位的范畴关系如人与小明是一对上-下位范畴关系尖锐的工具与铅笔也是上-下位范畴关系。下面是“写”框架的配价模式的例子例3其中左边是配价模式右边为句子例3人 写 小明在写人 尖锐的工具 写 小明拿着一只铅笔笔在写人 写 痕迹 小明在写作业人 尖锐的工具 平面 写 痕迹 小明用铅笔在作业本上写作业这个例子中小明属于框架元素人“人”是“小明”的上位范畴因此人可以被填入“小明”当然填入小红也行。相应的尖锐的工具被填入“一只铅笔”痕迹被填入“作业”平面被填入“作业本”。激活框架的除了有动词还有名词如例4和形容词如例5。例4punishment support retalition Injurythis attack was conducted in retaliation for the U.S. bombing raid on Tripoli...例5sleeper copula asleep Duration They were asleep for hours.5.语句理解文本中的所有语言成分都可以激活框架理解一个文本就是搜索或感知文本内容所激活的框架并对它们进行综合的过程。例如Fillmore的一个例子“The decedent while on land and in mufti last weekend ate a typical breakfast and read a novel high in flip strength.”。在阅读这句话时句中的不同实体会激活不同的框架adecedent。理解该词语要将视角置于法律遗产法中去理解。一般的法律语境的死者可以用the deceased来表达而decedent用在讨论一个死者的遗产时bland。land用来指与sea相对的“陆地”ground则是用来指与ai相对的“地面”。因此如果描写某人on land就是将视角定位于一个航海事件中cmufti。Mufti 是指军队中通常穿制服的人穿的普通衣服这个词语显然是限于和军队有关的语境的dweekend。理解这个词语需要以一定的社会制度和实践经验为背景即日历七天为一周一周内有五天连续时间是公众工作时间而有连续两天是私人生活时间而不是一天或三天ebreakfast。可以从三方面理解这个词第一一日三餐是文化生活中的一个行为当然有些人也会只吃早餐和午餐第二早餐是在睡完一觉之后的一天中较早的时候进行的也有可能在通宵后吃完早餐再睡觉第三它有独特的菜单(这视民族的不同而有许多细节差异)fflip strength。一些色情小说出版商用这个词组告诉作者每一页中都要包含一定数量的高“性”趣词。一本书中如果每页淫秽词语的比例都比较高那么它有比较高的flip strength反之则flip strength比较低。如果按照例句的字面意思来理解句子那么读者得到的意思可能是“死者于上周末在陆地上穿着便衣吃了顿普通的早晨读了一本狂热度高的小说。”。而根据框架语义学在阅读上述文本中每个词汇在理解者大脑中会唤起如上认知框架理解者把这些认知框架加以综合得以正确理解语言一个已经死亡的海军公务人员他在上周六到周日这段时间读了一本色情小说理解者还知道关于他的其他一些事情如他是如何打发时间的等。这个句子并没有直接给人们这些信息必须通过对以上背景框架进行综合才能真正理解其意义。6.框架之间的关系以上是对框架的描述在框架语义网络中框架并不是孤立的而是互相联系的框架与框架之间根据不同的关系联系着这些关系包括继承关系表示两个框架之间的上下位关系。上位框架是下位框架的抽象下位框架是上位框架的具体。比如感知框架是上位框架自主感知框架与非自主感知框架是它的下位框架。总分关系表示两个框架具有整体和局部之间的关系。如认知框架是总框架其分框架包括感知框架、意识框架、注意框架、记忆框架和思维框架。致使关系致使关系是一种因果关系表示动因动作发生原因与动作的关系即动因使运动发生。如使量变框架与量变框架。起始关系起始关系也是因果关系表示动作与量变之间的关系即某个动作使某个量变发生。如量变框架与量值框架。使用关系表示两个框架具有前景和背景之间的关系。参照关系不代表各框架之间的语义关系引入只是为了更好的说明被说明的框架。如例6由句1的raised激起“使量变”框架句2的increased可激活“量变”框架句3的high激活“量值”框架。其中“使量变”框架与“量变”框架是致使关系而“量变”框架喝“量值”框架是起始关系。例6句1Billie Blount raised taxes on farmers l8 times in 2002!句2Accidents increased 20%.句3This car is high in price.7.框架语义网络FrameNet基于框架语义学Baker和Fillmore于20世纪90年代末开始着手框架语义网络FrameNet的构建该工作建立了面向计算机、人工智能用于自然语言处理所需的词汇知识库并用于研究英语中语法和语义二者之间的关系。可以说框架语义学是理论基础框架语义网络是它的实践Baker和Fillmore1998刘开瑛和由丽萍2015。大脑中的框架是从与世界的互动中获得的那么框架语义网络一个关于框架的数据库是对框架的一种计算机模拟的构建可通过对大量语料的归纳而得类似于从真实世界中获得。其获得过程可分为两步首先对句子进行标注如将“小明在写作业”标注为“人小明 写 痕迹作业”需要人为分析得到配价模式“人 写 痕迹”词元“写”和框架元素“人” 和“ 痕迹”通过对大量语料的分析就能得到很多配价模式、词元和框架元素。再对这些句子的分析进行统计和整理如将同一类框架的词元、框架元素整合起来便完善了框架。8.认知主义起施事格、受事格和工具格等更容易理解框架元素如卖家、买家、商品等框架角色能更直接体现出人类的经验使语言使用者更容易接受。与格语法相比框架语义不追求高度的语义角色概括性深层格便是有高度概括性只追求适度的概括性使用场景角色将对深层格的研究取向转变为情景化的、具体化的和接近生活语义的名词。9.经验主义框架并不是如深层格一样通过人工设置而是与世界的互动中动态构建。框架语义学的哲学基础是经验主义这里的经验指的是一些个人经历Lakoff和Johnson1980认为概念是通过身体、大脑和对世界体验才能被形成和理解的。德国思想家Herder1772在《论语言的起源》一书提及到语言是感性活动的产物而非先验之物它只能通过经验和归纳的方法获取。这与乔姆斯基的语言天赋观形成对立。三心理学的框架上面说明了如何通过对配价模式填词得到句子。心理学的框架概念结构同样有类似的“配价”。可以借助Fillmore的框架语义学对心理学的框架进行理解。可以把词元对应心理学框架的关系边框架元素对应心理学框架的框架特征被填入的词对应心理学框架的语义值。在心理学框架中框架特征通过关系联系在一起一个框架特征可以被填入不同的语义值。使用下面的心理学框架作为说明汽车框架Barsalou1992如图4。它包含了驾驶员、燃料、发动机等框架特征也包括购买操作等关系。这些框架特征可以被多个不同的语义值填入。比如驾驶员可以填入Sue也可以填入Mike燃料即可以填入汽油也可以填入采油。可以对驾驶员和燃料分别填入这些的语义值可以得到“Sue购买汽油”、“Sue购买柴油”、“Mike购买汽油”、“Mike购买柴油”等不同的命题。这种“将语义值填入到框架元素中”是我们理解新情况的基础使同一个框架可以扩展到无穷个同类情景只需替换新的语义值即可。在这个例子中无论驾驶员变为谁Ben等燃料是什么等等通过框架我们都能理解它。图4框架除了具有理解的作用还有推理的功能。如果一个人是另外一个人的老师那么毫无疑问我们会知道后者是前者的学生。因此一个简化的“师生框架”中这个框架存在两个框架元素包括“老师”和“学生”同时也包括他们之间的两个关系从“老师”到“学生”的关系是“是老师”从“学生”到“老师”的关系是“是学生”。当我们知道“卡卡西是鸣人的老师”可以将“卡卡西”和“鸣人”分别填入到框架元素“老师”和“学生”中用实线表示。由此从框架中我们也能推理出鸣人是卡卡西的学生用虚线表示。如图5所示。图5