从语义标注文本中推定普罗普的功能项
详细信息    查看全文 | 推荐本文 |
  • 英文篇名:Inferring Propp's Functions from Semantically Annotated Text
  • 作者:马克·阿兰·芬雷森 ; 张瑞娇 ; 李扬
  • 英文作者:FINLAYSON,Mark Alan;ZHANG Ruijiao;LI Yang;
  • 关键词:人工智能 ; 计算语言学 ; 民间故事 ; 功能主义 ; 语义学
  • 英文关键词:artificial intelligence;;computational linguistics;;folklore;;functionalism;;semantics
  • 中文刊名:MSYA
  • 英文刊名:Folklore Studies
  • 机构:美国佛罗里达国际大学;中国海洋大学文学与新闻传播学院;
  • 出版日期:2019-07-15
  • 出版单位:民俗研究
  • 年:2019
  • 期:No.146
  • 基金:国家社科基金重大项目“海外藏珍稀中国民俗文献与文物资料整理、研究暨数据库建设”(项目编号:16ZDA163)子课题的阶段性成果
  • 语种:中文;
  • 页:MSYA201904012
  • 页数:19
  • CN:04
  • ISSN:37-1178/K
  • 分类号:119-136+162
摘要
弗拉基米尔·普罗普的《故事形态学》是民俗学的一项开创性研究,也是计算研究中一个引人注目的课题。我探讨了一种从语义标注文本中学习普罗普功能项的技术,并对普罗普语料库中的15个民间故事进行了语义角色、语义同指、时间结构、事件情感和角色的标注。之后我从普罗普提供的描述中导出了一组合并规则。当这些规则与模型融合学习框架的改进版本相结合时,能够很好地重现普罗普的功能项。三个重要的功能组——即A/a(加害/缺失),H/I(交锋/战胜),以及W(回报)——被精准地识别出来。这是计算系统学习一种真实的叙事结构理论的首次论证。
        VladimirPropp's Morphology of the Folktale is a seminal work in folkloristics and a compelling subject of computational study.I demonstrate a technique for learning Propp's functions from semantically annotated text.Fifteen folktales from Propp's corpus were annotated for semantic roles,co-reference,temporal structure,event sentiment,and dramatis personae.I derived a set of merge rules from descriptions given by Propp.These rules,when coupled with a modified version of the model merging learning framework,reproduce Propp's functions well.Three important function groups—namely A/a(villainy/lack),H/I(struggle and victory),and W(reward)—are identified with high accuracies.This is the first demonstration of a computational system learning a real theory of narrative structure.
引文
(1)阿尔吉尔达斯·朱利安·格雷马斯:《结构语义学:方法研究》,巴黎:拉鲁斯,1966年;克洛德·列维-斯特劳斯:《神话与意义》,纽约:劳特利奇,1978年;阿兰·邓迪斯:《北美印第安人民间故事形态论》,《民俗学者通讯》第195期,赫尔辛基:芬兰科学院,1964年。弗拉基米尔·普罗普:《故事形态学(第2版)》,劳伦斯·斯科特译,奥斯汀:得克萨斯大学出版,1968。
    (2)安德烈亚斯·斯托克、斯蒂芬·奥莫亨德罗:《由贝叶斯模型融合推导概率文法》,拉斐尔·C·卡拉斯科、何塞·翁西纳:《文法推理与应用》,柏林:斯普林格,1994年,第106-118页。
    (3)弗拉基米尔·普罗普:《故事形态学(第2版)》,劳伦斯·斯科特译,奥斯汀:得克萨斯大学,1968年,第21页。
    (4)伊格拉·科林德拉:《文法推理:学习自动化与语法》,剑桥:剑桥大学出版,2010年。
    (5)乔治·拉科夫:《神奇故事的结构复杂性》,《人的研究》第1卷,加利福尼亚州尔湾:加利福尼亚大学社会科学学院出版,1972年,第128-150页。https://georgelakoff.files.wordpress.com/2010/12/structural-complexity-in-fairy-tales-lakoff-1972.PDF
    (6)乔舒亚·古德曼:《概率特征文法》,哈里·邦特,安东·尼霍特:《概率论和其他解析技术的进展》,多德雷赫特:斯普林格,2000年,第63-84页。
    (7)加兹达尔·杰拉尔德、伊万·克莱因、杰弗里·K·普卢姆、伊万·A·萨格:《广义短语结构语法》,牛津:巴兹尔·布莱克韦尔出版公司,1985年。
    (8)例如,阿兰·邓迪斯:《北美印第安人民间故事形态论》,《民俗学者通讯》第195期,赫尔辛基:芬兰科学院,1964年;本杰明·科尔比:《爱斯基摩民间故事的部分语法》,《美国人类学家》1973年第75卷第3期,第645-662页;贝伦·迪亚斯-阿古多、巴勃罗·赫瓦斯、费德里科·佩纳多:《基于案例推理的故事情节生成方法》,《案例推理欧洲会议(ECCBR)论文集》,马德里,2004年,第142-156页;哈里·哈尔平、约翰娜·穆尔、朱迪·罗伯逊:《故事改写情节的自动分析》,《自然语言处理实验方法会议(EMNLP)论文集》,巴塞罗那,2004年,第127-133页。
    (9)斯蒂芬·M·奥莫亨德罗:《动态学习与识别的首个最佳模型融合》,约翰·E·穆迪、斯蒂芬·J·韩森、理查德·P·李普曼:《神经信息处理系统研究进展5》,加利福尼亚(圣马特奥):摩根考夫曼,1992年,第958-965页;安德烈亚斯·斯托克、斯蒂芬·奥莫亨德罗:《由贝叶斯模型融合推导概率文法》,拉斐尔·C·卡拉斯科、何塞·翁西纳:《文法推理与应用》,柏林:斯普林格,1994年,第106-118页。
    (10)马修·扬-拉伊:《文法推理》,刘玲(音译)、M·塔梅尔·厄兹叙:《数据库系统百科全书》,柏林:斯普林格,2009年,第1256-1260页。
    (11)马克·阿兰·芬雷森:《从被标注的民间故事中学习叙事结构》,麻省理工学院博士学位论文,2011年。
    (12)对于非平凡起始故事,模型融合的搜索空间变得太大而难以管理:它相当于贝尔数Bn,其中n是模型中的初始状态数(罗塔,1964)。当n增大时,贝尔数也会迅速变大。例如,当B2=2时,B3=5,当B10=115975时,B55≈3.59e+31。
    (13)亚历山大·N·阿法纳西耶夫:《俄罗斯民间故事》3卷本,莫斯科:国家艺术出版社,1957年。请注意,普罗普使用的是阿法纳西耶夫故事集的旧版。为方便起见,我们在文中提供了更现代的引文。
    (14)J.L.费希尔:《民间故事的社会心理分析》,《现代人类学》1963年第4卷第3期,第249页。
    (15)史蒂文·伯德、马克·利伯曼:《语言标注的形式框架》,《语言通信》2001年第33卷第1-2期,第23-60页。
    (16)马克·阿兰·芬雷森:《在自然环境中收集语义:Story Workbench》,《人工智能协会秋季学术研讨会论文集:关于自然灵感人工智能》,华盛顿特区,2008年,第46-53页;马克·阿兰·芬雷森:《从被标注的民间故事中学习叙事结构》,麻省理工学院博士学位论文,2011年。
    (17)拉克尔·埃尔瓦斯、马克·阿兰·芬雷森:《新闻和叙事中描述性指称表达的盛行》,《第48届计算语言学协会年会论文集》,乌普萨拉,2010年,第49-54页。
    (18)詹姆斯·普斯捷约夫斯基、何塞·卡斯塔尼奥、罗伯特·因格里亚、罗泽·绍里、罗伯特·盖佐斯卡斯、安德烈·塞策、格雷厄姆·卡茨:《TimeML:文本中事件和时间表达式的稳定规范》,《第五届计算语义学国际研讨会(IWCS-5)论文集》,蒂尔伯格,2003年,第193页。
    (19)罗泽·绍里、杰西卡·利特曼、鲍勃·克尼彭、罗伯特·盖佐斯卡斯、安德烈·塞策、詹姆斯·普斯捷约夫斯基:《TimeML标注指南》(1.2.1版),2006,http://www.timeml.org/site/publications/timemldocs/annguide_1.2.1.pdf.
    (20)例(10)原句为:He lived in the underworld for almost a year.其时间连接词为for。——译者注
    (21)埃内科·阿吉尔、菲利普·埃德蒙兹编:《词义消歧》,多德雷赫特:斯普林格,2007年。
    (22)克里斯蒂亚娜·费尔鲍姆编:《WordNet:电子词汇数据库》,剑桥麻省理工学院:麻省理工出版社,1998年。
    (23)马莎·帕尔默、保罗·金斯伯里、丹尼尔·吉尔德:命题库:《命题库:语义角色标注的语料库》,《计算语言学》2005年第31卷第1期,第71-105页。
    (24)萨米尔·普拉丹、卡的里·哈吉奥卢、瓦莱丽·克鲁格勒、韦恩·沃德、詹姆斯·H·马丁、丹尼尔·尤尔基:《支持向量学习在语义论元分类中的应用》,《机器学习》2005年第60卷第1-3期,第11-39页。丹尼尔·吉尔德、丹尼尔·尤拉夫斯基:《语义角色的自动标记》,《计算语言学》2002年第28卷第3期,第245-288页。
    (25)温迪·G·莱纳特:《情节单元和叙事概述》,《认知科学》1981年第5卷第4期,第293-331页。
    (26)亚历山大·N·阿法纳西耶夫:《俄罗斯民间故事》3卷本,莫斯科:国家艺术出版社,1957年;亚历山大·N·阿法纳西耶夫:《俄罗斯神奇故事》,诺伯特·古特曼译,纽约:帕特农丛书,1975年,第310-311。
    (27)弗拉基米尔·普罗普:《故事形态学(第2版)》,劳伦斯·斯科特译,奥斯汀:得克萨斯大学,1968年,第36页。
    (28)弗拉基米尔·普罗普:《故事形态学(第2版)》,劳伦斯·斯科特译,奥斯汀:得克萨斯大学,1968年,第38页。
    (29)C·J·范·里杰斯伯根:《评估》,《信息检索》,伦敦:巴特沃斯,1979,第112-140页;另参见本期的尼科利奇、巴卡里奇。
    (30)琼·卡莱塔:《评估分类任务的一致性:Kappa统计》,《计算语言学》1996年第22卷第2期,第249-254页。
    (31)马克·阿兰·芬雷森:《从被标注的民间故事中学习叙事结构》,麻省理工学院博士学位论文,2011年。
    (32)表3中15个故事的中文名称按表中顺序翻译如下:硝皮匠尼基塔,神奇的天鹅,谢缅七兄弟,布赫坦·布赫坦诺维奇,水晶山,机灵的工人萨巴尔沙,熊之子伊万科,蛇与吉普赛人,伊万·波普洛夫,老坐在那儿的弗罗尔卡,伊瓦什科与巫婆,逃兵与魔鬼,丹尼拉·戈沃里拉王子,商人的女儿和女仆,黎明、黄昏和午夜。——译者注
    (33)吉安-卡洛·罗塔:《集合的分区数》,《美国数学月刊》1964年第71卷第5期,第498-504页。
    (34)劳伦斯·休伯特、菲普斯·阿拉比:《对比分区》,《分类期刊》1985年第2卷第1期,第193-218页。
    (35)纳撒内尔·钱伯斯、丹尼尔·尤拉夫斯基:《叙事事件链的无监督学习》,《计算语言学协会第46届年会论文集》,俄亥俄州哥伦布,2008年,第789-797页。纳撒内尔·钱伯斯、丹尼尔·尤拉夫斯基:《叙事模式及其参与者的无监督学习》,《计算语言学协会第47届年会论文集》,新达城,2009年,第602-610页。
    (36)米夏埃拉·勒涅里、亚历山大·科勒、曼弗雷德·平克尔:《利用网络实验学习脚本知识》,《计算语言学协会第48届年会论文集》,乌普萨拉,2010年,第979-988页。
    (37)本杰明·科尔比:《爱斯基摩民间故事的部分语法》,《美国人类学家》1973年第75卷第3期,第645-662页;阿兰·邓迪斯:《北美印第安人民间故事形态论》,《民俗学者通讯》第195期,赫尔辛基:芬兰科学院,1964年。
    (1)弗拉基米尔·普罗普:《故事形态学(第2版)》,劳伦斯·斯科特译,奥斯汀:得克萨斯大学,1968年。

© 2004-2018 中国地质图书馆版权所有 京ICP备05064691号 京公网安备11010802017129号

地址:北京市海淀区学院路29号 邮编:100083

电话:办公室:(+86 10)66554848;文献借阅、咨询服务、科技查新:66554700