当前位置: 首页 >> dafa888casino网页版下载 >> 学院热闻 >> 正文

古今汉语WordNet工作坊成功召开

作者:时间:2022-04-24点击数:

WordNet

工作坊

2022年4月20日下午,第二十六次计算语言学系列学术活动“古今汉语WordNet工作坊”在腾讯会议上顺利进行,北京大学计算语言学研究所刘扬副教授主讲,dafa888casino网页版下载李斌副教授主持,南师大本研部分学生参加了本次线上会议讨论,研讨了WordNet构建中的相关经验和存在问题。

WordNet(词网)是国际上通用的词义表示数据库,由称为synset的同义词集和各种语义关系组成。WordNet在语言学,心理学和人工智能等诸多领域有重要作用,是学术界和工业界不可或缺的资源。

李斌副教授介绍了南师在WordNet上的工作,主要围绕先秦古汉语WordNet的构建和校对展开。先秦WordNet的构建得益于北大构建的中文概念词典(CCD)的研究成果,将先秦词汇以CCD为中间媒介,映射到英语词网中,从而实现先秦古汉语词网、现代汉语词网、英语词网三者对应。

随后,卢雪晖同学就先秦WordNet的构建进行了《先秦WordNet的构建与跨语言分析》的汇报。先秦汉语是汉语发展的源头,其词汇研究对汉语词汇史具有重要意义,构建和改进先秦WordNet有利于系统展现先秦词汇语义全貌。卢雪晖主要报告了关于围绕先秦WordNet的改进,包括对于先秦词语映射到英文WordNet时存在的无法完全对应和多对多映射等问题提出自己的看法。随后又将先秦古汉语WordNet和古梵语、古拉丁语等古代语言的WordNet构建进行对比,。凸显了WordNet在跨语言应用上的价值。接着,拓新宇同学就汉代WordNet的构建也进行了分享,该研究可以为探究汉语词义演变提供更好的资源。

刘扬教授在了解了南师大的工作之后,开始了正式报告。首先,介绍了WordNet背后的理论以及在构建中文概念词典(CCD)时遇到的问题。刘老师首先从组合和聚合的角度介绍了词义的定义,随后介绍了英语WordNet自身存在和问题和体系上存在的一些错误。例如WordNet对于名词给出的顶层概念分类并没有给出具体的分类依据,存在一些应该汇集到一个公共父节点却形式散落的概念节点。并从计算机操作角度说明了对于体系和映射改进上的可行性和意义。刘老师认为概念映射是构建WordNet的中心环节,并且和我们分享了中文概念词典的兼容上对概念对应设立的三个语义原则:成词及词性原则、准确性原则、完备性原则。为了能够将现代汉语词汇尽可能全面的映射,在实际映射过程中需要对三个原则作出一定的取舍。中文概念词典反映了汉语的实际情况,对中文信息处理有更深的帮助。刘扬教授指出WordNet中主要依靠聚合关系组织词汇,未来可以在词义系统中继续补充必要且重要的组合关系信息来完善现有的WordNet体系。刘扬教授以参与构建的中文概念词典为例,既从理论层面向我们介绍了WordNet整体架构,也从技术层面提出一些构建的建议,同学们都受益匪浅。

互动讨论

此次分享会内容丰富,参会的老师和同学们都十分热情,积极发表自己的观点,并就自身工作和会议过程中的疑惑进行探讨。刘教授对基于Wordnet的词义演变、语言内部的概念化和词汇化现状、及语义选择限制等方面的研究提出了自己的看法,对古汉语WordNet的构建提出了很多重要的建议,加深了大家对WordNet的理解,探讨了汉语WordNet的构建与应用的价值。

本次线上讨论由dafa888casino网页版下载、计算机科学与电子信息学院和语言科技研究所共同举办,与会师生收获颇丰。这一系列项目活动,为同学们提供了深入了解计算语言学的平台和机会,有助于未来进一步探索完善相关项目,促进同学们的成长与进步。

版权所有:dafa888casino网页版下载 学院地址:江苏省南京市宁海路122号中大楼 邮编:210097
联系电话:(025)83598452 电子邮箱:03363@njnu.edu.cn