2024年1月13日晚,南京师范大学语言大数据与计算人文研究中心举办的首届“数字人文系列讲坛”第一场活动顺利开展。
本次讲坛通知一经发布,就有幸得到了各界研究学者的关注与踊跃报名。本次数字人文系列讲坛的总报名人数近200人共来自43个高校单位,实际总录取人数为95人。报名者主体为中青年教师、博士研究生、硕士研究生、本科生,分别来自北京大学、北京师范大学、浙江大学、重庆大学、等高校以及韩国檀国大学、美国阿拉巴马大学、日本早稻田大学等海内外单位。B站还有上百位听众,大家在线上齐聚一堂,共同参与到数字人文系列讲坛的交流活动中。
首场讲座邀请华中科技大学唐旭日教授,开展了题为“基于语料库的搭配研究与英文论文写作”的讲座。

讲座伊始,南京师范大学李斌老师介绍了唐老师的个人履历、学术成就和讲座主要内容。

在本次讲座中,唐旭日老师围绕“国际语料库语言学的研究范式、搭配研究的创新:研究范式改变的尝试、国际语料库语言学英文论文的写作”三大方面,结合相关事实、学术实例阐述见解,引发了大家的思考。
一、国际语料库语言学的研究范式
首先,关于“什么是研究范式”这个问题,唐教授指出,研究范式本质上是立足一个框架,这个框架包括三大的组成部分,分别是研究对象、知识论和方法论,并通过中国知网相关的论文标题进行了例证。谈到语料库语言学的研究范式时,唐教授基于两种不同的研究范式进行讲解,一种是基于语料库的范式,另一种是语料库驱动的范式。前者是自上而下的研究,是基于理论看语料,是一种温和的经验处理式的研究;后者是自下而上的研究,基于语言事实去探索语言现象中间存在的关联模式。
随后唐教授针对研究范式的问题进行了小结,指出不同学科有着不同的研究范式,不同学科的研究范式也不尽相同,所以当我们在实际做研究时会面临三个选择,分别是确定研究范式、综合运用多种研究范式和改变研究范式。
二、搭配研究的创新:研究范式改变的尝试
在“搭配研究的创新”部分,唐教授结合自身的研究经历进行了详细的介绍。唐教授首先就搭配与语料库语言学研究范式的关系进行了阐述,其作为研究对象本身是一种语言现象,作为知识是一种同现频次的语言知识,它的获取方法是统计分布,验证方法在语言习得、话语分析等领域都有应用,所以搭配是语料库语言学研究范式的重要组成部分。

那么搭配研究怎么去创新呢?唐教授提出首先要知道现有的研究中有什么不足,并指出关于搭配研究在当下的不足首先表现在表征形式上,“表格形式”不便于人工理解、分析,并且缺乏全局性,导致做句法、语义信息解读不方便。“搭配网络”采用可视化方法,但是与语言的线性形式不一致,且缺乏全局性,难以解读句法模式。基于上述不足,创新性地提出一种新的、以“搭配序列”为主体的形式化表征。这样的表征方式在可视化过程中准确地传递出了语言的线性特征,可以得出节点词与搭配词结合使用的不同句法形态,实现与弗思定义更为契合的、对不同情景语境图式的分析。
什么是搭配序列?唐教授指出一个节点词的搭配是由一系列携带搭配信息的搭配词构成,称为搭配序列。随后提出搭配词所携带的信息包含词形、相对于节点词的位置、相对于节点词的距离、与节点词的关联强度四个方面的信息,并通过一些实例论证了为何是这四个方面的信息,以及怎么去计算这些信息。并指出在该基础上还可以进行进一步的研究,如借助词语知识图谱对搭配序列进行语义抽象,观测节点词的语义分布;以及不同词间语义相似度的计算。唐教授通过区分英语中的副词和对二语习得词汇能力的分析两个实例,充分证明了这种基于Firthian Collocation的新的形式化表征所具备的实际意义。

三、国际语料库语言学英文论文的写作
唐教授关于英文论文写作需要注意的问题分别从研究范式、选题、研究过程、论文结构和语言四个方面进行了陈述,启发颇多。在同一个学科下面的不同领域,研究范式也不尽相同,因此在进行研究时要确定某一个特定的领域。研究范式的选择也意味着研究主题的选择,同一主题,不同研究范式在理论假设、知识表征以及研究方法方面不尽相同,尤其提醒我们避免将“目前尚未有人涉及”或“文献比较多”作为唯一选题标准,要注重选题的理论价值和应用价值!在研究过程上,要言必有据,推理清晰、连贯,注重细节。关于论文的结构和语言,唐教授指出结构一定要遵循研究范式,如果是英文写作,则地道的英语是基本的要求。好的论文一定是经过了多次修改、推敲、打磨出来的。他同样提醒我们要注意参考文献的书写规范,建议多用文献管理软件。
在提问环节,唐教授分享了自己怎样从英语专业进入到计算语言学领域的经验。在唐教授的解答中学员表示“受益匪浅”。
唐教授认为从事计算语言学需要三个条件:首先要思维严谨,有比较好的逻辑思维能力;其次是有一定的数学功底,起码高中数学要学的不错;最后要有一定的韧性和专注力。他希望更多的人才可以进入到计算语言学的领域中,推动学科发展,在国际上形成中国的影响力。
唐教授指出在数字人文的背景下,搭配这样的工具在很多领域都可以得到很大的应用。比如在文学领域里,给定一个文本,就可以用这种方法获取人物的性格。以人物姓名为节点词,通过搭配的动词来解读人物的行为,能够发现其经常做的一些事情,从而对人物角色进行总体解读和分析。在历史研究和话语分析中,基于搭配的研究方法也具备很大潜力。

最后李斌教授进行了总结,唐教授从搭配的创新研究出发为我们分析和理解问题提供了有益的指导,并提出用计算、计量的方法研究词语搭配的问题有很多创新和应用领域供大家去研讨。