Ⅰ 语料库语言学的介绍
别的语言学科基本上都是研究有关领域与语言之间的关系,例如,社会语言学研究的是社会与语言的关系,心理语言学研究的是人的心理活动与语言之间的关系。而语料库语言学则不同,它只是以语料库为手段来研究语言。
通过定性与定量相结合的研究发现,网络体育英语新闻标题在词汇、结构、时态和修辞方面具有自身独特文体特征:新闻标题的平均词长比一般文体稍长,并常通过省略虚词、使用缩略语、短小词汇、复合词、词性转换、大量动词词组、一般现在时态以及暗喻、换喻和双关等多种修辞手法来丰富新闻的描写。
Ⅲ 什么是语料库
关于语料库的三点基本认识:语料库中存放的是在语言的实际使用中真实出现过的语言材料;语料库是以电子计算机为载体承载语言知识的基础资源;真实语料需要经过加工(分析和处理),才能成为有用的资源;
定义
语料库
名词(corpus,复数corpora)
指经科学取样和加工的大规模电子文本库。借助计算机分析工具,研究者可开展相关的语言理论及应用研究。
corpus
n. (pl. corpora)
refers to a large collection of well-sampled and processed electronictexts, on which language studies, theoretical or applied, can be concted withthe aid of computer tools.
语料库是语料库语言学研究的基础资源,也是经验主义语言研究方法的主要资源。应用于词典编纂,语言教学,传统语言研究,自然语言处理中基于统计或实例的研究等方面。
分类
语料库有多种类型,确定类型的主要依据是它的研究目的和用途,这一点往往能够体现在语料采集的原则和方式上。有人曾经把语料库分成四种类型:⑴异质的(Heterogeneous):没有特定的语料收集原则,广泛收集并原样存储各种语料;⑵同质的(Homogeneous):只收集同一类内容的语料;⑶系统的(Systematic):根据预先确定的原则和比例收集语料,使语料具有平衡性和系统性,能够代表某一范围内的语言事实;⑷专用的(Specialized):只收集用于某一特定用途的语料。
除此之外,按照语料的语种,语料库也可以分成单语的(Monolingual)、双语的(Bilingual)和多语的(Multilingual)。按照语料的采集单位,语料库又可以分为语篇的、语句的、短语的。双语和多语语料库按照语料的组织形式,还可以分为平行(对齐)语料库和比较语料库,前者的语料构成译文关系,多用于机器翻译、双语词典编撰等应用领域,后者将表述同样内容的不同语言文本收集到一起,多用于语言对比研究。已经累积了大量各种类型的语料库,如:葡萄牙语种树库、面向文本分类研究的中英文新闻分类语料库、路透社文本分类训练语料库、中文文本分类语料库、大开放字幕库OpenSubtitles的多语言平行语料数据(OpenSubtitles Corpus)、《圣经》双语语料库("Bible" bilingual corpus)、Short messages service(SMS) corpus(短消息服务(SMS)语料)等。
特征
语料库有三点特征
⒈语料库中存放的是在语言的实际使用中真实出现过的语言材料,因此例句库通常不应算作语料库;
⒉语料库是承载语言知识的基础资源,但并不等于语言知识;
⒊真实语料需要经过加工(分析和处理),才能成为有用的资源。
语料库的发展经历了前期(计算机发明以前),第一代语料库,第二代语料库,到第三代语料库
Ⅳ 语料库怎样查询两本书里的重复词语
语料库不具备查重功能。
语料库是语料库语言学研究的基础资源,也是经验主义语言研究方法的主要资源。应用于词典编纂,语言教学,传统语言研究,自然语言处理中基于统计或实例的研究等方面。
语料库有多种类型,确定类型的主要依据是它的研究目的和用途,这一点往往能够在语料采集的原则和方式上有所体现。有人曾经把语料库分成四种类型:(1)异质的:没有特定的语料收集原则,广泛收集并原样存储各种语料;(2)同质的:只收集同一类内容的语料;(3)系统的:根据预先确定的原则和比例收集语料,使语料具有平衡性和系统性,能够代表某一范围内的语言事实;(4)专用的:只收集用于某一特定用途的语料。
Ⅳ 什么是“语料库语言学
语料库语言学以语料库为手段研究语言 ,是一门独具特色的语言研究学科。语料库是大量可用计算机处理的语料的集合。
Ⅵ 什么是语料库
语料库中存放的是在语言的实际使用中真实出现过的语言材料。
Ⅶ 怎么利用语料库做古代汉语语法化研究
词语转类在各种语言现象中普遍存在。它指的是不经过任何词形变化直接用于其它词性的词。现代汉语中的名转动词现象一直是语言学家关注的焦点。回顾以往的研究可以发现,研究者们主要从结构主义语言学、转换生产语言学、认知语言学和功能语言学等不同的理论出发,对名转动词现象做出了不同程度的描写和解释,他们的研究对更好地理解这一语言现象有重要意义。语言的转变处于一个持续变化的连续系统,而非一成不变的封闭系统。名词彻底转换为动词要经过活用和兼类两个阶段才能成功完成。活用具有临时性,是偶然出现的用法,词典不会对其活用词性加以标注;而兼类具有稳定性,词典上会对其新词性加以标注。以往研究多侧重于不同理论对名转动词现象的解释,对转换过程中处于活用和兼类这两个不同阶段的词语的使用特点则研究较少。为弥补该不足,本文将借助《现代汉语词典》(第五版和第六版)以及北大汉语语料库(CCL)在以下方面做出有益尝试。第一,搜集第五版现代汉语词典中名转动词的活用词;第二,借助第六版现代汉语词典找出这些词中哪些已经变为兼类词;第三,对仍是活用词的和已经变为兼类的这两类词在北大汉语语料库中的语料进行比较和研究,通过定性和定量分析,对它们被用作动词的频率、分布以及语料来源进行比较,结果发现兼类被用作动词的平均频率大约是活用被用作动词的平均频率的十倍,而活用和兼类被用作动词的频率在不同的文本体裁中也呈现不同的特点。最后,本文借助认知语言学中的凸显理论和转喻对名转动词的活用和兼类做进一步比较,发现活用词的动词意义并不稳定,只适用于一些特定语境,而兼类词的动词意义比较固定,已成为中心词义的一部分。
Ⅷ 外国语言学及应用语言学有哪些研究方向
外国语言学与应用语言学以外国语言为主要研究对象,侧重将语言学理论、方法及其研究成果应用到与语言相关的各个领域。
外国语言学及应用语言学研究方向是什么
其主要研究方向有:
1.语言学:研究句法、语义、语用、语篇等语言核心层面及其与思维、逻辑、认知和社会等方面的关系;研究基于语料库的语言描写。
外国语言学及应用语言学研究方向是什么
2.外语教学:研究外语教学原理与实践,外语教学环境要素,第二语言习得,双语教学,外语教学大纲设计,外语教材、教学法和语言测试等。
3.语言与文化:研究语言的文化信息载体形式,文学文类和作品,文学文体,跨文化交际等。
Ⅸ 认知语言学的方法
认知语言学的主要研究方法简介
1
内省法
语言内省是指语言使用者对认知中凸现的语言的某些方面进行有意识的注意。认知语言学在开创之初,为了构建该学派的理论框架,主要都采用的是内省法的思辨性研究,即研究者通过观察、内省、分析、推理手段等对语言现象形成规律性的认识。内省研究方法可以追溯到古希腊时期。柏拉图是纯粹的心智主义者。他认为人类先天具有认知世界的能力,可用内省法进行逻辑推理,采用演绎法认识世界,并获得关于世界的知识。但是,内省法研究语言存在一些天然的缺陷。首先,主要参照既有的研究文献或语料进行研究,虽然该方法在逻辑上具有演绎的性质,但主观性太强;其次,不同实验主体用内省法得出的实验结果仅适用于解释特定的实验,缺乏普遍的解释力;最后,人类的某些认知功能无法被感觉经验所感知,等等。
2
语料库法
语料库法是用来记录自然发生的言语的一种方法。它主要是对书写文本中的片段进行记录。因此,语料库法的优势在于它可以给研究人员提供大量的文本信息。从本质上看,语料库是研究者对于某一语言现象内省的验证。它能利用计算机存储量大和检索迅速的优势。近年来,该方法在认知隐喻理论、构式理论及词义理论等方面获得了广泛应用,为认知语言学的众多理论假设提供了实际的语料支撑,从使用频率上对语言现象的集中趋势进行验证。语料库法的优点还反映在以下几个方面。
首先,语料库法可以通过频率反映某一个语言现象的特征,从而揭示该语言现象在人类认知过程中的无意识性。这种无意识性往往很难通过有意识的内省法揭示出来。
其次,可从语料分析上观察某一语言现象的历时演变过程。
另外,语料的频率统计还可以帮助研究人员发现词语的共现特征。而在这一点上其他研究方法,尤其是内省法很难做到。
语料库法还能帮助研究人员发现那些与某一语词(表述)意义相近的表述。这样,就会形成一个有关某情境的表达式集合,如同义词词典。而内省法很难完成这样的任务,说明人的认知能力不具备这样的信息提取能力。
语料库法最大的弊端在于它受研究者个人主观判断影响。首先,研究者对检索关键词的选取在一定程度上会影响检索的结果,并影响研究结论;其次,语料库自身的完善程度也会影响最终的结论。因为语料库中未出现的语言现象有时并非语言实际使用中没有,有可能是语料库不健全所致。再次,语料库并不能直接反映许多抽象的、标准化的语言结构。原因在于语料库所收录的语句可能是说话人省略了某些成分后的简化表达,从结构上看不符合标准的句法或语法要求,但实际使用中是完全可以进行交流的。最后,语料库并不能给研究人员提供直接的结论,对检索结果的分析依然取决于研究人员的主观判断。
3
多模态分析法
多模态分析主要用于手语和体势语的认知研究。它同样也是从现实生活中寻找素材,通过对手语或体势语的研究来探索人类的认知过程,以期从新的视角对语言现象进行解释。
与语料库法不同的是,多模态分析可以记录言语过程的每一个细节,包括言者的语调、音调等。学者们普遍认为,手语和口语一样,是一个系统的谱系结构,都具有认知上的共性。对手语的研究可以为认知语言学的研究提供一定的认知理据和语料来源。例如,研究人员发现,美国手语(ASL)中也有Lakoff和Johnson提出的结构隐喻和实体隐喻,以“IDEAS ARE OBJECTS”为例。在ASL中,表达思想需要斟酌时,手势传达的是从许多可能的选择中小心慎重地挑出一个物体的意思。
同样,手势也具有隐喻性。研究人员发现,受试在表达好的事物或行为时,往往用向上的手势,而在表达坏的事物或行为时,通常使用向下的手势,这和语言表达式中蕴含的概念隐喻GOOD IS UP;BAD IS DOWN相一致。此外,受试者在表达抽象概念时用右上手势,而在表达具体概念时用左下手势,这和语言表达式中蕴含的概念隐喻ABSTRACT IS UP;CONCRETE IS DOWN吻合。
多模态分析法的优点首先在于可以灵活地分析那些言语过程中被认为是中度或低度可及性的次级信息系统,如,声音动态性、姿势、体势等。其次,在线记录也可以捕获一些不易被直接提取的信息,研究人员可随后基于录像判断一个言语是否合乎语法等。再者,它可以分析言语过程中的一些综合因素,因为这些因素都会促成说话人表述的形成,这也是内省法难以办到的。
多模态法的主要弊端在于其自身并不能决定哪个模态及其成分是研究人员所应该关注和研究的要点。这往往需要研究人员采用其他一些方法进行补充和探索。
4
心理实验法
心理实验法也被称为“行为研究法”(Behavioral Research),是指在一定条件下,通过给予被试某种刺激或任务,然后观察被试对刺激的反应,或完成任务的情况,借此推断整个过程中所涉及的认知机制或过程。近年来,心理实验法在认知语言学中被越来越多的学者所采用。例如,研究人员将该方法应用于隐喻理解过程的研究发现,如果一个隐喻是人们较为熟悉的,对其理解则并不需要通过字面意义的过渡。但如果是不熟悉的隐喻,则需要字面义作为中介,以触发隐喻义。此外,心理实验法还可应用于二语习得与母语习得所涉及的不同的认知机制的研究等等。
心理实验法的最大优点在于可以观察到一些非常微妙的认知过程,如对认知加工时间的测量可以精确到毫秒。另外,可以人为地控制一些变量,从而观察在受控变量下人们对语言反应的认知机制。
5
脑神经实验法
脑神经实验法主要通过一些仪器设备,观察与某一语言机制相关的脑神经或脑区的活动。目前主要应用于语言神经认知研究的方法有ERP,fMRI,PET,MEG等。这些先进的科技手段已帮助语言学家发现了与语言有关的脑区在语言的认知加工时的一些重要的神经机制,对认知语言学的发展产生了深远的影响。
借助脑神经实验法,语言学家们从以往的仅仅通过内省式的推断,发展到现在能获得实证的认知神经科学的证据支持,这不但有助于检验一个理论假设是否具有心理实在性,还能检验其是否具有神经实在性。例如,研究人员通过ERPs电生理实验发现,认知语言学家所提出的框架语义理论是一个在神经层面客观存在的认知现象。通过比较实验中不同的电生理指标,研究人员发现,在一个特定的框架中理解一个语篇所激活的N400比未提供框架下所诱发的幅度要高,这就证实了框架知识在理解中的重要作用。此外,隐喻理解所涉及的神经机制也得到了相关脑神经研究法的验证。
因此,神经法使得语言学家们所提出的“心理—神经—语言”三个层面在认知系统上更加完善、可靠。可以说,在语言的人工智能领域,神经法是未来认知语言学的一个重要发展方向。
*本文内容来自《认知语言学研究方法》
Ⅹ 语料库语言学如何为语言学的研究提供统计数据
语料库存储的是真实语料,经过收集、加工处理,可以跟你用户需求提取全部符合的语料,从而进行统计分析,然后才能得到数据