❶ 语料库的使用
几百兆的文件,记事本打不开,可下载ultra-edit试下.
关于"是......的"的句子,最好表达如下:
!是$20的
意思是:以"是"开头,以"的"结尾,且其间隔不大于20个字的的句子(20可以修改成别的数字,这要看你的具体目的了).这个句子的特征为判断句,故以是为中心子句(中心词).
北大语料库 有详尽的说明及实例:
http://ccl.pku.e.cn:8080/ccl_corpus/jsearch/ccl_corpus_readme.htm#2.6_子句
❷ 怎么进入北大语料库收费吗
需要一定的人缘资本 不是光有钱就可以的
❸ 北京大学语料库现代汉语部分所收语料的范围和时间段。
北京大学计算语言学研究所已经完成了一个有2700万汉字的现代汉语语料库的基本加工。加工项目除词语切分和词性标注外,还包括专有名词(人名、地名、团体机构名称等)标注、语素子类标注以及动词、形容词的特殊用法标注。详情请查阅《北京大学现代汉语语料库基本加工规范》,它的出台是为了更广泛地向专家、同行征询意见,以便进一步修订。
❹ skell语料库使用方法
基本上没有办法建立相应的语料库,优质的原语料是优质语料库的前提。
动态变化的语料库:大众传播媒体的情况是在不断变化的,语料库也要相应变化.(例如:1978年,中国报纸只有186种,基本上是单一的党委机关报,到1995年底,已经增加到2202种,平均期印数增加4倍,总印张增加3·5倍,报纸的品种,功能,发行都有了相当大的变化如果要科学地反应语言的流通应用情况,语料库的容量,选材,抽样等怎么可能一成不变呢)
❺ 怎么是使用北京语言大学的语料库啊
有很多同行、高手帮你解决问题,互动性很强。好像不连接到北大中文语料库,也不能查找。主要是同行间的互相交流,也会提供很多语料库相关资源。
好像服务器在香港,有时不好上。