❶ 語料庫的使用
幾百兆的文件,記事本打不開,可下載ultra-edit試下.
關於"是......的"的句子,最好表達如下:
!是$20的
意思是:以"是"開頭,以"的"結尾,且其間隔不大於20個字的的句子(20可以修改成別的數字,這要看你的具體目的了).這個句子的特徵為判斷句,故以是為中心子句(中心詞).
北大語料庫 有詳盡的說明及實例:
http://ccl.pku.e.cn:8080/ccl_corpus/jsearch/ccl_corpus_readme.htm#2.6_子句
❷ 怎麼進入北大語料庫收費嗎
需要一定的人緣資本 不是光有錢就可以的
❸ 北京大學語料庫現代漢語部分所收語料的范圍和時間段。
北京大學計算語言學研究所已經完成了一個有2700萬漢字的現代漢語語料庫的基本加工。加工項目除詞語切分和詞性標注外,還包括專有名詞(人名、地名、團體機構名稱等)標注、語素子類標注以及動詞、形容詞的特殊用法標注。詳情請查閱《北京大學現代漢語語料庫基本加工規范》,它的出台是為了更廣泛地向專家、同行征詢意見,以便進一步修訂。
❹ skell語料庫使用方法
基本上沒有辦法建立相應的語料庫,優質的原語料是優質語料庫的前提。
動態變化的語料庫:大眾傳播媒體的情況是在不斷變化的,語料庫也要相應變化.(例如:1978年,中國報紙只有186種,基本上是單一的黨委機關報,到1995年底,已經增加到2202種,平均期印數增加4倍,總印張增加3·5倍,報紙的品種,功能,發行都有了相當大的變化如果要科學地反應語言的流通應用情況,語料庫的容量,選材,抽樣等怎麼可能一成不變呢)
❺ 怎麼是使用北京語言大學的語料庫啊
有很多同行、高手幫你解決問題,互動性很強。好像不連接到北大中文語料庫,也不能查找。主要是同行間的互相交流,也會提供很多語料庫相關資源。
好像伺服器在香港,有時不好上。