RDF:
TE_03_漢語平衡語料庫_抽樣資料
[MT] TE_03_ 语料 库 _ 抽样 网

使用條款

使用此資料集前,請詳閱下列條款:

  • 資料庫之電子型式,組成資料內容與型式,著作權屬中央研究院原各著做小組,智慧財產權所有權仍屬中研院所有。

  • 資料庫內容之著作權屬原始著作人所有

  • 牽涉本條款第一項及第二項著作內容之任何引用之商業行為應與著作權所有人另定約規定之。

  • 如有侵犯資料庫著作權或智慧財產權之行為,應由使用者自行負擔法律責任。

  • 如因使用資料庫而發生任何損害,原著作權人及授權單位(國網中心)不負任何損害賠償責任,使用人願意放棄向著作權人及授權單位索賠之權利。

  • 用戶如有因使用此資料而發表相關學術研究成果,須於文中載明。

  • 目前完整資料集授權對象為國網中心計算主機學研用戶,並同意使用協議。

若使用者使用本資料集,即視為同意上述條款並履行相關法律義務。

中央研究院漢語平衡語料庫 簡介

中央研究院漢語平衡語料庫(簡稱 Sinica Corpus)第 4.0 版,為一包含一千多萬目詞的帶標記平衡語料庫。本語料庫中每個文句都依詞斷開,並標示詞類標記。語料的蒐集也盡量做到平衡分配在不同的主題和語式上,是現代漢語無窮多的語句中一個代表性的樣本。所蒐集的文章為 1981 年到 2007 年之間的文章。


完整資料申請使用說明

  • 完整資料集授權對象為國網中心計算主機 正式學研用戶
  • 完整資料之使用條款與資料取用說明說明請參考資料集中 Data_Usage_and_License_Agreement-Sinica.pdf 中之內文。
  • 確認同意使用條款後,請填寫所需之申請資料後,回傳至 datamarket@narlabs.org.tw。
[MT] #__ Terms of Use __ ## Please read the following terms: * The electronic model of the database, the content and type of information, the copyright Central Research Institute, etc., the wisdom property rights ownership is still All in the school res...

Data and Resources

  • 漢語平衡語料庫_說明.pdfPDF

  • asbc4_sample_約1萬詞.xmlXML

  • Data_Usage_and_License_Agreement-Sinica.pdfPDF

    1.完整資料集授權對象:國網中心計算主機學研用戶。 2.若需要完整資料集,請同意此使用協議,並回傳至datamarket@narlabs.org.tw。

Additional Info

Field Value
Last Updated September 16, 2021, 13:32 (CST)
Created September 16, 2021, 13:31 (CST)
DPA_DateImported 212582112
DPA_former_id 32c5d2a9-56f1-4580-8c37-d571f94406ca
DPA_former_name nchc_2019_te_03
DPA_former_owner_org 6cfd6542-46e2-49bd-87ac-7f9b97b3711f
DPA_former_site https://scidm.nchc.org.tw
AODP Economy Taiwan