RDF:
TE_06_中文分詞語料庫_抽樣資料
[MT] TE_06_ 中文 分 分料 库 _ 抽样 资料

使用條款

使用此資料集前,請詳閱下列條款:

  • 資料庫之電子型式,組成資料內容與型式,著作權屬中央研究院原各著做小組,智慧財產權所有權仍屬中研院所有。

  • 資料庫內容之著作權屬原始著作人所有

  • 牽涉本條款第一項及第二項著作內容之任何引用之商業行為應與著作權所有人另定約規定之。

  • 如有侵犯資料庫著作權或智慧財產權之行為,應由使用者自行負擔法律責任。

  • 如因使用資料庫而發生任何損害,原著作權人及授權單位(國網中心)不負任何損害賠償責任,使用人願意放棄向著作權人及授權單位索賠之權利。

  • 用戶如有因使用此資料而發表相關學術研究成果,須於文中載明。

  • 目前完整資料集授權對象為國網中心計算主機學研用戶,並同意使用協議。

若使用者使用本資料集,即視為同意上述條款並履行相關法律義務。

中文分詞語料庫

中文分詞語料庫為一包含兩百萬詞、不含詞類標記的語料庫,每個文句皆根據分詞原則來斷 詞。而此分詞原則,乃是中華民國計算語言學學會在經濟部中央標準局委辦的「資訊處理用 中文分詞規範調查研究及草案研擬」計畫中所訂定的。本語料庫來源包括書面語和口語兩部 分,其中資訊類佔 21%。


完整資料申請使用說明

  • 完整資料集授權對象為國網中心計算主機 正式學研用戶
  • 完整資料之使用條款與資料取用說明說明請參考資料集中 Data_Usage_and_License_Agreement-Sinica.pdf 中之內文。
  • 確認同意使用條款後,請填寫所需之申請資料後,回傳至 datamarket@narlabs.org.tw。
[MT] #__ Terms of Use __ ## Please read the following terms: * The electronic model of the database, the content and type of information, the copyright Central Research Institute, etc., the wisdom property rights ownership is still All in the school res...

Data and Resources

  • 中文分詞語料庫_說明.pdfPDF

  • sample_1萬詞.seg

  • Data_Usage_and_License_Agreement-Sinica.pdfPDF

    1.完整資料集授權對象:國網中心計算主機學研用戶。 2.若需要完整資料集,請同意此使用協議,並回傳至datamarket@narlabs.org.tw。

Additional Info

Field Value
Last Updated September 16, 2021, 13:34 (CST)
Created September 16, 2021, 13:33 (CST)
DPA_DateImported 212582112
DPA_former_id 4923a562-237f-4b9b-821f-4cfd41bb2fdc
DPA_former_name nchc_2019_te_06
DPA_former_owner_org 6cfd6542-46e2-49bd-87ac-7f9b97b3711f
DPA_former_site https://scidm.nchc.org.tw
AODP Economy Taiwan