Монгол хэл бичгийн мэдээлэл боловсруулалтад зориулсан тэмдэг нэрийн утгын ангиллын тогтолцоо

Main Article Content

Ин Хуа Хай

Abstract

In Mongolian, nouns, adjectives and verbs are three Open Part of Speech, which occupy a relatively high proportion in the vocabulary of the dictionary and corpus. Therefore, the semantic classification of it is not only the component of Mongolian lexical semantics but also the basic content of Mongolian computational semantics. For the Mongolian corpus processing and semantic dictionary development needs, using the semantic field theory as the framework, the project divided 6 major categories, 262 sub-categories on the lexical basic meaning of the adjectives, and developed its corresponding mark set, completed the semantic annotation on "one million-word modern Mongolian corpus”. The paper dissertates the Theory of Semantic Field based on the overview of previous research of Mongolian semantics, and describes the semantic classification and its mark set, and the application in corpus processing.





Тэмдэг нэр, жинхэнэ нэр, үйл үг нь монгол хэлний гурван том “задгай шинжтэй” үгсийн аймаг (Open Part of Speech) бөгөөд толь бичиг, хэлний материалын хөмрөг зэрэгт эдгээр үгсийн аймгийн эзлэх хувь нь харьцангуй өндөр байдаг. Иймээс үгийн сангийн утгазүйн талаас утгаар нь ангилах нь монгол хэлний үгийн сан зүйн бүрэлдэхүүн агуулга болох төдийгүй монгол хэлний цахим утгазүй (Mongolian Computational Semantics)-н суурь судалгаа болно. Монгол хэл бичгийн мэдээлэл боловсруулалтын материалын хөмрөг боловсруулах ба утгын толь байгуулах бодит хэрэгцээнд зориулж, тус өгүүлэлд утгын талбайн онолоор утгын ангиллын онолын загвар болгож, тэмдэг нэрийн үгийн сангийн үндсэн утгын онцлогийг үндэслэж, түүнийг 6 том төрөл, 262 жижиг төрөлд ангилж, тэдгээрийн харгалзсан тэмдгийн олонлогийг (mark set) боловсруулж, “Зуун түмэн үгтэй одоо үеийн монгол хэлний материалын хөмрөг”-т утгын тэмдэг хадсан байна. Мөн өгүүлэлд үгийн утгын ангиллын судлагдсан байдлыг тоймчлон тоочсон суурин дээр, утгын талбайн онол хийгээд тэмдэг нэрийн утгын ангилал, жич түүний тэмдгийн олонлогийг тайлбарлан өгүүлж, тус утгын ангиллын тогтолцооны материалын хөмрөг боловсруулах судалгааны хэрэглээний ач холбогдлыг хураангуйлан тайлбарлав.




Article Details

How to Cite
Хай, И. Х. (2018). Монгол хэл бичгийн мэдээлэл боловсруулалтад зориулсан тэмдэг нэрийн утгын ангиллын тогтолцоо. Acta Mongolica, 17(492), 100–113. Retrieved from https://journal.num.edu.mn/actamongolica/article/view/5912
Section
Articles

References

Ш.Лувсанвандан “Орчин цагийн монгол хэл”, Өвөр монголын ардын хэвлэлийн хороо., 1961 он.

Хамтын бүтээл “Орчин цагийн монгол хэлний үг зүйн байгуулалт”, тэргүүн дэвтэр. Улаанбаатар., 1987 он.

Өвөр монголын их сургуулийн Монгол судлалын дээд сургуулийн монгол хэл бичиг судлах газар “Одоо үеийн монгол хэл” (хоёрдугаар хэвлэл)., 2005 он.

Чингэлтэй “Одоо үеийн монгол хэлний зүй”, Өвөр монголын ардын хэвлэлийн хороо.,1979 он.

Эрдэнчулуу “Сураг занги шийдвэрлэлтэд зориулсан монгол хэлний үйл үгийн утга судлал”, Өвөр монголын ардын хэвлэлийн хороо., 2009 он.

Жиан Ин Цүн “Сураг занги шийдвэрлэлтэд зориулсан монгол хэлний тэмдэг нэрийн утга судлал”, Өвөр монголын их сургуулийн мастер цол хамгаалах өгүүлэл., 2003 он.

Боо Жин Лан “Монгол хэлний хоршоо тэмдэг нэр ба жинхэнэ нэрийн утгын уялдааны тухай”, Өвөр монголын багшийн их сургуулийн мастер цол хамгаалах өгүүлэл., 2005 он.

Сэцэн., Дэлгэрмаа “Утга зүй”, Өвөр монголын ардын хэвлэлийн хороо., 1996 он.

Д.Бадамдорж “Монгол хэлний үгийн сангийн утга зүй”, Улаанбаатар хот., 2006 он, х.221.

[11]冯志伟著,“自然语言计算机形式分析的理论与方法”,中国科学技术大学出版社2017.1月,р.418-421。

Өвөр монголын их сургуулийн Монгол судлалын дээд сургуулийн Монгол хэл бичиг судлах газар “Одоо үеийн монгол хэл” (хоёрдугаар хэвлэл)., 2005 он, х.415.

Бүгд найрамдах дундад ард улсын стандарт “Сураг зангийн мэргэжил, сураг занги шийдвэрлэлтэд зориулсан монгол хэлний үгсийн тэмдэг” (GBT 26235-2010), Бүгд найрамдах дундад ард улсын улсын чанар чансааг хянан батлах ерөнхий товчоо, дундад улсын улсын стандартын хамааралтын зөвлөл., 2011 оны 11 сар.