词性标注(Part-Of-Speech tagging, POS tagging)也被称为语法标注(grammatical tagging)或词类消疑(word-category disambiguation),是语料库语言学(corpus linguistics)中将语料库内单词的词性按其含义和上下文内容进行标记的文本数据处理技术。词性标注可以由人工或特定算法完成,使用机器学习(machine learning)方法实现词性标注是自然语言处理(Natural Language Processing, NLP)的研究内容。常见的词性标注算法包括隐马尔可夫模型(Hidden Markov Mod...
【词的意思】:词(詞) cí(ㄘˊ) (一)、语言里最小的可以独立运用的单位:词汇。词书。词典。词句。词序。词组。 详情>
【性的意思】:性 xìng(ㄒ一ㄥˋ) (一)、人或事物的本身所具有的能力、作用等:性质。性格。性命(生命)。性能 详情>
【标的意思】:标(標) biāo(ㄅ一ㄠ) (一)、树木的末端,引申为表面的,非根本的:标本。治标不治本。(二)、 详情>
【注的意思】:注 zhù(ㄓㄨˋ) (一)、灌进去:注入。注射。大雨如注。(二)、(精神、力量)集中在一点:注视。 详情>
• 词性标注是自然汉语处理中的一个难点。
• 改进的基于转换方法的拉丁蒙文词性标注
• 中文句法分析的基础是自动分词词性标注和命名实体识别。
• 兼类词的词类排歧是汉语语料词性标注中的难点问题,它严重影响语料的词性标注质量。
• 本文对词性标注的方法进行了研究,分析了基于规则的方法和基于统计的方法的优缺点。
• 摘要兼类词的词类排歧是汉语语料词性标注中的难点问题,它严重影响语料的词性标注质量。
• 并且,针对词性标注容易引起语义缺失的问题,提出了以语义标注作为医案信息抽取规则的方案。
• 摘要解决蒙古语基本名词短语的定界问题,是在蒙古语词性标注语料库的基础上进行的探索性研究。