NLP

Universal Dependencies

https://universaldependencies.org/ Universal Dependencies (UD) is a framework for consistent annotation of grammar (parts of speech, morphological features, and syntactic dependencies) across different human languages. UD是一个为了对不同人类语言的语法(词性、词法特性、句法依赖)进行连续标记的框架。 Morphology The morphological specification of a (syntactic) word in the UD scheme consists of three levels of representation: A lemma representing the semantic content of the word. A part-of-speech tag representing the abstract lexical category associated with the word. A set of features representing lexical and grammatical properties that are associated with the particular word form.

自然语言处理中的pos tags

从句级别 S - 简单的陈述句。 SBAR - 从属连词引导的从句。 SBARQ - wh-开头的单词或者wh-开头的短语的直接问句。 SINV - 倒装句。 SQ - 倒装的是/否疑问句,或者主从句是一个wh-开头的问句,在SBARQ中跟随着wh-短语。 短语级别 WHADJP - wh-形容词(wh-adjective)短语。 WHAVP - wh-副词(wh-adverb)短语。 WHNP - wh-名词短语。 WHPP- wh-介词短语。 ADJP - 形容词短语。 ADVP - 副词短语。 CONJP - 连词短语。 FRAG - fragment(片段)? INTJ - 感叹词,插入语。类似于POS tag UH(插入语, yes)。 LST - 标记列表。 包括周围的标点符号。 NAC - 不是一种句子中的成分,用来显示在一个名词短语中,特定的置于名词之前的修饰语的范围? NP - 名词短语。 NX - 用来复杂的名词短语前标识名词短语的头部。 PP - 介词短语。 PRN - 插入语。 PRT - 小品词(与动词构成短语动词的副词或介词, look for, put off)。