플그래밍/파이써언

[파이썬] 품사 태깅, 이것만은 알고 가자 (nltk)

훗티v 2023. 6. 25. 05:56
728x90
반응형

텍스트를 토큰화시킨후 품사를 태깅 시키는 방법에 대해서 알아보겠습니다.

 

import nltk
from nltk.tokenize import word_tokenize

text = "I went to the store yesterday and bought some bread and milk, 
but I realized I forgot my wallet at home."

tokens = word_tokenize(text)

for each in nltk.pos_tag(tokens):
    print(f"{each[0]} ({each[1]})")

 

textword_tokenize()로 토큰화하고나서 각 토큰을 nltk.pos_tag()로 품사를 붙여줍니다.

 

 

각 단어에 품사가 붙여진걸 볼 수 있습니다.

품사 약어 설명은 이 사이트를 통해 자세히 알아볼 수 있습니다.

 

 

 

 

 

쿠팡 광고 클릭 시, 이에 따른 일정액의 수수료를 제공받으며 블로그 운영에 큰 도움이 됩니다. 감사합니다.

반응형