텍스트를 토큰화시킨후 품사를 태깅 시키는 방법에 대해서 알아보겠습니다.
import nltk
from nltk.tokenize import word_tokenize
text = "I went to the store yesterday and bought some bread and milk,
but I realized I forgot my wallet at home."
tokens = word_tokenize(text)
for each in nltk.pos_tag(tokens):
print(f"{each[0]} ({each[1]})")
text를 word_tokenize()로 토큰화하고나서 각 토큰을 nltk.pos_tag()로 품사를 붙여줍니다.
각 단어에 품사가 붙여진걸 볼 수 있습니다.
품사 약어 설명은 이 사이트를 통해 자세히 알아볼 수 있습니다.
쿠팡 광고 클릭 시, 이에 따른 일정액의 수수료를 제공받으며 블로그 운영에 큰 도움이 됩니다. 감사합니다.
728x90
'플그래밍 > 파이써언' 카테고리의 다른 글
[파이썬] Selenium - webdriver 사용 시 뜨는 콘솔창 숨기기 (0) | 2023.07.22 |
---|---|
[파이썬] 한글 품사 태깅, 이것만은 알고 가자 (konlpy) (0) | 2023.06.25 |
[파이썬] 노이즈 및 불용어, 이것만은 알고 가자 (nltk) (0) | 2023.06.25 |
[파이썬] 정규표현식, 이것만은 알고 가자 (regex) (0) | 2023.06.25 |
[파이썬] 단어 토큰화는 이렇게 (nltk) (0) | 2023.06.25 |