어간추출
어간(Stem)을 추출하는 작업을 어간 추출(stemming)이라고 합니다.
어간 추출은 형태학적 분석을 단순화한 버전이라고 볼 수도 있고,
정해진 규칙만 보고 단어의 어미를 자르는 어림짐작의 작업이라고 볼 수도 있습니다.
다시 말해, 이 작업은 섬세한 작업이 아니기 때문에
어간 추출 후에 나오는 결과 단어는 사전에 존재하지 않는 단어일 수도 있습니다.

출처 : youtu.be/gBwGPI0srBE
출처 : wikidocs.net/21707
위키독스
온라인 책을 제작 공유하는 플랫폼 서비스
wikidocs.net
728x90
'AI월드 > ⚙️AI BOOTCAMP_Section 4' 카테고리의 다른 글
NLP, 텍스트 전처리 기본개념_Day66(4) (0) | 2021.04.12 |
---|---|
Stopwords, 불용어, nlp_Day66(3) (0) | 2021.04.12 |
NLP 입문, tokenization_Day66 (0) | 2021.04.12 |
Neural Networks(신경망,딥러닝) 주간 키워드 정리_Day61~64 (0) | 2021.04.08 |
역전파 이해_Day62 (0) | 2021.04.06 |
댓글