ElasticSearch 살펴보기 - 역색인 (Inverted Index)
ElasticSearch 살펴보기 - 역색인 (Inverted Index)
역색인이 되는 순서
HTML 문서가 역색인 되는 Flow
Character Filter
- 분석전 전처리 과정
- html_strip 등 처리
Tokenizer Filter
- 형태소 분석
- 토큰 분리
Token Filter
- 토큰 후처리
- 불필요한 단어 제거, 소문자 변환등 등 처리
HTML 문서가 역색인 되는 Flow
Character Filter
Tokenizer Filter
Token Filter
댓글남기기