텍스트 데이터 분석 텍스트 (비정형데이터로부터) 정보를 추출해 내는 작업 자연어처리(NLP,Natural Language Processing)에 기반 전처리과정 텍스트 분석 텍스트 정규화(Text Normalization) 텍스트의 형태를 일관되게 변형하는 작업 토큰화(Tokenization) 텍스트를 의미단위(토큰)로 분할하는 작업 어간추출(Stemming) 형태가 변형된 단어로부터 어간을 부누리하는 작업 형태소 분석(POS-Tagging) 토큰의 형태소를 파악하는 작업 텍스트분석의 종류 정보 추출 : 문서내의 정형데이터를 추출하는 작업 문서 분류 : 문서들을 특정 분류 체계에 따라 분류하는 작업 감성 분석 : 문서에 내포되어있는 감정과 의견을 추출하는 작업 토큰화 텍스트를 의미단위로 분할하는 작업 단..