728x90
한국어 처리 패키지인 konlpy는 5가지의 형태소 분석기 지원(Okt, Komoran, Kkma, Mecab, Hannanum)
Okt
형태소 파서 중 실행 속도가 가장 빠르다.
Kkma
문장 갯수 많아지면 다른 분석기에 비해 압도적으로 시간 소요 늘어남
띄어쓰기 오류에 덜 민감
Mecab
압도적으로 빠르다
띄어쓰기에서 높은 정확도
Komoran
여러 어절을 하나의 품사로 분석 가능
공백이 포함된 고유명사 정확하게 분석 가능
Hannanum
띄어쓰기 없는 문장은 분석 품질 좋지 않다
728x90
'핀테크 교육 > 금융데이터 활용' 카테고리의 다른 글
파이썬 - 데이터베이스 연결 (0) | 2022.07.14 |
---|---|
워드클라우드 (0) | 2022.07.05 |
크롤링 (네이버 기사 크롤링 - newspaper3k 사용) (0) | 2022.07.05 |
크롤링 (네이버 기사 크롤링) (0) | 2022.07.05 |
크롤링 (네이버 금융 크롤링) (0) | 2022.07.05 |