본문 바로가기

nlp2

NLP(자연어처리) 화장품 리뷰 분석 (3) Word2Vec / 단어별 유사도 유사어 찾기 리뷰 데이터로 Word2Vec 을 만드는 실습을 하였습니다. Word2Vec 으로 단어별 유사도와 연관어 찾기 word2vec 은 word to vec 라는 뜻으로, 단어를 벡터형식으로 변환시켜줍니다. 벡터형식 데이터 계산을 통해 단어별 유사도와 연관어를 추출해낼 수 있습니다. 실습 내용을 짧게 설명드릴께요! 1)데이터가 저장되어있는 구글 드라이브에 마운트한다. 2)github의 mecab 형태소 분석기를 colab으로 불러와 필요한 파일을 실행한다. 3)폰트를 설치한다. 4)구글 드라이브에서 데이터를 불러온다. 5)word2vec, mecab을 import 한다 6)준비된 데이터 단어를 학습시켜 벡터값으로 변환한다. 7)유사도, 유사어를 출력한다. 정리된 것 보니 복잡하거나 어려워보이지 않습니다! 할 .. 2023. 2. 7.
NLP(자연어처리) 화장품 리뷰 분석 (2) 빈도수 분석 / 워드클라우드 데이터 준비하는 방법이 궁금하신 분들은 이전 포스팅을 보고 와주세요 :) https://walkandwork.tistory.com/21 NLP(자연어처리) 화장품 리뷰 분석 (1)_데이터 준비 /크롤링 몰라도 가능 화장품 컨텐츠를 발행하면서, 온라인 제품 리뷰를 분석하면 제품마다 특성을 뚜렷하게 볼 수 있을 것 같아 자연어처리 공부를 시작했습니다. 아직 실수도 많고, 허점도 많지만, 시작이 반이라는 walkandwork.tistory.com 오늘은 어제 정리한 데이터를 통해서 빈도수 분석과 워드클라우드 만드는 방법을 포스팅해보겠습니다. 고객리뷰 빈도수 분석을 통해, 해당 제품의 가장 큰 이슈, 특장점을 고객 입장에서 객관적으로 분석할 수 있겠죠? 워드클라우드를 통해 특장점을 한눈에 직관적으로 표현할 수 .. 2023. 2. 3.