본문 바로가기

데이터분석4

엑셀 데이터 통합 (여러 시트 데이터 계산하기 / 합계 평균 ) 사용법 엑셀 데이터 탭의 통합 기능 활용하여 매출 데이터 요약 안녕하세요. 오늘은 시트에 나뉘어진 데이터의 합계를 구하는 방법을 알려드리겠습니다. 1) 판매데이터가 월별로 시트에 구분되어있습니다. 다양한 판매처의 상품들이 섞여있어 데이터를 해석하기 어렵습니다. 먼저, 판매처별로 월별 매출의 합을 구해보겠습니다. 각 시트에 [판매처, 상품코드, 상품명, 수수료, 매출액, 복수구매, 상품대, 배송비, 이익, 광고(사용), 광고(초과), 이익-광고 ] 데이터가 나열되어있습니다. 시트 맨 끝에 통합된 데이터를 출력해줄 시트를 추가해줍니다. 저는 ["총계"] 라는 시트를 추가해주었습니다. 2) 시트에 출력하고 싶은 데이터 항목을 입력해줍니다. 이 때, 원본 데이터의 모든 항목을 입력하실 필요는 없습니다. 모든항목 중 필.. 2023. 2. 16.
NLP(자연어처리) 화장품 리뷰 분석 (3) Word2Vec / 단어별 유사도 유사어 찾기 리뷰 데이터로 Word2Vec 을 만드는 실습을 하였습니다. Word2Vec 으로 단어별 유사도와 연관어 찾기 word2vec 은 word to vec 라는 뜻으로, 단어를 벡터형식으로 변환시켜줍니다. 벡터형식 데이터 계산을 통해 단어별 유사도와 연관어를 추출해낼 수 있습니다. 실습 내용을 짧게 설명드릴께요! 1)데이터가 저장되어있는 구글 드라이브에 마운트한다. 2)github의 mecab 형태소 분석기를 colab으로 불러와 필요한 파일을 실행한다. 3)폰트를 설치한다. 4)구글 드라이브에서 데이터를 불러온다. 5)word2vec, mecab을 import 한다 6)준비된 데이터 단어를 학습시켜 벡터값으로 변환한다. 7)유사도, 유사어를 출력한다. 정리된 것 보니 복잡하거나 어려워보이지 않습니다! 할 .. 2023. 2. 7.
NLP(자연어처리) 화장품 리뷰 분석 (2) 빈도수 분석 / 워드클라우드 데이터 준비하는 방법이 궁금하신 분들은 이전 포스팅을 보고 와주세요 :) https://walkandwork.tistory.com/21 NLP(자연어처리) 화장품 리뷰 분석 (1)_데이터 준비 /크롤링 몰라도 가능 화장품 컨텐츠를 발행하면서, 온라인 제품 리뷰를 분석하면 제품마다 특성을 뚜렷하게 볼 수 있을 것 같아 자연어처리 공부를 시작했습니다. 아직 실수도 많고, 허점도 많지만, 시작이 반이라는 walkandwork.tistory.com 오늘은 어제 정리한 데이터를 통해서 빈도수 분석과 워드클라우드 만드는 방법을 포스팅해보겠습니다. 고객리뷰 빈도수 분석을 통해, 해당 제품의 가장 큰 이슈, 특장점을 고객 입장에서 객관적으로 분석할 수 있겠죠? 워드클라우드를 통해 특장점을 한눈에 직관적으로 표현할 수 .. 2023. 2. 3.
NLP(자연어처리) 화장품 리뷰 분석 (1)_데이터 준비 /크롤링 몰라도 가능 화장품 컨텐츠를 발행하면서, 온라인 제품 리뷰를 분석하면 제품마다 특성을 뚜렷하게 볼 수 있을 것 같아 자연어처리 공부를 시작했습니다. 아직 실수도 많고, 허점도 많지만, 시작이 반이라는 생각으로! 배워간다는 마음가짐으로 하루하루 꾸준히 실습해보고 있습니다. 실습 개념이므로 크롤링을 하기보다는 직접 손으로 리뷰를 몇페이지 긁어서 분석해보았습니다. 올리브영과 네이버쇼핑의 리뷰 데이터를 이용하여 실습하였습니다. 사이트에서 리뷰를 긁어 엑셀에 붙여넣기를 해줍니다. a1시트 오른쪽 마우스 클릭, 선택하여 붙여넣기 > 텍스트형 몇가지 수정사항이 눈에 띄죠? 1) "평점5 ..."로 시작하는 반복 문장 2) 리뷰시작 전 요약문장이 반복됨 3) 빈 셀이 있음 (사실, 빈 셀은 분석에서 문제되지는 않아요!) 문장이 반.. 2023. 2. 2.