최종 발표 자료
분석 방향
- Olist는 온라인 전자상거래 플랫폼으로 소비자들은 단순 판매자가 제시하는 정보만 참고하여 구매하다 보니 제품 구매에 대한 높은 불확실성을 가짐.
- 따라서 소비자는 이러한 불확실성을 줄이기 위해 긍정적인 후기, 부정적인 후기, 후기의 양을 적극 활용함.
- 고객이 직접적으로 의견을 표출하는
review_score
, review_title
, review_comment_message
를 집중적으로 분석하는 것이 적합할 것으로 생각 되어 관련 가설 설정.
- 리뷰 스코어별 평균 리뷰 길이
- 특정 점수대에서 리뷰를 자세하게 작성했을 것이다.
- Why? 불만인 점을 많이 표출했을 것
- Therefore, 리뷰를 길게 작성한 고객은 무엇을 작성했을지 탐색
분석 포인트
- 서비스 이용 시 어떤 문제점이 있는지, 고객들은 무엇이 만족이고 불만인지, 고객에게 더 나은 서비스를 제공하기 위해 고객 반응 분석이 필요
- 리뷰 ⇒ 고객 반응에 대한 지표
- 짧든 길든 리뷰가 작성된 이상, 고객의 주관적인 후기에 관련된 내용들이 무조건 나올 수 밖에 없다고 생각
- 리뷰가 쌓이는 것 ⇒ 마케팅 전략의 지표, 곧 자산!
- 긍정 리뷰 : 제품 장점에 대한 고객 어필, 매출 상승 요인 파악
- 부정 리뷰 : 문제점 개선 포인트(배송, 제품, 서비스 등)
리뷰 길이에 따른 리뷰 분포
입력된 리뷰(n=40,997)를 50자 단위로 구간화하여 각 구간별 리뷰 수 분포 파악

길이가 긴 리뷰의 기준 설정
- 가장 긴 리뷰는 214자
- 중앙값인 107의 ±10로 설정
- 100자 미만 리뷰는 31,442개로
76.73%
, 100자 이상 리뷰는 9,535개로 23.27%
- 약 상위 20%라는 점에서
⇒ 길게 작성된 리뷰의 기준을 100자 이상으로 설정. long_review라고 정의함.
- 100글자는 상대적으로 너무 길지 않으면서도, 제품이나 서비스에 대한 자세한 의견을 표현하기에 충분한 길이라고 생각됨
각 점수별 long_review 비율

리뷰 점수 |
리뷰 수 |
길게 쓴 리뷰 수 |
긴 리뷰 비율(%) |
5 |
20554 |
2357 |
11.47 |
4 |
5976 |
1204 |
20.15 |
3 |
3557 |
1203 |
33.82 |
2 |
2145 |
937 |
43.68 |
1 |
8745 |
3947 |
45.13 |
- 5점대는 약 90% 확률로 리뷰를 짧게 작성
- 반면 1점대는 전체에서 45%로, 1점을 준 고객의 2명 중 1명은 리뷰를 길게 작성함.
- 🟥 막대(long_review)를 보면 1점대는 다른 점수대의 2~4배 더 높은 비율
- 더 자세한 피드백일 확률 up
- 부정적인 경험을 한 고객이 문제점을 상세히 설명하려는 경향