목록전체 글 (19)
나홀로 데이터 분석가의 1인 연구실

0-1. 사용 데이터 수집 대상 사이트: https://movie.naver.com 수집 기준 기간: 2023.01.04 영화 데이터셋: 리뷰 데이터셋 관련 영화 정보(899개) * 데이터 관련은 아래 링크를 참조 2023.01.04 - [Personal Project/Long-Term Project] - [네이버 영화] 관람객 Vs. 평론가, 의견차이에 대한 탐색 [네이버 영화] 관람객 Vs. 평론가, 의견차이에 대한 탐색 0-1. 프로젝트 목표 영화를 비롯한 멀티 미디어 콘텐츠 사용 시 전문가와 일반 사용자 간의 의견 차이가 종종 발생하여, 이러한 현상에 대해 탐구해보고자 한다. 0-2. 프로젝트 계획 네이버 영화에 scent-of-light.tistory.com 1-1. 히스토그램 우선 899개의 ..

0-1. 프로젝트 목표 영화를 비롯한 멀티 미디어 콘텐츠 사용 시 전문가와 일반 사용자 간의 의견 차이가 종종 발생하여, 이러한 현상에 대해 탐구해보고자 한다. 0-2. 프로젝트 계획 네이버 영화에 존재하는 최근 리뷰와 영화 정보를 수집함. 관람객과 평론가 간의 평점 차이를 확인함. 평점 차이가 많이 나는 영화는 어떠한 특성을 지닌지 탐색함. 인구통계학적으로 평론가와 가장 유사한 관람객 집단은 어디인지 탐색함. 1-1. 데이터 수집 정보 수집 대상 사이트: https://movie.naver.com 수집 기준 기간: 2023.01.04 리뷰 데이터셋: 최근 작성 리뷰(10,000개) 영화 데이터셋: 리뷰 데이터셋 관련 영화 정보(899개) * Null값 제거 1-2. 데이터 정의서 평균 평점 데이터셋 형..

0-1. 프로젝트 목표 대학생들이 강의평가를 할 때 중요시 하는 것이 무엇일지 탐색적 분석을 해보자. 0-2. 프로젝트 계획 에브티라임(대학생 커뮤니티) 내 최신 강의평 200개를 수집. 우호적인 강의평가와 부정적 강의평가의 차이를 확인. 부정적 강의평가의 원인을 탐색해봄. 1-1. 데이터 수집 기간 2023.01.02 - 2023.01.03 최근 강의평 수집 1-2. 데이터 정의서 데이터 형태: (259 x 4) 우선 본 분석에서는 테이블을 하나만 쓰기에 별다른 key값 없이 분석을 진행하였다. 2-1. [평가 점수]의 분포도 평가 점수 분포표를 보면 긍정 평가가 부정 평가 보다 높은 것을 알 수 있다. 이러한 현상은 거의 대부분의 평가 데이터에서 보여준다. 2-2. [평가 점수]와 [리뷰 길이]간의 ..