본문 바로가기
데이터 어쩌구/전처리 및 시각화

[부스트코스] 캐글 실습 : 설문조사 응답 분석 (3)

by annmunju 2021. 1. 21.

2021/01/20 - [공부/3. 데이터 사이언스] - [부스트코스] 캐글 실습 : 설문조사 응답 분석 (2)

 

[부스트코스] 캐글 실습 : 설문조사 응답 분석 (2)

2021/01/19 - [공부/3. 데이터 사이언스] - [부스트코스] 캐글 실습 : 설문조사 응답 분석 (1) [부스트코스] 캐글 실습 : 설문조사 응답 분석 (1) www.boostcourse.org/ds116/joinLectures/28015 캐글 실습으로 배..

mungdo-log.tistory.com

ㄴ 이전글 이어서


1. 범위를 축소해서 : 국가가 대한민국인 사람들을 대상으로

 1) 연령

#국가가 Korea인 사람들만 모아서
korea = mcq.loc[(mcq['Country']=='South Korea')]

print('The number of interviewees in Korea: ' + str(korea.shape[0]))

sns.distplot(korea['Age'].dropna())
plt.title('Korean')
plt.show()

 

 2) 성별

- count

pd.DataFrame(korea['GenderSelect'].value_counts())

 

- 시각화

sns.countplot(x='GenderSelect', data=korea)
plt.title('Korean')

 

 3) 성별에 따른 연령을 히스토그램으로 표현

figure, (ax1, ax2) = plt.subplots(ncols=2)

figure.set_size_inches(12,5)

sns.distplot(korea['Age'].loc[korea['GenderSelect']=='Female'].dropna(), 
             norm_hist=False, color=sns.color_palette("Paired")[4], ax=ax1)
plt.title('korean Female')

sns.distplot(korea['Age'].loc[korea['GenderSelect']=='Male'].dropna(), 
             norm_hist=False, color=sns.color_palette("Paired")[0], ax=ax2)
plt.title('korean Male')

 

 4) 고용 여부 barplot # xticks

sns.barplot(x=korea['EmploymentStatus'].unique(), y=korea['EmploymentStatus'].value_counts()/len(korea))
plt.xticks(rotation=30, ha='right')
plt.title('Employment status of the korean')
plt.ylabel('')
plt.show()

글자가 저리 삐뚜룸 한건 xtikcs 때문 

- 학생인지 아닌지 여부

korea['StudentStatus'] = korea['StudentStatus'].fillna('No')
sns.countplot(x='StudentStatus', data=korea)
plt.title('korean')
plt.show()

 

- 풀타임 근무중 / 구직중 count 보기

full_time = korea.loc[(korea['EmploymentStatus'] == 'Employed full-time')]
print(full_time.shape)
looking_for_job = korea.loc[(
    korea['EmploymentStatus'] == 'Not employed, but looking for work')]
print(looking_for_job.shape)

#(116, 228)
#(34, 228)

 

728x90