2021/01/20 - [공부/3. 데이터 사이언스] - [부스트코스] 캐글 실습 : 설문조사 응답 분석 (2)
ㄴ 이전글 이어서
1. 범위를 축소해서 : 국가가 대한민국인 사람들을 대상으로
1) 연령
#국가가 Korea인 사람들만 모아서
korea = mcq.loc[(mcq['Country']=='South Korea')]
print('The number of interviewees in Korea: ' + str(korea.shape[0]))
sns.distplot(korea['Age'].dropna())
plt.title('Korean')
plt.show()
2) 성별
- count
pd.DataFrame(korea['GenderSelect'].value_counts())
- 시각화
sns.countplot(x='GenderSelect', data=korea)
plt.title('Korean')
3) 성별에 따른 연령을 히스토그램으로 표현
figure, (ax1, ax2) = plt.subplots(ncols=2)
figure.set_size_inches(12,5)
sns.distplot(korea['Age'].loc[korea['GenderSelect']=='Female'].dropna(),
norm_hist=False, color=sns.color_palette("Paired")[4], ax=ax1)
plt.title('korean Female')
sns.distplot(korea['Age'].loc[korea['GenderSelect']=='Male'].dropna(),
norm_hist=False, color=sns.color_palette("Paired")[0], ax=ax2)
plt.title('korean Male')
4) 고용 여부 barplot # xticks
sns.barplot(x=korea['EmploymentStatus'].unique(), y=korea['EmploymentStatus'].value_counts()/len(korea))
plt.xticks(rotation=30, ha='right')
plt.title('Employment status of the korean')
plt.ylabel('')
plt.show()
- 학생인지 아닌지 여부
korea['StudentStatus'] = korea['StudentStatus'].fillna('No')
sns.countplot(x='StudentStatus', data=korea)
plt.title('korean')
plt.show()
- 풀타임 근무중 / 구직중 count 보기
full_time = korea.loc[(korea['EmploymentStatus'] == 'Employed full-time')]
print(full_time.shape)
looking_for_job = korea.loc[(
korea['EmploymentStatus'] == 'Not employed, but looking for work')]
print(looking_for_job.shape)
#(116, 228)
#(34, 228)
728x90
'데이터 어쩌구 > 전처리 및 시각화' 카테고리의 다른 글
[부스트코스] 캐글 실습 : 설문조사 응답 분석 (6) (0) | 2021.01.25 |
---|---|
[부스트코스] 캐글 실습 : 설문조사 응답 분석 (5) (0) | 2021.01.22 |
[부스트코스] 캐글 실습 : 설문조사 응답 분석 (4) (0) | 2021.01.22 |
[부스트코스] 캐글 실습 : 설문조사 응답 분석 (2) (0) | 2021.01.20 |
[부스트코스] 캐글 실습 : 설문조사 응답 분석 (1) (0) | 2021.01.19 |