본문 바로가기
2-1. Analysis Seoul CCTV (데이터 정리) 보호되어 있는 글 입니다. 2021. 9. 17.
1. 환경설정 [Anaconda (Jupyter)] 1. Anaconda Prompt (miniconda) 접속 2. 가상환경 설정 완료 (ds_study) - 가상환경 접속 : conda activate ds_study - 가상환경 빠져나오기 : conda deactivate - 여러 환경 확인해보기 : conda env list 3. matplotlib 에서 한글 폰트 사용하기 # 그래프 inline import matplotlib.pyplot as plt %matplotlib inline # 폰트명 확인하기 from matplotlib import font_manager f_path = 'C:/Windows/Fonts/malgun.ttf' font_manager.FontProperties(fname=f_path).. 2021. 9. 14.
[라이브러리] from scipy import stats 1. SciPy 안에 있는 패키지 중 stats는 Statistical functions (scipy.stats) : 통계 기능 제공 Statistical functions for masked arrays (scipy.stats.mstats) 2. SciPy 특징 - 넘파이 상위에서 구동되는 라이브러리 정도로 이해해도 무방. - NumPy, SciPy 등은 수치계산을 위한 패키지이므로 성능이 중요 3. scipy.stats 통계가 하는 주된 일. 1) Random Variable(확률 변수) : 확률 밀도 함수, 누적 확률 함수, 샘플 생성, Parameter Estimation (fitting) 2) Test 4. scipy.stats 에서 제공하는.. 1) 연속형 변수 2) 이산형 변수 5. 주의 :.. 2021. 4. 2.
[라이브러리] import numpy as np 1. Numpy? NumPy("넘파이"라 읽는다)는 행렬이나 일반적으로 대규모 다차원 배열을 쉽게 처리 할 수 있도록 지원하는 파이썬의 라이브러리이다. NumPy는 데이터 구조 외에도 수치 계산을 위해 효율적으로 구현된 기능을 제공한다. 벡터, 행렬 등 수치 연산을 수행하는 선형대수(Linear algebra) 라이브러리이며 관련 수치 연산을 지원하고 내부적으로는 C로 구현되어 있어 연산이 빠른 속도로 수행됨. 2. 기능 POWERFUL N-DIMENSIONAL ARRAYS : Fast and versatile, the NumPy vectorization, indexing, and broadcasting concepts are the de-facto standards of array computing t.. 2021. 4. 2.
[라이브러리] import pandas as pd 1. pandas? In computer programming, pandas is a software library written for the Python programming language for data manipulation and analysis. In particular, it offers data structures and operations for manipulating numerical tables and time series. 2. 기능 DataFrame object for data manipulation with integrated indexing. : 데이터 프레임, 인덱싱 Tools for reading and writing data between in-memory data st.. 2021. 3. 26.
[부스트코스] 캐글 실습 : 설문조사 응답 분석 (9) 2021.01.25 - [공부/3. 데이터 사이언스] - [부스트코스] 캐글 실습 : 설문조사 응답 분석 (8) [부스트코스] 캐글 실습 : 설문조사 응답 분석 (8) 2021/01/25 - [공부/3. 데이터 사이언스] - [부스트코스] 캐글 실습 : 설문조사 응답 분석 (7) [부스트코스] 캐글 실습 : 설문조사 응답 분석 (7) 2021/01/25 - [공부/3. 데이터 사이언스] - [부스트코스] 캐글 mungdo-log.tistory.com Q11. 데이터사이언스 직업을 찾는데 가장 고려해야 할 요소는 무엇일까요? qc = question.loc[question['Column'].str.contains('JobFactor')] print(qc.shape) qc.Question.values Job.. 2021. 3. 19.
[부스트코스] 캐글 실습 : 설문조사 응답 분석 (8) 2021/01/25 - [공부/3. 데이터 사이언스] - [부스트코스] 캐글 실습 : 설문조사 응답 분석 (7) [부스트코스] 캐글 실습 : 설문조사 응답 분석 (7) 2021/01/25 - [공부/3. 데이터 사이언스] - [부스트코스] 캐글 실습 : 설문조사 응답 분석 (6) [부스트코스] 캐글 실습 : 설문조사 응답 분석 (6) 2021/01/22 - [공부/3. 데이터 사이언스] - [부스트코스] 캐글 mungdo-log.tistory.com Q9. 개인프로젝트나 학습용 데이터를 어디에서 얻나요? - PublicDatasetsSelect에서 여러 문항으로 된 데이터 쪼개서 q에 저장. mcq['PublicDatasetsSelect'] = mcq[ 'PublicDatasetsSelect'].asty.. 2021. 1. 25.
[부스트코스] 캐글 실습 : 설문조사 응답 분석 (7) 2021/01/25 - [공부/3. 데이터 사이언스] - [부스트코스] 캐글 실습 : 설문조사 응답 분석 (6) [부스트코스] 캐글 실습 : 설문조사 응답 분석 (6) 2021/01/22 - [공부/3. 데이터 사이언스] - [부스트코스] 캐글 실습 : 설문조사 응답 분석 (5) [부스트코스] 캐글 실습 : 설문조사 응답 분석 (5) 2021/01/22 - [공부/3. 데이터 사이언스] - [부스트코스] 캐글 mungdo-log.tistory.com ㄴ 이전글 이어서... Q7. 데이터 사이언스 직무에서 가장 중요하다고 생각되는 스킬은? job_features = [ x for x in mcq.columns if x.find( 'JobSkillImportance') != -1 and x.find('Job.. 2021. 1. 25.
[부스트코스] 캐글 실습 : 설문조사 응답 분석 (6) 2021/01/22 - [공부/3. 데이터 사이언스] - [부스트코스] 캐글 실습 : 설문조사 응답 분석 (5) [부스트코스] 캐글 실습 : 설문조사 응답 분석 (5) 2021/01/22 - [공부/3. 데이터 사이언스] - [부스트코스] 캐글 실습 : 설문조사 응답 분석 (4) [부스트코스] 캐글 실습 : 설문조사 응답 분석 (4) 2021/01/21 - [공부/3. 데이터 사이언스] - [부스트코스] 캐글 mungdo-log.tistory.com ㄴ 이전글 이어서... Q4. 데이터과학을 위해 높은 사양의 컴퓨터가 필요한가요? 1. 설문 내용, 응답자 수 파악하기 qc = question.loc[question[ 'Column'].str.contains('HardwarePersonalProjectsS.. 2021. 1. 25.
728x90