'데이터 어쩌구/전처리 및 시각화' 카테고리의 글 목록

본문 바로가기

(이사중) 바로가기

[Numpy] 이미지 array (3, 4차원) 다루기 1. Array 다루기 3차원 배열(RGB)의 조건부 수정 # array.shape : (1024, 12xx, 3) -> [[[0, 0, 0], [ ... ]]] array[(array.sum(axis=-1) == 0)] = 255 # [[[0, 0, 0], [ ... ]]] 경우에서 # [0, 0, 0](검은색) 한 묶음으로 더해지는데 값이 0인 경우 → [255, 255, 255](흰색)으로 수정 두 배열 동일한지 여부 (비교) np.array_equal(a1, a2, equal_nan=False) 요소 별 곱셈 * or np.multiply() 2. 이미지↔ 픽셀 (OpenCV, PIL) 이미지를 픽셀로 보기 (OpenCV) img = cv2.imread(img_name) 이미지를 픽셀로 보기 (P.. 2023. 8. 26.

[Pandas] DataFrame 고급 사용 데이터프레임 고급 사용 array가 포함된 데이터 프레임 저장 Pickle 이용해 딕셔너리로 저장한 후 다시 불러와서 데이터 프레임으로 변환 import pickle # write with open('data_save.pickle','wb') as fw: pickle.dump(df.to_dict(), fw) # read with open('data_save.pickle', 'rb') as fr: data_dict = pickle.load(fr) df = pd.DataFrame(data_dict) 차집합 구하기 : 테스트 데이터프레임에서 일부 데이터프레임 지우기 # test_df - rm_df test_df = pd.merge(rm_df, test_df, how='outer', indicator=True).. 2023. 8. 26.

[프로젝트] 시각화 데이터프레임 조작하기 왜 어렵지.. 컬럼명 바꾸고 자리 뒤집고 맨날 하면서 맨날 헷갈려서 고생중 1. df.drop(['Unnamed: 0','Unnamed: 0.1', '정류장_ID'], axis=1) 데이터 프레임 생성하면 자꾸 새로운 인덱스가 추가됨. 그거 삭제하는 방법 drop. axis는 열기준, 행기준 지정 read_csv() 에서 index_col 미리 지정해주기 : 인덱스로 지정할 열이름 / False (인덱스 한칸 밀려있는 상황일 때, 자체적으로 인덱스 만들어서 0~n 생성) 2. 여러 변수 출력 코드 from IPython.core.interactiveshell import InteractiveShell InteractiveShell.ast_node_interactivity="all" 3. 거리를 측정하는 .. 2022. 4. 6.

[객체지향] EDA : 배경지식 1. 평균값 : mean() 2. 중앙값 : mid() 3. 최빈값 : mode(), value_count > sort > 첫번째 값 1. 분산과 표준편차 : var(), std() 2. 범위 : max() - min() 3. 사분위수 : np.percentile(data, 25/50/75/100) * 표준화된 데이터는 평균이 0이고 표준편차가 1이다. 1. Z 점수(표준화 변량) (해당점수 - 점수들의 평균) / 표준편차 2. min-max 표준화 (해당점수 - 점수들의 최솟값) / (점수들의 최댓값 - 점수들의 최솟값) +. 편찻값 : 평균이 x, 표준편차가 y로 정규화 할 경우 x + (y * ((해당점수 - 점수들의 평균) / 표준편차)) 2022. 1. 17.

[객체지향] Pandas [라이브러리] import pandas as pd 1. pandas? In computer programming, pandas is a software library written for the Python programming language for data manipulation and analysis. In particular, it offers data.. mungdo-log.tistory.com [Pandas] 데이터 프레임 다루기 pandas에서 내가 가장 어려워 하는 것 중에 하나가 데이터 프레임 다루는 거다. 내가 필요할 때 맞는 방식으로 자유롭게 열을 늘렸다, 이름도 바꿨다 하는 건 너무 어려워서 한 페이지에 정리하고 mungdo-log.tistory.com [Pandas] 데이터 읽어오.. 2022. 1. 17.

[객체지향] Numpy [라이브러리] import numpy as np 1. Numpy? NumPy("넘파이"라 읽는다)는 행렬이나 일반적으로 대규모 다차원 배열을 쉽게 처리 할 수 있도록 지원하는 파이썬의 라이브러리이다. NumPy는 데이터 구조 외에도 수치 계산을 위해 효율적 mungdo-log.tistory.com [배열(array) 기초] 1) array 생성 : array(object, dtype, ...) data = [1,2,3] arr = np.array(data) arr # array([1, 2, 3]) 2) array 크기 확인 : shape arr.shape # (3,) 3) array 자료형 확인 : dtype arr.dtype # dtype('int64') - 부호가 있는 정수 int(8, 16, 32,.. 2022. 1. 6.

7-1. Population : 인구 소멸 위기지역 파악 보호되어 있는 글 입니다. 2021. 10. 15.

6-2. Naver API에서 수집한 몰스킨 데이터 정리 및 시각화 보호되어 있는 글 입니다. 2021. 10. 15.

6-1. Naver API 등록 및 간단한 사용 보호되어 있는 글 입니다. 2021. 10. 13.

이전 1 2 3 다음

728x90

티스토리툴바