본문 바로가기
[linux] zip & nohup 리눅스에서 압축파일 다루기 zip / unzip 하위 디렉토리 압축 zip -r compressed.zip /path/to/dir zip 내용 추가 zip compressed.zip path/to/file 현재 폴더에 압축 해제 unzip compressed.zip 특정 폴더에 해제 unzip compressed.zip -d /path/to/put background에서 실행되도록 하는 명령어 (끄지마!) nohup # 켜기 nohup python app.py > app_gradio.nohup & # 'app'이 들어간 목록 확인 ps -fu annmunju | grep app # annmunju 10000 16782 33 14:07 pts/16 00:00:07 python app.py # 끄기 kill.. 2023. 8. 26.
[Pandas] DataFrame 고급 사용 데이터프레임 고급 사용 array가 포함된 데이터 프레임 저장 Pickle 이용해 딕셔너리로 저장한 후 다시 불러와서 데이터 프레임으로 변환 import pickle # write with open('data_save.pickle','wb') as fw: pickle.dump(df.to_dict(), fw) # read with open('data_save.pickle', 'rb') as fr: data_dict = pickle.load(fr) df = pd.DataFrame(data_dict) 차집합 구하기 : 테스트 데이터프레임에서 일부 데이터프레임 지우기 # test_df - rm_df test_df = pd.merge(rm_df, test_df, how='outer', indicator=True).. 2023. 8. 26.
[kaggle] Painting Vs Photograph Classification 사진과 그림을 구분해주는 모델 따라하기 [Painting or Photo]Guess right?_Deep Learning Explore and run machine learning code with Kaggle Notebooks | Using data from Painting Vs Photograph Classification Dataset www.kaggle.com 순서 Module Import 데이터 목록 확인 gray scale한 array를 dataset으로 만들기 데이터셋 합치기 train test split normalize 및 모델 학습에 적합한 형태로 변환 사진, 그림 이렇게 두가지 카테고리로 변환 모델링 (Sequential) 모델 컴파일 (optimizer) 모델 fit 그래프로 정확도.. 2022. 9. 1.
[온라인 : 기본 알고리즘] 다이나믹 프로그래밍 # 피보나치 수열 def fibo(x): if x == 1 or x == 2: return 1 return fibo(x-1) + fibo(x-2) # 피보나치 수열 : 메모리제이션 방식 d = [0] * 100 def fibo_top_down(x): if x == 1 or x == 2: return 1 if d[x] != 0: return d[x] d[x] = fibo(x - 1) + fibo(x - 2) return d[x] # 피보나치 수열 : 바텀업 방식 d = [0] * 100 d[1] = 1 d[2] = 1 n = 99 for i in range(3, n+1): d[i] = d[i - 1] + d[i + 2] print(d[n]) 2022. 4. 15.
[프로젝트] 시각화 데이터프레임 조작하기 왜 어렵지.. 컬럼명 바꾸고 자리 뒤집고 맨날 하면서 맨날 헷갈려서 고생중 1. df.drop(['Unnamed: 0','Unnamed: 0.1', '정류장_ID'], axis=1) 데이터 프레임 생성하면 자꾸 새로운 인덱스가 추가됨. 그거 삭제하는 방법 drop. axis는 열기준, 행기준 지정 read_csv() 에서 index_col 미리 지정해주기 : 인덱스로 지정할 열이름 / False (인덱스 한칸 밀려있는 상황일 때, 자체적으로 인덱스 만들어서 0~n 생성) 2. 여러 변수 출력 코드 from IPython.core.interactiveshell import InteractiveShell InteractiveShell.ast_node_interactivity="all" 3. 거리를 측정하는 .. 2022. 4. 6.
[ProDS] 머신러닝 이론 및 데이터 처리 1. 데이터 전처리 : 데이터 생성, 정제, 변환, 결합 1) 결측값 처리법 (1) 완전 제거법 (정보 손실의 분석 결과 왜곡 가능성 있음) (2) 평균대체법 (추정량 표준오차가 과소 추정될 수 있음) (3) 핫덱대체법 : 동일한 데이터 내 결측값이 발생한 관찰치와 유사한 특성을 가진 다른 관찰치의 정보를 이용하여 대체하는 방법 2) 이상치 판별 (1) 박스플롯 그려서 이외 Q1-1.5*IQR 과 Q3+1.5*IQR의 범위를 넘어가는 자료를 이상값으로 진단. (2) 표준화 점수 (Z-score)의 절대값이 2, 3보다 큰 경우를 이상값으로 진단. 3) 이상값 처리 (1) 이상값 제외 (2) 이상값 대체 : 이상값을 정상 범위의 최소값, 최대값과 대체 (3) 변수 변환 : 자료값 전체에 로그변환, 제곱근 .. 2022. 3. 19.
[ProDS] 통계 이론 및 데이터 시각화 1. 확률의 개념과 특징 1) 라플라스의 확률 : n개 (유한한) 실험결과의 표본 공간에서 m(m = 0, P(S) = 1, 상호 배반인 경우 P(A1 U A2 U ... ) = P(A1) + P(A2) + ... 3) 콜모그로프의 확률(공리적 접근방식) (1) 정의 : 표본공간을 정의역으로 하며 (위 세가지) 공리를 만족하는 함수를 확률로 정의 4) 특징 (1) 여사건, 곱사건(교집합), 합사건(합집합) (2) 조건부 확률 : B사건 하에서 A사건이 일어날 확률 : P(A|B) (3) 독립사건 : P(A | B) = P(A), P(A 교집합 B) = P(A) * P(B) 2. 베이즈 정리 : 결과 A, 원인 B 1) 표본공간의 분할 : 어떤 결과 확률이 k개의 원인들 중에 하나로 결정 되어야 함. 모.. 2022. 3. 15.
[온라인 : 기본 알고리즘] 그래프 탐색 ## DFS def dfs(graph, v, visited): # 현재 노드 방문처리 visited[v] = True print(v, end=' ') # 현재 노드와 연결된 다른 노드를 재귀적으로 방문 for i in graph[v]: if not visited[i]: dfs(graph, i, visited) graph = [ [], [2, 3, 8], #1과 연결된 [1, 7], #2와 연결된 [1, 4, 5], #3과 연결된 [3, 5], #4와 연결된 [3, 4], #5와 연결된 [7], [2, 6, 8], [1, 7] ] # 각 노드의 방문 정보 visited = [False] * 9 dfs(graph, 1, visited) ## BFS from collections import deque def.. 2022. 3. 1.
[온라인 : 기본 알고리즘] 선택정렬, 삽입정렬, 퀵정렬, 계수정렬 # 선택정렬 def choiceFunc(ls) : for i in range(len(ls)): min_index = i for j in range(i+1, len(ls)): if ls[min_index] > ls[j]: min_index = j ls[i], ls[min_index] = ls[min_index], ls[i] return ls # 삽입정렬 def insertionFunc(ls): for i in range(1,len(ls)): for j in range(i, 0, -1): if ls[j] < ls[j-1]: ls[j], ls[j-1] = ls[j-1], ls[j] else : break return ls # 퀵정렬 def quickSort(array, start, end): if start .. 2022. 2. 21.
728x90