본문 바로가기

Study doc.

(35)
[Python] iloc vs loc ■ iloc 숫자(integer position)로 접근 예시) data.iloc[:,:3] - 특정 순서의 열을 인덱싱 할 때 data.iloc[:,[2,5,-1]] # -1은 마지막 열 ■ loc 문자(label)로 접근 예시) - 행과 열 모두 인덱싱 한 경우 pd.concat([target,weather_mean],axis=1).corr().loc['smp_max':'supply','area':] - 특정 열을 선택한 경우 daily_price_oil.loc[:,['date','mean']] - 열의 특정 범위를 선택한 경우 weather.loc[:,'area':'temp'] 결론 인덱싱을 숫자로 할지, 문자로 할지 차이였다.
[Python] concat vs merge ■ concat 을 이용한 데이터 합치기 - 오른쪽으로 붙이기 행의 크기가 안맞으면 NaN값이 자동으로 삽입됨 pd.concat([df1,df2],axis=1) - 아래로 붙이기 열 이름이 같지 않으면 NaN값으로 채워짐 pd.concat([df1,df2],axis=0) ■ merge 를 이용한 데이터 합치기 * 한 번에 두개씩만 가능 1. 기본 공통된 열의 공통 값만 합쳐짐 한쪽에만 있는 값은 합쳐지지 않음 pd.merge(df1,df2) 2. how 파라미터 - 한쪽이라도 있으면 NaN으로 채워지고 합쳐짐 pd.merge(df1,df2, how='outer') - 왼쪽을 고정시키고 없는 값은 NaN으로 채워지고 합쳐짐 (오른쪽 기준은 'right') pd.merge(df1,df2, how='left'..
[Python] apply, lambda 함수의 활용 + map 함수 ■ apply 함수 데이터 프레임에 특정 함수를 '적용'시키는 함수 df.apply(f(x), axis = ?) 예시) 다음과 같은 데이터 프레임이 있을때, df = pd.DataFrame({'Math' : [80,60,90], 'English' : [50,90,60]}, index = ['A','B','C']) - 이 반의 수학 평균점수, 영어 평균점수를 알고 싶다면 df.apply(np.average,axis=0) - A의 평균, B의 평균, C의 평균값을 알고 싶으면 df.apply(np.average,axis=1) ■ lambda 함수 한 번 쓰고 버리는 함수 lambda x : f(x) 예시) f = lambda x: x+100 f(8) 활용 다음과 같은 형태의 특성에서 시간에 대한 정보를 제거..