본문 바로가기
AI월드/⚙️AI BOOTCAMP_Section 1

Data Manipulation,concat,merge,melt_Day3

by khalidpark 2020. 12. 30.

Data Science / Section 1 / Sprint 1 / 20.12.30

 

Lecture

 

Pandas

 


concat


Concat = 붙인다

merge = 합친다

 

x,y는 각각 데이터셋

 

pd.concat([x,y]) #axis = 0 이 기본값 , #상하로 붙인다

pd.concat([x,y], axis = 1) #좌우로 붙인다

 

결측치는 NaN으로 채워진다

 

df = pd.concat([df.reset_index(), df2['종목'].head(6)], axis = 1)

df.reset_index() => 좌측 index값을 리셋 (0,1,2,3,4,5~)로 세팅하고, 기존 인덱스값은 우측으로 한줄미뤄서 세팅

df2['종목'].head(6) => 7번행은 사용하지않을 항목이기때문에 head(6)으로 범위지정해서 적용

axix =1 => 좌우로 붙일거라서

 

 


merge


 

 

 

df.merge(df2, how = 'inner', on = '종목')

how = inner 방법으로 붙여라

on = 기준이될 열(또는행)


tidy data


 

 

 

pandas 의 `melt` 함수를 사용하여 table1을 tidy 형태로 바꿀 수 있습니다.

 

table1 = table1.reset_index()

(첫열에 인덱스가 아닌 값이 있다면 reset활용하여  index화 하고 우측으로 한칸밀기)

tidy1 = table1.melt(id_vars = 'index', value_vars = ['A''B'])

melt . table '녹여서' 핀다고 생각하고

id vars 는 기준

value vars  는 표현값 (맞나?)

 

pandas.pydata.org/docs/reference/api/pandas.melt.html

 

pandas.melt — pandas 1.2.0 documentation

If True, original index is ignored. If False, the original index is retained. Index labels will be repeated as necessary.

pandas.pydata.org

 

Tidy --> Wide

`pivot_table` 함수는 `melt`의 반대 역할을 하는 함수입니다.

 

wide = tidy1.pivot_table(index = 'row', columns = 'column', values = 'value')

 

 

 

 

data

numerical data = 숫자

categorical data = numerical이 아닌

 

명목척도

분류(카테고리칼데이터) 명목척도,순서척도

수량(뉴머릭데이터) 구간척도,비율척도

728x90

댓글