Data Science / Section 1 / Sprint 1 / 20.12.30
Lecture
Pandas
concat
Concat = 붙인다
merge = 합친다
x,y는 각각 데이터셋
pd.concat([x,y]) #axis = 0 이 기본값 , #상하로 붙인다
pd.concat([x,y], axis = 1) #좌우로 붙인다
결측치는 NaN으로 채워진다
df = pd.concat([df.reset_index(), df2['종목'].head(6)], axis = 1)
df.reset_index() => 좌측 index값을 리셋 (0,1,2,3,4,5~)로 세팅하고, 기존 인덱스값은 우측으로 한줄미뤄서 세팅
df2['종목'].head(6) => 7번행은 사용하지않을 항목이기때문에 head(6)으로 범위지정해서 적용
axix =1 => 좌우로 붙일거라서
merge
df.merge(df2, how = 'inner', on = '종목')
how = inner 방법으로 붙여라
on = 기준이될 열(또는행)
tidy data
pandas 의 `melt` 함수를 사용하여 table1을 tidy 형태로 바꿀 수 있습니다.
table1 = table1.reset_index()
(첫열에 인덱스가 아닌 값이 있다면 reset활용하여 index화 하고 우측으로 한칸밀기)
tidy1 = table1.melt(id_vars = 'index', value_vars = ['A', 'B'])
melt . table '녹여서' 핀다고 생각하고
id vars 는 기준
value vars 는 표현값 (맞나?)
pandas.pydata.org/docs/reference/api/pandas.melt.html
Tidy --> Wide
`pivot_table` 함수는 `melt`의 반대 역할을 하는 함수입니다.
wide = tidy1.pivot_table(index = 'row', columns = 'column', values = 'value')
data
numerical data = 숫자
categorical data = numerical이 아닌
명목척도
분류(카테고리칼데이터) 명목척도,순서척도
수량(뉴머릭데이터) 구간척도,비율척도
'AI월드 > ⚙️AI BOOTCAMP_Section 1' 카테고리의 다른 글
Data Manipulation_Day3(4)_ggplot,그래픽문법 (0) | 2021.01.03 |
---|---|
Data Visulaize,plot,seaborn_Day4 (0) | 2021.01.03 |
25 pandas tricks_Day3(2) (0) | 2020.12.30 |
Feature Engineering,형변환_Day2(2) (0) | 2020.12.30 |
Feature Engineering,데이터전처리,_Day2 (0) | 2020.12.29 |
댓글