본문 바로가기

컴퓨터 마스터되기

[pandas] 데이터 정리 방

이어서...

pandas 에 iris 데이터 셋을 불러와서 train 이라는 어레이에 추가했다고 보자

from sklearn.datasets import load_iris
train = load_iris()

여기에 다른 변수를 저장하거나, 특정 열을 뺴고 싶다면 아래와 같다.

train_y = train['variety']
train_x = train.drop(['variety'], axis=1)

이렇게 한다면 train_y에는 학습하고자 하는 GT값이

train_x 에는 학습하고자하는 변수들만 나누어서 저장할 수 있다.