리스트 예시: 게시물이 존재할 경우 3건을 노출합니다.
-
컴퓨터 마스터되기
라벨 인코더 label encoder
라벨 인코더iris 데이터를 기준으로 설명하겠다.아이리스 데이터를 보게되면 중간에 varierty 항에 변수형이 문자가 들어가 있다.이럴경우 숫자로 변경해주어야하는데 이떄 사용하는 것이 label encoder이다.from sklearn.preprocessing import LabelEncoder#train_x = iris.drop(['varierty', axis =1])#test_x = iris.drop(['varierty', axis =1])# 데이터 타입이 object인 varierty column을 숫자로 변경 합니다qual_col = ['variety']for i in qual_col: lebel1 = LabelEncoder() lebel1 = lebel1.fit(train_x[i])..
-
컴퓨터 마스터되기
[matplotlib] 플롯 그리기
먼저 라이브러리를 불러오자import matplotlib.pyplot as pltimport seaborn as sns이전 글에 이어서 iris 데이터셋을 학습한다.iris 데이터셋을 train이라는 어레이에 저장해 둔상태다.train_y = train['variety']train_x = train.drop(['variety'], axis=1) plt.figure(figsize = (15,15))sns.pairplot(train_x)plt.show()그렇가면 각 변수별 갯수는 어떻게 될까? 이건 아래의 코드를 실행해보fig, axes = plt.subplots(2, 2, figsize=(20,20)) #사이즈에 맞게 변경#index명 입력 추가로 늘려주면서 위치 지정해줘야해sns.countplot(x =..
-
컴퓨터 마스터되기
[pandas] 데이터 정리 방
이어서...pandas 에 iris 데이터 셋을 불러와서 train 이라는 어레이에 추가했다고 보자from sklearn.datasets import load_iristrain = load_iris()여기에 다른 변수를 저장하거나, 특정 열을 뺴고 싶다면 아래와 같다.train_y = train['variety']train_x = train.drop(['variety'], axis=1)이렇게 한다면 train_y에는 학습하고자 하는 GT값이train_x 에는 학습하고자하는 변수들만 나누어서 저장할 수 있다.
갤러리 예시: 게시물이 존재할 경우 4건을 노출합니다.