맷플롯립(Matplotlib) - 데이터를 차트나 플롯으로 시각화 - Matplotlib의 주요 모듈인 pyplot은 plt라는 명칭으로 import 하는 것이 관례 import matplotlib.pyplot as plt 라인 플롯(plot) plt.plot() : 라인 플롯을 그림 : x축과 y축의 값을 기재하고 시각화 import matplotlib.pyplot as plt plt.plot([1,2,3,4],[2,4,8,6]) plt.show() 제목 및 축 레이블 삽입 plt.title() : 그래프의 제목 삽입 plt.xlabel() or plt.ylabel() : x축 or y축에 축 이름 삽입 plt.title('test') plt.plot([1,2,3,4],[2,4,8,6]) plt.xla..
넘파이(Numpy) - 수치 데이터를 다루는 파이썬 패키지 - 벡터 및 행렬을 사용하는 선형 대수 계산에서 주로 사용 - Numpy는 np라는 명칭으로 import 하는 것이 관례 import numpy as np np.array() - 리스트, 튜플, 배열로 부터 ndarray를 생성 - 축의 개수(ndim)와 크기(shape) 존재 import numpy as np vec = np.array([1, 2, 3, 4, 5]) print(vec) print("vec의 타입 :", type(vec)) [1 2 3 4 5] vec의 타입 : - 2차원 배열을 만들 때는 array() 안에 하나의 리스트만 들어가므로 리스트의 리스트를 넣어야 함 mat = np.array([[10, 20, 30], [40, 50..
MNIST 데이터 - 미국 국립표준기술원(NIST)이 고등학생과 인구조사국 직원 등이 쓴 손글씨를 이용해 만든 데이터 - 7만 개의 글자 이미지에 각각 0부터 9까지 이름표를 붙인 데이터셋 - keras API를 이용해 불러올 수 있음 이미지 인식 1. 데이터 준비 - X : 불러온 이미지 데이터 / y : 이미지에 0~9를 붙인 이름표 - X_train, y_train : 학습셋 / X_test, y_test : 테스트셋 from tensorflow.keras.datasets import mnist # MNIST 데이터셋을 불러와 학습셋과 테스트셋으로 저장 (X_train, y_train), (X_test, y_test) = mnist.load_data() # 학습셋과 테스트셋이 각각 몇 개의 이미지로..
와인 품질 예측 데이터 - 레드 와인과 화이트 와인에 대한 화학적 특성과 품질 등급을 통해 와인의 종류 예측 1. 환경 및 데이터 준비 from tensorflow.keras.models import Sequential from tensorflow.keras.layers import Dense from sklearn.model_selection import train_test_split import pandas as pd # 데이터 입력 df = pd.read_csv('./data/wine.csv', header=None) # 데이터를 미리 봄 df.head() # 와인의 속성을 X로 와인의 분류를 y로 저장 X = df.iloc[:,0:12] y = df.iloc[:,12] 2. 검증셋 포함하여 모델 ..
k겹 교차 검증(k-fold cross validation) - 데이터셋을 여러 개로 나누어 하나씩 테스트셋으로 사용하고 나머지를 모두 합해서 학습셋으로 사용 - 가지고 있는 데이터의 100%를 학습셋으로 사용할 수 있고, 동시에 테스트셋으로도 사용 가능 - 데이터셋을 k개로 나눈 후 그 중 k-1개를 학습셋으로, 1개를 테스트셋으로 만들어 k번의 학습을 순차적으로 실시 5겹 교차 검증 예제 - 초음파 광물 예측 데이터 - 초음파 광물 예측 데이터 분석은 https://codingmoding.tistory.com/93 여기서 확인! 1. 환경 및 데이터 준비 from tensorflow.keras.models import Sequential from tensorflow.keras.layers import..
초음파 광물 예측 데이터 - 수중 음파 탐지기로 쏜 결과를 보고 광석인지 일반 암석인지 구분 from tensorflow.keras.models import Sequential from tensorflow.keras.layers import Dense import pandas as pd df = pd.read_csv('./data/sonar3.csv', header=None) # 음파 관련 속성을 X로, 광물의 종류를 y로 저장 X = df.iloc[:,0:60] y = df.iloc[:,60] # 모델 설정 model = Sequential() model.add(Dense(24, input_dim=60, activation='relu')) model.add(Dense(10, activation='rel..
피마 인디언 당뇨병 예측 데이터 - 피마 인디언을 대상으로 당뇨병 발병 여부를 예측 1. 환경 및 데이터 준비 - pandas와 seaborn 라이브러리가 설치되어 있지 않다면 '!pip install 라이브러리'로 먼저 설치 # 필요한 라이브러리 호출 import pandas as pd import matplotlib.pyplot as plt import seaborn as sns read_csv() : csv 파일을 불러오는 함수 : pandas에 존재 # 피마 인디언 당뇨병 데이터셋을 불러옴 df = pd.read_csv('./data/pima-indians-diabetes3.csv') 2. 데이터 조사 - 판다스(pandas) 활용 판다스(pandas) : 넘파이의 기능을 포함하면서도 다양한 포맷..