[파이썬] iris 데이터셋으로 머신러닝 배우기 <로지스틱 회귀>
·
Coding & Data Analysis/Python
로지스틱 회귀 (Logistic Regression)단순 선형회귀, 다중 선형회귀, 다항 회귀 모두 수치적인 데이터를 다뤘다면,로지스틱 회귀는 범주형 데이터를 다룬다. 독립변수에 따라 종속변수가 어디로 분류되어야 하는가의 문제.애초에 "Logistics" 가 물류를 의미하는 만큼 닉값을 하는듯.. 원리는 간단하게 보면 다음과 같다.선형회귀는 값 그 자체를 y축에 표시하지만, 로지스틱 회귀는 y축에 확률을 표시한다.그리고 확률이 50%가 넘어가는지의 여부에 따라 범주를 구분한다.위에 표시된 곡선은 "시그모이드 함수(Sigmoid Function)" 이라고 부른다.   데이터 및 전처리from sklearn.datasets import load_irisiris = load_iris()df = pd.DataF..
[오답노트] Python에서 for 문으로 matplotlib 그래프 겹치기 w. 머신러닝
·
Coding & Data Analysis/Python
구현하고자 하는 것맨날 plt.plot 이나 scatter 으로 일일히 겹치는 건 지루하다!! for 문으로 그래프 드르륵 탁!(for 문을 활용해서 다항 회귀의 차수에 따른 그래프를 겹쳐서 그리기) 단계별 코드plt.figure()plt.scatter(X,y, c = '#2EC4B6', s = 20, alpha = 0.3)figure 랑 scatter 를 먼저 입력한다. figure 가 제일 위에 오는게 포인트! col = ['orange','blue','green','red']label = ['x^1','x^2','x^3','x^4']for x in range(1,5) : poly_reg_x = PolynomialFeatures(degree = x) #차수 X_deg = poly_reg_x..
[파이썬] airquality 데이터셋으로 머신러닝 배우기 <다항 회귀>
·
Coding & Data Analysis/Python
데이터이번엔 선형성이 강하지 않은 새로운 데이터를 사용해보고 싶었다. 파이썬에서 결측치 처리도 해볼겸..R의 airquality 데이터는 결측치를 포함하고 있고, 약한 선형성을 띄기에 ML을 연습하기 좋다!https://github.com/vincentarelbundock/Rdatasets/blob/master/csv/datasets/airquality.csv Rdatasets/csv/datasets/airquality.csv at master · vincentarelbundock/RdatasetsA collection of datasets originally distributed in R packages - vincentarelbundock/Rdatasetsgithub.com  다항 회귀다항 회귀는 고..
[파이썬] iris 데이터셋으로 머신러닝 배우기 <다중선형회귀 & 평가지표>
·
Coding & Data Analysis/Python
데이터이번 글에서는 범주형 데이터를 사용하는 다중선형회귀를 다루기에, 수치와 범주를 모두 포함하는유용한 데이터셋인 R의 iris 를 활용합니다.import pandas as pdimport matplotlib.pyplot as pltfrom sklearn.datasets import load_irisiris = load_iris()df = pd.DataFrame(iris.data, columns = iris.feature_names)df['species'] = iris.targetdf['species'] = df['species'].replace({0:'Setosa',1:'Versicolor',2:'Virginica'})사이킷런에서도 iris를 내장데이터셋으로 가지고 있기에 스근하게 가져와주기..load..
[파이썬] 미국 경제 데이터셋으로 머신러닝 배우기 2 <경사 하강법>
·
Coding & Data Analysis/Python
데이터R의 ggplot2 라이브러리의 "economics" 데이터를 활용했습니다. https://ggplot2.tidyverse.org/reference/economics.html US economic time series — economicsThis dataset was produced from US economic time series data available from https://fred.stlouisfed.org/. economics is in "wide" format, economics_long is in "long" format.ggplot2.tidyverse.org  경사하강법x = df.loc[:,'pce'].values.reshape(-1,1)y = df.loc[:,'psavert']..
[파이썬] 미국 경제 데이터셋으로 머신러닝 배우기 <선형회귀>
·
Coding & Data Analysis/Python
데이터R의 ggplot2 라이브러리의 "economics" 데이터를 활용했습니다. https://ggplot2.tidyverse.org/reference/economics.html US economic time series — economicsThis dataset was produced from US economic time series data available from https://fred.stlouisfed.org/. economics is in "wide" format, economics_long is in "long" format.ggplot2.tidyverse.org  배열(array)import numpy as nparray1 = np.array([[1, 2, 3], [4, 5, 6]])..