[파이썬/Python] AI 반도체 주식 분석하기!📉📈(이동평균 & 수익률)
·
Project/주식 & 비트코인 분석
요약파이썬과 주피터 노트북을 활용해서 주가 데이터를 받아온 다음, 시각화를 통해나스닥에 상장된 AI반도체 기업들의 주식에 대한 이동 평균, 일일 수익률, 종목 간 상관성을가시적으로 표현해볼 것이다. 전 단계인 데이터 준비와 전처리 과정은 이전 포스팅을 참고하자.  이동평균 (Moving Averages)보통 시계열 분석을 원래 데이터 그대로 수행하게 되면 추세가 오르락 내리락 하여가시성이 떨어지는 경우가 많다. 물론 실제 데이터가 그렇기 때문에 그것 역시 중요하지만,추세를 확인하고 싶을 때는 보통 이동 평균(Moving Averages)을 많이 사용한다.계속해서 바뀌는 가격을 일정 부분 평균으로 주기적으로 뭉쳐서 데이터를 부드럽게 만든다.ma_day = [10,20,50]for ma in ma_day: ..
[파이썬/Python] 나스닥 AI 반도체 주요 기업들 주식 분석하기!📉📈(주가 편)
·
Project/주식 & 비트코인 분석
개요이전 3개의 포스팅에서 연달아 엔비디아의 주식을 간단하게 분석해 보았다. 하지만 조금 더 깊고 넓게, 엔비디아가 포함된 한 산업군의 주가를 분석하는 것도 재미있을 것 같았다.흥미로운 상관관계가 있을지도 모르고, 조금 더 다양한 기법을 적용해볼 수도 있다.이번 글에서는 나스닥에 상장된 AI 반도체 산업 기업들의 주가 데이터를 가져와서간단하게 분포까지 확인해볼 것이다.  데이터 준비import numpy as npimport matplotlib.pyplot as pltimport pandas as pdimport seaborn as snsimport yfinance as yfimport datetime as dt필요한 라이브러리를 import해준다. 보통 사이킷런 말고는 이렇게 미리 해놓는게 편한 듯. ..
[파이썬] 엔비디아 주식 예측 머신러닝 모델 만들고 평가까지 (최종)
·
Project/주식 & 비트코인 분석
개요이전 편에서 데이터의 시각화를 통해 데이터에 대한 어느 정도의 인사이트를 얻었다. 데이터를 보고 시각화 등의 기법을 통해, 데이터를 다각도로 살펴보고 의미있는 방점들을 찾아내는 것을보통 EDA(Exploratory Data Analysis)라고 한다. 전처리 후엔 EDA를 수행한다.이번 편에는 데이터의 이상치를 제거한 후, sklearn에서 제공하는 여러 모델들을 통해 간단하게 주식 예측 모델 학습과 평가를 해볼 것이다.  이상치plt.figure(figsize = (5,3))sns.boxplot(data = df)plt.show()이상치 확인은 여러 방식으로 할 수 있지만, 박스플롯이 가장 직관적이기에 좋다. 가격들은 비교적 안정적인 반편, 거래량은 가끔씩 껑충 뛰어오를 때가 있나보다. 이상치(흰 ..
[파이썬] 엔비디아 주식 분포 & 추세 분석하기 (시각화 편)
·
Project/주식 & 비트코인 분석
개요이전 편에서 야후 금융 데이터를 받아서 필요한 전처리를 모두 수행했다. 올바른 데이터가 모두 갖춰졌다면 분석을 통해서 인사이트를 얻고, 그것을 직관적인 형태로 보고까지 해야한다."숫자가 스스로 말하게 해라" 라는 데이터 분석의 의의를 잊지 말자.Matplotlib, Seaborn 으로 시각화를 수행하고, sklearn 의 여러 모델들을 통해 학습 및 평가까지 수행해보자.  분포 시각화plt.style.use('bmh')sns.set_style('darkgrid')두 패키지를 통해 시각화하기 전, 원하는 스타일을 미리 맞춰주는 것이 좋다. 여기서 사용하는 스타일은 어두운 그리드 스타일로 통일해보자! (가장 깔끔하다고 생각하는 스타일..) plt.figure(figsize = (10,5))sns.viol..
[파이썬] 야후 주식API와 파이썬으로 엔비디아 주가분석 (전처리/스케일링 편)
·
Project/주식 & 비트코인 분석
개요데이터분석에 대한 기본 개념과 파이썬이라는 언어에 익숙해졌다면, 여러 종류의 데이터를 가지고 연습을 해봐야실력이 늘기 마련이다. 여러 도메인 (경제, 사회, 자연어, 정치 등) 에 대한 지식을 쌓는 것과 동시에세상을 객관적으로 바라볼 수 있는 능력이 새기는 것이 데이터 분석의 매력인 것 같다.이번 글에서는, 야후에서 제공하는 주가 데이터를 파이썬을 통해 전처리, 시각화, 예측 등을 해볼 것이다.요즘 엔비디아와 관련해서 많은 이야기들이 오고 가는 것 같다. 객관적인 시각이 중요한 시점이다. (사용하는 라이브러리 : pandas, matplotlib, seaborn, sklearn, yfinance)  데이터 생성import numpy as npimport matplotlib.pyplot as pltim..
최적의 아이돌 인스타 피드 만들기 : 2일차 (데이터 수집하기)
·
Project/최적의 인스타 피드
무엇을?주제는 이다. 그렇다면 무엇을 수집해야 하는가. 이 질문이 정말 중요하다.R 프로그래밍 언어에 대해 기본적인 숙지가 된 후 여러 주제를 생각해봤다." 야구 좋아하니까, 야구 데이터를 수집해볼까? " , " 기숙사에 사니까, 기숙사 엘레베이터 데이터는 어떨까? " 등.. 내가 생각한 좋은 데이터 분석 주제의 특징은 다음과 같다.이미 나와 있는 데이터도 좋지만, 내가 직접 수집해보는 과정까지 겪어보자.주제는 내가 필요에 의해 정하는 거지, 이미 나와있는 주제는 의미가 떨어진다.분석할 거리가 많은 주제면 좋다. (데이터 프레임의 열이 많아야 한다는 의미)다양한 시각화가 가능한 데이터꾸준하게 수집하기 용이한 데이터이미 수집 체계가 갖추어져 있지 않은 데이터야구는 사실 '통계의 스포츠' 라고 불릴 정도로..