최적의 아이돌 인스타 피드 만들기 : 1일차 (계획 짜기)
·
Project/최적의 인스타 피드
계기시작은 뭐 그냥 평범한 고민에서 이뤄진 것 같다. 평소에 응원하는 가수인 스테이씨의최근 국내 컴백 앨범인 'Metamorphic' 의 성적 저조 때문에 고민이 많았다. 노래가 그렇게 좋은데..  멜론 TOP100에서는 타이틀곡인 'Cheeky Icy Thang' 이 언제 들어왔는지 기억이 안 날 정도로 빠르게 사라졌고,HOT100에서 간신히 중위권 순위를 유지하다가 떨어지고 말았다.   음악적으로 신박한 도전을 한 것도 맞고, 타이틀곡이라는 무게에 비해선 가벼운 느낌이 있는 것도 맞다.하지만 나는 이번 앨범 뿐만이 아닌, 스테이씨라는 브랜드에 대해 고민해보았다. 작년 8월 16일. 그때 나는 고등학교 3학년이였고스터디카페에서 공부를 하다가 컴백 시간에 맞게 그 당시 컴백 타이틀인 'Bubble' 을 ..
[Python] 개강 후 첫 번째 공부 : Colab 으로 파이썬 데이터 분석 준비
·
Coding & Data Analysis/Python
인트로9월 1일이 개강날이였고, 저는 학교에 적응을 마쳤으니 슬슬 포스팅을 정기적으로해보려고 노력하겠습니다. 그저 평범한 경영학과 학생이 본인이 관심있어하는 영역을 공부하는 기록이지만누군가는 배워갈 것들이 있을수도 있고, 누군가는 영감을 얻어 갈 것이라고 믿습니다.이번 글에는 Python 으로 데이터 분석을 하기 위한 기초 지식과 Colab 소개를 해보겠습니다.   숫자를 잘 다루는 거대한 비단뱀Python. 영어로 번역하면 '거대한 비단뱀' 이라는 뜻인데요, 창작자가 의도한 것인지는 몰라도현존하는 프로그래밍 언어 중 가장 광범위하고 많이 사용되는 언어라고 해도 과언이 아닙니다. 웹 및 앱 개발에서는 백엔드를 도맡아 서비스의 로직을 관리하고,스크래퍼같은 반복 구문 기반 프로그램을 구성하는 언어가 되기도 ..
경영학과 + 데이터 분석 = ?
·
Records & Thoughts
경영학의 한계사람은 계속 바뀌어 갑니다.평소에 즐겨 보는 유튜브만 보더라도 한 영상, 한 사건, 혹은그저 충분한 시간만 주어진다면 사람. 즉 소비자의 구매 행동은 이전의 그것과 달라집니다. 이 관점에서 비추어 볼 때, 경영학과의 'Case Study(과거에 성공했던 경영전략 및 사례들을 통해 배워 이후의 산업에 적용해보기)' 는 의미가 크지 않습니다. 과거의 상황은 그 시간대의 여러 요소들이 겹쳐 해당 산업이 뒷받침되었던 것이기 때문에, 미래의 전략을 짜는 과정에서는 해당 전략을 그대로 사용할 이유가 없습니다. 오히려 과거의 상황에 대한 데이터가 있다면, '어떤 요소들에 의해 해당 전략이 성공했을까?' 라는 질문을 통해특정 상황에 맞는 경영학적 인사이트를 얻을 수도 있습니다.과거를 답습하는게 아니라 과거..
[R] R으로 보고서 & 인터랙티브 웹까지 만들수 있다. (feat. Shiny)
·
Coding & Data Analysis/R
인트로뭔가 공부를 더 해야 직성이 풀리는 날 있잖아..그래서 분산분석 관련 글을 적고 난지 얼마 안되어서 새로운 글을 적어봅니다. R은 정말 강력한 데이터 분석 및 시각화 툴이지만, 다양한 기능과 패키지를 활용해서간단한 문법 몇 가지만으로도 PDF, Word, HTML 등으로 표현된 보고서를 10분만에 만들거나웹 개발적인 지식이 부족하더라도 사용자와 상호작용하는 인터랙티브 웹을 만드는 것도 가능합니다.데이터 분석가로서는 결국엔 '배포' 가 최종 목적지이기에마무리가 중요하다는 것을 잊지 맙시다!  R MarkdownR에서 지원하는 파일 확장자는 .r 이지만,보고서를 작성하는 경우, R markdown 이라는 마크다운 형식으로 작성된 문서인 .rmd 확장자를 사용합니다. File 탭에서 R 스크립트를 새로 ..
[R] 지역별 미세먼지 농도 비교 & 가설 검정
·
Coding & Data Analysis/R
인트로오늘의 분석은 '서울시 지역별 미세먼지 농도 비교' 이다.간단하게 박스플롯을 통해서 평균, 사분위수 등을 확인해보고통계 기법 중 하나인 '가설 검정' 을 활용하여 특정 가설을 입증할 수 있는지에 대해 확인해보겠다.  수집과 전처리공공데이터포털에는 매우 다양하고 광범위한 데이터가 많지만, 특정 주제를 정했다면그 주제를 확실하게 다루는 하나의 사이트에서 자료를 구하는 것도 좋은 방법이 된다.오늘의 수집은 '서울특별시 대기환경정보 홈페이지' 에서 구했다.https://cleanair.seoul.go.kr/ 서울특별시 대기환경정보 cleanair.seoul.go.kr 이 사이트에서 얻는 데이터의 특징을 고려해본다면, 열 데이터가 일자(1일, 2일 등)이고,행 데이터가 지역(동작구, 강남구 등)이기 때문에,..
[R] 코로나19 선별진료소 빈도분석 & 지도 시각화
·
Coding & Data Analysis/R
인트로오늘의 데이터 분석 주제는 " 전라남도 코로나19 선별진료소 위치와 도시별 빈도 " 이다.빈도 분석은 이전 글에서 다뤘던 count → arrange 문법과 ggplot2 의 reorder 옵션을 활용했고,지도 시각화는 이미지를 끌어와서 시각화하는 방법과지도 핀을 활용하게 해주는 패키지의 기능을 활용해보았다.   빈도분석전처리는 Excel 에서 간단하게 행 몇가지와 필요없는 열을 삭제했고, R에서는 names 함수를 통해열 이름을 한글에서 영어로 변경해주었다.# names 함수 : 컬럼명 벡터로 return.names(data)  이후, count 함수를 통해 각 도시별 진료소 수를 담은 데이터프레임을 만들고해당 데이터프레임을 geom_col 함수로 시각화한다. 너비(width)와 채우기(fill)..