일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | 5 | ||
6 | 7 | 8 | 9 | 10 | 11 | 12 |
13 | 14 | 15 | 16 | 17 | 18 | 19 |
20 | 21 | 22 | 23 | 24 | 25 | 26 |
27 | 28 | 29 | 30 |
- 콕스비례모형
- 확률실험
- R dplyr
- 생존분석
- 생존그래프
- 카플란마이어
- CrossValidation
- ggplot()
- 의사결정나무
- 데이터 핸들링
- R select
- R문법
- 교차타당성
- 이산형 확률분포
- R filter
- R 결측치
- Bias-Variance Tradeoff
- 미국 선거데이터
- R 연습문제
- R mutate
- 주식데이터시각화
- 강화학습 #추천서적 #강화학습인액션
- dplyr
- ggplot2
- R ggplot2
- 데이터핸들링
- ISLR
- ggsurvplot
- R
- geom_errorbar
- Today
- Total
목록ggplot2 (5)
Must Learning With Statistics

시계열 데이터는 매우 중요한 데이터 타입 중 하나입니다. 하지만, 시간의 흐름에 따라 값이 입력되는 데이터이기 때문에, 일반인 독립(Independent)데이터와 같은 방식으로 처리하면 잘못된 분석을 진행하게 됩니다. 이번 포스팅은 시계열 데이터를 다루는 방법 및 시각화를 하는 방법에 다루어보도록 하겠습니다. 데이터 다운로드 링크 : https://www.kaggle.com/timoboz/tesla-stock-data-from-2010-to-2020 0. 데이터 및 패키지 로드 library(ggplot2) library(dplyr) library(reshape) library(tseries) library(cowplot) library(forecast) TSLA = read.csv("D:\\Dropbo..

마침 kaggle에 대한민국 코로나 데이터가 올라왔기에, 이를 통해 시각화를 해보도록 하겠습니다. 이번 포스팅은 대한민국 코로나 바이러스 확진자 데이터를 이용한 시각화를 진행해보도록 하겠습니다. 데이터는 다음 링크에서 받으시면 됩니다. 데이터 다운로드 링크: https://www.kaggle.com/kimdanny/covid19-in-south-korea 1. 데이터 불러오기 및 패키지 로딩 library(ggplot2) library(dplyr) library(reshape) Corona = read.csv("D:\\Dropbox\\DATA SET(Dropbox)\\covid19-in-south-korea\\Corona_rok.csv") dates confirmed deaths recovered 1/2..

1. 생존 그래프에 구간 표시하기 이번 포스팅에서는 지난 포스팅에서 그렸던 생존분석 그래프를 더 다양하게 그려보도록 하겠습니다. 생존분석을 진행하는 의사선생님들은 생존율이 90%, 80%, 70% 등 떨어지는 구간을 생존그래프에 표현하고 싶어합니다. 데이터는 저번 포스팅에서 썼던 데이터를 그대로 사용하도록 하겠습니다. 이번 포스팅부터는 survminer패키지는 사용하지 않도록 하겠습니다. ggplot2만으로도 모든 것을 다 그릴 수 있기 때문입니다. 데이터 다운로드 링크: https://www.dropbox.com/sh/vtqlvrgdts2yfez/AAD_cd49dBcvgBNdz-C-A6TFa?dl=0 library(ggplot2) library(survival) Survival = read.csv("D..

1. 생존분석 그래프의 중요성 생존분석은 의학계열에서 가장 자주 쓰이는 분석방법 중 하나입니다. 논문에 많이 활용되는 만큼, 생존분석 그래프또한 논문에 실리게 됩니다. 관계자의 말에 따르면 생존분석 그래프를 잘 그려야 논문 Accept에 유리하다는 소식을 들었습니다. 이번 포스팅은 생존 그래프를 어떻게 하면 잘 그릴 수 있을지에 대해 다룹니다. 2. 생존분석 시각화(카플란 마이어) 이번 글은 생존분석의 시각화가 목적이기 때문에 생존분석의 이론은 다루지 않고 바로 진행합니다. library(survival) library(survminer) survival 패키지 : 생존분석 모델링을 위한 패키지입니다. survminer 패키지 : 생존분석 시각화를 위한 패키지입니다. 데이터 다운로드 링크: https:/..

Chapter9. ggplot2를 활용한 다양한 그래프 그리기 이번 장에서는 ggplot2로 그릴 수 있는 그래프들의 종류에 대해 알아보도록 하겠습니다. library(ggplot2) library(dplyr) STOCK = read.csv("D:\\Dropbox\\DATA SET(Dropbox)\\uniqlo.csv") STOCKDate=as.Date(STOCKDate) STOCKYear=as.factor(format(STOCKDate,"%Y")) STOCKDay=as.factor(format(STOCKDate,"%a")) Group_Data = STOCK %>% group_by(Year,Day) %>% dplyr::summarise(Mean = round(mean(Open)), ..