Notice
Recent Posts
Recent Comments
Link
일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | 5 | 6 | 7 |
8 | 9 | 10 | 11 | 12 | 13 | 14 |
15 | 16 | 17 | 18 | 19 | 20 | 21 |
22 | 23 | 24 | 25 | 26 | 27 | 28 |
29 | 30 | 31 |
Tags
- ggsurvplot
- 카플란마이어
- CrossValidation
- 생존분석
- ISLR
- 확률실험
- R select
- 콕스비례모형
- 이산형 확률분포
- 강화학습 #추천서적 #강화학습인액션
- 데이터핸들링
- R dplyr
- R mutate
- R filter
- ggplot()
- 생존그래프
- geom_errorbar
- dplyr
- R문법
- 데이터 핸들링
- Bias-Variance Tradeoff
- 의사결정나무
- ggplot2
- R 연습문제
- 교차타당성
- 미국 선거데이터
- 주식데이터시각화
- R ggplot2
- R
- R 결측치
Archives
- Today
- Total
목록2020/03/01 (1)
Must Learning With Statistics
[R] 중고 자동차 데이터를 활용한 탐색적 자료분석 실전 예시
1. 탐색적 자료분석 이번 포스팅에서는 중고자동차가격 데이터에 대해 EDA(탐색적 자료분석)를 진행해보도록 하겠습니다. 탐색적 자료분석(EDA, Exploratory Data Analysis)은 데이터 분석에 있어서 매우 중요한 step입니다. 절차는 본 분석에 진행되기에 앞서 어떻게 데이터를 분석할건지 탐색하는 것입니다. 사회에서 가장 통계분석을 못하는 유형은 탐색적 분석 절차를 거치지 않고 바로 모델링부터 도전하려는 사람들입니다. 이 글을 읽으시는 분들은 그런 실수를 안하시기를 바랍니다. 탐색적 자료분석은 정답이 있는 것이 아닙니다. 그저 짧은 시간을 투자해 최대한의 정보를 뽑아, 데이터에 대해 이해를 하는 단계라고 보시면 됩니다. 다양한 방법들이 존재하지만, 제가 주로 하는 방법은 ’시각화’입니다...
R Code
2020. 3. 1. 18:29