일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | |||
5 | 6 | 7 | 8 | 9 | 10 | 11 |
12 | 13 | 14 | 15 | 16 | 17 | 18 |
19 | 20 | 21 | 22 | 23 | 24 | 25 |
26 | 27 | 28 | 29 | 30 | 31 |
- 이산형 확률분포
- ISLR
- R mutate
- R select
- R dplyr
- ggplot2
- ggsurvplot
- 주식데이터시각화
- ggplot()
- dplyr
- 미국 선거데이터
- 생존분석
- geom_errorbar
- R
- R 결측치
- R 연습문제
- 데이터 핸들링
- 의사결정나무
- 카플란마이어
- Bias-Variance Tradeoff
- 데이터핸들링
- CrossValidation
- R문법
- R ggplot2
- 강화학습 #추천서적 #강화학습인액션
- 교차타당성
- R filter
- 콕스비례모형
- 확률실험
- 생존그래프
- Today
- Total
Must Learning With Statistics
통계적 추정과 검정 본문
12. 통계적 추정과 검정
선거철이 다가올 경우, 여러분들은 수없이 많은 표본조사 결과를 여러 매체를 통해 접할 수가 있습니다. '어느 후보의 지지율이 OO%이며 신뢰수준 95%에서 조사가 되었다.' 이런 문구는 매우 익숙하실 것입니다. 통계 분석의 목적은 모집단을 대표할 수 있는 표본을 수집한 뒤, 모집단에 대해 추정을 진행하는 것입니다. 추정은 점추정량과 구간추정량으로 나뉘게 됩니다.일반적으로 추정량이라고 하면 점추정량을 의미하며 이는 모수를 단 하나의 점으로 추측하는 통계량입니다. 예를 들어, 우리가 A카페에 방문한 고객들의 연령대를 조사해야하는데, 모든 고객의 나이정보를 수집할 수가 없는 경우를 가정하겠습니다. 이 경우, 주어진 고객들의 나이 정보를 통해 전체 고객의 평균 나이를 소수점까지 예측하는 것을 '점추정'이라고 합니다. 하지만, 한정된 정보만으로 전체 집단(모집단)의 정보를 완벽하게 맞추는 것은 불가능합니다. 그렇기에 우리는 모수(고객연령의 평균)를 포함하는 신뢰구간을 구하게 됩니다. 이를 구간추정이라고 합니다. "통계학이 무엇을 하는 학문인가?" 라는 질문이 주어지면 통계학은 '추정'을 하는 학문이라고 간단하게 설명을 할 수가 있습니다. 검정이란 여러분들이 많이 들어보셨을법한 '가설검정'을 의미합니다. 주어진 가설이 통계적으로 참인지 거짓인지 밝혀내기 위한 과정입니다. 앞으로 등장하는 모든 분석 모형은 추정과 가설검정을 진행하게 되어 있습니다. 다만, 예외의 경우도 있으나 그 예외의 경우들에 대해서 이 책에서는 다루지 않습니다.
'통계 이론' 카테고리의 다른 글
구간추정 (0) | 2020.03.22 |
---|---|
점추정 (0) | 2020.03.22 |
카이제곱분포와 F분포 (Chi-square distribution and F-distribution) (0) | 2020.03.22 |
t분포(student's t-distribution) (0) | 2020.03.22 |
모수(parameter)와 통계량(statistic) (0) | 2020.03.22 |