반응형
PART 01 통계 입문
Chapter 01 통계
가장 일반적인 의미에서 통계란, 정보 또는 데이터를 규정하고 구성하며 해석하는 데 사용되는 여러 도구와 기법을 의미.
변수란?
변하는 값으로, 변수는 <숫자 vs 문자> / <독립 vs 종속> 과 같이 두 종류로 분류할 수 있음.
<숫자 vs 문자>
- 숫자: 연속형 변수 = 양적 변수
- 등간척도: 측정된 변수 사이 등간성이 있고, 단위가 부여되나 절대 0과 비율의 의미가 없음.
예) 온도, IQ점수
- 비율척도: 측정된 변수 사이 등간성이 없고, 단위가 부여되며 절대 0과 비율의 의미가 있음.
예) 키, 몸무게, 나이, 시간
- 문자: 범주형 변수 = 질적 변수
- 명목척도: 그룹의 이름으로 구분. 예) 성별, 정치적 소속, 인종
- 순위척도: 그룹의 이름으로 구분되며, 그룹 간 순위가 있음. 예) 성적, 학력
<독립 vs 종속>
- 독립변수: 설명변수, 원인
- 종속변수: 반응변수, 결과
기술 통계란?
수집된 데이터의 특성을 정리, 요약하고 설명하는 데 사용.
예) 평균, 중앙값, 최빈값
*연속형 변수 → 평균, 중앙값
*범주형 변수 → 최빈값
추론 통계란?
대부분 데이터를 수집하고 요약한 다음 단계에 해당.
소규모의 데이터를 기반으로 더 큰 규모의 데이터 집단에 대하여 추론하는 데 사용.
*소규모 데이터 집단을 표본(sample)이라고 하며, 이는 모집단(population)의 일부 또는 하위 집합.
기술통계와 추론통계는 상호보완적이며, 어떤 통계를 사용할 지는 답을 구하고자 하는 질문에 따라 달라짐.
반응형
'빅데이터 > R | 만만한 통계 (R 활용)' 카테고리의 다른 글
R vs Python | R과 파이썬의 차이점: R과 파이썬은 어떻게 다른가 (0) | 2023.02.01 |
---|---|
R이란? | R의 특징 / 기능 / 장점 / 사용 (0) | 2023.01.31 |