빅데이터/R | 만만한 통계 (R 활용)

통계 | 변수란? (연속형 vs 범주형 / 양적 vs 질적 / 독립 vs 종속) / 기술 통계와 추론 통계

KimKelly 2023. 3. 5. 23:28
반응형

PART 01 통계 입문

Chapter 01 통계

가장 일반적인 의미에서 통계란, 정보 또는 데이터를 규정하고 구성하며 해석하는 데 사용되는 여러 도구와 기법을 의미.

 

변수란?

변하는 값으로, 변수는 <숫자 vs 문자> / <독립 vs 종속> 과 같이 두 종류로 분류할 수 있음.

 

<숫자 vs 문자>

  • 숫자: 연속형 변수 = 양적 변수 

- 등간척도: 측정된 변수 사이 등간성이 있고, 단위가 부여되나 절대 0과 비율의 의미가 없음.

예) 온도, IQ점수

- 비율척도: 측정된 변수 사이 등간성이 없고, 단위가 부여되며 절대 0과 비율의 의미가 있음.  

예) 키, 몸무게, 나이, 시간

 

  • 문자: 범주형 변수 = 질적 변수

- 명목척도: 그룹의 이름으로 구분. 예) 성별, 정치적 소속, 인종

- 순위척도: 그룹의 이름으로 구분되며, 그룹 간 순위가 있음. 예) 성적, 학력

 

<독립 vs 종속>

  • 독립변수: 설명변수, 원인
  • 종속변수: 반응변수, 결과

 

 

기술 통계란?

수집된 데이터의 특성을 정리, 요약하고 설명하는 데 사용.

예) 평균, 중앙값, 최빈값

 

*연속형 변수  평균, 중앙값

*범주형 변수  최빈값

 

추론 통계란?

대부분 데이터를 수집하고 요약한 다음 단계에 해당. 

소규모의 데이터를 기반으로 더 큰 규모의 데이터 집단에 대하여 추론하는 데 사용.

 

*소규모 데이터 집단을 표본(sample)이라고 하며, 이는 모집단(population)의 일부 또는 하위 집합.

 

 

 

기술통계와 추론통계는 상호보완적이며, 어떤 통계를 사용할 지는 답을 구하고자 하는 질문에 따라 달라짐.  

 

반응형