반응형

빅데이터/R | 만만한 통계 (R 활용) 3

통계 | 변수란? (연속형 vs 범주형 / 양적 vs 질적 / 독립 vs 종속) / 기술 통계와 추론 통계

PART 01 통계 입문 Chapter 01 통계 가장 일반적인 의미에서 통계란, 정보 또는 데이터를 규정하고 구성하며 해석하는 데 사용되는 여러 도구와 기법을 의미. 변수란? 변하는 값으로, 변수는 / 과 같이 두 종류로 분류할 수 있음. 숫자: 연속형 변수 = 양적 변수 - 등간척도: 측정된 변수 사이 등간성이 있고, 단위가 부여되나 절대 0과 비율의 의미가 없음. 예) 온도, IQ점수 - 비율척도: 측정된 변수 사이 등간성이 없고, 단위가 부여되며 절대 0과 비율의 의미가 있음. 예) 키, 몸무게, 나이, 시간 문자: 범주형 변수 = 질적 변수 - 명목척도: 그룹의 이름으로 구분. 예) 성별, 정치적 소속, 인종 - 순위척도: 그룹의 이름으로 구분되며, 그룹 간 순위가 있음. 예) 성적, 학력 독립..

R vs Python | R과 파이썬의 차이점: R과 파이썬은 어떻게 다른가

R과 Python은 데이터 분석 도구로 많이 쓰이지만, 두 언어는 개발 목적이 다름. R과 python은 어떻게 다를까? R 데이터 분석용으로 만들어진 언어. 데이터 처리와 통계 분석 기능이 특화됨. 프로그래밍 지식이 없어도 쉽고 간단한 문법으로 사용 가능. 데이터 분석이 목적이라면 파이썬보다 쉽게 분석 가능함. Python 소프트웨어를 개발하기 위해 만들어진 언어. 유튜브, 인스타그램, 드롭박스 등과 같은 웹 서비스가 파이썬으로 개발됨. 텐서플로 등과 같은 딥러닝을 활용할 수 있는 라이브러리가 등장하면서 주목받음. 데이터 분석 서비스 어플리케이션 개발 목적이라면 파이썬이 더 자유롭게 개발 가능함. 미래 지향적으로 보면, 둘 중 하나만 사용해야 가능한 기능은 없어질 것. (R에서 사용한 기능이 Pytho..

R이란? | R의 특징 / 기능 / 장점 / 사용

R이란? 데이터 분석을 위한 프로그래밍 언어로, 다양한 기능을 지원하는 오픈소스 소프트웨어 R의 특징 데이터 분석 도구, 프로그래밍 언어 뉴질랜드 통계학 교수 (Ross Ihaka, Robert Gentleman) 개발 1990년 초반 개발 2000년 정식 version 1.0 발표 무료로 사용할 수 있는 오픈 소스 설치 메모리 용량 적게 소요 32, 64 bit 지원 OS free: window, linux, mac help fuction: 학습하는데 많은 도움이 됨 R의 기능 R의 대표적인 기능은 통계 분석이다. 기초 통계 분석부터 가설 검정에 사용되는 고급 통계 분석 기법 상관계수 r (-1 < r < 1) 양의 상관관계: 같은 방향으로 증가하거나 감소 (0 < r < 1) 음의 상관관계 : 반대 ..

반응형