본문 바로가기
미디어를 통하여

40대에 다시 바라보는 통계학에 대하여

by 3books-lee 2024. 3. 29.

다양하고 복잡한 정보들

그것들을 어떤 게 분석하고

예측하고, 무엇을 근거로 결론을 내릴지.

 

 

모든 분야의 기저에

통용되고 있는 학문이 바로

통계학이 아닐까 싶다.

 

 

 

 

대표적인 예로

요즘들어 많이 하는 전화 설문,

문자 투표, SNS 응모 등

 

 

답변을 하는 대상자별 분석,

예를 들어

어느 연령대인지, 사는 지역, 성별, 직업 등을 묻고

그 집단에서 나오는 결론이 어떤 성향을 나타내는지

조사한다.

 

 

그리고 조사 대상자들이 그런 한 결론이 나오게 된

원인을 추측이나, 다른 질문 등을 통해 파악한다.

 

 

통계학

사회 전반, 과학, 의학, 심리학 등

여러 분야에서 효과적인 의사 결정을

내리는 데 중요한 역할을 한다.

 

 

통계학의 주요 분야는

다음과 같이 분류할 수 있다.

 

 

기술통계학(Descriptive Statistics)

   데이터를 요약하고 설명하는데 주로 사용된다.

평균, 중앙값, 분산 등의 개념을 사용하여

데이터의 특성을 요약하고 설명하는 것을 의미다.

 

 

예를 들어 학생들의 성적을 분석할 때

기술통계학을 사용하여 평균 점수, 중앙값, 표준편차 등을 계산한다.

학생들의 평균적인 성적 수준, 성적 분포의 퍼짐 정도 등을 파악할 수 있다.

 

 

또한 기업에서 제품이나 서비스에 대한

마케팅 조사를 할 때

고객들의 선호도, 만족도 등의 의사를 파악할 수 있다.

 

 

 

 

 

 

 

추론통계학(Inferential Statistics)

샘플 데이터를 통해 모집단에 대한 결론을 내리는 것을 다룬다.

이는 표본에서 얻은 정보를 사용하여

모집단에 대한 일반적인 패턴이나 특성을 추론하는 과정을 의미합니다.

추론통계학은 가설 검정, 신뢰구간, 회귀분석 등

다양한 기법을 사용합니다.

 

 

대표적인 예로 제조업 분야에서는

제품의 품질을 검사하여

모집단의 품질에 대한 추론 한다.

제품의 일부를 추출하여 품질 검사를 실시하고,

그 결과를 분석하여 전체 제품의 품질 수준을 추론할 수 있다.

 

 

 

 

 

확률론(Probability Theory)

불확실성을 다루는 데 사용된다.

확률론은 랜덤 한 사건이 일어날 확률을

모델링하고 이해하는데 중요한 도구다.

이는 확률 분포, 확률 변수, 조건부 확률 등을 다룬다.

 

 

기상학에서는 확률론을 사용하여

날씨 패턴과 기상 조건의 확률을 모델링한다.

이를 통해 기상 예측 모델을 구축하여 향후 날씨를 예측하고

재해를 예방하거나 대비할 수 있다

 

 

 

 

회귀분석(Regression Analysis)

 변수 간의 관계를 탐구하는 통계적 기법이다.

이는 한 변수가 다른 변수에 어떻게 영향을

미치는지 이해하고 예측하는 데 사용된다.

 

 

부동산 시장에서 주택 가격을 예측하는 경우

주택의 크기, 위치, 시장 수요 등이 주요한 변수인데,

선택한 독립 변수들과 종속변수(주택가격) 간의

관계를 모델링하고 분석하여

예측하는데 활용하는 것이다.

 

 

 

통계적 실험(Experimental Design)

 실험을 설계하고 분석하는 과정을 다룹니다.

이는 실험 조건을 설정하고 효과를 평가하여

인과 관계를 추론하는 과정을 의미한다.

 

의학연구에서 통계적 실험을 하여

새로운 치료법이나 약물의 효과를 평가할 수 있다.

특정 환자 집단을 선택 후 무작위로 분류하여

약물 투여 그룹과 그렇지 않은 대조군을 비교한다.

두 그룹 간의 차이가 우연에 의한 것인지

실제로 약물의 효과에 의한 것인지 확인할 때 적용된다.

 

 

 

 

비모수 통계학(Nonparametric Statistics)

 모수에 대한 가정 없이 데이터를 분석하는 방법론을 다룬다.

이는 데이터가 정규분포를 따르지 않거나

분포에 대한 사전 정보가 부족한 경우에 사용된다.

 

약물의 부작용을 조사할 때,

환자들의 특성에 따른 부작용의 발생률을

비교하고자 할 때 적용된다.

이때, 환자 집단의 크기가 작거나 분포가

정규분포를 따르지 않을 수 있으므로

비모수 통계학을 사용하여 부작용 발생률을 비교할 수 있다.