확률변수는 어떤 사건을 수치로 변환하는 도구이고,
확률분포는 확률변수가 가질 수 있는 값과 그 확률을 설명하는 수학적 모델입니다.
확률분포를 통해 확률변수의 특성을 분석하고, 기대값과 분산 등의 통계적 특성을 알 수 있습니다.
확률에 대해서 이해하기 전에 시행(trial)과 사건(event) 에 대해서 알아야합니다.
시행(trial): 반복할 수 있으며, 매번 결과가 달라질 수 있는 실험.
Ex) 주사위 3개를 던지는 것.
사건(event): 시행에 따른 결과를 의미합니다.
Ex) 눈금의 합이 10.
확률이란, 어떠한 사건(Event)이일어날 가능성을 수로 표현한 것 입니다.
확률변수(Random Variable)란, 사건으로 인해 그 값이 확률적으로 정해지는 변수를 의미합니다. 시행할 때마다 변할 수 있는 값(눈금의 합)이라고 합니다.
주사위 2개를 던지는 시행(trial)을 할 때, 눈금의 합이 변할 수 있습니다.
즉, "확률 변수 = 눈금의 합"으로 표현할 수 있습니다.
확률 변수는 대문자 X로 표기하고, 확률변수가 취할 수 있는 값은 소문자 x로 표기합니다.
앞면이 0이고, 뒷면이 1이 있는 2개의 동전이 있고, 동전 2개를 동시에 던진다고 가정합니다.
가능한 X의 값은 0,1,2 가 있습니다. 동전 2개를 던질 때마다 X의 값이 달라질 수 있습니다.
그러므로, 확률적으로 변할 수 있다고 하여 X를 확률 변수라고 합니다.
각 사건에 대한 확률을 정의하자면 아래와 같을 수 있습니다.
여기서 확률변수 X는 두 눈금의 합이라고 할 수 있습니다.
확률함수란(Probability Function), 확률 변수에 따라서 확률값을 부여하는 함수를 의미합니다.
확률함수는 일반적으로 p로 표현하고, 주사위 2개를 던졌을 때 눈금의 합이 4가 나올 확률은 1/36입니다.
이를 다음과 같이 표현할 수 있습니다.
확률분포(Probability Distribution) 이란, 각 사건에 어느 정도의 확률이 할당되었는지를 표현한 정보를 의미합니다.
위의 그림이 흔하게 말하는 확률분포라고 합니다.
즉, 특정한 어떤 사건에 대한 확률들을 의미합니다.
확률변수 X가 가지는 값 x에 확률 P(X = x) 를 대응시키는 함수를 의미합니다.