Excel 통계 함수: BINOMDIST

기술 자료 번역 기술 자료 번역
기술 자료: 827459 - 이 문서가 적용되는 제품 보기.
모두 확대 | 모두 축소

이 페이지에서

요약

이 문서에서는 Microsoft Office Excel 2003의 BINOMDIST 함수 및 그 사용 방법에 대해 설명하며, 이 함수를 Excel 2003에서 실행한 결과와 이전 버전의 Excel에서 실행한 결과를 비교합니다.

Mac용 Microsoft Excel 2004 정보

Mac용 Excel 2004의 통계 함수는 Microsoft Office Excel 2003의 통계 함수를 업데이트할 때 사용한 알고리즘과 동일한 알고리즘을 사용하여 업데이트되었습니다. Excel 2003에서 함수를 작동 및 수정하는 방법을 설명하는 이 문서의 모든 정보는 Mac용 Excel 2004에도 적용됩니다.

추가 정보

cumulative가 TRUE이면 BINOMDIST(x, n, p, cumulative) 함수는 n 독립 베르누이 시행에서 x회 이하의 성공 확률을 반환합니다. 각 시행의 성공 확률은 p이고 실패 확률은 1-p입니다. cumulative가 FALSE이면 BINOMDIST는 정확히 x의 성공 확률을 반환합니다.

구문

BINOMDIST(x, n, p, cumulative)

매개 변수

  • x는 음이 아닌 정수입니다.
  • n은 양의 정수입니다.
  • p는 0과 1 사이의 숫자입니다.
  • Cumulative는 TRUE 또는 FALSE 값을 갖는 논리 변수입니다.

사용 예

다음과 같이 가정합니다.
  • 야구에서 "3할 타자"가 타석(시행)에서 안타(성공)를 칠 확률이 3할이다.
  • 타석에서 연속적으로 방망이를 휘두르는 횟수는 독립 베르누이 시행이다.
아래 표에서는 타자가 10타석에서 정확히 0, 1, 2, ... 또는 10안타를 칠 확률과 10타석에서 0, 1 이하, 2 이하, ..., 9 이하 또는 10 이하의 안타를 칠 확률을 구할 수 있습니다.

타자가 첫 200타석에서 50안타를 친 경우(2할5푼) 다음 300타석에서 100안타를 쳐야만 500타석에서 150안타를 쳐 3할을 유지할 수 있습니다. 아래 표에서는 타자가 자신의 평균 타율을 유지하기 위해 필요한 안타 수를 분석할 수 있습니다. 야구 해설가는 타자가 첫 200회 타석에서 50안타로 저조한 성적을 거둘 때 이를 걱정하는 팬들에게 "시즌이 끝날 무렵에는 평균 타율이 3할이 될 것"이라고 안심시키며 "평균의 법칙"을 자주 거론합니다. 그러나 정말로 타석에서 외부의 영향을 받지 않았고 안타를 칠 확률이 3할이었다면 첫 200타석의 결과가 이후의 300타석에서 안타를 칠 확률에 영향을 주지 않으므로 이러한 추론은 거짓이 됩니다.

BINOMDIST를 실제로 사용해 보려면 빈 Excel 워크시트를 만들고 아래 표를 복사한 다음 빈 Excel 워크시트에서 A1 셀을 선택하고 편집 메뉴에서 붙여넣기를 눌러 워크시트의 A1:C22 셀을 아래 표 항목으로 채우십시오.
표 축소표 확대
시행 수10
성공 확률0.3
성공, xP(정확히 x회 성공)P(x회 이하의 성공)
0=BINOMDIST(A4,$B$1,$B$2,FALSE)=BINOMDIST(A4,$B$1,$B$2,TRUE)
1=BINOMDIST(A5,$B$1,$B$2,FALSE)=BINOMDIST(A5,$B$1,$B$2,TRUE)
2=BINOMDIST(A6,$B$1,$B$2,FALSE)=BINOMDIST(A6,$B$1,$B$2,TRUE)
3=BINOMDIST(A7,$B$1,$B$2,FALSE)=BINOMDIST(A7,$B$1,$B$2,TRUE)
4=BINOMDIST(A8,$B$1,$B$2,FALSE)=BINOMDIST(A8,$B$1,$B$2,TRUE)
5=BINOMDIST(A9,$B$1,$B$2,FALSE)=BINOMDIST(A9,$B$1,$B$2,TRUE)
6=BINOMDIST(A10,$B$1,$B$2,FALSE)=BINOMDIST(A10,$B$1,$B$2,TRUE)
7=BINOMDIST(A11,$B$1,$B$2,FALSE)=BINOMDIST(A11,$B$1,$B$2,TRUE)
8=BINOMDIST(A12,$B$1,$B$2,FALSE)=BINOMDIST(A12,$B$1,$B$2,TRUE)
9=BINOMDIST(A13,$B$1,$B$2,FALSE)=BINOMDIST(A13,$B$1,$B$2,TRUE)
10=BINOMDIST(A14,$B$1,$B$2,FALSE)=BINOMDIST(A14,$B$1,$B$2,TRUE)
300회 시행, 성공 확률 0.3:
성공, xP(정확히 x회 성공)P(x회 이하의 성공)
89=BINOMDIST(A18,300,0.3,FALSE)=BINOMDIST(A18,300,0.3,TRUE)
90=BINOMDIST(A19,300,0.3,FALSE)=BINOMDIST(A19,300,0.3,TRUE)
99=BINOMDIST(A20,300,0.3,FALSE)=BINOMDIST(A20,300,0.3,TRUE)
100=BINOMDIST(A21,300,0.3,FALSE)=BINOMDIST(A21,300,0.3,TRUE)
101=BINOMDIST(A22,300,0.3,FALSE)=BINOMDIST(A22,300,0.3,TRUE)
참고 이 표를 새 Excel 워크시트에 붙여 넣은 후에는 붙여넣기 옵션 단추를 누르고 주변 서식에 맞추기를 누르십시오. 붙여 넣은 범위를 선택한 상태에서 서식 메뉴에서 을 가리킨 다음 선택한 열에 맞게를 누르십시오. B4:C22 셀의 서식을 읽기 쉽게 지정할 수 있습니다. 예를 들어, 숫자를 소수점 다섯 자리까지 표시할 수 있습니다.

B4:B14 셀은 10회 시행에서 정확히 x회의 성공 확률을 보여줍니다. 성공 확률이 가장 높은 횟수는 3회입니다. 0, 6, 7, 8, 9 또는 10회의 성공 확률은 각각 0.05 미만이며 모두 더하면 약 0.076이 됩니다. 따라서 1, 2, 3, 4 또는 5회의 성공 확률은 약 1 ? 0.076 = 0.924입니다. C4:C14 셀은 10회 시행에서 x회 이하의 성공 확률을 보여줍니다. 모든 행의 C열에 있는 항목은 해당 행의 B열에 있는 항목에서 그 아래 모든 행의 항목을 합한 것과 같음을 확인할 수 있습니다.

B18:B20 셀은 300회 시행에서 성공 확률이 가장 높은 횟수가 90회임을 보여줍니다. 정확히 x회의 성공 확률은 x 값이 90까지 증가할 때까지 함께 증가하다가 90을 넘으면 감소하기 시작합니다. 90회 이하의 성공 확률은 C20에 나와 있듯이 50%가 조금 넘습니다. 99회 이하의 성공 확률은 약 0.884입니다. 따라서 100회 이상의 성공 확률은 11.6%(0.116 = 1 ? 0.884)밖에 되지 않습니다.

이전 Excel 버전에서의 실행한 결과

Knusel(참고 1 참조)은 BINOMDIST가 숫자 오버플로로 인해 숫자 응답을 반환하지 않고 대신 #NUM!을 생성하는 경우를 증명했습니다. BINOMDIST가 숫자 응답을 반환하는 경우 이러한 응답은 올바른 것입니다. BINOMDIST는 시행 횟수가 1030회 이상인 경우에만 #NUM!을 반환합니다. n이 1030보다 작은 경우에는 계산 문제가 발생하지 않습니다. 실제로 n의 값이 이렇게 큰 경우는 거의 없습니다. 독립 시행 횟수가 이렇게 많은 경우, n*pn*(1-p)가 각각 30 이상으로 충분히 높은 경우 정규 분포를 곱해 이항 분포의 근사치를 구하고 그렇지 않으면 포아송 분포를 곱해 이항 분포의 근사치를 구할 수 있습니다.

참고 1 Knusel, L. "Microsoft Excel 97 통계적 분포의 정확성(On the Accuracy of Statistical Distributions in Microsoft Excel 97)", Computational Statistics and Data Analysis (1998), 26: 375-377.

cumulative가 아닌 경우 BINOMDIST(x, n, p, false)는 다음 수식을 사용합니다.
COMBIN(n,x)*(p^x)*((1-p)^(n-x))
COMBIN은 n 항목의 모집단에 x 항목의 조합 횟수를 제공하는 Excel 함수입니다. COMBIN(n,x)은 종종 nCx로 쓰여지고 "조합 계수" 또는 간단히 "n choose x"로 명명됩니다. 한 셀에 =COMBIN(1029,515)를 입력하고 다른 셀에 =COMBIN(1030,515)를 입력하여 COMBIN을 직접 실행해 보면 첫 번째 셀은 천문학적 숫자인 1.4298E+308을 반환하고 두 번째 셀은 첫 번째 셀의 값보다 크기 때문에 #NUM!을 반환합니다. 이전 버전의 Excel에서는 COMBIN이 오버플로되면 BINOMDIST도 오버플로됩니다.

Excel 2003에서는 COMBIN이 수정되지 않았습니다.

Excel 2003에서의 실행 결과

Microsoft는 오버플로가 발생하면 BINOMDIST가 #NUM!을 반환하는 문제를 확인했으며 오버플로가 발생하지 않으면 BINOMDIST가 제대로 작동한다는 것을 알고 있기 때문에 Excel 2003에서 조건부 알고리즘을 구현하였습니다. 이 알고리즘은 n이 1030보다 작은 경우 이전 Excel 버전의 BINOMDIST 코드(이 문서의 앞부분에 언급된 계산 수식)를 사용하고, n이 1030보다 크거나 같은 경우 이 문서의 뒷부분에서 설명하는 대체 알고리즘을 사용합니다. 일반적으로 COMBIN은 천문학적인 숫자이기 때문에 오버플로되지만 p^x 및 (1-p)^(n-x)는 각각 무한소입니다. 이 두 값을 곱할 수만 있다면 그 결과는 0과 1사이의 숫자가 될 수 있습니다. 그러나 기존의 유한 계산법으로는 이 두 값을 곱할 수 없으므로 대체 알고리즘이 COMBIN 계산을 수행하지 않습니다. Microsoft는 나중에 배율 지정에 사용되는 정확히 x회 성공 확률의 소수 자릿수가 없는 합계를 계산합니다. 또한 BINOMDIST를 통해 반환할 확률의 소수 자릿수가 없는 합계도 계산합니다. 마지막으로 배율 인수를 사용하여 정확한 BINOMDIST 값을 반환합니다. 이 알고리즘은 연속 항으로 이루어진 COMBIN 형식(n,k)*(p^k)*((1-p)^(n-k))의 비율이 단순하다는 사실을 이용합니다. 이 알고리즘은 다음 단계에서 의사 코드로 설명된 대로 진행됩니다.

0단계: (초기화) TotalUnscaledProbabilityUnscaledResult 속성을 0으로 초기화합니다. EssentiallyZero 상수 10^(-12) 같은 매우 작은 수로 초기화합니다.

1단계: n*p 값을 구하고 가장 근접한 정수 m으로 내림합니다. n회 시행에서 성공 확률이 가장 높은 횟수는 m 또는 m+1입니다. COMBIN(n,k)*(p^k)*((1-p)^(n-k))은 k 값이 m에서 m-1, m-2으로 감소할 때 함께 감소합니다. 또한 COMBIN(n,k)*(p^k)*((1-p)^(n-k))은 k 값이 m+1에서 m+2, m+3으로 증가할 때도 함께 증가합니다.
TotalUnscaledProbability = TotalUnscaledProbability + 1;
If (m == x) then UnscaledResult = UnscaledResult + 1;
If (cumulative && m < x) then UnscaledResult = UnscaledResult + 1;
2단계: km보다 큰 경우의 소수 자릿수가 없는 확률을 계산합니다.
PreviousValue = 1;
Done = FALSE;
k = m + 1;
While (not Done && k <= n)
  {
	CurrentValue = PreviousValue * (n ? k + 1) * p / (k * (1 ? p));
	TotalUnscaledProbability = TotalUnscaledProbability + CurrentValue;
	If (k == x) then UnscaledResult = UnscaledResult + CurrentValue;
	If (cumulative && k < x) then UnscaledResult = UnscaledResult +
		CurrentValue;
	If (CurrentValue <= EssentiallyZero) then Done = TRUE;
	PreviousValue = CurrentValue;
	k = k+1;
  }
end While;
3단계: km보다 작은 경우의 소수 자릿수가 없는 확률을 계산합니다.
PreviousValue = 1;
Done = FALSE;
k = m - 1;
While (not Done && k >= 0)
  {
	CurrentValue = PreviousValue * k+1 * (1-p) / ((n ? k) * p);
	TotalUnscaledProbability = TotalUnscaledProbability + CurrentValue;
	If (k == x) then UnscaledResult = UnscaledResult + CurrentValue;
	If (cumulative && k < x) then UnscaledResult = UnscaledResult + 
		CurrentValue;
	If (CurrentValue <= EssentiallyZero) then Done = TRUE;
	PreviousValue = CurrentValue;
	k = k-1;
  }
end While;
4단계: 소수 자릿수가 없는 결과를 다음과 같이 조합합니다.
Return UnscaledResult/TotalUnscaledProbability;
이 방법은 n이 1030보다 크거나 같은 경우에만 사용되지만 Excel 워크시트에 아래 덧셈 공식을 사용하면 BINOMDIST(3, 10, 0.3, TRUE)(야구의 경우 3할 타자가 10타석에서 3안타 이하를 칠 확률)를 계산하기 위해 이 알고리즘을 직접 실행할 수 있습니다.

이 방법을 실제로 사용해 보려면 아래 표를 복사하고 위에서 만든 Excel 워크시트에서 D1 셀을 선택한 다음 편집 메뉴에서 붙여넣기를 눌러 워크시트의 D1:E15 셀을 아래 표 항목으로 채웁니다.
표 축소표 확대
=D5*(1-$B$2)*(A4+1)/($B$2*($B$1-A4))=D4/$D$15
=D6*(1-$B$2)*(A5+1)/($B$2*($B$1-A5))=D5/$D$15
1=D6/$D$15
=D6*$B$2*($B$1-A7+1)/((1-$B$2)*A7)=D7/$D$15
=D7*$B$2*($B$1-A8+1)/((1-$B$2)*A8)=D8/$D$15
=D8*$B$2*($B$1-A9+1)/((1-$B$2)*A9)=D9/$D$15
=D9*$B$2*($B$1-A10+1)/((1-$B$2)*A10)=D10/$D$15
=D10*$B$2*($B$1-A11+1)/((1-$B$2)*A11)=D11/$D$15
=D11*$B$2*($B$1-A12+1)/((1-$B$2)*A12)=D12/$D$15
=D12*$B$2*($B$1-A13+1)/((1-$B$2)*A13)=D13/$D$15
=D13*$B$2*($B$1-A14+1)/((1-$B$2)*A14)=D14/$D$15
=SUM(D4:D14)
D 열에는 소수 자릿수가 없는 확률이 포함됩니다. D6 셀의 1은 알고리즘의 1단계 결과입니다. Excel 2003은 2단계의 순서대로 D7, D8, ..., D14 셀의 항목을 계산하고, 3단계의 순서대로 D5 및 D4 셀을 계산합니다. 소수 자릿수가 없는 모든 확률의 합계는 D15에 표시됩니다.

3 이하의 성공 확률을 계산하려면 임의의 빈 셀에 다음 수식을 입력합니다.
= SUM(D4:D7)/D15
위의 예제에서 EssentiallyZero는 2단계나 3단계를 중단하지 않습니다. 그러나 BINOMDIST(550, 2000, 0.3, TRUE)를 계산하려는 경우에는 EssentiallyZero가 2단계나 3단계를 중단할 수 있습니다. n = 2000 및 p = 0.3인 이항 확률 변수에는 평균치 600 및 표준 편차 SQRT(2000*0.3*(1 ? 0.3)) = SQRT(420) = 20.5인 정규 분포로 근사치를 구하는 분포가 있습니다. 805는 표준치보다 높은 10개의 표준 편차이며 395는 표준치보다 낮은 10개의 표준 편차입니다. EssentiallyZero 설정에 따라 EssentiallyZero는 805에 이르기 전에 2단계를 중단하고 395에 이르기 전에 3단계를 중단할 수 있습니다.

결론

Excel 2003 이전 버전에서는 시행 수가 1030보다 많거나 같은 경우에만 부정확성이 발생합니다. 이 경우 함께 곱하는 연속 항 중 한 항의 값이 오버플로되기 때문에 BINOMDIST가 #NUM!을 반환합니다. 이 문제를 해결하기 위해 Excel 2003에서는 이러한 오버플로가 발생할 경우 이 문서의 앞부분에서 설명하는 대체 절차를 사용합니다.

CRITBINOM, HYPGEOMDIST, NEGBINOMDIST 및 POISSON 함수는 이전 버전의 Excel과 유사한 방식으로 동작합니다. 이러한 함수도 마찬가지로 올바른 숫자 값을 반환하거나 #NUM!이나 #DIV/0!을 반환합니다. 즉, 오버플로(또는 언더플로)가 발생하면 오류가 발생합니다. 이러한 오류가 언제, 어떻게 발생하는지 확인하는 방법은 간단합니다. Excel 2003에서는 이전 버전에서 #NUM!을 반환할 경우 올바른 응답을 반환하기 위해 BINOMDIST에 사용하는 알고리즘과 유사한 대체 알고리즘을 사용합니다.

BINOMDIST에 대한 자세한 내용을 보려면 도움말 메뉴에서 Microsoft Excel 도움말을 누르고 길잡이 창의 검색 대상 상자에 binomdist를 입력한 다음 검색 시작을 눌러 나타나는 항목을 참조하십시오.



Microsoft 제품 관련 기술 전문가들과 온라인으로 정보를 교환하시려면 Microsoft 뉴스 그룹에 참여하시기 바랍니다.

속성

기술 자료: 827459 - 마지막 검토: 2006년 2월 28일 화요일 - 수정: 2.1
본 문서의 정보는 다음의 제품에 적용됩니다.
  • Microsoft Office Excel 2003
  • Microsoft Excel 2004 for Mac
키워드:?
kbinfo KB827459

피드백 보내기

 

Contact us for more help

Contact us for more help
Connect with Answer Desk for expert help.
Get more support from smallbusiness.support.microsoft.com