Excel 통계 함수: GROWTH

요약

이 문서에서는 Microsoft Office Excel 2003 및 이후 버전의 Excel에서 GROWTH 함수에 대해 설명하고, 함수가 사용되는 방법을 설명하고, Excel 2003 및 이후 버전의 Excel 함수 결과와 이전 버전의 Excel에서 GROWTH 결과를 비교합니다. GROWTH는 관련 함수 LINEST를 호출하여 평가됩니다. Excel 2003 및 이후 버전의 Excel용 LINEST에 대한 광범위한 변경 내용이 요약되어 있으며 GROWTH에 대한 의미도 설명되어 있습니다.

Macintosh용 Microsoft Excel 2004 정보

Mac용 Excel 2004의 통계 함수는 Excel 2003 및 이후 버전의 Excel에서 통계 함수를 업데이트하는 데 사용된 것과 동일한 알고리즘을 사용하여 업데이트되었습니다. 함수의 작동 방식 또는 Excel 2003 이상 버전의 Excel에서 함수가 수정된 방법을 설명하는 이 문서의 모든 정보는 Mac용 Excel 2004에도 적용됩니다.

추가 정보

GROWTH(known_y, known_x, new_x 상수) 함수는 지수 곡선이 맞는 회귀 분석을 수행하는 데 사용됩니다. 최소 제곱 기준이 사용되며 GROWTH은 해당 기준에 가장 적합한 항목을 찾으려고 합니다. Known_y "종속 변수"의 데이터를 나타내고 known_x 하나 이상의 "독립 변수"에 대한 데이터를 나타냅니다. GROWTH 도움말 파일은 두 번째 또는 세 번째 인수를 생략할 수 있는 드문 경우에 대해 설명합니다.

p 예측 변수가 있다고 가정하면 GROWTH은 기본적으로 LOGEST를 호출합니다. LOGEST는 폼의 수식에 맞습니다.

y = b * (m1^x1) * (m2^x2) * ... * (mp^xp)

계수, b, m1, m2, ..., mp의 값은 y 데이터에 가장 적합한 것으로 결정됩니다.

마지막 인수 "상수"가 TRUE로 설정된 경우 회귀 모델에 곱하기 계수 b를 회귀 모델에 포함하려고 합니다. FALSE로 설정하면 b는 기본적으로 1로 설정하여 제외됩니다. 마지막 인수는 선택 사항입니다. 인수를 생략하면 TRUE로 해석됩니다.

이 문서의 나머지 부분에서는 데이터가 열로 정렬되어 known_y y 데이터의 열이고 known_x x 데이터의 하나 이상의 열이라고 가정합니다. 물론 이러한 각 열의 차원(길이)은 같아야 합니다. New_x 열에 정렬된 것으로 간주되며 known_x new_x 동일한 수의 열이 있어야 합니다. 아래의 모든 관찰은 데이터가 열에 정렬되지 않은 경우 동일하게 사실이지만 이 단일(가장 자주 사용되는) 사례를 설명하는 것이 더 쉽습니다.

Excel의 LOGEST 함수를 호출하여 가장 적합한 회귀 모델을 계산한 후 GROWTH는 new_x 연결된 예측 값을 반환합니다.

이 문서에서는 예제를 사용하여 GROWTH가 LOGEST와 어떻게 관련되어 있는지를 보여주고, EXCEL 2003 이전 버전의 Excel에서 GROWTH 관련 문제로 변환되는 LOGEST 관련 문제를 지적합니다. GROWTH는 LOGEST를 효과적으로 호출하고, LOGEST를 실행하고, LOGEST 출력의 회귀 계수를 사용하여 new_x 각 행과 연결된 예측된 y 값을 계산하고, 예측된 y 값의 이 열을 제공합니다. 따라서 LOGEST 실행의 문제에 대해 알고 있어야 합니다. LOGEST가 호출되면 LINEST를 효과적으로 호출합니다. GROWTH 및 LOGEST에 대한 코드는 Excel 2003 및 이후 버전의 Excel용으로 다시 작성되지 않았지만 LINEST 코드의 광범위한 변경(및 개선 사항)이 적용되었습니다.

이 문서에 보충으로, LINEST에 대 한 다음 문서는 매우 권장. Excel 2003 이전 버전의 Excel에서 LINEST 관련 몇 가지 예제 및 문서 문제가 포함되어 있습니다.

LINEST에 대한 자세한 내용은 다음 문서 번호를 클릭하여 Microsoft 기술 자료의 문서를 확인합니다.

828533 Excel 2003 및 Mac용 Excel 2004의 LINEST 함수에 대한 설명

Excel 2003에 대해 수정된 LINEST 도움말 파일도 권장됩니다.

LOGEST에 대한 다음 문서에서는 LOGEST가 LINEST와 상호 작용하는 방법을 설명합니다. 이러한 세부 정보는 여기에서 생략됩니다.

자세한 내용은 다음 문서 번호를 클릭하여 Microsoft 기술 자료의 문서를 확인합니다.

828528 Excel 통계 함수: LOGEST

이 문서의 초점은 Excel 2003 이전 버전의 Excel에서 숫자 문제에 초점을 맞추고 있기 때문에 이 문서에는 GROWTH 사용에 대한 실질적인 예가 많지 않습니다. GROWTH의 도움말 파일에는 유용한 예제가 포함되어 있습니다.

구문

GROWTH(known_y's, known_x's, new_x's, constant)

인수, known_y, known_x 및 new_x 는 관련 차원이 있는 배열 또는 셀 범위여야 합니다. known_y m 행별로 하나의 열인 경우 known_x c가 1보다 크거나 같은 m 행별 c 열입니다. C는 예측 변수의 수입니다. m은 데이터 포인트의 수입니다. New_x 가 1보다 크거나 같은 r 행에 의한 c 열이어야 합니다. (데이터가 열 대신 행에 배치되는 경우 차원의 유사한 관계가 유지되어야 합니다.) 상수는 TRUE 또는 FALSE(또는 Excel이 각각 FALSE 또는 TRUE로 해석하는 0 또는 1)로 설정해야 하는 논리적 인수입니다. GROWTH에 대한 마지막 세 가지 인수는 모두 선택 사항입니다. 두 번째 인수, 세 번째 인수 또는 둘 다를 생략하는 옵션은 GROWTH 도움말 파일을 참조하세요. 네 번째 인수를 생략하면 TRUE로 해석됩니다.

GROWTH의 가장 일반적인 사용법은 GROWTH(A1:A100, B1:F100, B101:F108, TRUE)와 같은 데이터를 포함하는 두 개의 셀 범위를 포함합니다. 일반적으로 둘 이상의 예측 변수가 있기 때문에 이 예제의 두 번째 인수에는 여러 열이 포함됩니다. 이 예제에는 주체 100개, 각 주체에 대한 종속 변수 값 1개(known_y) 및 각 주제에 대한 5개의 종속 변수 값(known_x)이 있습니다. GROWTH를 사용하여 예측된 y 값을 계산하려는 8개의 추가 가상 주제가 있습니다.

사용 예

Excel 워크시트 예제는 다음과 같은 주요 개념을 설명하기 위해 제공됩니다.

  • GROWTH가 LOGEST와 상호 작용하는 방법
  • Excel 2003 이전 버전의 Excel에서 known_x 줄 바꿈으로 인해 GROWTH(또는 LOGEST 및 LINEST)에서 발생하는 문제

참고

LINEST의 컨텍스트에서 두 번째 글머리 기호 항목에 대한 광범위한 설명은 LINEST에 대한 문서에 제공됩니다.

GROWTH 함수를 설명하려면 빈 Excel 워크시트를 만들고, 다음 표를 복사하고, 빈 Excel 워크시트에서 셀 A1을 선택한 다음, 다음 표가 워크시트의 셀 A1:K35를 채우도록 항목을 붙여넣습니다.

A B C D 전자 F G H J K
Y: x's:
=EXP(F2) 1 2 1 1
=EXP(F3) 3 4 1 2
=EXP(F4) 4 5 1 3
=EXP(F5) 6 7 1 4
=EXP(F6) 7 8 1 5
new x's: 9 11
12 14
cols B,C를 사용한 GROWTH: Excel 2002 및 이전 버전의 Excel 값:
Excel 2003 및 이후 버전의 Excel 값:
=GROWTH(A2:A6,B2:C6,B7:C8,TRUE) #NUM! 472.432432563203
=GROWTH(A2:A6,B2:C6,B7:C8,TRUE) #NUM! 3400.16400895377
col B만 사용하는 GROWTH
=GROWTH(A2:A6,B2:B6,B7:B8,TRUE) 472.432432563203 472.432432563203
=GROWTH(A2:A6,B2:B6,B7:B8,TRUE) 3400.16400895377 3400.16400895377
LOGEST의 맞춤 값은 Excel 2003 이상 버전에서 생성됩니다.
cols B, C 사용 Col B 사용
=EXP(LN(K24)*1 + LN(J24)*B7 + LN(I24)*C7) =EXP(LN(J31)*1 + LN(I31)*B7)
=EXP(LN(K24)*1 + LN(J24)*B8 + LN(I24)*C8) =EXP(LN(J31)*1 + LN(I31)*B8)
cols B,C를 사용하는 LOGEST: Excel 2002 및 이전 버전의 Excel 값: Excel 2003 및 이후 버전의 Excel 값:
=LOGEST(A2:A6,B2:C6,TRUE,TRUE) =LOGEST(A2:A6,B2:C6,TRUE,TRUE) =LOGEST(A2:A6,B2:C6,TRUE,TRUE) #NUM! #NUM! #NUM! 1 1.9307233720034 1.26724101129183
=LOGEST(A2:A6,B2:C6,TRUE,TRUE) =LOGEST(A2:A6,B2:C6,TRUE,TRUE) =LOGEST(A2:A6,B2:C6,TRUE,TRUE) #NUM! #NUM! #NUM! 0 0.043859649122807 0.206652964726136
=LOGEST(A2:A6,B2:C6,TRUE,TRUE) =LOGEST(A2:A6,B2:C6,TRUE,TRUE) =LOGEST(A2:A6,B2:C6,TRUE,TRUE) #NUM! #NUM! #NUM! 0.986842105263158 0.209426954145848 #N/A
=LOGEST(A2:A6,B2:C6,TRUE,TRUE) =LOGEST(A2:A6,B2:C6,TRUE,TRUE) =LOGEST(A2:A6,B2:C6,TRUE,TRUE) #NUM! #NUM! #NUM! 225 3 #N/A
=LOGEST(A2:A6,B2:C6,TRUE,TRUE) =LOGEST(A2:A6,B2:C6,TRUE,TRUE) =LOGEST(A2:A6,B2:C6,TRUE,TRUE) #NUM! #NUM! #NUM! 9.86842105263158 0.131578947368421 #N/A
COL B만 사용하는 LOGEST
=LOGEST(A2:A6,B2:B6,TRUE,TRUE) =LOGEST(A2:A6,B2:B6,TRUE,TRUE) 1.9307233720034 1.26724101129183 1.9307233720034 1.26724101129183
=LOGEST(A2:A6,B2:B6,TRUE,TRUE) =LOGEST(A2:A6,B2:B6,TRUE,TRUE) 0.0438596491228071 0.206652964726136 0.043859649122807 0.206652964726136
=LOGEST(A2:A6,B2:B6,TRUE,TRUE) =LOGEST(A2:A6,B2:B6,TRUE,TRUE) 0.986842105263158 0.209426954145848 0.986842105263158 0.209426954145848
=LOGEST(A2:A6,B2:B6,TRUE,TRUE) =LOGEST(A2:A6,B2:B6,TRUE,TRUE) 224.999999999999 3 225 3
=LOGEST(A2:A6,B2:B6,TRUE,TRUE) =LOGEST(A2:A6,B2:B6,TRUE,TRUE) 9.86842105263158 0.131578947368421 9.86842105263158 0.131578947368421

참고

이 표를 새 Excel 워크시트에 붙여넣은 후 붙여넣기 옵션 단추를 클릭한 다음 대상 서식 일치를 클릭합니다. 붙여넣은 범위를 계속 선택한 상태에서 실행 중인 Excel 버전에 따라 다음 절차 중 하나를 사용합니다.

  • Microsoft Office Excel 2007에서 탭을 클릭하고 그룹에서 서식을 클릭한 다음 열 너비 자동 맞춤을 클릭합니다.
  • Excel 2003에서 서식 메뉴의 열을 가리킨 다음 선택 영역 자동 맞춤을 클릭합니다.

GROWTH에 대한 데이터는 셀 A1:C8에 있습니다. (D2:D6 셀의 항목은 데이터의 일부가 아니지만 아래 그림에 사용됩니다.) 이전 버전의 Excel과 이후 버전의 Excel에 대한 두 가지 모델에 대한 GROWTH 결과는 각각 E10:E16 및 I10:116 셀에 표시됩니다. 셀의 결과 A10:A16은 사용 중인 Excel 버전에 해당합니다. 현재 GROWTH에서 LOGEST를 호출하는 방법과 GROWTH에서 LOGEST 결과를 사용하는 방법을 조사할 때 Excel 2003 및 이후 버전의 Excel에 대한 결과에 집중합니다.

GROWTH 및 LOGEST는 다음 단계에서 상호 작용하는 것으로 볼 수 있습니다.

  1. GROWTH(known_y, known_x, new_x, 상수)를 호출합니다.
  2. GROWTH은 LOGEST(known_y, known_x, 상수, TRUE)를 호출합니다.
  3. LOGEST에 대한 이 호출의 회귀 계수를 가져옵니다. 이러한 계수는 LOGEST 출력 테이블의 첫 번째 행에 표시됩니다.
  4. 각 new_x 행에 대해 예측된 y-value는 이러한 LOGEST 계수와 해당 행의 new_x 값을 기반으로 계산됩니다.
  5. 4단계의 계산된 값은 해당 new_x 행에 해당하는 GROWTH 출력에 적합한 셀에 반환됩니다.

GROWTH가 적절한 결과를 반환하는 경우 LOGEST는 3단계에서 적절한 결과를 생성해야 합니다. 3단계에서 LOGEST를 평가하려면 LINEST를 호출해야 하므로 LINEST가 잘 동작해야 합니다. Excel 2003 이전 버전의 EXCEL에서 LINEST와 관련하여 발생하는 문제는 선형 예측 열에서 발생합니다. (이전 버전의 Excel에서는 GROWTH에 대한 마지막 인수가 FALSE로 설정된 경우 발생하는 LINEST 및 LOGEST에 다른 문제가 있습니다. 그러나 이러한 문제는 GROWTH의 결과에 영향을 미치지 않으며 여기에서 논의되지 않습니다.)

하나 이상의 열 c를 다른 열, c1, c2 및 기타 열의 배수 합계로 표현할 수 있는 경우 예측 열(known_x)은 공선입니다. c열은 c1, c2 및 기타 열에서 포함되는 정보를 생성할 수 있으므로 중복이라고 하는 경우가 많습니다. 동시성 존재의 기본 원칙은 중복 열이 원래 데이터에 포함되는지 아니면 원래 데이터에서 제거되는지 여부에 따라 결과가 영향을 받지 않아야 한다는 것입니다. Excel 2003 이전 버전의 LINEST에서는 동시성을 찾을 수 없으므로 이 원칙을 쉽게 위반했습니다. 하나 이상의 열 c를 다른 열, c1, c2 및 기타 열의 배수 합계와 거의 동일하게 표현할 수 있는 경우 예측 열은 거의 공선입니다. 이 경우 "거의 같음"은 c1, c2 및 기타 열의 가중 합계에 있는 해당 항목에서 c로 된 항목의 제곱 편차의 작은 합계를 의미합니다. 예를 들어 "매우 작음"은 10^(-12) 미만일 수 있습니다.

첫 번째 모델은 행 10에서 12까지의 열 B와 C를 예측 변수로 사용하고 Excel에 상수를 모델링하도록 요청합니다(마지막 인수는 TRUE로 설정됨). 그러면 Excel에서 D2:D6 셀과 비슷한 추가 예측 열이 효과적으로 삽입됩니다. 행 2~6의 C 열에 있는 항목이 B 및 D 열에 있는 해당 항목의 합계와 정확히 동일하다는 것을 쉽게 알 수 있습니다. 따라서 C 열은 다음 항목의 배수 합계이므로 공선성이 있습니다.

  • 열 B
  • LOGEST에 대한 세 번째 인수가 생략되었거나 TRUE("일반" 대/소문자)이므로 삽입된 Excel의 추가 열인 1s

이로 인해 Excel 2003 이전 버전의 Excel에서 결과를 계산할 수 없는 숫자 문제가 발생합니다. 따라서 GROWTH 출력 테이블은 #NUM!으로 채워집니다.

두 번째 모델(행 14~16)은 모든 버전의 Excel에서 성공적으로 처리할 수 있는 모델입니다. 공선성이 없으며 사용자가 상수를 모델링하도록 Excel에 다시 요청합니다. 이 모델은 다음과 같은 이유로 여기에 포함되어 있습니다.

  • 첫째, 가장 일반적인 실용적인 경우는 공선성이 없다는 것입니다. 이러한 경우는 모든 버전의 Excel에서 충분히 처리됩니다. 이전 버전의 Excel이 있는 경우 가장 일반적인 실제 사례에서는 숫자 문제가 발생할 가능성이 없다는 것을 알고 안심할 수 있어야 합니다.
  • 둘째, 이 예제는 두 모델에서 Excel 2003 이상 버전의 Excel 동작을 비교하는 데 사용됩니다. 대부분의 주요 통계 패키지는 공선을 분석하고, 모델에서 다른 여러 항목의 합계인 열을 제거하고, 사용자에게 "C 열은 다른 예측기 열에 선형적으로 의존하며 분석에서 제거되었습니다"와 같은 메시지를 사용자에게 경고합니다.

Excel 2003 이상 버전의 Excel에서는 이러한 메시지가 경고 또는 텍스트 문자열이 아니라 LOGEST 출력 테이블에 전달됩니다. GROWTH에는 이러한 메시지를 사용자에게 전달하는 메커니즘이 없습니다. LOGEST 출력 테이블에서 1이고 표준 오류가 0인 회귀 계수는 모델에서 제거된 열의 계수에 해당합니다. LOGEST 출력 테이블은 10-16행의 GROWTH 출력에 해당하는 행 23~35에 포함됩니다. 셀 I24:I25의 항목에는 제거된 중복 예측기 열이 표시됩니다. 이 경우 LOGEST는 C 열을 제거하도록 선택했습니다(셀 I24, J24, K24의 계수는 각각 C, B 및 Excel의 상수 열에 해당함). 공선성이 있는 경우 관련된 열 중 하나를 제거할 수 있으며 선택은 임의입니다.

행 30~35의 두 번째 모델에서는 공선성이 없고 열이 제거되지 않습니다. 두 모델에서 예측된 y 값이 동일하다는 것을 알 수 있습니다. 이 문제는 다른 항목의 배수 합계인 중복 열을 제거해도 결과 모델의 적합성이 저하되지 않기 때문에 발생합니다. 이러한 열은 가장 적합한 제곱을 찾기 위해 추가된 값이 없기 때문에 정확하게 제거됩니다. 또한 Excel 2003 및 이후 버전의 Excel에서 셀 I23:K35의 LOGEST 출력을 검사하면 출력 테이블의 마지막 세 행이 동일하다는 것을 알 수 있습니다. 또한 셀 I31:J32 및 셀 J24:K25의 항목이 일치합니다. 이는 C 열이 모델에 포함되어 있지만 LOGEST가 실행되기 전에 C 열이 제거되었을 때와 같은 중복(셀 I24:K28의 출력)이 발견될 때와 동일한 결과를 얻습니다(셀 I31:J35의 출력). 이는 공선성의 존재에 대한 기본 원칙을 충족합니다.

셀 A18:C21에서 Microsoft는 Excel 2003 및 이후 버전의 Excel에서 데이터를 사용하여 GROWTH가 LOGEST 출력을 사용하고 관련 예측 y 값을 계산하는 방법을 설명합니다. 셀 A20:A21 및 셀 C20:C21의 수식을 검사하여 두 모델 각각에 대한 셀 B7:C8의 new_x 셀 B7:C8에서 LOGEST 계수와 LOGEST 계수를 결합하는 방법을 확인할 수 있습니다(B 열, C를 예측 변수로 사용, B열만 예측 변수 사용).

LOGEST가 LINEST를 호출하기 때문에 Excel 2003 및 이후 버전의 Excel에서 LOGEST에서 공선성이 식별됩니다. LINEST는 회귀 계수에 대해 해결하는 다른 방법을 사용합니다. 이 방법은 QR 분해입니다. LINEST 문서에는 작은 예제에 대한 QR 분해 알고리즘의 연습이 포함되어 있습니다.

이전 버전의 Excel 결과 요약

증가 결과는 LOGEST의 부정확한 결과로 인해 LINEST의 부정확한 결과에서 비롯된 Excel 2003 이전 버전의 Excel에서 부정적인 영향을 받습니다.

LINEST는 공선성 문제에 주의를 기울이지 않는 접근 방식을 사용하여 계산되었습니다. 공선성의 존재로 인해 오류, 회귀 계수의 부적절한 표준 오류 및 부적절한 자유도가 발생했습니다. 경우에 따라 LINEST가 출력 테이블을 #NUM!으로 채운 문제가 충분히 심각합니다. 실제로 대부분의 경우와 마찬가지로, 선형(또는 거의 collinear) 예측 열이 없다고 확신할 수 있는 경우 LINEST는 일반적으로 허용 가능한 결과를 제공합니다. 따라서 COLLINEAR(또는 거의 collinear) 예측 열이 없는 것을 볼 수 있는 경우 GROWTH 사용자는 마찬가지로 안심할 수 있습니다.

Excel 2003 및 이후 버전의 Excel 결과 요약

LINEST의 향상된 기능에는 회귀 계수를 결정하는 QR 분해 방법으로 전환하는 것이 포함됩니다. QR 분해에는 다음과 같은 이점이 있습니다.

  • 더 나은 숫자 안정성(일반적으로 더 작은 반올림 오류)
  • 공선성 문제 분석

이 문서에 설명된 Excel 2003 이전 버전의 Excel의 모든 문제는 Excel 2003 및 이후 버전의 Excel에서 수정되었습니다. LINEST의 이러한 개선 사항은 LOGEST 및 GROWTH의 향상된 기능으로 변환됩니다.

결론

LINEST가 Excel 2003 및 이후 버전의 Excel에서 크게 향상되었기 때문에 GROWTH의 성능이 향상되었습니다. LINEST의 향상된 기능은 LOGEST가 GROWTH에 의해 호출되므로 LOGEST에도 영향을 줍니다. 이전 버전의 Excel 사용자는 GROWTH를 사용하기 전에 예측 열이 공선형이 아닌지 확인해야 합니다.

이 문서와 LINEST 문서에 제시된 자료의 대부분은 처음에는 Excel 2003 이전 버전의 Excel 사용자에게 경고하는 것처럼 보일 수 있습니다. 그러나, 공선성은 케이스의 단지 작은 비율에 있는 문제이다는 것을 주의해야 합니다. 이전 버전의 Excel은 동시성이 없는 경우 허용되는 GROWTH 결과를 제공합니다.

다행히 LINEST의 향상된 기능은 Analysis ToolPak의 선형 회귀 도구(이 도구는 LINEST를 호출함) 및 두 가지 관련 Excel 함수인 LOGEST 및 TREND에도 영향을 줍니다.