Excel 통계 함수: TREND

기술 자료 번역 기술 자료 번역
기술 자료: 828801 - 이 문서가 적용되는 제품 보기.
모두 확대 | 모두 축소

이 페이지에서

요약

이 문서에서는 Microsoft Office Excel 2003 및 이후 Excel 버전의 TREND 함수에 대해 설명하고 함수를 사용하는 방법을 보여 줍니다. 또한 Excel 2003 및 이후 Excel 버전에서 TREND를 실행한 결과를 이전 Excel 버전에서 TREND를 실행한 결과와 비교합니다.

TREND는 관련 함수인 LINEST를 호출하여 계산됩니다. 이 문서에서는 Excel 2003 및 이후 Excel 버전에서 LINEST가 광범위하게 변경된 사항을 요약하고 TREND에 대한 이러한 변경 사항의 의미를 설명합니다.

Macintosh용 Microsoft Excel 2004 정보

Macintosh용 Microsoft Excel 2004의 통계 함수는 Excel 2003 및 이후 Excel 버전과 동일한 알고리즘을 사용하여 업데이트되었습니다. Excel 2003 및 이후 Excel 버전에서 함수를 작동하고 수정하는 방법을 설명하는 이 문서의 모든 정보는 Macintosh용 Excel 2004에도 적용됩니다.

추가 정보

TREND(known_y's, known_x's, new_x's, constant) 함수는 선형 회귀를 수행하는 데 사용됩니다. 최소 제곱 기준이 사용되며 TREND는 이 기준에서 최량적합을 찾으려고 합니다. known_y's는 "종속변수"의 데이터를 나타내고 known_x's는 하나 이상의 "독립변수"의 데이터를 나타냅니다. TREND 도움말 파일에는 두 번째 인수나 세 번째 인수가 생략될 수 있는 드문 경우에 대한 설명이 나와 있습니다.

마지막 인수 "constant"가 TRUE로 설정되면 회귀 모델에 절편계수를 포함하려는 것입니다. 마지막 인수가 FALSE로 설정되면 절편항이 포함되지 않고 적합 회귀선이 원점을 통과해야 합니다. 마지막 인수는 선택 사항이지만 생략되면 TRUE로 해석됩니다.

이 문서의 나머지 부분에서 쉽게 설명하기 위해 데이터가 열로 정렬되어 있으며 known_y's가 하나의 y 데이터 열이고 known_x's가 하나 이상의 x 데이터 열이라고 가정합니다. 물론 이러한 각 열의 차원(길이)은 동일해야 합니다. new_x's도 열로 정렬되어 있다고 가정하며 known_x's에 대한 열과 동일한 수의 new_x's에 대한 열이 있어야 합니다. 이 문서의 모든 관측값은 데이터가 열로 정렬되어 있지 않은 경우에도 동일하게 해당하지만 설명하기 쉽기 때문에 여기에서는 데이터가 정렬되어 있는 경우(가장 자주 사용됨)에 대해 설명합니다.

TREND는 Excel의 LINEST 함수를 호출하여 최량적합 회귀 모델을 계산한 후 new_x's와 관련된 예측값을 반환합니다.

이 문서에서는 예제를 사용하여 TREND와 LINEST의 관계를 보여 주고 Microsoft Excel 2002 및 이전 Excel 버전의 LINEST 관련 문제를 지적합니다. 이러한 문제는 TREND와 관련된 문제로 나타납니다. TREND에 대한 코드는 Excel 2003 및 이후 Excel 버전용으로 다시 작성되지 않았지만 LINEST 코드는 광범위하게 변경되고 개선되었습니다.

TREND는 실제로 LINEST를 호출하고 실행하며 new_x's의 각 행과 관련된 예측된 y 값의 계산에서 LINEST 출력의 회귀계수를 사용하고 이 예측된 y 값의 열을 사용자에게 제공합니다. 따라서 LINEST를 실행할 때의 문제에 대해 알고 있어야 합니다.

이 문서를 보완하는 LINEST에 대한 다음 문서를 참조하는 것이 좋습니다. 다음 문서에서는 몇 가지 예제를 제공하고 Excel 2002 및 이전 Excel 버전의 LINEST 관련 문제에 대해 설명합니다.

자세한 내용은 Microsoft 기술 자료의 다음 문서를 참조하십시오.
828533 Excel 2003과 그 이상 버전 Excel의 LINEST 함수에 대한 설명


이 문서에서는 Excel 2002 및 이전 Excel 버전의 수치 문제에 대해 중점적으로 다루기 때문에 TREND를 사용하는 방법에 대한 실제적인 예제를 많이 제공하지는 않습니다. TREND의 도움말 파일에 유용한 예제가 포함되어 있습니다.

구문

TREND(known_y's, known_x's, new_x's, constant)
known_y's, known_x's 및 new_x's 인수는 관련된 차원이 있는 셀 범위나 배열이어야 합니다. known_y's가 m x 1 행렬이면 known_x's는 m x c 행렬입니다(c는 1보다 크거나 같음). c는 예측변수의 수이고 m은 데이터 요소의 수입니다. new_x's는 r x c 행렬이어야 합니다(r은 1보다 크거나 같음). 데이터가 열 대신 행에 배치되는 경우에도 차원에서 유사한 관계가 유지되어야 합니다. constant는 TRUE나 FALSE(또는 Excel에서 각각 FALSE나 TRUE로 해석하는 0 또는 1)로 설정되어야 하는 논리 인수입니다. TREND의 마지막 세 인수는 모두 선택 사항입니다. 두 번째 인수, 세 번째 인수 또는 두 인수를 모두 생략하는 옵션에 대한 내용은 TREND 도움말 파일을 참조하십시오. 네 번째 인수를 생략하면 TRUE로 해석됩니다.

TREND의 가장 일반적인 사용 예에는 TREND(A1:A100, B1:F100, B101:F108, TRUE)와 같은 데이터를 포함하는 두 범위의 셀이 포함됩니다. 일반적으로 예측변수가 두 개 이상이기 때문에 이 예제의 두 번째 인수에는 여러 열이 포함됩니다. 이 예제에는 100개의 대상, 대상마다 하나의 종속변수 값(known_y) 및 대상마다 5개의 종속변수 값(known_x's)이 있습니다. TREND를 사용하여 예측된 y 값을 계산할 수 있는 8개의 추가 가상 대상이 있습니다.

사용 예

Excel 워크시트 예제는 다음과 같은 주요 개념을 보여 주기 위해 제공됩니다.
  • TREND가 LINEST와 상호 작용하는 방식
  • Excel 2002 및 이전 Excel 버전에 대한 TREND(또는 LINEST)의 공선적 known_x's 때문에 발생하는 문제
LINEST의 맥락에서 두 번째 항목에 대해 자세히 설명한 내용이 LINEST에 대한 문서에 나와 있습니다.

TREND 공선성을 보여 주기 위해 빈 Excel 워크시트를 만들고 다음 표를 복사한 다음 빈 Excel 워크시트에서 A1 셀을 선택하고 다음 표가 워크시트의 A1:K35 셀을 채우도록 항목을 붙여 넣습니다.
표 축소표 확대
y:x's:
1121
2341
3451
4671
5781
new x's:911
1214
B,C 열을 사용하는 TREND:Excel 2003 이전 버전의 값:Excel 2003 및 이후 Excel 버전의 값:
=TREND(A2:A6,B2:C6,B7:C8,TRUE)#NUM!6.15789473684211
=TREND(A2:A6,B2:C6,B7:C8,TRUE)#NUM!8.13157894736842
B 열만 사용하는 TREND
=TREND(A2:A6,B2:B6,B7:B8,TRUE)6.15789473684216.15789473684211
=TREND(A2:A6,B2:B6,B7:B8,TRUE)8.131578947368428.13157894736842
Excel 2003 및 이후 Excel 버전 LINEST 결과의 적합값
B, C 열 사용B 열 사용
= K24*1 + J24*B7 + I24*C7=J31*1+I31*B7
=K24*1 + J24*B8 + I24*C8=J31*1 +I31*B8
B,C 열을 사용하는 LINEST:Excel 2003 이전 버전의 값:Excel 2003 및 이후 Excel 버전의 값:
=LINEST(A2:A6,B2:C6,TRUE,TRUE)=LINEST(A2:A6,B2:C6,TRUE,TRUE)=LINEST(A2:A6,B2:C6,TRUE,TRUE)#NUM!#NUM!#NUM!00.6578947368421050.236842105263158
=LINEST(A2:A6,B2:C6,TRUE,TRUE)=LINEST(A2:A6,B2:C6,TRUE,TRUE)=LINEST(A2:A6,B2:C6,TRUE,TRUE)#NUM!#NUM!#NUM!00.0438596491228070.206652964726136
=LINEST(A2:A6,B2:C6,TRUE,TRUE)=LINEST(A2:A6,B2:C6,TRUE,TRUE)=LINEST(A2:A6,B2:C6,TRUE,TRUE)#NUM!#NUM!#NUM!0.9868421052631580.209426954145848#N/A
=LINEST(A2:A6,B2:C6,TRUE,TRUE)=LINEST(A2:A6,B2:C6,TRUE,TRUE)=LINEST(A2:A6,B2:C6,TRUE,TRUE)#NUM!#NUM!#NUM!2253#N/A
=LINEST(A2:A6,B2:C6,TRUE,TRUE)=LINEST(A2:A6,B2:C6,TRUE,TRUE)=LINEST(A2:A6,B2:C6,TRUE,TRUE)#NUM!#NUM!#NUM!9.868421052631580.131578947368421#N/A
B 열만 사용하는 LINEST
=LINEST(A2:A6,B2:B6,TRUE,TRUE)=LINEST(A2:A6,B2:B6,TRUE,TRUE)0.6578947368421050.2368421052631590.6578947368421050.236842105263158
=LINEST(A2:A6,B2:B6,TRUE,TRUE)=LINEST(A2:A6,B2:B6,TRUE,TRUE)0.04385964912280710.2066529647261360.0438596491228070.206652964726136
=LINEST(A2:A6,B2:B6,TRUE,TRUE)=LINEST(A2:A6,B2:B6,TRUE,TRUE)0.9868421052631580.2094269541458480.9868421052631580.209426954145848
=LINEST(A2:A6,B2:B6,TRUE,TRUE)=LINEST(A2:A6,B2:B6,TRUE,TRUE)224.99999999999932253
=LINEST(A2:A6,B2:B6,TRUE,TRUE)=LINEST(A2:A6,B2:B6,TRUE,TRUE)9.868421052631580.1315789473684219.868421052631580.131578947368421
이 표를 새 Excel 워크시트에 붙여 넣은 후에는 붙여넣기 옵션을 누르고 주변 서식에 맞추기를 누릅니다. 붙여 넣은 범위를 선택한 상태에서 실행 중인 Excel 버전에 따라 다음 절차 중 하나를 수행하십시오.
  • Microsoft Office Excel 2007에서는 탭을 누르고 그룹에서 서식을 누른 다음 열 너비 자동 맞춤을 누릅니다.
  • Excel 2003에서는 서식 메뉴에서 을 가리킨 다음 선택한 열에 맞게를 누릅니다.
TREND의 데이터는 A1:C8 셀에 있습니다. D2:D6 셀의 항목은 데이터의 일부가 아니지만 이 문서의 뒷부분에서 설명하기 위해 사용됩니다. 이전 Excel 버전과 이후 Excel 버전에 대한 두 가지 모델의 TREND 결과가 각각 E10:E16 셀과 I10:116 셀에 제공됩니다. A10:A16 셀의 결과는 사용 중인 Excel 버전에 해당합니다. 현재 이 문서에서는 TREND에서 LINEST를 호출하는 방법과 TREND에서 LINEST 결과를 사용하는 방법을 살펴볼 때 Excel 2003 및 이후 Excel 버전에서의 결과를 중점적으로 다룹니다.

TREND와 LINEST가 다음과 같이 상호 작용하는 것을 확인할 수 있습니다.
  1. TREND(known_y's, known_x's, new_x's, constant)를 호출합니다.
  2. TREND는 LINEST(known_y's, known_x's, constant, TRUE)를 호출합니다.
  3. 이 LINEST 호출에서 회귀계수를 얻습니다. 이러한 계수가 LINEST 출력 테이블의 첫 번째 행에 나타납니다.
  4. 각각의 new_x's 행에 대한 예측된 y 값이 이러한 LINEST 계수와 해당 행의 new_x's 값을 기반으로 계산됩니다.
  5. 4단계에서 계산된 값이 해당 new_x's 행에 해당하는 TREND 출력에 적절한 셀에 반환됩니다.
TREND가 적절한 결과를 반환하려면 LINEST가 3단계에서 적절한 결과를 생성해야 합니다. 여기에서의 문제는 공선적 예측인자 열에서 발생합니다.

적어도 하나의 열(c)이 다른 열(c1, c2 및 다른 열)의 배수의 합으로 표현될 수 있으면 예측인자 열(known_x's)이 공선적입니다. c 열에 포함되는 정보가 c1, c2 및 다른 열에서 구성될 수 있기 때문에 c 열의 이름이 중복되는 경우가 많습니다. 공선성이 있는 경우의 기본 원칙은 원래 데이터에서 중복 열을 포함하거나 제거해도 결과가 영향을 받지 않는 것입니다. Excel 2002 및 이전 Excel 버전에서는 LINEST가 공선성을 검색하지 않기 때문에 이 원칙이 쉽게 위반됩니다. 적어도 하나의 열(c)이 다른 열(c1, c2 및 다른 열)의 배수의 합과 거의 같게 표현될 수 있으면 예측인자 열이 거의 공선적입니다. 이 경우에 "거의 같음"은 c1, c2 및 다른 열의 가중치 합의 해당 항목에서 c의 항목에 대한 제곱 편차의 합이 매우 작음을 의미합니다. 예를 들어, "매우 작음"은 10^(-12)보다 작은 값일 수 있습니다.

10-12 행의 첫 번째 모델은 B 및 C 열을 예측인자로 사용하고 constant(TRUE로 설정된 마지막 인수)를 모델링하도록 Excel에 요청합니다. Excel에서는 D2:D6 셀과 같은 추가 예측인자 열을 실제로 삽입합니다. C 열의 2-6 행에 있는 항목이 B 및 D 열에 있는 해당 항목의 합과 정확하게 같은 것을 쉽게 확인할 수 있습니다. 따라서 C 열이 다음 항목의 배수의 합이므로 공선성이 존재합니다.
  • B 열
  • LINEST의 세 번째 인수(TREND의 네 번째 인수와 같음)가 생략되었거나 TRUE("일반적인" 경우)이기 때문에 삽입되는 1로 이루어진 Exce의 추가 열
이 때문에 Excel 2002 및 이전 Excel 버전에서 결과를 계산할 수 없고 TREND 출력 테이블이 #NUM!로 채워지는 수치 문제가 발생합니다.

14-16 행의 두 번째 모델은 모든 Excel 버전에서 성공적으로 처리할 수 있습니다. 공선성은 없으며 constant를 모델링하도록 Excel에 다시 요청할 수 있습니다. 이 모델은 두 가지 이유 때문에 여기에 포함되어 있습니다.

첫째, 공선성이 없는 경우가 가장 일반적일 수 있습니다. 이러한 경우는 모든 버전의 Excel에서 효과적으로 처리됩니다. 이전 Excel 버전을 사용할 때 가장 일반적인 경우에 수치 문제가 발생할 가능성은 거의 없습니다.

둘째, 이 예제는 두 모델에서 Excel 2003 및 이후 Excel 버전의 동작을 비교하는 데 사용됩니다. 대부분의 주요 통계 패키지는 공선성을 분석하고 다른 열의 배수의 합인 열을 모델에서 제거하며 "C 열이 다른 예측인자 열과 선형 종속 관계이므로 분석에서 제거되었습니다."와 같은 경고 메지지를 표시합니다.

Excel 2003 및 이후 Excel 버전에서는 이러한 메시지가 경고나 텍스트 문자열로 전달되지 않고 LINEST 출력 테이블에 제공됩니다. TREND에는 사용자에게 이러한 메시지를 전달하는 메커니즘이 없습니다. LINEST 출력 테이블에서 표준 오류가 0인 회귀계수 0은 모델에서 제거된 열의 계수에 해당합니다. LINEST 출력 테이블은 TREND 출력의 10-16 행에 해당하는 23-35 행에 포함됩니다. I24:I25 셀의 항목은 제거된 중복 예측인자 열을 보여 줍니다. 이 경우에 LINEST는 C열을 제거하도록 선택했습니다(I24, J24 및 K24 셀의 계수는 각각 C, B 및 Excel의 constant 열에 해당함). 공선성이 있으면 관련된 열 중 하나가 제거될 수 있으며 선택은 임의로 이루어집니다.

30-35 행의 두 번째 모델에는 공선성이 없으며 열이 제거되지 않습니다. 예측된 y 값이 두 모델에서 동일한 것을 확인할 수 있습니다. 이 문제는 다른 열의 배수의 합인 중복 열을 제거하면 결과 모델의 적합도가 줄어들지 않기 때문에 발생합니다. 이러한 열은 최소제곱 최량적합을 찾으려고 할 때 추가되는 값을 나타내지 않기 때문에 정확하게 제거됩니다.

또한 Excel 2003 및 이후 Excel 버전의 I23:K35 셀에서 LINEST 출력을 검토하는 경우 출력 테이블의 마지막 세 행이 동일하고 I31:J32 셀과 J24:K25 셀의 항목이 일치하는 것을 확인할 수 있습니다. 이는 C 열이 모델에 포함되어 있지만 중복되었다고 확인된 경우(I24:K28 셀의 출력), LINEST가 실행되기 전에 C 열이 제거된 경우(I31:J35 셀의 출력)와 동일한 결과가 생성됨을 보여 줍니다. 이것은 공선성이 있을 때의 기본 원칙을 충족합니다.

이 문서에서는 A18:C21 셀에서 Excel 2003 및 이후 Excel 버전에 대한 데이터를 사용하여 TREND가 LINEST 출력을 사용하여 관련이 있는 예측된 y 값을 계산하는 방법을 보여 줍니다. A20:A21 셀과 C20:C21 셀의 수식을 검토하여 각각의 두 모델(B, C 열을 예측인자로 사용, B 열만 예측인자로 사용)에서 LINEST 계수가 B7:C8 셀의 new_x's 데이터와 결합되는 방식을 확인할 수 있습니다.

회귀계수에 대한 완전히 다른 해결 방법 때문에 Excel 2003 및 이후 Excel 버전의 LINEST에서 공선성이 확인됩니다. 이 방법을 QR 분해라고 합니다. LINEST 문서에서는 작은 예제에 대한 QR 분해 알고리즘의 연습에 대해 설명합니다.

이전 Excel 버전에서의 결과 요약

TREND 결과는 Excel 2002 및 이전 Excel 버전에서 생성된 LINEST의 정확하지 않은 결과로 인해 부정적인 영향을 받습니다.

LINEST는 공선성 문제를 고려하지 않는 방법을 사용하여 계산됩니다. 공선성이 있기 때문에 반올림 오류, 회귀계수의 적절하지 않은 표준 오류 및 적절하지 않은 자유도가 발생합니다. 반올림 문제가 매우 심각해서 LINEST가 출력 테이블을 #NUM!로 채우는 경우도 있습니다.

대부분의 실제 경우처럼 공선적(또는 거의 공선적) 예측인자 열이 없다고 확신할 수 있으면 일반적으로 LINEST는 받아들일 만한 결과를 제공합니다. 따라서 TREND를 사용하는 경우에도 공선적(또는 거의 공선적) 예측인자 열이 없다고 확신하면 마찬가지 결과를 기대할 수 있습니다.

Excel 2003 및 이후 Excel 버전에서의 결과 요약

LINEST의 향상된 기능에는 회귀계수를 확인하는 QR 분해 방법으로 전환하는 기능이 포함됩니다. QR 분해에는 다음과 같은 이점이 있습니다.
  • 향상된 수치 안정성(일반적으로 더 작은 반올림 오류)
  • 공선성 문제 분석
이 문서에서 보여 준 Excel 2002 및 이전 Excel 버전의 모든 문제는 Excel 2003 및 이후 Excel 버전에서 해결되었습니다.

결론

Excel 2003 및 이후 Excel 버전에서 LINEST가 크게 향상되었기 때문에 TREND의 성능이 높아졌습니다. 이전 Excel 버전을 사용하는 경우 TREND를 사용하기 전에 예측인자 열이 공선적이 아닌지 확인하십시오.

이 문서와 LINEST 문서에 있는 대부분의 자료는 처음에는 Excel 2002 및 이전 Excel 버전의 사용자에게 놀랍게 보일 수 있습니다. 그러나 공선성이 문제가 되는 경우는 많지 않습니다. 이전 Excel 버전에서는 공선성이 없는 경우 받아들일 만한 TREND 결과를 제공합니다.

LINEST의 향상된 기능은 분석 도구의 선형 회귀 도구(이 도구는 LINEST를 호출함)와 관련 Excel 함수인 LOGEST 및 GROWTH에 긍정적인 영향을 미칩니다.

속성

기술 자료: 828801 - 마지막 검토: 2008년 5월 13일 화요일 - 수정: 4.1
본 문서의 정보는 다음의 제품에 적용됩니다.
  • Microsoft Office Excel 2007
  • Microsoft Office Excel 2003
  • Microsoft Excel 2004 for Mac
키워드:?
kbformula kbexpertisebeginner kbinfo KB828801

피드백 보내기

 

Contact us for more help

Contact us for more help
Connect with Answer Desk for expert help.
Get more support from smallbusiness.support.microsoft.com