Excel 통계 함수: 추세

요약

이 문서는 Microsoft Office Excel 2003과 이후 Excel 버전의 TREND 함수에 설명, 함수를 사용 하는 방법과 추세의 결과 이전 버전의 Excel에서 Excel 2003과 이후 Excel 버전의 함수 결과 비교를 보여 줍니다.

추세는 관련된 함수인 LINEST를 호출 하 여 계산 됩니다. Excel 2003과 이후 Excel 버전의 LINEST의 광범위 한 변경 내용을 요약 하 고 추세에 대 한 의미를 설명 합니다.

내용은 Macintosh 용 Microsoft Excel 2004

Macintosh 용 Microsoft Excel 2004에서 통계 함수는 동일한 알고리즘을 사용 하 여 Excel 2003과 이후 Excel 버전으로 업데이트 되었습니다. 정보는 함수의 작동 방식을 또는 Excel 2003 및 이후 Excel 버전 함수를 수정 하는 방법을 설명 하는이 문서의 Macintosh 용 Excel 2004에도 적용 됩니다.

자세한 내용

TREND (known_y's, known_x's, new_x's, 상수) 함수는 선형 회귀 분석을 수행 하는 데 사용 됩니다. 최소 제곱 기준이 사용 되 고 추세가 기준에서 최 량 적합을 찾으려고 합니다. Known_y's의 "종속 변수" 데이터를 나타내며 예측 데이터를 하나 이상의 "독립 변수"를 나타냅니다. TREND 도움말 파일에서는 드문 경우 지만 두 번째 또는 세 번째 인수를 생략할 수 있습니다.

"상수" 마지막 인수가 TRUE로 설정 되어 있는 경우 회귀 모델을 회귀 모델에서 절편에 대 한 계수를 포함 합니다. 없는 절편 항의 포함; 마지막 인수를 FALSE로 설정 하는 경우 원점을 통해 강제로 피팅된 회귀. 마지막 인수는 선택 사항입니다. 이 생략 하면 TRUE로 해석 됩니다.

이 문서의 나머지 부분에서 쉽게, 열으로 정렬 되어 있으며 known_y's y 데이터 열이 고 known_x's가 하나 이상의 x 데이터 열 이라고 가정 합니다. 물론 이러한 각 열의 차원 (길이) 같아야 합니다. New_x's를 열에 정렬도 간주 하 고 new_x's known_x's와 열 수가 있어야 합니다. 이 문서의 모든 관측값은 데이터가 열로 정렬 되지 않습니다 하지만이 단일 (가장 자주 사용 되는) 경우에만 쉽게도 동일 하 게 합니다.

(Excel의 LINEST 함수 호출) 하 여 가장 적합된 한 회귀 모델 컴퓨팅 추세 new_x's와 관련 된 예측된 값을 반환 합니다.

추세 LINEST 어떠한 관련이 있는지를 표시 하 고 Microsoft Excel 2002와 이전 버전 Excel의 LINEST 사용 하 여 문제를이 문서의 예제를 사용 합니다. 이러한 문제는 경향 문제를 변환합니다. Excel 2003과 이후 Excel 버전의 TREND에 대 한 코드를 다시 작성 하지, 하지만 LINEST 코드에 광범위 하 게 변경 (및 개선) 되었습니다.

경향 효과적으로 LINEST를 호출, LINEST 실행, 회귀 계수를 LINEST 출력에 연결 된 각 행의 new_x's, 예측 된 y 값의 계산에 사용 하 고 예측 된 y 값이 칼럼에서는. 따라서 LINEST 실행에서 문제에 대해 알고 있어야 합니다.

이 문서를 보완, LINEST에 대 한 다음 문서를 적극 권장 합니다. 몇 가지 예제를 포함 하 고 Excel 2002와 이전 버전 Excel의 LINEST 사용 하 여 문제를 문서화 합니다.

자세한 내용은 다음 문서 번호를 클릭하여 Microsoft 기술 자료에서 해당 문서를 확인하십시오.

Mac 용 Excel 2004 및 Excel 2003에서 LINEST 함수 828533 설명



Excel 2002 및 이전 버전의 Excel에서 숫자 문제에 중점을 두고 이기 때문에이 문서에서는 추세를 사용 하는 방법에 대 한 실제적인 예제를 많이 갖지 않습니다. TREND의 도움말 파일에 유용한 예제가 포함 되어 있습니다.

구문

TREND(known_y's, known_x's, new_x's, constant)
인수 및 known_x's, new_x's, known_y's, 관련된 치수를 사용 하 여 셀 범위 또는 배열 이어야 합니다. Known_y's m 개의 행에서 한 열에 있으면 known_x's는 c 열 c는 1 보다 크거나 m 개의 행으로. C는 예측 변수의; 수 note m은 데이터 요소의 수입니다. New_x's 행 r c 열 해야 위치는 보다 큰 크거나 하나. (차원에서 유사한 관계가 유지 데이터 열 대신 행에 배치 되는 경우입니다.) 상수는는 논리 인수를 TRUE 또는 FALSE (또는 0 또는 Excel 각각 TRUE 또는 FALSE로 해석 하는 1)로 설정 해야 합니다. Trend의 마지막 세 인수는 모두 선택 사항입니다. 두 번째 인수, 세 번째 인수 또는 두 인수를 생략 하면 옵션에 대 한 TREND 도움말 파일을 참조 하십시오. 네 번째 인수를 생략 하면 TRUE로 해석 됩니다.

추세의 가장 일반적인 용도 두 범위 (a1: a100, B1:F100, B101:F108, TRUE) 추세와 같은 데이터를 포함 하는 셀을 포함 합니다. 일반적으로 예측 변수가 두 개 이상 있기 때문에이 예제의 두 번째 인수에는 여러 열 note입니다. 이 예제에서는 100 개의 주제와 하나의 종속변수 값 (known_y) 마다 5 개의 종속변수 값 (known_x's) 하 고 있습니다. 8 명의 추가 가상 대상이 추세를 사용 하 여 예측 된 y 값을 계산.

사용의 예

Excel 워크시트 예제는 다음과 같은 주요 개념을 설명 하기 위해 제공 됩니다.
  • 추세는 LINEST와 상호 작용 하는 방법
  • Excel 2002와 이전 버전의 Excel에 대 한 공 선적 known_x's 추세 (또는 LINEST)으로 인해 발생 하는 문제
LINEST에 대 한 문서에서 두 번째 글머리 기호 지점의 컨텍스트에서 LINEST의 광범위 한 토론 제공 됩니다.

TREND 공선성을 보여 주기 위해 빈 Excel 워크시트를 만들고, 다음 표를 복사, 빈 Excel 워크시트에서 A1 셀을 선택 하 고 표에서 셀 A1:K35 워크시트에서 채우도록 항목을 붙여 넣습니다.
y:x:
1121
2341
3451
4671
5781
새 x.911
1214
열 B, c:를 사용 하 여 추세이전 Excel 2003 값:Excel 2003과 이후 Excel 버전의 값:
=TREND(A2:A6,B2:C6,B7:C8,TRUE)#NUM!6.15789473684211
=TREND(A2:A6,B2:C6,B7:C8,TRUE)#NUM!8.13157894736842
B 열 사용 추세
=TREND(A2:A6,B2:B6,B7:B8,TRUE)6.15789473684216.15789473684211
=TREND(A2:A6,B2:B6,B7:B8,TRUE)8.131578947368428.13157894736842
Excel 2003 및 이후 버전의 Excel의 LINEST 결과 값 구성 됩니다.
열 B, C를 사용 하 여B 열 사용
= K24*1 + J24*B7 + I24*C7=J31*1+I31*B7
=K24*1 + J24*B8 + I24*C8=J31*1 +I31*B8
열 B, c:를 사용 하는 LINEST이전 Excel 2003 값:Excel 2003과 이후 Excel 버전의 값:
=LINEST(A2:A6,B2:C6,TRUE,TRUE)=LINEST(A2:A6,B2:C6,TRUE,TRUE)=LINEST(A2:A6,B2:C6,TRUE,TRUE)#NUM!#NUM!#NUM!00.6578947368421050.236842105263158
=LINEST(A2:A6,B2:C6,TRUE,TRUE)=LINEST(A2:A6,B2:C6,TRUE,TRUE)=LINEST(A2:A6,B2:C6,TRUE,TRUE)#NUM!#NUM!#NUM!00.0438596491228070.206652964726136
=LINEST(A2:A6,B2:C6,TRUE,TRUE)=LINEST(A2:A6,B2:C6,TRUE,TRUE)=LINEST(A2:A6,B2:C6,TRUE,TRUE)#NUM!#NUM!#NUM!0.9868421052631580.209426954145848#N/A
=LINEST(A2:A6,B2:C6,TRUE,TRUE)=LINEST(A2:A6,B2:C6,TRUE,TRUE)=LINEST(A2:A6,B2:C6,TRUE,TRUE)#NUM!#NUM!#NUM!2253#N/A
=LINEST(A2:A6,B2:C6,TRUE,TRUE)=LINEST(A2:A6,B2:C6,TRUE,TRUE)=LINEST(A2:A6,B2:C6,TRUE,TRUE)#NUM!#NUM!#NUM!9.868421052631580.131578947368421#N/A
B 열 사용 하는 LINEST
=LINEST(A2:A6,B2:B6,TRUE,TRUE)=LINEST(A2:A6,B2:B6,TRUE,TRUE)0.6578947368421050.2368421052631590.6578947368421050.236842105263158
=LINEST(A2:A6,B2:B6,TRUE,TRUE)=LINEST(A2:A6,B2:B6,TRUE,TRUE)0.04385964912280710.2066529647261360.0438596491228070.206652964726136
=LINEST(A2:A6,B2:B6,TRUE,TRUE)=LINEST(A2:A6,B2:B6,TRUE,TRUE)0.9868421052631580.2094269541458480.9868421052631580.209426954145848
=LINEST(A2:A6,B2:B6,TRUE,TRUE)=LINEST(A2:A6,B2:B6,TRUE,TRUE)224.99999999999932253
=LINEST(A2:A6,B2:B6,TRUE,TRUE)=LINEST(A2:A6,B2:B6,TRUE,TRUE)9.868421052631580.1315789473684219.868421052631580.131578947368421
이 표를 새 Excel 워크시트에 붙여넣을 클릭합니다
붙여넣기 옵션을 누른 다음 주변 서식에 맞추기. 붙여 넣은 범위를 선택한 상태로 실행 중인 Excel 버전에 따라 다음 절차 중 하나를 사용.
  • Microsoft Office Excel 2007과 2010에서 탭, 그룹에서 서식 을 클릭 한 다음 열 너비 자동 맞춤을클릭.
  • Excel 2003을 가리킵니다
    서식 메뉴 및 클릭에
    선택한 열에 맞게입니다.
A1:C8 셀에에서 추세에 대 한 데이터는. (셀에서는 d2: d6 항목 데이터에 포함 되지 않습니다 하지만에 대 한 설명은이 문서의 뒷부분에 나오는 사용 됩니다.) 모두 이전 버전의 Excel과 이후 버전의 Excel에 대 한 서로 다른 두 모델에 대 한 추세의 결과 각각 E10:E16 셀 및 셀 I10:116에 표시 됩니다. A10: a16 셀의에서 결과 사용 중인 Excel 버전에 해당 됩니다. 지금은 본이 문서에서는 Excel 2003 및 이후 Excel 버전의 결과 결과 TREND가 LINEST를 호출 하는 방법 및 추세 LINEST를 사용 하는 방법을 조사 하는 경우.

TREND와 LINEST는 다음과 같이 상호 작용을 볼 수 있습니다.
  1. TREND (known_y's, known_x's, new_x's, 상수)를 호출합니다.
  2. 추세는 LINEST (known_y's, known_x's, 상수, TRUE)를 호출합니다.
  3. 이 호출은 linest에서 회귀 계수를 얻을; 이러한 계수가 LINEST 출력 테이블의 첫 번째 행에 나타납니다.
  4. 각 new_x's 행에 대해 예측된 한 y 값은 기준으로 계산 이러한 LINEST 계수와 해당 행의 new_x's 값.
  5. 4 단계에서 계산 된 값이 해당 new_x's 행에 해당 하는 TREND 출력에 적절 한 셀에 반환 됩니다.
추세를 적절 한 결과 반환 하려면 LINEST가 더 잘 갈 적절 한 결과 3 단계에서. 문제는 공 선적 예측 인자 열에서 발생합니다.

적어도 하나의 열 c c1, c2 및 다른 열의 배수의 합으로 표현 될 수 있으면 예측 인자 열 (known_x's)이 공 선적입니다. C 열 c1, c2 및 다른 열에서 포함 된 정보를 생성할 수 있기 때문에 이중 라고 자주 합니다. 공선성이 있을 때의 기본 원칙은 결과가 영향을 받지 않는 포함 또는 원본 데이터에서 중복 열을 제거 됩니다. Excel 2002와 이전 버전 Excel의 LINEST는 공선성 보이지 않았습니다, 때문에 이러한 원칙을 위반 쉽게 했습니다. 적어도 하나의 열 c c1, c2 및 다른 열의 배수의 합과 거의 같게 표현 될 수 있으면 예측 인자 열이 거의 공 선적입니다. 이 경우 "거의 같음" 의미에서 c1, c2 및 다른 열의 가중치 합 해당 항목에서에서 c의 항목에 대 한 제곱 편차의 합이 매우 작음을 "매우 작음" 보다 작을 수 있습니다 10^(-12) 예.

10 ~ 12 행의 첫 번째 모델, 인자로 B 및 C 열을 사용 하 고 상수를 모델 Excel 요청 (마지막 인수를 TRUE로 설정). 다음 효율적으로 가져올 보이는 셀에서는 d2: d6 같은 추가 예측 인자 열에 있습니다. C 열의 2-6 행에 있는 항목이 B와 D. 열에서 해당 항목의 합과 같은 정확 하 게는 쉽습니다. 따라서 C 열의 배수의 합 이므로 공선성이 있습니다.
  • B 열
  • Excel의 삽입 (경향에 대 한 네 번째 인수로 동일) LINEST의 세 번째 인수가 생략 된 때문에 1로 이루어진 추가 열 또는 TRUE ("일반적인" 경우)
이 경우 Excel 2002와 이전 버전의 Excel에서 결과 계산할 수 없습니다 하 고 #NUM TREND 출력 테이블이 채워지는 수치 문제가 이러한!.

14-16 행의 두 번째 모델은 모든 Excel 버전에서 성공적으로 처리할 수 있습니다. 공선성이 없는 및 상수를 모델링 하려면 Excel을 다시 요청할 수 있습니다. 이 모델은 포함 여기 두 가지 이유 때문입니다.

첫째, 것은 아마도 가장 일반적인 실제 경우일: 있습니다. 이러한 경우는 모든 버전의 Excel에서 제대로 처리 됩니다. 규칙을 알고 수치 문제가 가장 일반적인 실용적인 경우 이전 버전의 Excel 사용 하는 경우 발생할 수 가능성이 없는 다시 확인 해야 합니다.

둘째,이 예제는 두 모델에서 이후 버전의 Excel과 Excel 2003의 동작을 비교 하는 데 사용 됩니다. 대부분의 주요 통계 패키지를 공선성 분석, 모델에서 다른 열의 배수의 합 인 열을 제거, "열 C 다른 예측 인자 열을 선형으로 종속 된 및 분석에서 제거 되었습니다."와 같은 메시지와 함께 경고

Excel 2003과 이후 Excel 버전에서는 이러한 메시지 경고 또는 텍스트 문자열로 아니라 LINEST 출력 테이블에 전달 됩니다. 경향에 게 메시지를 배달 하기 위한 메커니즘이 없습니다. LINEST 출력 테이블에서 회귀 계수 0의 표준 오차는 0은 모델에서 제거 된 열의 계수에 해당 합니다. LINEST 출력 테이블은 23 ~ 35 행 10-16의에서 TREND 출력에 해당 행에 포함 됩니다. I24:I25 셀의에서 항목은 제거 된 중복 예측 인자 열을 보여 줍니다. LINEST C 열을 제거 하기로 결정이 경우, (B, C 열을 Excel의 셀 I24, J24, 계수 K24 해당 상수 열 각각). 공선성이 있으면 관련 된 열 중 하나가 제거 될 수 있습니다 및 선택은 임의로.

30-35 행의 두 번째 모델에는 공선성과 열이 제거 되지 않습니다. 예측 된 y 값은 두 모델에서 동일한 있는지 확인할 수 있습니다. 다른 열의 배수의 합 인 중복 열을 제거 하면 결과 모델의 적합도 줄어들지 않습니다 때문에이 문제가 발생 합니다. 이러한 열에 맞는 최상의 최소 제곱 찾으려고 추가 된 값을 나타내지 않기 때문에 제거 됩니다.

또한 Excel 2003과 이후 Excel 버전의 i23: k35 셀에서에서 LINEST 출력을 살펴보면 출력 테이블의 마지막 세 행은 동일 하 고 셀 I31:J32 및 J24:K25 셀의 항목이 일치 하는 있는지 확인할 수 있습니다. C 열이 모델에 포함 될 때 동일한 결과 가져온 보여줍니다 하지만 출력 되는 것 중복 (셀 I24:K28에) LINEST (I31:J35 셀의에서 출력)가 실행 되기 전에 C 열 제거 된 경우로 발견. 공선성이 있을 때 기본 원칙을 충족합니다.

셀 A18:C21에이 문서에서는 데이터 Excel 2003 및 이후 Excel 버전에 대 한 설명 추세 LINEST 출력 사용 방법과 관련 된 예측 된 y 값을 계산 하기 위해. 셀의 A20:A21 및 C20:C21 셀의 수식을 살펴보면 각각의 두 모델 (열 B, C 인자로 사용, B 열만 예측에 사용) LINEST 계수가 b7: c8 셀의에서 new_x's 데이터와 결합 방법을 볼 수 있습니다.

공선성은 Excel 2003과 이후 Excel 버전의 LINEST의 회귀 계수를 해결 하는 완전히 다른 방법으로 인해 식별 됩니다. 이 방법은 QR 분해 라고 합니다. LINEST 문서에서는 작은 예제를 QR 분해 알고리즘의 연습을 설명합니다.

이전 버전 Excel의 결과 요약

부정적인 추세 결과 Excel 2002와 이전 버전 Excel의 LINEST의 정확 하지 않은 결과가 적용 됩니다.

LINEST는 공선성 문제를 고려 하지 않는 방법을 사용 하 여 계산 합니다. 공선성이 있으면 반올림 오류, 적절 하지 않은 표준 오류 회귀 계수 및 적절 하지 않은 자유도 발생합니다. 종종 반올림 문제가 매우 심각해 서 linest가 출력 테이블을 #NUM 했습니다!.

경우 대부분의 실제 경우 처럼 공 선적 (또는 거의 공 선적) 예측 인자 열이 하 고 LINEST는 받아들일 만한 결과 제공 일반적으로 신뢰할 수 있습니다. 따라서 TREND를 사용 하는 경우 야도는 공 선적 (또는 거의 공 선적) 예측 인자 열이 확실 한 경우.

Excel 2003과 이후 Excel 버전의 결과 요약

LINEST의 개선 사항은 포함 회귀 계수를 확인 하는 QR 분해 방법으로 전환 합니다. QR 분해에는 다음과 같은 장점이 있습니다.
  • 향상 된 수치 안정성 (일반적으로 더 작은 반올림 오류)
  • 공선성 문제 분석
Excel 2003과 이후 Excel 버전의 Excel 2002와 이전 버전의 Excel에는이 문서에 나와 있는 문제를 모두 수정 되었습니다.

결론

Excel 2003과 이후 Excel 버전의 LINEST 크게 향상 추세의 성능이 향상 되었습니다. 이전 버전의 Excel 사용 하는 경우는 예측 인자 열 선적이 아닌지 확인 TREND를 사용 하기 전에.

이 문서와 LINEST 문서에 표시 되는 내용의 상당 부분이 나타날 수 있습니다 처음에 이전 버전의 Excel과 Excel 2002 사용자에 게 놀랍게. 그러나 공선성이 문제가 적은 비율의 경우에는 note입니다. 이전 버전의 Excel 공선성이 없는 경우 받아들일 만한 TREND 결과 제공 합니다.

다행히도 LINEST의 개선 사항은 긍정적인 영향을 줍니다 (LINEST 호출)는 분석 도구의 선형 회귀 도구와 두 개의 다른 관련 Excel 함수: LOGEST 및 성장이 가능 합니다.


키워드: 수식 추세 성장 Linest Logest XL2003 XL2007 XL2010



속성

문서 ID: 828801 - 마지막 검토: 2017. 2. 7. - 수정: 2

Microsoft Office Excel 2007, Microsoft Excel 2004 for Mac, Microsoft Office Excel 2003, Microsoft Excel 2010

피드백