컴퓨터소프트웨어

방정식 예 : Excel에서 회귀. 선형 회귀

회귀 분석 - 하나 개 이상의 독립 변수의 매개 변수의 의존성을 보여주는 통계 연구 방법. 이전 컴퓨터 시대에, 그것의 사용은 많은 양의 데이터에 와서 특히, 다소 어려웠다. 오늘, Excel에서 회귀를 구축하는 방법을 배우고, 당신은 단지 몇 분에서 복잡한 통계 문제를 해결할 수 있습니다. 다음은 경제학의 구체적인 예이다.

회귀 유형

이 개념은 수학에 도입 프란시스 갈턴에 의해 1886 년에. 회귀는 다음과 같습니다

  • 선형;
  • 포물선;
  • 전원;
  • 지수;
  • 쌍곡선;
  • 지수;
  • 로그.

예 1

6 개 공업 기업의 평균 임금의 직원의 구성원의 사임 수의 의존도를 결정하는 문제를 생각해 보자.

작업. 여섯 개 기업 평균 월급 자발적으로 종료 직원 수를 분석 하였다. 표 형식에서 우리는있다 :

B

C

(1)

엑스

사직의 수

봉급

Y

30000 루블

3

(1)

(60)

35000 루블

4

(35)

40000 루블

5

3

(20)

45000 루블

6

4

(20)

50,000 루블

(7)

5

(15)

55000 루블

8

6

(15)

60000 루블

6 개 기업 회귀 모델의 평균 임금에서 양 분리 노동자의 의존성을 결정하는 문제 Y가 = 식의 형태를 가지고 0 + 1 X 1 + ... + k 번째 X K, 여기서 x I - 영향 변수 A I - 회귀 계수, AK - 요인의 수.

Y는 주어진 작업 - 급여, X로 표시된다 - 직원을 해고 할 수있는 지표, 기여 요인이다

"엑셀"스프레드 시트의 힘을 모으고

Excel에서 회귀 분석은 내장 함수 기존 테이블 데이터에 응용 프로그램이 선행되어야한다. 그러나, 이러한 목적을 위해 매우 유용한 추가 기능 "패킷 분석"을 사용하는 것이 좋습니다. 을 활성화하려면 다음을 수행해야합니다

  • 탭 "파일"로에 '설정'으로 이동;
  • 열린 창에서, '부가 기능'을 선택;
  • 라인 "관리"의 오른쪽 아래에있는 버튼을 "이동"을 클릭;
  • "분석 도구"옆에 체크 표시를하고 "확인"을 눌러 작업을 확인합니다.

제대로하면, 작업 시트 "엑셀"위에있는 "데이터"탭의 오른쪽 측면에서, 원하는 버튼을 보여줍니다.

Excel의 선형 회귀

이제 손에 계량 경제 계산에 필요한 모든 가상 도구를 가지고, 우리는 우리의 문제를 해결하기 위해 시작할 수 있습니다. 이 작업을 수행하려면 :

  • 버튼은 "데이터 분석"을 클릭;
  • 열린 창에서 버튼을 "회귀"를 클릭;
  • 값의 범위를 소개 나타나는 탭 Y (분리 노동자의 수)와 X (급여);
  • «확인»버튼을 눌러 자신의 행동을 재확인한다.

그 결과, 프로그램이 자동으로 새 시트 스프레드 시트 데이터를 회귀 분석을 채울 것입니다. 주의! Excel에서이 목적을 위해 선호하는 장소를 설정 할 수있는 기회가있다. 예를 들어, Y 값과 X, 또는 새로운 책, 구체적 데이터의 저장을 위해 설계된 동일한 시트 일 수있다.

R 제곱에 대한 회귀 분석 결과

고려 예를 들어 데이터에서 얻은 엑셀 데이터의 형식은 :

우선, 우리는 R 제곱의 가치에 주목해야한다. 이 판정의 계수를 나타낸다. 이 예에서, R 제곱 = 0.755 (75.5 %), m. E. 모델의 계산 된 매개 변수는 75.5 %로 고려 된 파라미터 간의 관계를 설명한다. 결정 계수의 높은 값은 선택된 모델은 특정 태스크에 더 유용한 것으로 간주된다. 정확하게 0.8 위의 R 제곱 값으로 실제 상황을 설명하기 위해 생각됩니다. 는 R 평방 <0.5은 다음 Excel에서 회귀 분석은 합리적인 것으로 간주 할 수없는 경우.

비율 분석

번호 64.1428은 우리의 모델의 모든 변수 XI가 재설정됩니다 경우 Y의 값이됩니다 보여줍니다. 즉,이 분석 매개 변수의 값이 특정 모델에 기재된 것 이외의 요인에 의해 영향을받는 것으로 주장 될 수있다.

셀 B18에있는 다음 요소 -0.16285는 변수 X의 중요한 영향이 모델 내에서 직원의 평균 급여가 -0.16285의 무게, t에서 사임의 수에 영향을 미치는 것을 의미한다 Y로 보여줍니다. E. 미치는 영향의 정도에 모든 작은. 부호는 "-"계수가 음을 나타냅니다. 우리 모두가 기업에서 더 많은 급여가 적은 사람들이 고용 또는 해고의 계약을 해지하는 욕망을 표명 한 것을 알고 있기 때문에 그것은 분명하다.

다중 회귀

이 용어에서 여러 형태의 독립 변수와 연통 식을 의미한다 :

Y = F (X 1 + X 2 + ... X의 m) + ε, Y는 - 기능 점수 (종속 변수)이고, X 1, X 2, ..., X의 m은 - 표지 인자 (독립 변수)이다.

매개 변수 추정

회귀 (MR)의 경우는 최소 제곱 법 (LSM)을 사용하여 수행된다. 폼 Y = A + B를 1 × 1 + ... + B m에서 m + X의 선형 방정식 ε 정규 방정식의 시스템을 구축 (cm. 아래)

이 방법의 원리를 이해하기 위해서, 우리는 이중 케이스를 고려한다. 그럼 우리는 상황이 공식으로 설명했다

따라서, 우리가 얻을 :

σ는 어디에 - 각 기능의 분산이며, 인덱스에 반영.

방정식 MR 규모를 standartiziruemom하기에 MNC을 적용한다. 이 경우, 우리는 방정식을 얻을 :

상기 t Y, T, X 1, ... t XM - 평균 값은 0이다하는 변수 standartiziruemye; I를 β - 표준화 회귀 계수와 표준 편차 - 1.

모든 난을 β 있습니다 이 경우와 비교 따라서, 정규화 및 tsentraliziruemye로 정의 된 유효하다고 간주. 또한, βi는 가장 낮은 값을 갖는 것과 버리는 요인의 선별을 수행하도록 허용한다.

선형 회귀 식을 사용의 문제점

지난 8개월 위해 특정 제품의 N의 가격의 역학의 테이블이 있다고 가정. 그것은 1850 루블의 가격 일행의 인수 여부를 결정하는 것이 필요하다. / T.

B

C

(1)

달의 이름

가격 N

(1)

1월

톤 당 1750 루블

3

톤 당 1755 루블

4

3

행진

톤 당 1767 루블

5

4

4월

톤 당 1760 루블

6

5

할 수있다

톤 당 1770 루블

(7)

6

유월

톤 당 1790 루블

8

(7)

7월

톤 당 1810 루블

9

8

위엄있는

톤 당 1840 루블

이미 위에서 제시된 예 도구 "데이터 분석"으로 알려져 사용하는 데 필요한 표 프로세서 "엑셀"이 문제를 해결합니다. 다음, "회귀"섹션 설정 매개 변수를 선택합니다. (월) 독립을 위해 - 우리는에 입력 간격 X의» "입력 범위 Y»가와에서 (올해의 특정 개월이 경우 상품의 가격을) 종속 변수의 값의 범위를 도입해야한다"고 기억해야합니다. 우리는«확인»을 클릭하여 작업을 확인합니다. (그래서 표시된 경우) 새 워크 시트에, 우리는 회귀에 대한 데이터를 얻을 수 있습니다.

우리는 이들의 파라미터 A 및 B로 라인 달의 번호 및 이름의 계수의 회귀 분석의 결과 시트«Y 교차점 "행에서 계수들은 y = ax + b 형태의 선형 방정식을 구축하고있다. 따라서,이 문제에 대한 선형 회귀 식 (EQ) (3)과 같이 쓸 수있다 :

상품의 가격 N = 11,714 * 1727.54 월 번호 +.

또는 대수 표기법

Y = X + 11,714 1727,54

결과 분석

(가) 복수의 상관 계수 (CMC) 및 판정뿐만 아니라 시험과 피셔의 t-test를 이용하여 충분히 선형 회귀 식을 수신할지 결정한다. 그들이 이름을 여러 R, R-광장, 각각 F-t-통계 및 통계, 아래의 행동 결과에 테이블 "엑셀"회귀합니다.

KMC R은 독립 변수와 종속 변수 간의 근접성 확률의 관계를 추정 할 수있다. 높은 값은 변수 "달의 수"와 사이에 충분히 강한 연결을 나타냅니다 "1t 당 루블에서 N 제품 가격을." 그러나,이 관계의 성격을 알 수 없습니다.

R 2 판정 계수의 제곱 (RI)은, 즉, 총 분산의 비율 수치 특징 실험 데이터 부분의 산란을 도시 선형 회귀 식에 대응하는 종속 변수의 값. 이 문제에있어서,이 값은 수득 정확도가 높은 E. 통계 SD 기재되어 MP., 84.8 %이다.

또한 피셔 기준으로 알려진 F-통계 선형 의존성 또는 그 존재를 확인하는 가설을 반증의 중요성을 평가하기 위해 사용된다.

t-통계 (학생의 t 시험)의 값은 무료 알 수없는 선형 의존 멤버의 계수의 의미를 평가하는 데 도움이됩니다. t 검정> t의 CR 값의 경우, 자유 기간의 선형 방정식 무의미의 가설은 거절된다.

악기를 통해 무료 기간 동안이 문제에서 "엑셀"그것은 t이 169,20903를 = 것을 발견되었고, P = 2,89E-12, t. E.는 신자가 무료 기간의 무의미의 가설을 거부됩니다 제로 확률을 가지고. t = 5,79405 미지의 계수, 및 p = 0,001158 들어. 즉, 거절 올바른 가설 미지 용 계수의 무의미 할 확률은 0.12 %이다.

따라서, 적절히 선형 회귀 식을 얻을 수 있다고 주장했다.

주식을 구매의 타당성의 문제

다중 회귀는 같은 "데이터 분석"도구를 사용하여 Excel에서 수행되었다. 특정 응용 프로그램을 고려하십시오.

가이드 회사«NNN»는 JSC«MMM»의 주식의 20 %를 구입할지 여부를 결정해야합니다. 패키지 가격 (SP)은 7000 만 달러이다. «NNN»의 전문가는 유사한 거래에 대한 데이터를 수집. 그것은 이러한 매개 변수에 대한 주식의 가치를 평가하기로 결정했다, 같은 달러의 수백만 표현 :

  • 채무 (VK);
  • 연간 매출 볼륨 (VO);
  • 채권 (VD);
  • 고정 자산 (SOF)의 값.

또한, 미국 수천 달러에서 기업의 임금 채무 (V3 U)를 사용합니다.

의사 결정 테이블 프로세서 엑셀 수단

먼저 입력 데이터의 테이블을 작성해야합니다. 다음과 같이이다 :

다음 :

  • 전화 상자 "데이터 분석";
  • 선택된 "회귀"섹션;
  • 창 칼럼 G에서 "입력 간격 Y»투여 범위 종속 변수 값;
  • 윈도우 "입력 간격 X»의 오른쪽에있는 적색 화살표 아이콘을 클릭하고 칼럼 B, C, D, F.의 모든 값의 시트 범위 격리

마크는 점 "새 워크 시트"와 "확인"을 클릭합니다.

이 작업에 대한 회귀 분석을 가져옵니다.

연구 결과 및 결론

용지 테이블 엑셀 프로세서 회귀 방정식 위에서 제시된 데이터로부터 반올림 "수집"

SD = 0.103 * SOF + 0541 *의 VO - 0031 * VK + 0405 * VD + 0691 * VZP - 265844.

더 일반적인 수학적 형태로는 다음과 같이 쓸 수있다 :

Y = 0,103 * 0,541 * X1 + X2 - X3 + 0,031 * 0,405 * 0,691 * X4 + X5 - 265,844

아래 표에 제시된«MMM»JSC에 대한 데이터 :

SOF, USD

VO, USD

VK, USD

VD, USD

VZP, USD

JV, USD

102.5

535.5

45.2

41.5

21.55

64.72

회귀 방정식을 대입하면, 64,720,000 달러의 그림을 얻었다. 이것은 그들의 비용이 꽤 7000 만 달러에 고가를 붙여 때문에 JSC«MMM»의 주식을 구입하지 말아야 것을 의미한다.

당신이 볼 수 있듯이, 스프레드 시트의 사용 "엑셀"및 회귀 방정식은 타당성을 확실히 특정 거래에 관한 정보통 결정을 내릴 수있었습니다.

지금 당신은 무엇을 회귀 알고있다. 위에서 설명한 Excel로 예를 들면, 계량 경제학의 실질적인 문제 해결에 도움이 될 것입니다.

Similar articles

 

 

 

 

Trending Now

 

 

 

 

Newest

Copyright © 2018 ko.delachieve.com. Theme powered by WordPress.