Section author: Danielle J. Navarro and David R. Foxcroft

பின்னடைவு மாதிரியின் பொருத்தத்தை அளவிடுதல்

எனவே ஒரு நேரியல் பின்னடைவு மாதிரியின் குணகங்களை எவ்வாறு மதிப்பிடுவது என்பது இப்போது எங்களுக்குத் தெரியும். சிக்கல் என்னவென்றால், இந்த பின்னடைவு மாதிரி ஏதேனும் நல்லதா என்பதை நாங்கள் இன்னும் தெரியவில்லை. எடுத்துக்காட்டாக, `` பின்னடைவு 1`` மாதிரி * கூறுகிறது * ஒவ்வொரு மணிநேர தூக்கமும் என் மனநிலையை நிறைய மேம்படுத்தும், ஆனால் அது குப்பையாக இருக்கலாம். நினைவில் கொள்ளுங்கள், பின்னடைவு மாதிரி ஒரு கணிப்பை மட்டுமே உருவாக்குகிறது *ŷ *: துணை: எனது மனநிலை எப்படி இருக்கிறது என்பதைப் பற்றி நான் நான்`, ஆனால் எனது உண்மையான மனநிலை *y *: துணை:` நான்`. இந்த இரண்டு மிக நெருக்கமாக இருந்தால், பின்னடைவு மாதிரி ஒரு நல்ல வேலையைச் செய்துள்ளது. அவை மிகவும் வித்தியாசமாக இருந்தால், அது ஒரு மோசமான வேலையைச் செய்துள்ளது.

*R *² (r-squared) மதிப்பு

மீண்டும், இதைச் சுற்றி சிறிது கணிதத்தை மடிக்கலாம். முதலாவதாக, சதுர எச்சங்களின் கூட்டுத்தொகையை நாங்கள் பெற்றுள்ளோம்

\[\mbox{SS}_{res} = \sum_i (Y_i - \hat{Y}_i)^2\]

இது மிகவும் சிறியதாக இருக்கும் என்று நம்புகிறோம். குறிப்பாக, விளைவு மாறியின் மொத்த மாறுபாட்டுடன் ஒப்பிடுகையில், அது மிகச் சிறியதாக இருக்க வேண்டும் என்பதே நாங்கள் விரும்புவது

\[\mbox{SS}_{tot} = \sum_i (Y_i - \bar{Y})^2\]

நாங்கள் இங்கே இருக்கும்போது, இந்த மதிப்புகளை நாமே கணக்கிடுவோம், கையால் அல்ல. அதற்கு பதிலாக சாமோவியைப் பயன்படுத்துவோம். | பெற்றோர்ஊட் | _ தரவுகளைத் திறக்கவும், இதனால் நாங்கள் அதில் வேலை செய்ய முடியும். முதலில் செய்ய வேண்டியது * ŷ * மதிப்புகளைக் கணக்கிடுவதாகும், மேலும் ஒரு முன்கணிப்பாளரை மட்டுமே பயன்படுத்தும் எளிய மாதிரிக்கு நாம் பின்வருவனவற்றை செய்வோம்:

  1. வெற்று நெடுவரிசைக்குச் சென்று (தரவு தொகுப்பின் முடிவில்) மற்றும் நெடுவரிசை தலைப்பில் இருமுறை சொடுக்கு செய்து, `` புதிய கணக்கிடப்பட்ட மாறி`` ஐத் தேர்ந்தெடுத்து முதல் வரியில் `` y_pred`` மற்றும் `` 125.97 + சூத்திரத்தை உள்ளிடவும் 8.94 *dani.sleep) `` `` = `` ( *f *: துணை: x) உடன் தொடங்கும் வரியில்.

சரி, இப்போது எந்த நாளிலும் நான் எவ்வளவு எரிச்சலாக இருப்பேன் என்பதற்கான பின்னடைவு மாதிரி கணிப்புகளை சேமிக்கும் ஒரு மாறியை நாங்கள் பெற்றுள்ளோம், எங்கள் சதுர எச்சங்களின் தொகையை கணக்கிடுவோம். பின்வரும் சூத்திரத்தைப் பயன்படுத்தி நாங்கள் அதைச் செய்வோம்:

  1. `` (Dani.grump - y_pred) ^ 2`` என்ற சூத்திரத்தைப் பயன்படுத்தி `` sq_resid`` என்ற புதிய நெடுவரிசையை உருவாக்குவதன் மூலம் ச்கொயர் எச்சங்களைக் கணக்கிடுங்கள். இந்த நெடுவரிசையில் உள்ள மதிப்புகள் பின்னர் SS : துணை: res ஐப் பெற சுருக்கப்பட்டுள்ளன.

  2. `` (Dani.grump - vmean (dani.grump)) ^ 2`` என்ற சூத்திரத்தைப் பயன்படுத்தி `` sq_total` என்ற மற்றொரு நெடுவரிசையை உருவாக்குவதன் மூலம் சராசரியிலிருந்து சதுர விலகலைக் கணக்கிடுங்கள். இந்த நெடுவரிசையில் உள்ள மதிப்புகள் பின்னர் SS : துணை: TOT ஐப் பெற சுருக்கப்பட்டுள்ளன.

இந்த மதிப்புகளின் கூட்டுத்தொகையை கணக்கிட, `` விளக்கங்கள்`` → `` விளக்க புள்ளிவிவரங்கள்`` என்பதைக் சொடுக்கு செய்து `` sq_resid`` மற்றும் `` sq_total`` ஆகியவற்றை `` மாறிகள்` பெட்டியில் நகர்த்தவும். கீழே உள்ள `` புள்ளிவிவரங்கள்` கீழ்தோன்றும் மெனுவிலிருந்து `` தொகை`` தேர்ந்தெடுக்க வேண்டும். `` Sq_resid`` இன் தொகை ** 1838.722 ** மதிப்பைக் கொண்டுள்ளது. இது ஒரு பெரிய எண், இருப்பினும், இது மிகவும் அர்த்தமல்ல. `` Sq_total`` இன் தொகை ** 9998.590 ** மதிப்பைக் கொண்டுள்ளது. சரி, இது கடைசியாக இருந்ததை விட மிகவும் (சுமார் ஐந்து மடங்கு) பெரிய எண்ணிக்கையாகும், எனவே இது எங்கள் பின்னடைவு மாதிரி நல்ல கணிப்புகளைச் செய்து கொண்டிருந்தது என்று இது அறிவுறுத்துகிறது (அதாவது, சராசரியைப் பயன்படுத்தும் மாதிரியுடன் ஒப்பிடும்போது மீதமுள்ள பிழையை இது வெகுவாகக் குறைத்துள்ளது ஒற்றை முன்கணிப்பு). ஆனால் இது மிகவும் விளக்கமளிக்கவில்லை.

இதை சரிசெய்ய, இந்த இரண்டு மிகவும் அர்த்தமற்ற எண்களை ஒரு எண்ணாக மாற்ற விரும்புகிறோம். ஒரு நல்ல, விளக்கக்கூடிய எண், எந்தவொரு குறிப்பிட்ட காரணத்திற்காகவும் நாங்கள் *r *² என்று அழைப்போம். தரவைக் கணிப்பதில் பின்னடைவு மாதிரி எந்த பிழையும் செய்யாவிட்டால், *r *of இன் மதிப்பு 1 க்கு சமமாக இருக்க வேண்டும் என்பதே நாம் விரும்புவது. வேறு வார்த்தைகளில் கூறுவதானால், மீதமுள்ள பிழைகள் பூச்சியமாக இருக்கும் என்று மாறிவிட்டால். அதாவது, ss : sub: res = 0 என்றால் *r *² = 1 என்று எதிர்பார்க்கிறோம். இதேபோல், மாதிரி முற்றிலும் பயனற்றதாக இருந்தால், *r *the 0 க்கு சமமாக இருக்க விரும்புகிறோம். என்ன செய்ய வேண்டும் நான் “பயனற்றவர்” என்பதன் அர்த்தமா? பின்னடைவு மாதிரி வீட்டை விட்டு வெளியேற வேண்டும், அதன் தலைமுடியை வெட்டி, உண்மையான வேலையைப் பெற வேண்டும் என்று கோருவதால், நான் இன்னும் நடைமுறை வரையறையைத் தேர்வு செய்ய வேண்டியிருக்கும். இந்த விசயத்தில், நான் சொல்வது என்னவென்றால், சதுரங்களின் எஞ்சிய தொகை மொத்த சதுரங்களின் தொகையை விட சிறியதல்ல, SS : sub: res = ss : sub:` tot`. காத்திருங்கள், நாம் ஏன் அதைச் சரியாகச் செய்யக்கூடாது? எங்கள் *r *² மதிப்பை எங்களுக்கு வழங்கும் தேற்றம் எழுதுவது மிகவும் எளிதானது, மேலும் கையால் கணக்கிட சமமாக எளிமையானது: [#] _ _

R² = 1 - (SSres / SStot)
R² = 1 - (1838.722 / 9998.590)
R² = 1 - 0.184

இது ** 0.816 ** இன்*r*க்கு க்கு ஒரு மதிப்பை அளிக்கிறது. R² மதிப்பு, சில நேரங்களில் ** தீர்மானத்தின் குணகம் ** [#] _ ஒரு எளிய விளக்கத்தைக் கொண்டுள்ளது: இது விளைவு மாறியில் உள்ள மாறுபாட்டின்*விகிதம்*ஆகும், இது முன்கணிப்பாளரால் கணக்கிடப்படலாம். எனவே, இந்த விசயத்தில் நாம் *r *² = 0.816 ஐப் பெற்றுள்ளோம் என்பதன் பொருள், முன்கணிப்பு (`` டானி.லீப்``) 81.6 % முடிவில் மாறுபாட்டை விளக்குகிறது (`` dani.grump``) . [#] _

இயற்கையாகவே, உங்கள் பின்னடைவு மாதிரிக்கான *r *² மதிப்பைப் பெற விரும்பினால் இந்த கணக்கீடுகள் அனைத்தையும் நீங்களே செய்ய வேண்டிய அவசியமில்லை. நாம் பின்னர் பார்ப்பது போல்: ref: சமோவியில் உள்ள கருதுகோள் சோதனைகளை இயக்குதல் <ceoficients_in_jamovi>, நீங்கள் செய்ய வேண்டியது இதை சாமோவியில் ஒரு விருப்பமாகக் குறிப்பிடுவதுதான். இருப்பினும், இப்போதைக்கு அதை ஒரு பக்கத்திற்கு வைப்போம். நான் சுட்டிக்காட்ட விரும்பும் *r *² of இன் மற்றொரு சொத்து உள்ளது.

பின்னடைவுக்கும் தொடர்புக்கும் இடையிலான உறவு

இந்த கட்டத்தில், நான் இதுவரை விவாதித்த இந்த மிக எளிமையான வடிவத்தில் பின்னடைவு என்ற எனது முந்தைய கூற்றை நாம் மறுபரிசீலனை செய்யலாம், அடிப்படையில் ஒரு தொடர்பு போன்றது. முன்னதாக, ஒரு பியர்சன் தொடர்பைக் குறிக்க * r * குறியீட்டைப் பயன்படுத்தினோம். தொடர்பு குணகத்தின் மதிப்பு *r *மற்றும் நேரியல் பின்னடைவிலிருந்து *r *² மதிப்பு ஆகியவற்றுக்கு இடையே சில உறவுகள் இருக்கக்கூடும்? நிச்சயமாக உள்ளது: சதுர தொடர்பு *r *² ² ஒரு கணிப்பாளருடன் ஒரு நேரியல் பின்னடைவுக்கான *r *² மதிப்புக்கு ஒத்ததாகும். வேறு வார்த்தைகளில் கூறுவதானால், ஒரு பியர்சன் தொடர்பை இயக்குவது ஒரு நேரியல் பின்னடைவு மாதிரியை இயக்குவதற்கு அதிகமாகவோ அல்லது குறைவாகவோ சமம், இது ஒரு முன்கணிப்பு மாறியை மட்டுமே பயன்படுத்துகிறது.

சரிசெய்யப்பட்ட *r *² (r- ச்கொயர்) மதிப்பு

நகரும் முன் சுட்டிக்காட்ட வேண்டிய ஒரு இறுதி சேதி. “சரிசெய்யப்பட்ட *r *²” என அழைக்கப்படும் மாதிரி செயல்திறனின் சற்று மாறுபட்ட அளவைப் புகாரளிப்பது மிகவும் பொதுவானது. சரிசெய்யப்பட்ட *r *² மதிப்பைக் கணக்கிடுவதன் பின்னணியில் உள்ள உந்துதல் என்பது மாதிரியில் அதிக முன்னறிவிப்பாளர்களைச் சேர்ப்பது *எப்போதும் * *r *² ² மதிப்பை அதிகரிக்க (அல்லது குறைந்தது குறையாது) ஏற்படுத்தும் என்பதைக் கவனிப்பதாகும்.

சரிசெய்யப்பட்ட *r *² மதிப்பு கணக்கீட்டில் ஒரு சிறிய மாற்றத்தை பின்வருமாறு அறிமுகப்படுத்துகிறது. *K *முன்னறிவிப்பாளர்களைக் கொண்ட ஒரு பின்னடைவு மாதிரிக்கு, *n *அவதானிப்புகள் கொண்ட தரவுத் தொகுப்பிற்கு பொருந்தும், சரிசெய்யப்பட்ட *r *² is ஆகும்:

\[\mbox{adj. } R^2 = 1 - \left(\frac{\mbox{SS}_{res}}{\mbox{SS}_{tot}} \times \frac{N - 1}{N - K - 1} \right)\]

இந்த சரிசெய்தல் சுதந்திரத்தின் அளவுகளை கணக்கில் எடுத்துக்கொள்ளும் முயற்சியாகும். சரிசெய்யப்பட்ட r *² மதிப்பின் பெரிய நன்மை என்னவென்றால், நீங்கள் மாதிரியில் அதிக முன்னறிவிப்பாளர்களைச் சேர்க்கும்போது, புதிய மாறிகள் மாதிரி செயல்திறனை மேம்படுத்தினால் மட்டுமே சரிசெய்யப்பட்ட *r *² ² மதிப்பு அதிகரிக்கும். . பெரிய குறைபாடு என்னவென்றால், சரிசெய்யப்பட்ட *r *² ² மதிப்பு * *r *² gean முடிந்த நேர்த்தியான வழியில் விளக்க முடியாது. *R² பின்னடைவு மாதிரியால் விளக்கப்பட்ட விளைவு மாறியில் மாறுபாட்டின் விகிதமாக ஒரு எளிய விளக்கத்தைக் கொண்டுள்ளது. எனது அறிவைப் பொறுத்தவரை, சரிசெய்யப்பட்ட *r *² பெறுநர் க்கு சமமான விளக்கம் எதுவும் இல்லை.

ஒரு வெளிப்படையான கேள்வி என்னவென்றால், நீங்கள் *r *² ² அல்லது சரிசெய்யப்பட வேண்டுமா என்பது *r *. இது அநேகமாக தனிப்பட்ட விருப்பத்தின் சேதி. விளக்கமளிக்கும் தன்மையைப் பற்றி நீங்கள் அதிகம் அக்கறை கொண்டிருந்தால், *r *² சிறந்தது. சார்புகளை சரிசெய்வதில் நீங்கள் அதிகம் அக்கறை கொண்டிருந்தால், சரிசெய்யப்பட்ட *r *² ² அநேகமாக சிறந்தது. எனக்காக மட்டுமே பேசும்போது, நான் *r *² ஐ விரும்புகிறேன். உங்கள் மாதிரி செயல்திறனின் அளவை விளக்குவது மிகவும் முக்கியமானது என்பது எனது உணர்வு. தவிர, பிரிவில் நாம் பார்ப்பது போல்: DOC: CH12_REGRESSION_07, ஒரு முன்கணிப்பாளரைச் சேர்ப்பதன் மூலம் நீங்கள் பெறும் *r *² இருந்து இல் முன்னேற்றம் என்பது வாய்ப்பு காரணமாக மட்டுமே என்று நீங்கள் கவலைப்படுகிறீர்கள் என்றால், அது ஒரு சிறந்த மாதிரி என்பதால் அல்ல, அதற்கான கருதுகோள் சோதனைகள் கிடைத்துள்ளன.