Section author: Danielle J. Navarro and David R. Foxcroft
புத்தகத்திலிருந்து புள்ளிவிவர மாதிரிகள் இல்லை
புள்ளிவிவரங்கள் ஒரு பெரிய புலம். இந்த புத்தகத்தில் நான் விவரித்த முக்கிய கருவிகள் (χ²-சோதனைகள், *t *-டெச்ட்கள், பின்னடைவு மற்றும் ANOVA) அன்றாட தரவு பகுப்பாய்வில் பரவலாகப் பயன்படுத்தப்படும் அடிப்படை கருவிகள், மேலும் அவை பெரும்பாலான அறிமுக புள்ளிவிவர புத்தகங்களின் மையத்தை உருவாக்குகின்றன. இருப்பினும், அங்கே நிறைய கருவிகள் உள்ளன. இந்த கருவிகள் மறைக்காத பல தரவு பகுப்பாய்வு சூழ்நிலைகள் உள்ளன, மேலும் இன்னும் எவ்வளவு இருக்கிறது என்பதைப் புரிந்துகொள்வது மிகவும் நல்லது, எடுத்துக்காட்டாக:
** நேரியல் அல்லாத பின்னடைவு. மறுபுறம், கோழி நாங்கள் தொடர்புகளின் எளிமையான சிக்கலைப் பற்றி பேசினோம், மாறிகள் இடையே நேரியல் அல்லாத உறவுகளை மதிப்பிடக்கூடிய கருவிகள் (எ.கா., ச்பியர்மேன் தொடர்புகள்) இருப்பதை நாங்கள் கண்டோம். புள்ளிவிவரங்களில் பல கருவிகள் உள்ளன, அவை நேரியல் அல்லாத பின்னடைவைச் செய்ய பயன்படுத்தப்படலாம். உதாரணமாக, சில நேரியல் அல்லாத பின்னடைவு மாதிரிகள் முன்னறிவிப்பாளர்களுக்கும் விளைவுகளுக்கும் இடையிலான உறவு மோனோடோனிக் (எ.கா., ஐசோடோனிக் பின்னடைவு) என்று கருதுகின்றன, மற்றவர்கள் இது மென்மையானது என்று கருதுகின்றனர், ஆனால் அவசியமாக மோனோடோனிக் அல்ல (எ.கா., லோவச் பின்னடைவு), மற்றவர்கள் உறவு கருதுகின்றனர் அறியப்பட்ட வடிவத்தில் உள்ளது, இது நேரியல் அல்ல (எ.கா., பல்லுறுப்புறுப்பு பின்னடைவு).
** லாசிச்டிக் பின்னடைவு. ** விளைவு மாறி பைனரி | பெயரளவு |, மல்டினோமியல் | பெயரளவு | போது பின்னடைவின் மற்றொரு மாறுபாடு ஏற்படுகிறது (பல குழுக்கள்) அல்லது ஆர்டினல் | ஆர்டினல் |, ஆனால் முன்னறிவிப்பாளர்கள் தொடர்ச்சியாக | உதாரணமாக, நீங்கள் சமூக ஊடகங்களை விசாரிக்கிறீர்கள் என்று வைத்துக்கொள்வோம், மேலும் யாரோ ஒருவர் ட்விட்டரில் இருக்கிறாரா இல்லையா என்பதை அவர்களின் வருமானம், அவர்களின் அகவை மற்றும் பிற மாறிகள் வரம்பின் செயல்பாடாக கணிக்க முடியுமா என்பதை நீங்கள் அறிய விரும்புகிறீர்கள். இது அடிப்படையில் ஒரு பின்னடைவு மாதிரியாகும், ஆனால் நீங்கள் வழக்கமான நேரியல் பின்னடைவைப் பயன்படுத்த முடியாது, ஏனெனில் விளைவு மாறி வகைப்படுத்தப்பட்டுள்ளது (எ.கா., நீங்கள் ட்விட்டரில் இருந்தாலும் அல்லது நீங்கள் இல்லாவிட்டாலும்). விளைவு மாறி வகைப்படுத்தப்பட்டதாக இருப்பதால், எச்சங்கள் பொதுவாக விநியோகிக்கப்படக்கூடிய வழி இல்லை. இந்த சூழ்நிலைக்கு புள்ளிவிவர வல்லுநர்கள் விண்ணப்பிக்கக்கூடிய பல கருவிகள் உள்ளன, அவற்றில் மிக முக்கியமானது லாசிச்டிக் பின்னடைவு.
** பொது நேரியல் மாதிரி (சி.எல்.எம்). ** சி.எல்.எம் என்பது உண்மையில் லாசிச்டிக் பின்னடைவு, நேரியல் பின்னடைவு, (சில) நேரியல் அல்லாத பின்னடைவு, ANOVA மற்றும் பலவற்றை உள்ளடக்கிய மாதிரிகளின் குடும்பமாகும். சி.எல்.எம் இல் உள்ள அடிப்படை சிந்தனை அடிப்படையில் நேரியல் மாதிரிகளை ஆதரிக்கும் அதே யோசனையாகும், ஆனால் இது உங்கள் தரவு பொதுவாக விநியோகிக்கப்படக்கூடாது என்ற கருத்தை அனுமதிக்கிறது, மேலும் முன்னறிவிப்பாளர்களுக்கும் விளைவுகளுக்கும் இடையிலான நேரியல் உறவுகளை அனுமதிக்கிறது. சி.எல்.எம் -க்குள் வரும் நீங்கள் இயக்கக்கூடிய மிக எளிதான பகுப்பாய்வுகள் நிறைய உள்ளன, எனவே இது பற்றி தெரிந்து கொள்வது மிகவும் பயனுள்ள சேதி.
** உயிர்வாழும் பகுப்பாய்வு. பின்னர், நான் அதைப் பற்றி ஒரு சாத்தியமான முறையான அக்கறையாகப் பேசிக் கொண்டிருந்தேன், ஆனால் நிறைய சூழ்நிலைகள் உள்ளன, அதில் வேறுபட்ட மனப்பான்மை உண்மையில் நீங்கள் ஆர்வமாக உள்ளது. உதாரணமாக, மக்கள் எவ்வளவு காலம் என்பதைக் கண்டுபிடிப்பதில் நீங்கள் ஆர்வமாக உள்ளீர்கள் என்று வைத்துக்கொள்வோம் ஒரே அமர்வில் வெவ்வேறு வகையான கணினி விளையாட்டுகளை விளையாடுங்கள். எஃப்.பி.எச் (முதல் நபர் துப்பாக்கி சுடும்) விளையாட்டுகளை விட நீண்ட நீட்டிப்புகளுக்கு மக்கள் ஆர்.டி.எச் (நிகழ்நேர மூலோபாயம்) விளையாட்டுகளை விளையாட முனைகிறார்களா? உங்கள் ஆய்வை நீங்கள் இவ்வாறு வடிவமைக்கலாம். மக்கள் ஆய்வகத்திற்குள் வருகிறார்கள், அவர்கள் விரும்பும் அளவுக்கு நீண்ட அல்லது குறைவாக விளையாடலாம். அவை முடிந்ததும், அவர்கள் விளையாடிய நேரத்தை நீங்கள் பதிவு செய்கிறீர்கள். இருப்பினும், நெறிமுறை கட்டுப்பாடுகள் காரணமாக, இரண்டு மணி நேரத்திற்கும் மேலாக விளையாடுவதை நீங்கள் அனுமதிக்க முடியாது என்று வைத்துக்கொள்வோம். வோ அவர் வரம்பிற்கு முன்பாக நிறைய பேர் விளையாடுவதை நிறுத்திவிடுவார்கள், எனவே அவர்கள் எவ்வளவு நேரம் விளையாடினார்கள் என்பது உங்களுக்குத் தெரியும். ஆனால் சிலர் இரண்டு மணிநேர வரம்பில் ஓடுவார்கள், எனவே நீங்கள் படிப்பைத் தொடர முடிந்தால் அவர்கள் எவ்வளவு காலம் விளையாடியிருப்பார்கள் என்பது உங்களுக்குத் தெரியாது. இதன் விளைவாக, உங்கள் தரவு முறையாக *தணிக்கை செய்யப்படுகிறது *: நீங்கள் மிக நீண்ட காலத்தை காணவில்லை. இந்த தரவை எவ்வாறு விவேகத்துடன் பகுப்பாய்வு செய்வது? உயிர்வாழும் பகுப்பாய்வு தீர்க்கும் சிக்கல் இதுதான். இந்த சூழ்நிலையை கையாள இது குறிப்பாக வடிவமைக்கப்பட்டுள்ளது, அங்கு நீங்கள் தரவின் ஒரு “பக்கத்தை” முறையாகக் காணவில்லை, ஏனெனில் ஆய்வு முடிந்தது. இது சுகாதார ஆராய்ச்சியில் மிகவும் பரவலாகப் பயன்படுத்தப்படுகிறது, மேலும் அந்த சூழலில் இது பெரும்பாலும் உயிர்வாழ்வை பகுப்பாய்வு செய்யப் பயன்படுகிறது. உதாரணமாக, நீங்கள் ஒரு குறிப்பிட்ட வகை புற்றுநோயால் பாதிக்கப்பட்டவர்களைக் கண்காணிக்கலாம், சிலர் மருத்தீடு பெற்றுள்ளவர்கள் மற்றும் மருத்தீடு B ஐப் பெற்ற மற்றவர்கள், ஆனால் 5 ஆண்டுகளாக அவற்றைக் கண்காணிக்க மட்டுமே உங்களுக்கு பொருள் உள்ளது. ஆய்வுக் காலத்தின் முடிவில் சிலர் உயிருடன் இருக்கிறார்கள், மற்றவர்கள் இல்லை. இந்த சூழலில், எந்த மருத்தீடு மிகவும் பயனுள்ளதாக இருக்கும் என்பதை தீர்மானிக்க உயிர்வாழும் பகுப்பாய்வு பயனுள்ளதாக இருக்கும், மேலும் காலப்போக்கில் மக்கள் எதிர்கொள்ளும் மரண அபாயத்தைப் பற்றி உங்களுக்குச் சொல்கிறது.
** கலப்பு மாதிரிகள். ** மீண்டும் மீண்டும் நடவடிக்கைகள் ANOVA பெரும்பாலும் சோதனை அலகுகளுக்குள் கொத்தாக இருக்கும் சூழ்நிலைகளில் பயன்படுத்தப்படுகிறது. இதற்கு ஒரு சிறந்த எடுத்துக்காட்டு என்னவென்றால், நீங்கள் தனிப்பட்ட நபர்களை பல நேர புள்ளிகளில் கண்காணிக்கும்போது. காலப்போக்கில் நீங்கள் மகிழ்ச்சியைக் கண்காணிக்கிறீர்கள் என்று சொல்லலாம். ஆரோனின் மகிழ்ச்சி 10 இல் தொடங்குகிறது, பின்னர் 8 ஆக குறைகிறது, பின்னர் 6 ஆக குறைகிறது. பெலிண்டாவின் மகிழ்ச்சி 6 இல் தொடங்குகிறது, பின்னர் 8 ஆகவும் பின்னர் 10 ஆகவும் உயர்கிறது. இந்த இரண்டு நபர்களும் ஒரே "ஒட்டுமொத்த" மகிழ்ச்சியைக் கொண்டுள்ளனர் (சராசரி முழுவதும் சராசரி மூன்று நேர புள்ளிகள் 8), எனவே மீண்டும் மீண்டும் நடவடிக்கைகள் ANOVA பகுப்பாய்வு ஆரோன் மற்றும் பெலிண்டாவைப் போலவே சிகிச்சையளிக்கும். ஆனால் அது தெளிவாக தவறு. ஆரோனின் மகிழ்ச்சி குறைந்து வருகிறது, அதேசமயம் பெலிண்டா அதிகரித்து வருகிறது. காலப்போக்கில் மக்கள் மாறக்கூடிய ஒரு பரிசோதனையிலிருந்து தரவை உகந்ததாக பகுப்பாய்வு செய்ய விரும்பினால், மீண்டும் மீண்டும் நடவடிக்கைகளை விட உங்களுக்கு அதிக சக்திவாய்ந்த கருவி தேவை. இந்த சிக்கலைத் தீர்க்க மக்கள் பயன்படுத்தும் கருவிகள் “கலப்பு” மாதிரிகள் என்று அழைக்கப்படுகின்றன, ஏனெனில் அவை தனிப்பட்ட சோதனை அலகுகள் (எ.கா. காலப்போக்கில் தனிப்பட்ட நபர்களின் மகிழ்ச்சி) மற்றும் ஒட்டுமொத்த விளைவுகளைப் பற்றி அறிய வடிவமைக்கப்பட்டுள்ளன (எ.கா. காலப்போக்கில் மகிழ்ச்சியில் பணத்தின் விளைவு ). மீண்டும் மீண்டும் நடவடிக்கைகள் ANOVA என்பது ஒரு கலப்பு மாதிரியின் எளிய எடுத்துக்காட்டு, ஆனால் கலப்பு மாதிரிகள் மூலம் நீங்கள் செய்யக்கூடிய நிறைய விசயங்கள் உள்ளன, அவை ANOVA ஐ மீண்டும் மீண்டும் செய்ய முடியாது.
** பல பரிமாண அளவிடுதல். ** காரணி பகுப்பாய்வு என்பது “மேற்பார்வை செய்யப்படாத கற்றல்” மாதிரியின் எடுத்துக்காட்டு. இதன் பொருள் என்னவென்றால், நான் குறிப்பிட்டுள்ள பெரும்பாலான “மேற்பார்வையிடப்பட்ட கற்றல்” கருவிகளைப் போலல்லாமல், உங்கள் மாறிகளை முன்னறிவிப்பாளர்களாகவும் விளைவுகளாகவும் பிரிக்க முடியாது. பின்னடைவு என்பது மேற்பார்வையிடப்பட்ட கற்றல், அதே சமயம் காரணி பகுப்பாய்வு மேற்பார்வை செய்யப்படாத கற்றல் ஆகும். இருப்பினும் இது மேற்பார்வை செய்யப்படாத கற்றல் மாதிரியின் ஒரே வகை அல்ல. எடுத்துக்காட்டாக, காரணி பகுப்பாய்வில் ஒன்று மாறிகளுக்கு இடையிலான தொடர்புகளின் பகுப்பாய்வில் அக்கறை கொண்டுள்ளது. இருப்பினும், பொருள்கள், உருப்படிகள் அல்லது நபர்களுக்கு இடையிலான ஒற்றுமைகள் அல்லது ஒற்றுமையை பகுப்பாய்வு செய்வதில் நீங்கள் உண்மையில் ஆர்வமாக உள்ள பல சூழ்நிலைகள் உள்ளன. இந்த சூழ்நிலையில் நீங்கள் பயன்படுத்தக்கூடிய பல கருவிகள் உள்ளன, அவற்றில் மிகச் சிறந்தவை பல பரிமாண அளவிடுதல் (எம்.டி.எச்) ஆகும். எம்.டி.எச்சில், உங்கள் உருப்படிகளின் “வடிவியல்” பிரதிநிதித்துவத்தைக் கண்டுபிடிப்பதே சிந்தனை. ஒவ்வொரு உருப்படியும் சில இடத்தின் ஒரு புள்ளியாக “திட்டமிடப்பட்டுள்ளது”, மேலும் இரண்டு புள்ளிகளுக்கு இடையிலான தூரம் அந்த உருப்படிகள் எவ்வளவு வேறுபட்டவை என்பதற்கான ஒரு நடவடிக்கையாகும்.
** கிளச்டரிங். ** மேற்பார்வை செய்யப்படாத கற்றல் மாதிரியின் மற்றொரு எடுத்துக்காட்டு கிளச்டரிங் (வகைப்பாடு என்றும் குறிப்பிடப்படுகிறது), இதில் உங்கள் எல்லா பொருட்களையும் அர்த்தமுள்ள குழுக்களாக ஒழுங்கமைக்க விரும்புகிறீர்கள், அதாவது ஒத்த உருப்படிகள் ஒரே குழுக்களுக்கு ஒதுக்கப்படுகின்றன. நிறைய கிளச்டரிங் மேற்பார்வை செய்யப்படாதது, அதாவது குழுக்கள் என்னவென்று உங்களுக்குத் தெரியாது, நீங்கள் யூகிக்க வேண்டும். பிற "மேற்பார்வையிடப்பட்ட கிளச்டரிங்" சூழ்நிலைகள் உள்ளன, அங்கு நீங்கள் குழு உறுப்பினர்களை மற்ற மாறிகளின் அடிப்படையில் கணிக்க வேண்டும், மேலும் அந்த குழு உறுப்பினர்கள் உண்மையில் கவனிக்கத்தக்கவை. லாசிச்டிக் பின்னடைவு இந்த வழியில் செயல்படும் ஒரு கருவியின் சிறந்த எடுத்துக்காட்டு. இருப்பினும், குழு உறுப்பினர்கள் உங்களுக்கு உண்மையில் தெரியாதபோது, நீங்கள் வெவ்வேறு கருவிகளைப் பயன்படுத்த வேண்டும் (எ.கா., கே-ஐன்ச் கிளச்டரிங்). "அரை மேற்பார்வையிடப்பட்ட கிளச்டரிங்" என்று நீங்கள் ஏதாவது செய்ய விரும்பும் சூழ்நிலைகள் கூட உள்ளன, இதில் சில பொருட்களுக்கான குழு உறுப்பினர்களை நீங்கள் அறிவீர்கள், ஆனால் மற்றவர்கள் அல்ல. நீங்கள் யூகிக்க முடியும் என, கிளச்டரிங் ஒரு மிகப் பெரிய தலைப்பு, மேலும் தெரிந்து கொள்ள மிகவும் பயனுள்ள சேதி.
** காரண மாதிரிகள். ** இந்த புத்தகத்தில் நான் அதிகம் பேசாத ஒரு சேதி என்னவென்றால், மாறிகள் இடையேயான காரண உறவுகளைப் பற்றி அறிய புள்ளிவிவர மாடலிங் எவ்வாறு பயன்படுத்தலாம் என்பதுதான். உதாரணமாக, துப்பாக்கிச் சூட்டில் யாரோ ஒருவர் எப்படி இறந்தார் என்பதைப் பற்றி சிந்திக்கும்போது ஆர்வமுள்ள பின்வரும் மூன்று மாறிகளைக் கவனியுங்கள். ஒரு சாவுஒறுப்பு ஒழுங்கு வழங்கப்பட்டதா இல்லையா என்பதை நாம் அளவிட விரும்பலாம் (மாறி A), ஒரு மதிப்பெண் வீரர் தங்கள் துப்பாக்கியை (மாறி B) சுட்டாரா இல்லையா, மற்றும் அந்த நபர் ஒரு புல்லட் (மாறி சி) மூலம் தாக்கப்பட்டாரா இல்லையா. இந்த மூன்று மாறிகள் அனைத்தும் ஒருவருக்கொருவர் தொடர்புபடுத்தப்பட்டுள்ளன (எ.கா., துப்பாக்கிகள் சுடப்படுவதற்கும் மக்கள் தோட்டாக்களால் பாதிக்கப்படுவதற்கும் இடையே ஒரு தொடர்பு உள்ளது), ஆனால் தொடர்புகளைப் பற்றி பேசுவதை விட அவர்களைப் பற்றி வலுவான அறிக்கைகளை வெளியிட விரும்புகிறோம். நாங்கள் காரணத்தைப் பற்றி பேச விரும்புகிறோம். சாவுஒறுப்பு கட்டளை (அ) மதிப்பெண் வீரருக்கு தீ (பி) ஐ ஏற்படுத்துகிறது என்று நாங்கள் கூற விரும்புகிறோம், இதனால் யாரோ ஒருவர் சுட்டுக் கொல்லப்படுகிறார் (சி). இயக்கிய அம்பு குறியீட்டால் இதை நாம் வெளிப்படுத்தலாம்: இதை ஒரு → B → C. என்று எழுதுகிறோம். இந்த “காரணச் சங்கிலி” என்பது மார்க்ச்மேன் முதலில் சுடும் ஒன்றைக் காட்டிலும் நிகழ்வுகளுக்கு அடிப்படையில் மாறுபட்ட விளக்கமாகும், இது படப்பிடிப்பு B → C ஐ ஏற்படுத்துகிறது, மற்றும் சாவுஒறுப்பு வரிசையை "பின்னோக்கி" வழங்குவதற்கு சாவுஒறுப்பு செய்பவர், பி → ஏ. இந்த "பொதுவான விளைவு" மாதிரி ஏ மற்றும் சி இரண்டும் பி காரணமாக ஏற்படுகின்றன என்று கூறுகிறது. இவை ஏன் வேறுபட்டவை என்பதை நீங்கள் காணலாம். முதல் காரண மாதிரியில், சாவுஒறுப்பு செய்பவர் உத்தரவை வழங்குவதைத் தடுக்க முடிந்திருந்தால் (A ஐ மாற்ற தலையிடுவது), எந்த படப்பிடிப்பும் நடந்திருக்காது. இரண்டாவது மாடலில், சாவுஒறுப்பு உத்தரவைப் பின்பற்றி மார்க்ச்மேன் * இல்லை * என்பதால் படப்பிடிப்பு எந்த வகையிலும் நடந்திருக்கும். மாறிகள் இடையேயான காரண உறவுகளைப் புரிந்துகொள்ள முயற்சிப்பது குறித்த புள்ளிவிவரங்களில் ஒரு பெரிய இலக்கியம் உள்ளது, மேலும் உங்கள் தரவைப் பற்றிய வெவ்வேறு காரணக் கதைகளை சோதிக்க உதவும் பல வேறுபட்ட கருவிகள் உள்ளன. இந்த கருவிகளில் மிகவும் பரவலாகப் பயன்படுத்தப்படுவது (உளவியலில் குறைந்தபட்சம்) கட்டமைப்பு சமன்பாடுகள் மாடலிங் (SEM) ஆகும், மேலும் சில சமயங்களில் புத்தகத்தைப் பற்றி பேச நான் நீட்டிக்க விரும்புகிறேன்.
நிச்சயமாக, இந்த பட்டியல் கூட முழுமையடையாது. நேரத் தொடர் பகுப்பாய்வு, உருப்படி மறுமொழி கோட்பாடு, சந்தை கூடை பகுப்பாய்வு, வகைப்பாடு மற்றும் பின்னடைவு மரங்கள் அல்லது பிற தலைப்புகளில் ஏதேனும் ஒன்றை நான் குறிப்பிடவில்லை. இருப்பினும், நான் மேலே கொடுத்த பட்டியல் அடிப்படையில் இந்த புத்தகத்திற்கான எனது விருப்பப்பட்டியல். நிச்சயமாக, இது புத்தகத்தின் நீளத்தை இரட்டிப்பாக்கும், ஆனால் உளவியலில் ஆராய்ச்சியாளர்களைப் பயன்படுத்த வேண்டிய பெரும்பாலான விசயங்களை மறைக்கும் அளவுக்கு நோக்கம் பரந்ததாக மாறிவிட்டது என்று பொருள்.