Section author: Danielle J. Navarro and David R. Foxcroft
தரவு அட்டவணைப்படுத்துதல் மற்றும் குறுக்கு-வழக்கு
தரவை பகுப்பாய்வு செய்யும் போது மிகவும் பொதுவான பணி அதிர்வெண் அட்டவணைகளை நிர்மாணிப்பது அல்லது ஒரு மாறியை மற்றொன்றுக்கு எதிராக குறுக்கு தேர்வு செய்வது. இந்த பணிகளை சாமோவியில் அடைய முடியும், இந்த பிரிவில் எப்படி என்பதை நான் உங்களுக்குக் காண்பிப்பேன்.
ஒற்றை மாறிகள் அட்டவணைகளை உருவாக்குதல்
ஒரு எளிய எடுத்துக்காட்டுடன் ஆரம்பிக்கலாம். ஒரு சிறு குழந்தையின் பெற்றோராக நான் இயல்பாகவே நைட் கார்டன் *போன்ற தொலைக்காட்சி நிகழ்ச்சிகளைப் பார்க்க நிறைய நேரம் செலவிடுகிறேன். | நைட்மார்டன் | _ தரவு தொகுப்பில், உரையாடலின் ஒரு குறுகிய பகுதியை நான் படியெடுத்துள்ளேன். கோப்பில் ஆர்வத்தின் இரண்டு மாறிகள் உள்ளன, `` ச்பீக்கர்`` மற்றும் `` சொல்யூன்ச்``. சமோவியில் இந்தத் தரவைத் திறந்து, `` தரவு`` பார்வையில் தரவைப் பாருங்கள். தரவு இதுபோன்றதாக இருப்பதை நீங்கள் காண்பீர்கள்:
`` ச்பீக்கர்` `மாறி
upsy-daisy upsy-daisy upsy-daisy upsy-daisy tombliboo tombliboo makka-pakka makka-pakka makka-pakka makka-pakka
`` சொல்` `மாறி
pip pip onk onk ee oo pip pip onk onk
இதைப் பார்த்தால், எனது நல்லறிவுக்கு என்ன ஆனது என்பது மிகவும் தெளிவாகிறது! எனது தரவுகளாக, நான் செய்ய வேண்டிய ஒரு பணி, நிகழ்ச்சியின் போது ஒவ்வொரு கதாபாத்திரமும் பேசும் சொற்களின் எண்ணிக்கையின் அதிர்வெண் எண்ணிக்கையை உருவாக்குவதாகும். சாமோவி `` விளக்கங்கள்`` திரையில் `` அதிர்வெண் அட்டவணைகள்`` எனப்படும் ஒரு தேர்வுப்பெட்டியைக் கொண்டுள்ளது, இது இதைச் செய்கிறது, காண்க: எண்: அத்தி-ஃப்ரெக்டபிள்.
இங்குள்ள வெளியீடு முதல் வரியில் நாம் பார்ப்பது `` ச்பீக்கர்`` மாறியின் அட்டவணையாகும். `` நிலைகள்` நெடுவரிசையில் இது தரவுகளில் இருக்கும் அனைத்து வெவ்வேறு பேச்சாளர்களையும் பட்டியலிடுகிறது, மேலும் எண்ணிக்கைகள்` நெடுவரிசையில் அந்த பேச்சாளர் தரவுகளில் எத்தனை முறை தோன்றும் என்பதை இது உங்களுக்குக் கூறுகிறது. வேறு வார்த்தைகளில் கூறுவதானால், இது ஒரு அதிர்வெண் அட்டவணை.
சாமோவியில், `` அதிர்வெண் அட்டவணைகள்`` செக் பாக்ச் ஒற்றை மாறிகளுக்கு ஒரு அட்டவணையை மட்டுமே உருவாக்கும். இரண்டு மாறிகளின் அட்டவணைக்கு, எடுத்துக்காட்டாக `` ச்பீக்கர்`` மற்றும் `` உச்சரிப்பு`` ஆகியவற்றை இணைத்து, ஒவ்வொரு பேச்சாளரும் ஒரு குறிப்பிட்ட உச்சரிப்பு எத்தனை முறை சொன்னார்கள் என்பதை நாம் காண முடியும், எங்களுக்கு ஒரு குறுக்கு-டேபுலேசன் அல்லது தற்செயல் அட்டவணை தேவை. சாமோவியில் நீங்கள் `` அதிர்வெண்கள்`` → `` தற்செயல் அட்டவணைகள்` → `` சுயாதீன மாதிரிகள்`` பகுப்பாய்வு செய்வதன் மூலம் இதைச் செய்யலாம், மேலும் `` ச்பீக்கர்`` மாறியை `` வரிசைகள்` பெட்டியில் நகர்த்தலாம் `` நெடுவரிசைகள்` பெட்டியில் `` சொல் மாறுபாடு. நீங்கள் காட்டப்பட்டுள்ளதைப் போன்ற ஒரு தற்செயல் அட்டவணையை நீங்கள் கொண்டிருக்க வேண்டும்: numref: `Fig-contingencyTable.
Fig. 33 `` ச்பீக்கர்`` மற்றும் `` சொல்யூன்ச்` மாறுபாடுகளுக்கான தற்செயல் அட்டவணை
தயாரிக்கப்பட்ட `` χ² சோதனைகள்` அட்டவணையைப் பற்றி கவலைப்பட வேண்டாம். இதை நாங்கள் பின்னர் அத்தியாயத்தில் மறைக்கப் போகிறோம்: DOC: ../ CH10/CH10_CHISQUARE. தற்செயல் அட்டவணையை விளக்கும் போது இவை எண்ணிக்கைகள் என்பதை நினைவில் கொள்ளுங்கள், எனவே முதல் வரிசை மற்றும் இரண்டாவது எண்களின் நெடுவரிசை 2 மதிப்புக்கு ஒத்திருக்கிறது என்பது `` மக்கா பக்கா`` (வரிசை 1) `` ஓங்க்`` (நெடுவரிசை ஆகியவற்றைக் குறிக்கிறது என்பதைக் குறிக்கிறது 2) இந்த தரவு தொகுப்பில் இரண்டு முறை.
ஒரு தற்செயல் அட்டவணையில் சதவீதங்களைச் சேர்ப்பது
காட்டப்பட்டுள்ள தற்செயல் அட்டவணை: NUMREF: FIG-CONTINGENTENCETABLE மூல அதிர்வெண்களின் அட்டவணையைக் காட்டுகிறது. அதாவது, குறிப்பிட்ட மாறிகளின் நிலைகளின் வெவ்வேறு சேர்க்கைகளுக்கான மொத்த வழக்குகளின் எண்ணிக்கை. இருப்பினும், உங்கள் தரவு சதவீதங்கள் மற்றும் எண்ணிக்கையின் அடிப்படையில் ஒழுங்கமைக்கப்பட வேண்டும் என்று நீங்கள் விரும்புகிறீர்கள். `` தற்செயல் அட்டவணைகள்` சாளரத்தில் செல்கள் விருப்பத்தின் கீழ் வெவ்வேறு சதவீதங்களுக்கான தேர்வுப்பெட்டிகளை நீங்கள் காணலாம். முதலில், `` வரிசை`` செக் பாக்சைக் சொடுக்கு செய்து, வெளியீட்டு சாளரத்தில் உள்ள தற்செயல் அட்டவணை இதில் மாறும்: NumRef: Fig-ContingencyRow.
Fig. 34 வரிசை சதவீதங்களுடன் `` ச்பீக்கர்```` மற்றும் `` சொல் `மாறுபாடுகளுக்கான தற்செயல் அட்டவணை
நாம் இங்கே பார்ப்பது ஒவ்வொரு கதாபாத்திரத்தால் செய்யப்பட்ட சொற்களின் சதவீதமாகும். வேறு வார்த்தைகளில் கூறுவதானால், `` மக்கா பக்கா`` இன் சொற்களில் 50 % `` பிப்``, மற்ற 50 % `` ஓங்க்`` ஆகும். நெடுவரிசை சதவீதங்களைக் கணக்கிடும்போது (`` வரிசை`` ஐத் தேர்வுசெய்து `` கலங்கள்` விருப்பங்கள் சாளரத்தில் `` நெடுவரிசை` ஐ சரிபார்க்கும்போது), இதைக் காண்க), காண்க: NumRef: Fig-ContingencyCol. இந்த பதிப்பில், நாம் பார்ப்பது ஒவ்வொரு சொற்களுடனும் தொடர்புடைய எழுத்துக்களின் சதவீதமாகும். உதாரணமாக, `` ee`` கூறும் போதெல்லாம் (இந்த தரவு தொகுப்பில்), 100 % நேரம் இது ஒரு டோம்ப்ளிபூ என்று சொல்லும்.
Fig. 35 நெடுவரிசை சதவீதங்களுடன், `` பேச்சாளர்```` மற்றும் `` சொல் `மாறிகள் ஆகியவற்றிற்கான தற்செயல் அட்டவணை