Section author: Danielle J. Navarro and David R. Foxcroft

தரவு அட்டவணைப்படுத்துதல் மற்றும் குறுக்கு-வழக்கு

தரவை பகுப்பாய்வு செய்யும் போது மிகவும் பொதுவான பணி அதிர்வெண் அட்டவணைகளை நிர்மாணிப்பது அல்லது ஒரு மாறியை மற்றொன்றுக்கு எதிராக குறுக்கு தேர்வு செய்வது. இந்த பணிகளை சாமோவியில் அடைய முடியும், இந்த பிரிவில் எப்படி என்பதை நான் உங்களுக்குக் காண்பிப்பேன்.

ஒற்றை மாறிகள் அட்டவணைகளை உருவாக்குதல்

ஒரு எளிய எடுத்துக்காட்டுடன் ஆரம்பிக்கலாம். ஒரு சிறு குழந்தையின் பெற்றோராக நான் இயல்பாகவே நைட் கார்டன் *போன்ற தொலைக்காட்சி நிகழ்ச்சிகளைப் பார்க்க நிறைய நேரம் செலவிடுகிறேன். | நைட்மார்டன் | _ தரவு தொகுப்பில், உரையாடலின் ஒரு குறுகிய பகுதியை நான் படியெடுத்துள்ளேன். கோப்பில் ஆர்வத்தின் இரண்டு மாறிகள் உள்ளன, `` ச்பீக்கர்`` மற்றும் `` சொல்யூன்ச்``. சமோவியில் இந்தத் தரவைத் திறந்து, `` தரவு`` பார்வையில் தரவைப் பாருங்கள். தரவு இதுபோன்றதாக இருப்பதை நீங்கள் காண்பீர்கள்:

`` ச்பீக்கர்` `மாறி

upsy-daisy upsy-daisy upsy-daisy upsy-daisy tombliboo tombliboo makka-pakka makka-pakka makka-pakka makka-pakka

`` சொல்` `மாறி

pip pip onk onk ee oo pip pip onk onk

இதைப் பார்த்தால், எனது நல்லறிவுக்கு என்ன ஆனது என்பது மிகவும் தெளிவாகிறது! எனது தரவுகளாக, நான் செய்ய வேண்டிய ஒரு பணி, நிகழ்ச்சியின் போது ஒவ்வொரு கதாபாத்திரமும் பேசும் சொற்களின் எண்ணிக்கையின் அதிர்வெண் எண்ணிக்கையை உருவாக்குவதாகும். சாமோவி `` விளக்கங்கள்`` திரையில் `` அதிர்வெண் அட்டவணைகள்`` எனப்படும் ஒரு தேர்வுப்பெட்டியைக் கொண்டுள்ளது, இது இதைச் செய்கிறது, காண்க: எண்: அத்தி-ஃப்ரெக்டபிள்.

`` ச்பீக்கர்` `மாறிக்கான அதிர்வெண் அட்டவணை

Fig. 32 `` ச்பீக்கர்` `மாறிக்கான அதிர்வெண் அட்டவணை

இங்குள்ள வெளியீடு முதல் வரியில் நாம் பார்ப்பது `` ச்பீக்கர்`` மாறியின் அட்டவணையாகும். `` நிலைகள்` நெடுவரிசையில் இது தரவுகளில் இருக்கும் அனைத்து வெவ்வேறு பேச்சாளர்களையும் பட்டியலிடுகிறது, மேலும் எண்ணிக்கைகள்` நெடுவரிசையில் அந்த பேச்சாளர் தரவுகளில் எத்தனை முறை தோன்றும் என்பதை இது உங்களுக்குக் கூறுகிறது. வேறு வார்த்தைகளில் கூறுவதானால், இது ஒரு அதிர்வெண் அட்டவணை.

சாமோவியில், `` அதிர்வெண் அட்டவணைகள்`` செக் பாக்ச் ஒற்றை மாறிகளுக்கு ஒரு அட்டவணையை மட்டுமே உருவாக்கும். இரண்டு மாறிகளின் அட்டவணைக்கு, எடுத்துக்காட்டாக `` ச்பீக்கர்`` மற்றும் `` உச்சரிப்பு`` ஆகியவற்றை இணைத்து, ஒவ்வொரு பேச்சாளரும் ஒரு குறிப்பிட்ட உச்சரிப்பு எத்தனை முறை சொன்னார்கள் என்பதை நாம் காண முடியும், எங்களுக்கு ஒரு குறுக்கு-டேபுலேசன் அல்லது தற்செயல் அட்டவணை தேவை. சாமோவியில் நீங்கள் `` அதிர்வெண்கள்`` → `` தற்செயல் அட்டவணைகள்` → `` சுயாதீன மாதிரிகள்`` பகுப்பாய்வு செய்வதன் மூலம் இதைச் செய்யலாம், மேலும் `` ச்பீக்கர்`` மாறியை `` வரிசைகள்` பெட்டியில் நகர்த்தலாம் `` நெடுவரிசைகள்` பெட்டியில் `` சொல் மாறுபாடு. நீங்கள் காட்டப்பட்டுள்ளதைப் போன்ற ஒரு தற்செயல் அட்டவணையை நீங்கள் கொண்டிருக்க வேண்டும்: numref: `Fig-contingencyTable.

`` ச்பீக்கர்`` மற்றும் `` சொல்யூரன்ச்` `க்கான தற்செயல் அட்டவணை

Fig. 33 `` ச்பீக்கர்`` மற்றும் `` சொல்யூன்ச்` மாறுபாடுகளுக்கான தற்செயல் அட்டவணை

தயாரிக்கப்பட்ட `` χ² சோதனைகள்` அட்டவணையைப் பற்றி கவலைப்பட வேண்டாம். இதை நாங்கள் பின்னர் அத்தியாயத்தில் மறைக்கப் போகிறோம்: DOC: ../ CH10/CH10_CHISQUARE. தற்செயல் அட்டவணையை விளக்கும் போது இவை எண்ணிக்கைகள் என்பதை நினைவில் கொள்ளுங்கள், எனவே முதல் வரிசை மற்றும் இரண்டாவது எண்களின் நெடுவரிசை 2 மதிப்புக்கு ஒத்திருக்கிறது என்பது `` மக்கா பக்கா`` (வரிசை 1) `` ஓங்க்`` (நெடுவரிசை ஆகியவற்றைக் குறிக்கிறது என்பதைக் குறிக்கிறது 2) இந்த தரவு தொகுப்பில் இரண்டு முறை.

ஒரு தற்செயல் அட்டவணையில் சதவீதங்களைச் சேர்ப்பது

காட்டப்பட்டுள்ள தற்செயல் அட்டவணை: NUMREF: FIG-CONTINGENTENCETABLE மூல அதிர்வெண்களின் அட்டவணையைக் காட்டுகிறது. அதாவது, குறிப்பிட்ட மாறிகளின் நிலைகளின் வெவ்வேறு சேர்க்கைகளுக்கான மொத்த வழக்குகளின் எண்ணிக்கை. இருப்பினும், உங்கள் தரவு சதவீதங்கள் மற்றும் எண்ணிக்கையின் அடிப்படையில் ஒழுங்கமைக்கப்பட வேண்டும் என்று நீங்கள் விரும்புகிறீர்கள். `` தற்செயல் அட்டவணைகள்` சாளரத்தில் செல்கள் விருப்பத்தின் கீழ் வெவ்வேறு சதவீதங்களுக்கான தேர்வுப்பெட்டிகளை நீங்கள் காணலாம். முதலில், `` வரிசை`` செக் பாக்சைக் சொடுக்கு செய்து, வெளியீட்டு சாளரத்தில் உள்ள தற்செயல் அட்டவணை இதில் மாறும்: NumRef: Fig-ContingencyRow.

`` ச்பீக்கர்`` மற்றும் `` உச்சரிப்பு`` க்கான வரிசை சதவீதங்களுடன் தற்செயல் அட்டவணை

Fig. 34 வரிசை சதவீதங்களுடன் `` ச்பீக்கர்```` மற்றும் `` சொல் `மாறுபாடுகளுக்கான தற்செயல் அட்டவணை

நாம் இங்கே பார்ப்பது ஒவ்வொரு கதாபாத்திரத்தால் செய்யப்பட்ட சொற்களின் சதவீதமாகும். வேறு வார்த்தைகளில் கூறுவதானால், `` மக்கா பக்கா`` இன் சொற்களில் 50 % `` பிப்``, மற்ற 50 % `` ஓங்க்`` ஆகும். நெடுவரிசை சதவீதங்களைக் கணக்கிடும்போது (`` வரிசை`` ஐத் தேர்வுசெய்து `` கலங்கள்` விருப்பங்கள் சாளரத்தில் `` நெடுவரிசை` ஐ சரிபார்க்கும்போது), இதைக் காண்க), காண்க: NumRef: Fig-ContingencyCol. இந்த பதிப்பில், நாம் பார்ப்பது ஒவ்வொரு சொற்களுடனும் தொடர்புடைய எழுத்துக்களின் சதவீதமாகும். உதாரணமாக, `` ee`` கூறும் போதெல்லாம் (இந்த தரவு தொகுப்பில்), 100 % நேரம் இது ஒரு டோம்ப்ளிபூ என்று சொல்லும்.

`` ச்பீக்கர்`` மற்றும் `` உச்சரிப்பு`` க்கான நெடுவரிசை சதவீதங்களுடன் தற்செயல் அட்டவணை

Fig. 35 நெடுவரிசை சதவீதங்களுடன், `` பேச்சாளர்```` மற்றும் `` சொல் `மாறிகள் ஆகியவற்றிற்கான தற்செயல் அட்டவணை