מדגם
בסטטיסטיקה, מדגם או מדגם מייצג הוא קבוצת פרטים, המהווה מודל לאוכלוסייה, שאליה היא שייכת. הפרטים במדגם עשויים להיות בני אדם מאוכלוסייה אנושית כלשהי, בעלי חיים ואפילו עצמים דוממים (למשל, מדגם של גפרורים נבדק כדי לאמוד את אחוז הגפרורים שלא נדלקים, מכלל אוכלוסיית הגפרורים המיוצרת במפעל מסוים).
מחקר הנערך על אוכלוסיית מדגם מכונה סקר. ככל שבחירת המדגם ("דגימה") נעשית באופן התואם יותר את המלצות הסטטיסטיקאים, כלומר באופן המייצג נאמנה יותר את מבנה האוכלוסייה הכללית, כך ניתן להסיק מהסקר מסקנות מדויקות יותר וסבירות יותר על אודות האוכלוסייה הרחבה שאותה מייצג המדגם.
הסיבות לשימוש במדגם
עריכהבסטטיסטיקה נהוג להסיק מסקנות אודות אוכלוסייה מסוימת על סמך מדגם[1]. רק לעיתים רחוקות נערך מחקר בקרב כל האוכלוסייה הנבדקת, זאת משום שכמעט בלתי אפשרי להגיע לכל הפרטים באוכלוסייה שהמחקר רלוונטי להם, אלא אם מדובר שהאוכלוסייה שלהם היא מצומצמת מאוד. מחקרים שנערכים על כלל האוכלוסייה נעשים במסגרת מפקד אוכלוסין. לדוגמה מפקד האוכלוסין והדיור שאותו עורכת הלשכה המרכזית לסטטיסטיקה מדי עשר שנים בערך. הסיבות לכך שמפקדים הם מחקרים נדירים הן:
- עלותו של מפקד עלולה להיות גבוהה מאוד.
- חלק מהמחקרים גורמים לנזק בלתי הפיך לפרטים הנבדקים. אין טעם, למשל, לבדוק אם כל הגפרורים שהמפעל מייצר באמת נדלקים.
- יש מחקרים שאוכלוסיית היעד שלהם כוללת גם פרטים שאי אפשר להשיג לצורך מחקר. לדוגמה, אוכלוסיית המכורים לסמים – לא סביר שמאה אחוז מהמכורים לסמים יודו בדבר לצורך המחקר. דוגמה מובהקת אחרת לזה היא במחקרים ברפואה: מחקר רפואי אינו מתעניין רק באוכלוסיית האנשים שכבר נולדו אלא ב"אוכלוסיית העל" של כל האנשים שעשויים להיוולד.
מדגם מייצג
עריכהמדגם מייצג הוא גודל המדגם המינימלי, בדגימה הסתברותית, המאפשר דיוק ניכר בהסקת המידע הסטטיסטי. גודל זה מושפע הן מגודל האוכלוסייה כולה והן מהשונות שיש באוכלוסייה לגבי התכונה הנחקרת. מדגם מייצג כשמו כן הוא. הוא אמור לייצג את האוכלוסייה שממנה הוא נדגם. הייצוגיות תאפשר לאחר קבלת התוצאות להשליך מהמדגם המצומצם על האוכלוסייה הכללית.
גודל המדגם
עריכהגודל מדגם הוא גורם המשפיע הן על עלות וזמן עריכת המחקר, והן על העוצמה הסטטיסטית של המחקר ועל יכולתו של המדגם לייצג את כלל תת-האוכלוסיות שבאוכלוסייה הנחקרת מאידך. גודל המדגם הנדרש מושפע בעיקר מגודל רווח הסמך הנדרש לתוצאות הסקר, מגודל האוכלוסייה כולה ומהשונות שיש באוכלוסייה לגבי התכונה הנחקרת.
כשנחקרת תכונה המתפלגת באוכלוסייה בהתפלגות נורמלית, באוכלוסייה שניתן להחשיב את גודלה לאין-סופי, גודל המדגם הדרוש הוא , כאשר סיגמא היא סטיית התקן של התכונה הנחקרת באוכלוסייה, E הוא גודל רווח הסמך הדרוש, ו-Z של חצי אלפא הוא גודל התלוי בהתפלגות הנורמלית הסטנדרטית ובמובהקות הדרושה.
סוגי מדגמים
עריכהכמו כל מודל אחר, ככל שקל יותר להשתכנע שהוא מייצג נאמנה את המערכת שהוא מדמה, כך המסקנות המוסקות בעזרתו תקפות יותר. לכן "מדגם מייצג" (ראו למעלה) חייב להיות, בין השאר, מדגם הסתברותי. דהיינו, שלכל פרט באוכלוסייה חייב להיות סיכוי להיכלל במדגם ועל הסיכוי הזה להיות ידוע. סיכוי דגימה ידוע מחייב מסגרת דגימה – רשימה הכוללת את כל הפרטים באוכלוסייה.
כוח השכנוע של מחקרים שנעשים בעזרת מדגמים לא הסתברותיים הוא נמוך יותר, אך לפעמים אין מנוס ממדגמים לא הסתברותיים.
מדגמים הסתברותיים
עריכהמדגם הסתברותי הוא כל מדגם שהפרטים בו נבחרו בעזרת הגרלה מתוך כלל הפרטים שבאוכלוסייה. היכולת לדגום מדגם הסתברותי תלויה באפשרות לקיים הגרלה כזו. כדי לקיים הגרלה כזו יש צורך ברשימה של כלל הפרטים שבאוכלוסייה. רשימה כזו קרויה מסגרת דגימה. במקרים רבים, מסגרת הדגימה היא רשימה מקורבת של כלל הפרטים באוכלוסייה. לדוגמה, רשימת כל התלמידים הרשומים לכל בתי הספר בישראל היא מסגרת דגימה המכילה רשימה מקורבת של כלל הילדים בישראל בין הגילים שש לשמונה עשרה. דוגמה נוספת: פנקס הבוחרים הוא מסגרת דגימה המכילה רשימה מקורבת של כלל אזרחי ישראל מעל גיל 18.
- דגימה אקראית פשוטה
- המדגם ההסתברותי הפשוט ביותר נקרא מדגם אקראי פשוט. במדגם כזה כל פרט ופרט נבחר למדגם בהליך אקראי מתוך מסגרת הדגימה, כך שלכל פרט במסגרת יש אותו סיכוי להיות במדגם. מדגם כזה נותן ייצוג טוב של האוכלוסייה ויכולת הכללה, אך חסרונו הוא שתת-אוכלוסיות קטנות אינן באות בו לידי ביטוי, שכן אין כל ביטחון שאכן תידגם כמות מספקת מאותה תת-אוכלוסייה. לדוגמה, אם מסגרת הדגימה היא רשימת שמות, כל שם ושם נבחר מהרשימה בהגרלת מקומו ברשימה.
- דגימה שיטתית
- בחירת הנדגם הראשון נעשית בהגרלה אקראית ובחירת שאר הנדגמים נעשית לפי יחס מסוים לנדגם הראשון. לדוגמה, אם מסגרת הדגימה היא ספר טלפונים, שמו של הנדגם הראשון מוגרל במקריות מתוך כלל השמות שבספר הטלפונים, שמו של הנדגם השני מופיע בדיוק עשרה עמודים מאוחר יותר בספר הטלפונים, שמו של השלישי מופיע בדיוק עשרה עמודים אחרי השני וכך הלאה. דגימה שיטתית מונעת בחירת פרטים שמקומם במסגרת המדגם סמוך מסיבות שאינן מקריות. למשל, דגימה שיטתית של עשרה אנשים מספר הטלפונים תמנע מצב שבו לרבים מהנדגמים יש אותו שם משפחה משום שהם מאותה העדה.
- דגימת שכבות
- כדי להבטיח ייצוג של תת-אוכלוסיות קטנות במדגם, שלא באות לידי ביטוי בדגימה אקראית פשוטה, ניתן להשתמש בדגימת שכבות. בעת בחירת המדגם, מבטיחים מכסה מסוימת של נדגמים מכל תת-אוכלוסייה. לאחר מכן, בעת הניתוח הסטטיסטי, משוקללות השכבות על מנת שלא ליצור הטיה בשל עודף ייצוג של תת-הקבוצות.
- דגימת אשכולות
- שתי השיטות לעיל הן קשות ליישום באוכלוסיות גדולות (ברמת אוכלוסיית מדינה) משתי סיבות עיקריות: ראשית, מסגרת דגימה אינה זמינה תמיד לאוכלוסיות כאלו ושנית – התפרסות של המדגם על כל אזורי הארץ גוררת הוצאות גבוהות. במקרה כזה נעשה שימוש במדגם אשכולות. האוכלוסייה הנדגמת מחולקת לאשכולות (גאוגרפיים בדרך כלל). לאחר מכן נערכת דגימה אקראית של אשכולות, ובשלב הבא – דגימה אקראית של פרטים מתוך כל אשכול שנבחר.
ניתן לשלב דגימת שכבות ודגימת אשכולות – לדוגמה, לבחור לפי שכבות מסוימות בתוך כל אשכול.
מדגמים לא הסתברותיים
עריכהעריכת מדגם הסתברותי עלולה להיות הליך ארוך ויקר. כמו כן, היא אינה אפשרית כאשר אין מסגרת דגימה. לכן, חוקרים משתמשים פעמים רבות במדגמים לא הסתברותיים.
שיטות שונות לדגימה לא הסתברותית:
- מדגם נוחות
- שיטה זו מתבססת על בחירת הנחקרים הקלים ביותר להשגה עבור עורך המחקר. יתרונה הגדול של שיטה זו הוא המחיר הזול שלה. חסרונותיה הם שהמדגם יהיה בהכרח מקבוצה חברתית מסוימת ולכן לא יהיה מייצג. שיטה זו מקובלת במחקרים ראשוניים (כמו ניסוי פיילוט).
- מדגם מומחים
- מדגם מומחים הוא סוג של מדגם נוחות. במדגם כזה יש משתתפים בודדים המכירים היטב את אוכלוסיית היעד של המחקר ומנסים להעיד בשמה על צרכיה ודעתה. מדגם כזה מקובל בבדיקת אב טיפוס של ציוד טכנולוגי. שלושה עד חמישה מומחים לנגישות יכולים למצוא במחקר כזה בעיות בעיצוב המוצר שיפריעו לאנשים עם לקויות להשתמש בציוד.
- מדגם מתנדבים
- פרסום קריאה לנחקרים, בחינם או תמורת תשלום, וקבלת כל הפונים שנמצאים מתאימים למחקר. לשיטה זו יש חסרונות סטטיסטיים גדולים מזו של דגימת הנוחות משום שקשה לדעת מה הגורמים המטים את הדגימה – החוקר אינו יודע מה גורם לנבדקים לפנות אליו. במקרה שלא ניתן לנהל את הסקר מרחוק (דואר נייר, דואר אלקטרוני, לינק לאתר אינטרנט, ריאיון בטלפון וכיוצא בזה) שיטה זו גם יקרה יותר מדגימת הנוחות משום שהיא כוללת פרסום מודעות בציבור הרחב ועשויה לכלול נסיעות ארוכות לצורך פגישה עם המשתתפים במחקר. מקובל להשתמש בשיטה זו רק כשאין ברירה אחרת.
- מדגם כדור שלג
- לאחר פנייה של החוקר ל"מעגל הראשון" של הנדגמים, הם פונים לחבריהם ומפנים אותם לחוקר וכך הלאה. שיטה זו שימושית במיוחד בחקר תופעות שאינן פומביות, כמו שימוש בסמים. חסרונה העיקרי הוא שהיא דוגמת רשת חברתית אחת.
- מדגם שבו נבחרת, באופן מכוון[2], קבוצה שדומה במדדים רבים ככל האפשר לאוכלוסייה הכללית
- סוג זה של מדגם אינו מקובל במחקר והוא משמש לדברים אחרים, כמו הרכבת חבר מושבעים. במדגם כזה דואגים שאחוז הנשים, בני המיעוטים, העשירים, העניים, הצעירים, הזקנים, המלומדים וכיוצא בזה יהיה דומה ככל האפשר לזה שבאוכלוסייה הכללית. הרכבת מדגם כזה דורשת מאמץ רב של למידה לעומק של פרטיהם הסוציולוגיים של הרבה מאוד אנשים ויש בה מעט מאוד מקום לאקראיות. מדגם כזה עשוי בהחלט להיבחר באופן שבו תוצאות הסקר נקבעו מראש והן אינן גילוי מחקרי.
זיווגים
עריכהדגימת זיווגים יכולה להיות הסתברותית או לא הסתברותית. מחקרים המשתמשים בשיטה זו הם בעלי כוח סטטיסטי רב מאשר מחקרים שאינם משתמשים בה, משום שבשיטה זו כל נבדק מושווה לנבדק נוסף אחד, הדומה לו ככל האפשר בתכונות שאינן נחקרות, בניגוד להשוואה כללית של שתי קבוצות מדגם.
דוגמאות לדגימת זיווגים אקראית:
- דגימות זוגיות בתוך משפחות:
- דגימה אקראית של זוגות תאומים זהים והשוואתם – מחקרי תאומים – למשל, בסקר לשם הערכת הסיכוי של אדם לחלות במחלה מסוימת, אם התאום הזהה שלו כבר חלה בה. סקר מסוג זה יכול להעריך עד כמה מחלה מסוימת תלויה בתורשה.
- מחקרי תאומים זהים ולא זהים – תאומים לא זהים בכל זאת דומים זה לזה יותר משני אחים, כי הם נולדו באותו יום וגדלו באותם תנאים. אחים אחרים עשויים להיות שונים יותר, משום שהבכור היה בן יחיד למשך כמה שנים וכיוצא בזה.
- בחירה אקראית של אנשים, ועבור כל אחד מהם בוחרים גם קרוב משפחה שלו מדרגה ראשונה (בנו, בתו, אחיו, אחותו, אביו או אמו). לקרובי משפחה כאלה יש רקע תורשתי דומה בהרבה מאשר לזרים מוחלטים או לזוגות נשואים.
- דגימה אקראית של זוגות נשואים והשוואתם. למשל, השוואת משכורות של נשים וגברים, אם היא נעשית בין זוגות נשואים, מבטלת את ההשפעה של הגורמים הגאוגרפיים והסוציאליים שיש במדגמים אחרים. כלומר, אם הגברים במדגם כמעט תמיד מרוויחים יותר מהנשים שבו, במדגם זוגות נשואים, אי אפשר לומר שמקום המגורים או הרקע המשפחתי השפיעו על המסקנות, שהרי כל גבר הושווה לאישה שגרה במקום זהה לשלו והיא בת משפחתו.
- דגימת אותו אדם פעמיים ליצירת זוג נדגם:
- דגימה אקראית של אנשים כלשהם ובדיקת כל אדם פעם אחת לפני טיפול מסוים ופעם שנייה אחרי אותו טיפול. כל אדם מושווה כך לעצמו לפני הטיפול ולאחריו.
- בחירה אקראית של אנשים והשוואת תפקוד יד ימינם לתפקוד יד שמאלם.
- זוגות שרירותיים – דגימה של שתי קבוצות אנשים אקראיות והשוואת כל אדם מאחת הקבוצות לזה שהכי דומה לו, סוציולוגית, בקבוצה השנייה. למשל, במדגם לצורך סקר דעות פוליטיות, המשווה בין שתי ערים, תושווה דעתה של אישה בת עשרים ושש, עם 12 שנות השכלה ממוצא ים-תיכוני בעיר א', לדעתה של אישה שוות גיל, השכלה ומוצא בעיר ב', דעתו של גבר בן שלושים עם תואר ראשון ממוצא סקנדינבי בעיר א' תושווה לדעתו של גבר שווה גיל, השכלה ומוצא בעיר ב' וכיוצא בזה.
דגימת זיווגים שאינה אקראית נעשית כאשר קשה למצוא מדגם זיווגים אקראי. למשל, במקרה שבו אוכלוסיית היעד קטנה. את תפקוד הידיים אצל אנשים עם שיתוק מוחין מקובל לבדוק במדגם מזווג שבו אנשים שרק אחת מידיהם פגועה. אצל כל אחד מהם משווים את פעילות היד הפגועה לפעילות היד שאינה פגועה ומסיקים מסקנות על כלל האנשים שידיהם פגועות לעומת כלל האנשים שידיהם אינן פגועות[3].
ראו גם
עריכהקישורים חיצוניים
עריכה- יוסי לוי, סטטיסטיקה רעה: מדגם לא מייצג, בבלוג "נסיכת המדעים"
- יוסי לוי, מהו גודל המדגם המתאים?, בבלוג "נסיכת המדעים
- מדגם, באתר MathWorld (באנגלית)
הערות שוליים
עריכה- ^ שמואל זמיר ורות בייט-מרום (2005). מבוא לסטטיסטיקה לתלמידי מדעי החברה א. רעננה: האוניברסיטה הפתוחה.
- ^ קו עיתונות, מדגם הלמ"ס, 8.5.17
- ^ van Roon, Dominique; Hulstijn, Wouter (2000). "Reciprocal tapping in spastic hemiparesis". Clinical rehabilitation. 14 (6): 592–600. doi:10.1191/0269215500cr366oa. ISSN 0269-2155. PMID 11128733.