ตัวอย่างหลัก (Master Sample) เทคนิคการวิเคราะห์สถิติ ที่มีบทบาทสำคัญในการเก็บข้อมูลทำวิจัย
ตัวอย่างหลัก (Master Sample) เทคนิคการวิเคราะห์สถิติ ที่มีบทบาทสำคัญในการเก็บข้อมูลทำวิจัย
รศ.ดร.พาชิตชนัต ศิริพานิช หลักสูตรสถิติประยุกต์ คณะสถิติประยุกต์ สถาบันบัณฑิตพัฒนบริหารศาสตร์ พามาทำความรู้จัก การวิเคราะห์สถิติเบื้องต้นที่ใช้กันทั่วไป โดยเฉพาะอย่างยิ่งการวิเคราะห์ข้อมูลเชิงสถิติที่ใช้ Statistical Software เป็นเครื่องมือช่วยในการคำนวณ มักเป็นการวิเคราะห์ข้อมูลภายใต้ข้อสมมุติ (Assumption) ว่าข้อมูลมาจากตัวอย่างสุ่ม (Random Sample) ซึ่งหมายความว่าตัวอย่างได้มาด้วยวิธีการเลือกตัวอย่างสุ่มแบบง่าย (Simple Random Sampling SRS) และเป็นการเลือกตัวอย่างแบบใส่คืน (Sampling with Replacement) ทำให้ค่าสังเกต (Observation) X1 X2 … Xn เป็นอิสระกัน (Independent) มีการแจกแจงเดียวกันและมีค่าพารามิเตอร์ (Parameter) เท่ากัน สมบัติ (Property) ดังกล่าวนี้ในภาษาสถิติเรียกว่า i.i.d. (Independent Identically Distribution)
วิธีการเลือกตัวอย่างสุ่มแบบง่าย (SRS) นี้เป็นวิธีที่ “ง่าย” ต่อการทำความเข้าใจสำหรับบุคคลทั่วไปสมชื่อเพราะมีลักษณะเหมือนการจับฉลากหรือออกรางวัลล็อตเตอรี่ที่คนส่วนมากคุ้นเคย แต่การจับฉลากส่วนใหญ่จะเป็นการเลือกฉลากสุ่มแบบไม่ใส่คืน (Sampling without Replacement) ทำให้ไม่ได้ฉลากซ้ำแต่การออกรางวัลล็อตเตอรี่อาจมีเลขซ้ำได้ทั้งในแต่ละรางวัลและระหว่างรางวัลต่าง ๆ ด้วย ในการเลือกตัวอย่างแบบ SRS มีข้อจำกัดว่าต้องมีกรอบตัวอย่าง (Sampling Frame) สมบูรณ์ เช่น การเลือกตัวอย่างผู้สูงอายุในหมู่บ้านแห่งหนึ่งซึ่งผู้ใหญ่บ้านมีรายชื่อผู้สูงอายุทุกคนในหมู่บ้านและยังทราบว่าแต่ละคนอยู่อาศัย ณ ที่ใด ดังนั้นการเลือกตัวอย่างสุ่มแบบ SRS จึงดำเนินการได้โดยง่ายด้วยวิธีจับฉลากรายชื่อหรือใช้คอมพิวเตอร์ช่วยในการสุ่ม อย่างไรก็ตามในการเก็บรวบรวมข้อมูลจากประชากรที่มีขนาดใหญ่ การเลือกตัวอย่างสุ่มแบบ SRS ย่อมเป็นไปโดยยาก เช่น การเลือกตัวอย่างผู้สูงอายุในประเทศไทย แม้จะมีชื่อที่อยู่ตามทะเบียนราษฎร์แต่นักวิจัยทั่วไปไม่อาจเข้าถึงฐานข้อมูลนั้นได้ สิ่งที่พอจะหาได้คือจำนวนรวมของผู้สูงอายุจำแนกตามเพศ อายุ และพื้นที่อยู่อาศัย (หมู่บ้าน ตำบล/แขวง อำเภอ/เขต จังหวัด) ตามทะเบียนราษฎร์เท่านั้น ซึ่งไม่ใช่กรอบตัวอย่างที่จะสามารถใช้ในการสุ่มตัวอย่างได้ รายชื่อและที่อยู่ของผู้สูงอายุในเขตพื้นที่เล็ก ๆ เช่น หมู่บ้านหรือตำบล (อบต.) อาจพอหาได้บ้าง ดังนั้นถ้าต้องการกรอบตัวอย่างของทั้งประเทศก็จำเป็นต้องสร้างขึ้นเอง การสร้างกรอบตัวอย่างสมบูรณ์สำหรับประชากรขนาดใหญ่มีค่าใช้จ่ายสูงมาก มีเพียงบางองค์กรเท่านั้นที่จำเป็นต้องทำและทำได้ เช่น สำนักงานสถิติแห่งชาติ อย่างไรก็ตาม ในกรณีที่ไม่มีกรอบตัวอย่างสมบูรณ์นักวิจัยอาจใช้แผนการเลือกตัวอย่างทางสถิติที่ไม่จำเป็นต้องมีกรอบตัวอย่างสมบูรณ์ เช่น การเลือกตัวอย่างหลายขั้น (Multi-stage Sampling)
ในที่นี้ขอนำเสนอเทคนิคทางสถิติที่เรียกว่าตัวอย่างหลัก(Master Sample MS) ซึ่งเหมาะสำหรับกรณีที่มีการสำรวจตัวอย่าง (Sample Survey) จากประชากร (Population) เดิมหลายครั้งหรือหลายรอบ เช่น การสำรวจครัวเรือน (Household Survey) ทั่วประเทศเป็นประจำทุก 1 – 2 ปี หรือการสำรวจความคิดเห็นของสาธารณชน (Public Opinion Poll) การสร้างตัวอย่างหลัก ไว้ใช้เสมือนเป็นกรอบตัวอย่างในการเลือกตัวอย่างย่อย (Subsample) ที่เป็นตัวอย่างสุ่มสำหรับการศึกษาแต่ละครั้ง
องค์การสหประชาชาติ (United Nations 1986) ให้นิยามตัวอย่างหลักไว้ว่า “A master sample is a sample from which subsamples can be selected to serve the needs of more than one survey or survey round” เห็นได้ว่า การสร้างตัวอย่างสุ่มขนาดใหญ่ (ตัวอย่างหลัก) เป็นประโยชน์แก่นักวิจัยที่ต้องการสำรวจตัวอย่างหลายครั้งจากประชากรเดียวกัน เช่น สำนักงานสถิติแห่งชาติของหลายประเทศมักมีตัวอย่างหลักไว้ใช้ในการสำรวจเรื่องต่าง ๆ อันเป็นผลมาจากการทำสำมะโนประชากรและการเคหะ (Population and Housing Census) ที่ต้องสร้างกรอบตัวอย่างในรูปของแผนที่ของครัวเรือน (Household) บนพื้นที่ต่าง ๆ ครอบคลุมทั้งประเทศเพื่อให้พนักงานสัมภาษณ์เข้าไปเก็บรวบรวมข้อมูลได้ทั่วถึงและครบถ้วน หลังจากทำสำมะโนประชากรฯ แล้วจะเก็บบางส่วนของแผนที่ครัวเรือนนั้นไว้ โดยปรับปรุง แก้ไข และ update สม่ำเสมอ เพื่อใช้เป็นตัวอย่างหลัก (กรอบตัวอย่าง) สำหรับการสำรวจเรื่องอื่น ๆ ที่ประชากรของการสำรวจคือครัวเรือนของทั้งประเทศหรือบางส่วน เช่น การสำรวจภาวะเศรษฐกิจและสังคมของครัวเรือน (Household Socio-Economic Survey HSES) ดังนั้นแทนที่จะใช้จ่ายเงินในการสร้างกรอบตัวอย่างใหม่สำหรับการสำรวจแต่ละครั้ง ก็ใช้ตัวอย่างหลักเดิมที่มีการ update ข้อมูลให้เป็นปัจจุบันแล้ว ค่าใช้จ่ายในการ update ก็เฉลี่ยกันไประหว่างการสำรวจหลายครั้ง การทำสำมะโนประชากรฯ นี้เป็นคำแนะนำ (Recommends) ขององค์การสหประชาชาติ (United Nations) ให้แต่ละประเทศดำเนินการทุก 10 ปีเป็นอย่างน้อย หรือบางประเทศที่มีศักยภาพมากพออาจดำเนินการทุก 5 ปี ดังนั้นการเก็บแผนที่ครัวเรือนบางส่วนไว้เป็นตัวอย่างหลักก็ช่วยลดค่าใช้จ่ายและเวลาในการทำกรอบตัวอย่างสมบูรณ์สำหรับการสำรวจสำมะโนครั้งต่อไปได้พอสมควรด้วย
การสร้างตัวอย่างหลักที่ดีต้องเป็นตัวอย่างที่เลือกมาแบบสุ่ม(Random Selection) มีขนาดใหญ่ที่นับว่าเป็นตัวแทนของประชากร (Population Representative) มีข้อมูลเบื้องต้นเพื่อใช้ประกอบการเลือกตัวอย่างย่อย (Subsample) โดยข้อมูลดังกล่าวต้องมีการ Update และตรวจสอบ Validity สม่ำเสมอ
นอกจากตัวอย่างหลักช่วยให้สามารถเลือกตัวอย่างสุ่มสำหรับการวิจัยได้แล้ว ยังมีข้อดีอีกมากมายตั้งแต่ความคุ้มค่าในการสร้างกรอบตัวอย่างที่ใช้ได้กับการสำรวจหลายครั้งหรือหลายรอบ ซึ่งทำให้ค่าใช้จ่ายเฉลี่ยกันไประหว่างการสำรวจหลายครั้ง ลดเวลาในขั้นตอนการเตรียมกรอบตัวอย่างสำหรับการสำรวจ ลดความยุ่งยากในการดำเนินการสำรวจ การมีข้อมูลเบื้องต้น (ลักษณะทั่วไปของหน่วยตัวอย่าง) ก็ช่วยลดเวลาและค่าใช้จ่ายในการเก็บรวบรวมข้อมูลด้วย รวมทั้งมีข้อดีอื่น ๆ เฉพาะด้านเป็นรายกรณี แต่ในทางตรงกันข้าม ตัวอย่างหลักก็มีข้อเสียหลายประการด้วยกัน กล่าวคือตัวอย่างหลักหนึ่ง ๆ มีข้อจำกัดที่ไม่เหมาะสมสำหรับการสำรวจบางอย่าง เช่น ตัวอย่างหลักของนิด้าโพลก็เหมาะสมสำหรับการเก็บรวบรวมข้อมูลแบบใช้การสัมภาษณ์ทางโทรศัพท์ (Telephone Survey) ที่มีข้อถามไม่มากนักแบบโพลสาธารณะที่ดำเนินการอยู่ แต่ไม่เหมาะกับเทคนิคการเก็บรวบรวมข้อมูลแบบอื่น และยังอาจทำให้เกิดความเอนเอียง (Bias) ในการเลือกตัวอย่างในบางกรณี นอกจากนี้การสร้าง การรักษาปรับปรุง เพิ่มเติม (ขยายขนาด) และ update ตัวอย่างหลักมีค่าใช้จ่ายค่อนข้างสูง แต่ถ้ามีการใช้ตัวอย่างหลักเพื่อการสำรวจหลายครั้งค่าใช้จ่ายก็จะยิ่งเฉลี่ยกันออกไป เห็นได้ว่าโดยมากแล้วนักวิจัยคนใดคนหนึ่งอาจไม่สามารถสร้างตัวอย่างหลักได้ จำเป็นต้องเกิดกับองค์กรหรือกลุ่มนักวิจัยที่ช่วยกันสร้าง ช่วยกันใช้ และช่วยกันดูแลรักษาปรับปรุง อย่างไรก็ตามองค์กรที่สร้างตัวอย่างหลักบางแห่งก็ให้บริการเลือกตัวอย่าง (Sampling Selection) หรือเก็บรวบรวมข้อมูลโดยใช้ตัวอย่างหลักที่มีภายใต้ข้อกำหนดบางประการ เช่น สำนักงานสถิติแห่งชาติ (NSO) และนิด้าโพล