PASW Statistics 17

เป็นภาคสอง ต่อเนื่องจากบล็อกที่เขียนไว้ก่อนหน้านั้น หัวข้อ “ความรู้สถิติเบื้องต้น สำหรับการออกแบบสอบถาม” … คราวนี้ อาจารย์ได้สอนวิธีการใช้งานโปรแกรม SPSS โดยให้ทุกคนใช้โปรแกรม PASW Statistics version 17 ที่ทางมหาวิทยาลัยมหิดลซื้อ license มา จำนวน 1,000 users (แต่มีข้อจำกัดคือ ต้องใช้ภายใน network ของมหาวิทยาลัยเท่านั้น และยังมีปัญหานิดหน่อย คือชื่อค่าตัวแปรยังเขียนเป็นภาษาไทยไม่ได้)

ขอเล่าประวัติหน่อยนะ SPSS ย่อมาจาก Statistical Package for the Social Sciences อายุอานามของโปรแกรมนี้ก็ใช้กันมานาน 40 กว่าปีแล้ว ตั้งแต่สมัย Mainframe และใช้บัตรเจาะรู (สมัยเราเรียนปริญญาโท ยังเป็น version 10 รุ่น SPSS-X อยู่เลย ฮ่า ฮ่า) แต่ปัจจุบันบริษัท SPSS Inc. โดนบริษัท IBM ซื้อไป เมื่อปี 2009 กลายเป็น IBM SPSS for Windows รุ่น 17 (และล่าสุด คือรุ่น 18) นอกจากนั้น ยังออกรุ่น premier มาแทนที่ เรียกชื่อโปรแกรมว่า PASW (Predictive Analytics SoftWare) Statistics

การบันทึกข้อมูลด้วยโปรแกรม PASW Statistics
– เตรียมตาราง Data Editors เพื่อกรอกข้อมูล .. แถวตามแนวนอน (row) แทนผู้ตอบแบบสอบถาม 1 ราย / แถวตามแนวตั้ง (column) แทน 1 คำถามในแบบสอบถาม
– เตรียมข้อมูล Variable View กำหนดค่าต่างๆ ซึ่งประกอบด้วย
1. ตัวแปร (Name Variable) ตั้งชื่อยาวไม่เกิน 8 ตัวอักษร เป็นคล้ายๆ ชื่อเล่น เช่น edu
2. ฉลากตัวแปร (Label) เป็นชื่อจริง เช่น education
3. ค่าฉลาก (Value) กำหนดค่า เช่น 1=ชาย 2=หญิง
4. ค่าสูญหาย (Missing) ใช้ 9, 99 (ไม่ตอบ)
5. ชนิดตัวแปร (Variable Type) เช่น numeric (ตัวเลข) string (อักขระ) date (วันที่)
6. รูปแบบสดมภ์ (Column)
7. ระดับการวัด (Measurement) ได้แก่ nominal, ordinal, scale (ซึ่งหมายถึง interval และ ratio)

เราสามารถกรอกข้อมูลไว้ใน excel แล้ว copy มาแปะไว้ใน SPSS ได้ !!

เมื่อกรอกข้อมูลเสร็จแล้ว จะใช้ SPSS ทำการประมวลผลเบื้องต้น เช่น การคำนวณหาค่าร้อยละ ค่าความถี่ ความถี่สะสม และค่าสถิติพรรณนาต่างๆ ได้แก่ mean, median, mode, sum โดยการเลือกคำสั่ง Analyze -> Descriptive statistics -> Frequencies แสดงตารางแจกแจงความถี่ (frequency table) และกราฟแท่งแบบต่อเนื่อง (histogram)

การแปรียบเทียบประชากร 2 กลุ่ม เช่น เพศที่ต่างกัน มีทัศนคติที่ต่างกันหรือไม่ จะใช้คำสั่ง Analyze -> Compare Mean -> Independent sample T-test และดูค่า Sig. หรือ P-value ถ้ามากกว่า 0.05 คือยอมรับสมมุติฐาน ที่ว่าค่าความแปรปรวนเท่ากัน (Equal variances) แต่ถ้าค่า Sig. น้อยกว่า 0.05 แปลว่า ปฏิเสธสมมุติฐาน

ปกติเวลาเขียนบทความตีพิมพ์ เราจะไม่ใช้คำว่าค่า Sig. เพราะคำนี้ใช้เฉพาะโปรแกรม SPSS (อาจถูกฟ้องได้ถ้าไม่ซื้อลิขสิทธิ์โปรแกรม) จะเลี่ยงมาใช้คำว่า P-value แทน และถ้า P-value > 0.05 จะไม่พูดว่า ทัศนคติของผู้ชายและผู้หญิง “เหมือนกัน” แต่จะพูดว่า “แตกต่างกันอย่างไม่มีนัยสำคัญ” แทน

และถ้าประชากรมากกว่า 2 กลุ่ม จะใช้ One-way ANOVA เช่น ทัศนคติจำแนกตามช่วงอายุ ใช้คำสั่ง Analyze -> Compare Mean -> One-way ANOVA ถ้าค่า Sig. ที่ได้ น้อยกว่า 0.05 แสดงว่า มีช่วงอายุบางกลุ่มที่มีทัศนคติไม่เหมือนกลุ่มอื่น สามารถใช้ Post Hoc หาว่าคู่ไหนที่ไม่เหมือนชาวบ้าน โดยมีตัวเลือกย่อยต่างๆ เช่น LSD, Scheffe (ซึ่งนิยมเลือกทั้ง 2 ตัว) หรืองานวิจัยทางด้านชีววิทยา จะนิยมเลือก Duncan, Tukey (แต่ข้อเสียคือ สมาชิกแต่ละกลุ่ม ต้องมีจำนวนเท่ากัน)

ในกรณีที่เป็นตัวแปรนามบัญญัติ (Nominal scale) ทั้งหมด เช่นเพศ หรือสถานภาพ กับชนิดของหนังสือที่อ่าน จะหาค่าความถี่ ร้อยละ และใช้คำสั่ง Analyze -> Descriptive -> Crosstabs -> statistics (Chi-Square test)
ถ้าค่า P-Value > 0.05 แสดงว่ายอมรับสมมุติฐาน Ho ตัวแปรทั้งสองตัวเป็นอิสระต่อกัน

ก่อนจบ .. มีเคล็ดลับนิดหน่อย เกี่ยวกับตัวแปร ที่ใช้รหัสตัวเลข 1,2 แม้จะเป็นตัวแปรนามบัญญัติ เช่น เพศ ก็ให้กำหนดชนิดตัวแปรเป็น numeric ไว้ก่อน (แต่ต้องไม่เอาไปคำนวณค่าเฉลี่ย) .. เพราะถ้ากำหนดเป็น string บางครั้งจะมีปัญหาเวลาทำ grouping variable ได้

โฆษณา