PASW Statistics 17

เป็นภาคสอง ต่อเนื่องจากบล็อกที่เขียนไว้ก่อนหน้านั้น หัวข้อ “ความรู้สถิติเบื้องต้น สำหรับการออกแบบสอบถาม” … คราวนี้ อาจารย์ได้สอนวิธีการใช้งานโปรแกรม SPSS โดยให้ทุกคนใช้โปรแกรม PASW Statistics version 17 ที่ทางมหาวิทยาลัยมหิดลซื้อ license มา จำนวน 1,000 users (แต่มีข้อจำกัดคือ ต้องใช้ภายใน network ของมหาวิทยาลัยเท่านั้น และยังมีปัญหานิดหน่อย คือชื่อค่าตัวแปรยังเขียนเป็นภาษาไทยไม่ได้)

ขอเล่าประวัติหน่อยนะ SPSS ย่อมาจาก Statistical Package for the Social Sciences อายุอานามของโปรแกรมนี้ก็ใช้กันมานาน 40 กว่าปีแล้ว ตั้งแต่สมัย Mainframe และใช้บัตรเจาะรู (สมัยเราเรียนปริญญาโท ยังเป็น version 10 รุ่น SPSS-X อยู่เลย ฮ่า ฮ่า) แต่ปัจจุบันบริษัท SPSS Inc. โดนบริษัท IBM ซื้อไป เมื่อปี 2009 กลายเป็น IBM SPSS for Windows รุ่น 17 (และล่าสุด คือรุ่น 18) นอกจากนั้น ยังออกรุ่น premier มาแทนที่ เรียกชื่อโปรแกรมว่า PASW (Predictive Analytics SoftWare) Statistics

การบันทึกข้อมูลด้วยโปรแกรม PASW Statistics
– เตรียมตาราง Data Editors เพื่อกรอกข้อมูล .. แถวตามแนวนอน (row) แทนผู้ตอบแบบสอบถาม 1 ราย / แถวตามแนวตั้ง (column) แทน 1 คำถามในแบบสอบถาม
– เตรียมข้อมูล Variable View กำหนดค่าต่างๆ ซึ่งประกอบด้วย
1. ตัวแปร (Name Variable) ตั้งชื่อยาวไม่เกิน 8 ตัวอักษร เป็นคล้ายๆ ชื่อเล่น เช่น edu
2. ฉลากตัวแปร (Label) เป็นชื่อจริง เช่น education
3. ค่าฉลาก (Value) กำหนดค่า เช่น 1=ชาย 2=หญิง
4. ค่าสูญหาย (Missing) ใช้ 9, 99 (ไม่ตอบ)
5. ชนิดตัวแปร (Variable Type) เช่น numeric (ตัวเลข) string (อักขระ) date (วันที่)
6. รูปแบบสดมภ์ (Column)
7. ระดับการวัด (Measurement) ได้แก่ nominal, ordinal, scale (ซึ่งหมายถึง interval และ ratio)

เราสามารถกรอกข้อมูลไว้ใน excel แล้ว copy มาแปะไว้ใน SPSS ได้ !!

เมื่อกรอกข้อมูลเสร็จแล้ว จะใช้ SPSS ทำการประมวลผลเบื้องต้น เช่น การคำนวณหาค่าร้อยละ ค่าความถี่ ความถี่สะสม และค่าสถิติพรรณนาต่างๆ ได้แก่ mean, median, mode, sum โดยการเลือกคำสั่ง Analyze -> Descriptive statistics -> Frequencies แสดงตารางแจกแจงความถี่ (frequency table) และกราฟแท่งแบบต่อเนื่อง (histogram)

การแปรียบเทียบประชากร 2 กลุ่ม เช่น เพศที่ต่างกัน มีทัศนคติที่ต่างกันหรือไม่ จะใช้คำสั่ง Analyze -> Compare Mean -> Independent sample T-test และดูค่า Sig. หรือ P-value ถ้ามากกว่า 0.05 คือยอมรับสมมุติฐาน ที่ว่าค่าความแปรปรวนเท่ากัน (Equal variances) แต่ถ้าค่า Sig. น้อยกว่า 0.05 แปลว่า ปฏิเสธสมมุติฐาน

ปกติเวลาเขียนบทความตีพิมพ์ เราจะไม่ใช้คำว่าค่า Sig. เพราะคำนี้ใช้เฉพาะโปรแกรม SPSS (อาจถูกฟ้องได้ถ้าไม่ซื้อลิขสิทธิ์โปรแกรม) จะเลี่ยงมาใช้คำว่า P-value แทน และถ้า P-value > 0.05 จะไม่พูดว่า ทัศนคติของผู้ชายและผู้หญิง “เหมือนกัน” แต่จะพูดว่า “แตกต่างกันอย่างไม่มีนัยสำคัญ” แทน

และถ้าประชากรมากกว่า 2 กลุ่ม จะใช้ One-way ANOVA เช่น ทัศนคติจำแนกตามช่วงอายุ ใช้คำสั่ง Analyze -> Compare Mean -> One-way ANOVA ถ้าค่า Sig. ที่ได้ น้อยกว่า 0.05 แสดงว่า มีช่วงอายุบางกลุ่มที่มีทัศนคติไม่เหมือนกลุ่มอื่น สามารถใช้ Post Hoc หาว่าคู่ไหนที่ไม่เหมือนชาวบ้าน โดยมีตัวเลือกย่อยต่างๆ เช่น LSD, Scheffe (ซึ่งนิยมเลือกทั้ง 2 ตัว) หรืองานวิจัยทางด้านชีววิทยา จะนิยมเลือก Duncan, Tukey (แต่ข้อเสียคือ สมาชิกแต่ละกลุ่ม ต้องมีจำนวนเท่ากัน)

ในกรณีที่เป็นตัวแปรนามบัญญัติ (Nominal scale) ทั้งหมด เช่นเพศ หรือสถานภาพ กับชนิดของหนังสือที่อ่าน จะหาค่าความถี่ ร้อยละ และใช้คำสั่ง Analyze -> Descriptive -> Crosstabs -> statistics (Chi-Square test)
ถ้าค่า P-Value > 0.05 แสดงว่ายอมรับสมมุติฐาน Ho ตัวแปรทั้งสองตัวเป็นอิสระต่อกัน

ก่อนจบ .. มีเคล็ดลับนิดหน่อย เกี่ยวกับตัวแปร ที่ใช้รหัสตัวเลข 1,2 แม้จะเป็นตัวแปรนามบัญญัติ เช่น เพศ ก็ให้กำหนดชนิดตัวแปรเป็น numeric ไว้ก่อน (แต่ต้องไม่เอาไปคำนวณค่าเฉลี่ย) .. เพราะถ้ากำหนดเป็น string บางครั้งจะมีปัญหาเวลาทำ grouping variable ได้

ความรู้สถิติเบื้องต้น สำหรับการออกแบบสอบถาม

10-11 พฤษภาคม 2553 ที่ผ่านมา ห้องสมุดสตางค์ ได้เรียนเชิญ รศ. ศิริลักษณ์ สุวรรณวงศ์ จากภาควิชาคณิตศาสตร์ มาให้ความรู้เกี่ยวกับสถิติและการใช้โปรแกรม SPSS แก่พวกเรา .. อาจารย์เห็นว่าหน่วยงานต่างๆภายในคณะวิทยาศาสตร์ของเราพักนี้ชอบ “ออกแบบสอบถาม” นั่นนี่ กันมากมาย ก็เลยเอาเรื่องนี้มาสอนพวกเราด้วย จะได้มีความรู้ ไม่ออกแบบสอบถามอะไรที่ไม่เข้าท่า ก่อความรำคาญให้แก่ผู้คน อาจารย์สอนได้ไม่โหด แต่ มัน-ฮา มาก ได้ความรู้มาเพียบ .. ต้องขอขอบพระคุณอาจารย์มา ณ ที่นี้ด้วยค่ะ

สรุปความรู้ที่เรียนมาไว้ในบล็อกนี้ ครบบ้างไม่ครบบ้าง ก็ขออภัยนะคะ

การเก็บรวบรวมข้อมูล สำหรับงานวิจัยเชิงสำรวจ เป็นการเก็บรวบรวมข้อมูลจากแหล่งข้อมูลแบบปฐมภูมิ หรือทุติยภูมิ โดยใช้เครื่องมือต่างๆ ได้แก่

  1. แบบสอบถาม (Questionaire)
  2. แบบสัมภาษณ์ (Interview)
  3. แบบสังเกต (Observation) .. แอบดูพฤติกรรมอยู่ห่างๆ
  4. การมีส่วนร่วม (Participant Observation) .. ปลอมตัวเข้าไปร่วมทำกิจกรรมด้วย

สาระในแบบสอบถาม มี 4 ประเภท (ไม่ต้องมีให้ครบก็ได้)

  1. “คุณสมบัติประจำตัว” หรือข้อมูลทั่วไปของผู้ตอบแบบสอบถาม .. ไม่ควรให้เขียนชื่อ หรือสอบถามข้อมูลละเอียดจนเดาได้ว่าเป็นใคร! และอะไรถ้าไม่ใช้ ไม่เอามาวิเคราะห์ ก็ไม่ต้องถาม!
  2. “ทัศนคติ” ความคิดเห็น หรือความเชื่อ .. เป็นข้อถามเกี่ยวกับความรู้สึกนึกคิด (ชอบมากที่สุด –> น้อยที่สุด) เป็นเรื่องส่วนบุคคล คนย่อมคิดไม่เหมือนกัน ไม่มีผิดหรือถูก
  3. “ความรู้” (Knowledge) เป็นข้อถามเกี่ยวกับความรู้ความเข้าใจ เช่น รู้จักบริการนี้หรือไม่ ? มีทั้งถูกและผิด ตอบถูกก็คือถูก ตอบผิดก็คือผิด
  4. “พฤติกรรม” เป็นข้อถามที่เกี่ยวข้องกับพฤติกรรมของผู้ตอบแบบสอบถาม

ประเภทของข้อถาม
1. ข้อถามแบบปลายเปิด (เขียนอะไรก็ได้ แต่จะประมวลด้วยคอมพิวเตอร์ไม่ได้ ต้องอ่านเอาเอง)
2. ข้อถามแบบปลายปิด (มี choice ให้เลือก A,B,C,D, .. อาจเพิ่มข้อ อื่นๆ (โปรดระบุ) ..)
2.1 ข้อถามปลายปิด ที่มีคำตอบ 2 ทางเลือก
2.2 มีหลายตัวเลือก แต่ต้องเลือกตัวเดียว
2.3 ข้อถามแบบ เลือกตอบได้มากกว่า 1 ตัวเลือก
2.4 ข้อถามแบบจัดอันดับ (ranking question)
2.5 ข้อถามการจัดลำดับทัศนคติ

การจัดลำดับทัศนคติ นิยมใช้ Likert Scale เป็นการให้สเกลคำตอบ 5 ระดับคือ 5 (เห็นด้วยอย่างยิ่ง) 4 (เห็นด้วย) 3 (ปานกลาง) 2 (ไม่เห็นด้วย) 1 (ไม่เห็นด้วยอย่างยิ่ง) หรือ Semantic Differential Scale เป็นการให้สเกลคำตอบ 7 ระดับ
รวดเร็ว 7 6 5 4 3 2 1 ล่าช้า
ประทับใจ 7 6 5 4 3 2 1 ไม่ประทับใจ
หรือใช้ Thurstone’ s Scale ซึ่งมี 11 ระดับ นิยมใช้ในทางการแพทย์
(อาจเติมตัวเลือก ในกรณีที่ตอบไม่ได้ ไม่เคยใช้บริการ ไม่มีความเห็น เข้าไปด้วยก็ได้)

แบบสอบถามของเรา ต้องมีทั้ง Reliable และ Valid

คุณภาพของเครื่องมือ

  1. ความเที่ยงตรง (Valid) มีความถูกต้อง เครื่องมือที่มีความเที่ยงตรง หมายถึง เครื่องมือที่สามารถวัดได้ในสิ่งที่ต้องการวัด (ไม่ใช่ถามวิชาเลข แต่ชอบใช้คำศัพท์ยากๆ ในข้อสอบ ยังกับวัดความรู้ภาษา!) ต้องเป็นความเที่ยงตรงตามเนื้อหา (Content validity) อาศัยค่าสถิติที่สำคัญคือ ค่าความสอดคล้องระหว่างข้อถามกับวัตถุประสงค์หรือเนื้อหา IOC (Index of Item Objective Congruence) หรือดัชนีความเหมาะสม ใช้ผู้เชี่ยวชาญหลายๆ คนมาวัด แล้วหาค่าเฉลี่ย ให้คะแนน +1 (ตรง) 0 (ไม่แน่ใจ) -1 (ไม่ตรง) ข้อถามที่มีค่า 05-1.0 มีค่าความเที่ยงตรงสูง ถ้าต่ำกว่า 0.5 ต้องปรับปรุง
  2. ความเชื่อมั่น (Reliability) มีความแม่นยำ วัดกี่ครั้งก็เหมือนเดิม (ถ้าเป็นข้อสอบ สอบกี่ครั้งเด็กก็ตอบได้เหมือนเดิม ถ้าไม่ไปดูหนังสือเพิ่ม) ทัศนคติ ควรคงที่ ถ้าไม่มีอะไรมากระทบ การหาความเชื่อมั่นของแบบสอบถาม ใช้สัมประสิทธิ์แอลฟา (alpha-cofficient) ของครอนบาค (Cronbach) ค่าแอลฟาที่ใช้ควรมากกว่า 0.6 ถ้าน้อยกว่านั้น ควรปรับปรุงแบบสอบถาม หรืออาจตัดบางข้อทิ้ง (Aplha if Item Deleted)
  3. ความเป็นปรนัย (Objectivity) ถ้าเป็นข้อสอบ ใครตรวจก็ได้คะแนนเหมือนกัน
  4. ความยาก (Difficulty) แบบทดสอบมาตรฐาน มีค่าความยาก อยู่ระหว่าง 0.25-2.75 (ยาก -> ง่าย) แต่ถ้าเป็นข้อสอบควรมีความยาก ต่ำกว่า 0.25 (และเห็นว่ามหาวิทยาลัย ควรทำคลังข้อสอบกันได้แล้ว!)
  5. อำนาจจำแนก (Discrimination) ในข้อสอบต้องมีตัวนี้จะได้แยกเด็กเก่ง-ไม่เก่ง แบบสอบถามทัศนคติจำเป็นต้องมีด้วยเช่นกัน .. แบ่งออกเป็น 2 กลุ่ม สูตรที่ใช้ ใช้ t-test ซึ่งขึ้นกับ degree of freedom จำนวนคนตอบ มาก->น้อย

จำนวนแบบสอบถามที่ควรแจก ใช้สูตรคำนวณว่า จำนวนแบบสอบถาม = จำนวนตัวอย่างที่ต้องการ / อัตราการตอบ ตัวอย่างเช่น ถ้าต้องการคำตอบกลับมา 50 ราย และอัตราการตอบอยู่ที่ 10% หรือ 0.1 ดังนั้นจะต้องแจกแบบสอบถามไปทั้งสิ้น 50/0.1 = 500 ชุด .. และควรทำ pre-test ด้วย เพื่อตรวจสอบคุณภาพของเครื่องมือ ซึ่งไม่มีข้อจำกัดว่าจะ pre-test สักกี่คน อาจจะ 10-15 คนก็ได้ แต่ต้องเลือกคนที่ตอบจริงใจหน่อยนะ !

การใช้โปรแกรม SPSS ในการวิเคราะห์คุณภาพของเครื่องมือ
(มหาวิทยาลัยมหิดล ซื้อ license SPSS แล้ว 1,000 users)
– ใช้วิเคราะห์ความเที่ยงตรง (Valid) : หาค่า IOC
– ใช้วิเคราะห์ความเชื่อมั่น (Reliability) : หาค่าสัมประสิทธิ์แอลฟ่า Cronbach’s Apha Coeffient (เป็นการวัดทัศนคติ ไม่ใช่วัดข้อเท็จจริง) เลือกเมนู Analyze -> Scale -> Reliability Analysis (Model = Alpha)

แบบสอบถามที่แจกไปแล้ว วิเคราะห์อะไรได้บ้าง นอกจากหาค่าร้อยละ ??

สถิติที่น่าศึกษา เช่น
ตัวเลขเชิงปริมาณ ได้แก่ น้ำหนัก ส่วนสูง อายุ รายได้ รายจ่าย คะแนน ฯลฯ เอามาหาร และหาค่าเฉลี่ยได้ ใช้ parametric test ต่างๆ เช่น t-test, f-test
ตัวเลขเชิงคุณภาพ ได้แก่ เพศ คณะ ภาควิชา ระดับการศึกษา ตำแหน่ง ฯลฯ หาค่าเฉลี่ยไม่ได้ วัดได้ว่ามีกี่ % แล้วดูว่ามีนัยสำคัญหรือไม่
ค่าคะแนนทัศนคติ 5 4 3 2 1 ดูเหมือนจะเป็นเชิงคุณภาพ แต่จะคิดเป็นเชิงปริมาณก็ได้ เช่นระดับคะแนนของนักศึกษา A=5, B=4, C=3, D=2, F=1

มาตรวัดตัวแปร
1. ตัวแปรนามบัญญัติ (Nominal Scale) แบ่งพรรคแบ่งพวกได้ เช่น เพศ คณะ ภาควิชา ตำแหน่ง ช่วงอายุ ฯลฯ ใช้สถิติความถี่ : ร้อยละ เปอร์เซ็นต์ การนำเสนอข้อมูล : เป็นรูปกราฟแท่ง กราฟวงกลม

2. ตัวแปรอันดับ (Ordinal Scale) จัดอันดับได้ เช่น เกรด A, B, C ที่ 1,2,3 (แต่ไม่รู้ว่าที่ 1 เก่งกว่าที่ 2 เท่าไหร่) ระดับความคิดเห็น คะแนนทัศนคติ (บางครั้งระดับการศึกษา เช่น ประถม มัธยม อุดมศึกษา ก็อาจเป็นตัวแปรอันดับ) สถิติที่ใช้ : ความถี่ ร้อยละ การนำเสนอข้อมูล : รูปกราฟแท่ง กราฟวงกลม

3. ตัวแปรอันตรภาค (Interval Scale) ข้อมูลเป็นตัวเลข คูณ หาร บวก ลบ ยกกำลังได้ แต่ไม่มีศูนย์แท้จริง เช่น คะแนนสอบ เกรดเฉลี่ย อุณหภูมิ (อุณหภูมิ 0 องศา ไม่ได้แปลว่าไม่มีความร้อน) คะแนนทัศนคติ สถิติที่ใช้ : ค่าเฉลี่ย ส่วนเบี่ยงเบนมาตรฐาน การนำเสนอข้อมูล : รูปแผนภูมิกล่อง แผนภูมิต้นไม้ (ต้น-ใบ) แผนภาพกระจาย

4. ตัวแปรอัตราส่วน (Ratio Scale) เช่น รายได้ รายจ่าย อายุ อายุงาน น้ำหนัก (ศูนย์สนิท เช่น มีเงิน 0 บาท หมายถึง ไม่มีเงินเลย) สถิติที่ใช้ : ค่าเฉลี่ย ส่วนเบี่ยงเบนมาตรฐาน การนำเสนอข้อมูล : รูปแผนภูมิกล่อง แผนภูมิต้นไม้ (ต้น-ใบ) แผนภาพกระจาย

(คะแนนทัศนคติ อาจเป็น Ordinal หรือ Interval ก็ได้ แล้วแต่จะมอง)

นอกจากนั้น อาจารย์ยังได้อธิบายวิธีการลงรหัส/สร้างรหัสลงบนแบบสอบถาม เพื่อเตรียมวิเคราะห์ข้อมูล เช่น เพศ 1=ชาย, 2=หญิง, 9=ไม่ระบุ (เป็น nominal) / อายุ 1=18-30 ปี, 2=31-45 ปี, 3=46-55 ปี, 4=56-60 ปี, 9=ไม่ตอบ (เป็น nominal) / อายุงาน ….ปี ใช้ค่าตามความเป็นจริง คือ 0-43 ปี, 99=ไม่ตอบ (เป็น ratio)

ต้องการวิเคราะห์เป็นรายข้อ / รายด้าน (ข้อ 1+ข้อ 2+ข้อ 3) / หรือทั้งหมด (ด้านที่ 1+ด้านที่ 2+ด้านที่ 3) อาจรวม หรือแยกถามก็ได้ ถ้ายอมรับว่าคะแนนทัศนคติเป็นตัวแปรอันตรภาค ก็จะใช้ค่าเฉลี่ย และส่วนเบี่ยงเบนมาตรฐาน และใช้แผนภูมิกล่อง หรือแผนภูมิต้น-ใบ

ถ้าถามแค่มีเพศหญิงกี่คน เพศชายกี่คน ที่ตอบแบบสอบถาม หาค่าร้อยละ .. มันน้อยไป (ถ้าไม่ใช้ ก็ไม่ต้องถาม !)
– ต้องการทราบหรือไม่ว่า … เพศที่ต่างกัน จะมีคะแนนทัศนคติที่ต่างกัน ?
– ต้องการทราบหรือไม่ว่า … หน่วยงานสังกัดที่ต่างกัน จะมีคะแนนทัศนคติที่ต่างกัน ?
– ต้องการทราบหรือไม่ว่า … อายุงานที่ต่างกัน จะมีคะแนนทัศนคติที่ต่างกัน ?

ตัวแปรต้น (หมายถึง ต้นเหตุ ที่ทำให้ตัวแปรตาม เปลี่ยนแปลงไป)
ตัวแปรต้น ได้แก่ เพศ หน่วยงานที่สังกัด ช่วงอายุ (nominal) / อายุงาน (ratio)
ตัวแปรตาม ได้แก่ คะแนนทัศนคติ (Interval)

เพศ (ชาย หญิง) และหน่วยงาน (ส่วนกลาง ส่วนภูมิภาค) แบ่งเป็น 2 ระดับ ใช้ T-independent Test
ส่วนช่วงอายุ มีมากกว่า 2 ระดับ ใช้ One-way ANOVA