สถิติที่ใช้ในงานวิจัย

ทบทวนความรู้เบื้องต้นเกี่ยวกับสถิติที่ใช้ในงานวิจัยกันหน่อย … เอาแต่หัวข้อสรุปๆนะ รายละเอียดไปหาอ่านเอาเอง สถิติมี 2 ประเภท คือ

1. สถิติพรรณนา (Descriptive statistics) เป็นสถิติที่ใช้ในการสรุปข้อมูลที่ได้มาจากกลุ่มตัวอย่าง โดยไม่มีการอ้างอิงไปยังประชากร แต่เป็นการบรรยายลักษณะข้อมูลเท่านั้น เช่น การแจกแจงความถี่ (frequency distribution) การวัดแนวโน้มเข้าสู้ส่วนกลาง การวัดการกระจายของข้อมูล ฯลฯ การนำเสนอผลการวิเคราะห์ข้อมูลพรรณนาจะอยู่ในรูปตาราง (table) และแผนภูมิ (Chart) ชนิดต่างๆ

2. สถิติอ้างอิง (Inferential statistics) หรือสถิติอนุมาน เป็นสถิติที่ใช้เพื่อนำผลสรุปที่คำนวณได้จากการสุ่มตัวอย่าง ไปอธิบายหรือสรุปลักษณะของประชากรทั้งหมด วิธีที่ใช้ในการสรุปอ้างอิงไปยังกลุ่มประชากรนั้น คือ การประมาณค่า (Estimation) และการทดสอบสมมติฐาน (Hypothesis testing) การวิเคราะห์ความแปรปรวน (analysis of variance) การวิเคราะห์ความถดถอยและสหสัมพันธ์ (regression and correlation analysis) สถิติอ้างอิงจำแนกเป็น 2 ชนิดคือ แบบอ้างอิงพารามิเตอร์ (Parametric statistics) (ทดสอบสมมุติฐานโดยใช้สถิติ t-test, z-test, ANOVA, regression analysis ตัวแปรที่ต้องการวัดเป็น interval scale กลุ่มตัวอย่างจะต้องมีการแจกแจงเป็นโค้งปกติ กลุ่มประชากรจะต้องมีความแปรปรวนเท่ากัน) และแบบไม่อ้างอิงพารามิเตอร์ (Nonparametric statistics) (ใช้สถิติ chi-square, medium test, sign test กลุ่มตัวอย่างเป็น free distribution เป็นกลุ่มตัวอย่างขนาดเล็ก ไม่ทราบลักษณะการแจกแจงของประชากรที่สนใจจะศึกษา)

พารามิเตอร์ หมายถึง ค่าที่ใช้อธิบายคุณลักษณะประชากร (population) เช่น ค่าเฉลี่ยของประชากร (population mean)
ค่าสถิติ หมายถึง ค่าที่ได้จากตัวอย่าง (sample) เช่น ค่าเฉลี่ยของตัวอย่าง (sample mean)

ลักษณะข้อมูลที่ใช้ในงานวิจัย
– ข้อมูลเชิงปริมาณ แบ่งเป็นข้อมูลต่อเนื่อง (continuous data) คือค่าที่มีจุดทศนิยมได้ และข้อมูลไม่ต่อเนื่อง (discrete data) คือค่าที่เป็นจำนวนเต็มหรือจำนวนนับ
– ข้อมูลเชิงคุณภาพ เป็นข้อมูลที่แสดงถึงสถานภาพ คุณลักษณะ หรือคุณสมบัติ เช่น เพศ ตำแหน่ง

หรือจำแนกตัวแปรตามระดับการวัด ได้แก่
นามบัญญัติ (nominal scale) จำแนกความแตกต่างของสิ่งที่ต้องการวัดออกเป็นกลุ่ม เช่น 1=ชาย 2=หญิง ตัวเลขไม่สามารถนำมาบวก ลบ คูณ หาร ได้
เรียงอันดับ (ordinal scale) ใช้สำหรับจัดอันดับที่หรือตำแหน่งของสิ่งที่ต้องการวัด เช่น ระดับการศึกษา ผลการเรียน ความเก่ง ตัวเลขอันดับที่แตกต่างกันไม่สามารถบ่งบอกถึงปริมาณความแตกต่างได้ เช่น ไม่สามารถบอกได้ว่าเก่งกว่ากันเท่าไหร่ ตัวเลขสามารถนำมาบวกหรือลบกันได้
อันตรภาค หรือระดับช่วง (interval scale) กำหนดค่าตัวเลขโดยมีช่วงห่างระหว่างตัวเลขเท่าๆ กัน สามารถนำตัวเลขมาเปรียบเทียบกันได้ว่าว่ามีปริมาณมากน้อยเท่าใด แต่ไม่สามารถบอกได้ว่าเป็นกี่เท่าของกันและกัน เพราะไม่มีศูนย์ที่แท้จริง เช่น คะแนนสอบ อุณหภูมิ (อุณหภูมิ 0 องศา มิได้หมายความว่าจะไม่มีความร้อน) ตัวเลขสามารถนำมาบวก ลบ คูณ หรือหารกันได้
อัตราส่วน (ratio scale) สามารถกำหนดค่าตัวเลขให้กับสิ่งที่ต้องการวัด มีศูนย์แท้ เช่น น้ำหนัก ความสูง อายุ สามารถนำตัวเลขมาบวก ลบ คูณ หาร หรือหาอัตราส่วนกันได้ (เช่น ถนน 50 กิโลเมตร ยาวเป็น 2 เท่าของถนน 25 กิโลเมตร)

หรือจำแนกตามหน้าที่ ได้แก่ ตัวแปรอิสระ (ตัวแปรต้น) และตัวแปรตาม ซึ่งเป็นตัวแปรที่ต้องการศึกษา นอกจากนั้นอาจมีตัวแปรที่ไม่ได้ต้องการศึกษาแต่ต้องควบคุม เช่น ตัวแปรภายนอก (ตัวแปรเกิน หรือตัวแปรแทรกซ้อน) และตัวแปรเชื่อมโยง (ตัวแปรสอดแทรก)

สถิติพรรณนาที่ใช้อธิบายข้อมูลเชิงปริมาณ
– การแจกแจงข้อมูล ความถี่ (Frequency distribution) ร้อยละ (percentage)
– วัดแนวโน้มเข้าสู่ส่วนกลาง ได้แก่ ค่าเฉลี่ย (mean) นำข้อมูลทั้งหมดมารวมกันแล้วหารด้วยจำนวนข้อมูล / มัธยฐาน (median) เป็นสถิติในการจัดอันดับข้อมูล เป็นค่าที่อยู่ตรงกลาง เมื่อนำค่าที่ได้จากการวัดที่นำมาเรียงลำดับจากมากไปน้อย หรือน้อยไปมาก / ฐานนิยม (mode) หรือคะแนนที่มีความถี่สูงที่สุด
– บอกตำแหน่งของข้อมูล ได้แก่ เปอร์เซ็นต์ไทล์ (percentile) เดไซล์ (decide) ควอไทล์ (quartile)
– วัดการกระจายของข้อมูล ได้แก่ พิสัย (range) หรือค่าสูงสุด-ค่าต่ำสุด ส่วนเบี่ยงเบนควอไทล์ (quartile deviation) ส่วนเบี่ยงเบนมาตรฐาน (standard deviation) ความแปรปรวนของข้อมูล (variance)

สถิติพรรณนาที่ใช้อธิบายข้อมูลเชิงคุณภาพ
ได้แก่ ร้อยละ (percentage) สัดส่วน (proportion) อัตราส่วน (ratio) ฐานนิยม (mode)

สถิติพรรณนาที่ใช้อธิบายความสัมพันธ์ระหว่างข้อมูลเชิงปริมาณ
– สัมประสิทธิ์สหสัมพันธ์เชิงเส้นของเพียร์สัน (Pearson’s Correlation Coefficient)
– สัมประสิทธิ์สหสัมพันธ์ของสเปียร์แมน (Spearman’s correlation coefficient)

สถิติพรรณนาที่ใช้อธิบายความสัมพันธ์ระหว่างข้อมูลเชิงคุณภาพ
– สัมประสิทธิ์สหสัมพันธ์ของเครเมอร์วี (Cramer’s V)
– สร้างตารางไขว้แสดงความสัมพันธ์ระหว่างตัวแปร (crosstabulation table)

Advertisements

ความรู้สถิติเบื้องต้น สำหรับการออกแบบสอบถาม

10-11 พฤษภาคม 2553 ที่ผ่านมา ห้องสมุดสตางค์ ได้เรียนเชิญ รศ. ศิริลักษณ์ สุวรรณวงศ์ จากภาควิชาคณิตศาสตร์ มาให้ความรู้เกี่ยวกับสถิติและการใช้โปรแกรม SPSS แก่พวกเรา .. อาจารย์เห็นว่าหน่วยงานต่างๆภายในคณะวิทยาศาสตร์ของเราพักนี้ชอบ “ออกแบบสอบถาม” นั่นนี่ กันมากมาย ก็เลยเอาเรื่องนี้มาสอนพวกเราด้วย จะได้มีความรู้ ไม่ออกแบบสอบถามอะไรที่ไม่เข้าท่า ก่อความรำคาญให้แก่ผู้คน อาจารย์สอนได้ไม่โหด แต่ มัน-ฮา มาก ได้ความรู้มาเพียบ .. ต้องขอขอบพระคุณอาจารย์มา ณ ที่นี้ด้วยค่ะ

สรุปความรู้ที่เรียนมาไว้ในบล็อกนี้ ครบบ้างไม่ครบบ้าง ก็ขออภัยนะคะ

การเก็บรวบรวมข้อมูล สำหรับงานวิจัยเชิงสำรวจ เป็นการเก็บรวบรวมข้อมูลจากแหล่งข้อมูลแบบปฐมภูมิ หรือทุติยภูมิ โดยใช้เครื่องมือต่างๆ ได้แก่

  1. แบบสอบถาม (Questionaire)
  2. แบบสัมภาษณ์ (Interview)
  3. แบบสังเกต (Observation) .. แอบดูพฤติกรรมอยู่ห่างๆ
  4. การมีส่วนร่วม (Participant Observation) .. ปลอมตัวเข้าไปร่วมทำกิจกรรมด้วย

สาระในแบบสอบถาม มี 4 ประเภท (ไม่ต้องมีให้ครบก็ได้)

  1. “คุณสมบัติประจำตัว” หรือข้อมูลทั่วไปของผู้ตอบแบบสอบถาม .. ไม่ควรให้เขียนชื่อ หรือสอบถามข้อมูลละเอียดจนเดาได้ว่าเป็นใคร! และอะไรถ้าไม่ใช้ ไม่เอามาวิเคราะห์ ก็ไม่ต้องถาม!
  2. “ทัศนคติ” ความคิดเห็น หรือความเชื่อ .. เป็นข้อถามเกี่ยวกับความรู้สึกนึกคิด (ชอบมากที่สุด –> น้อยที่สุด) เป็นเรื่องส่วนบุคคล คนย่อมคิดไม่เหมือนกัน ไม่มีผิดหรือถูก
  3. “ความรู้” (Knowledge) เป็นข้อถามเกี่ยวกับความรู้ความเข้าใจ เช่น รู้จักบริการนี้หรือไม่ ? มีทั้งถูกและผิด ตอบถูกก็คือถูก ตอบผิดก็คือผิด
  4. “พฤติกรรม” เป็นข้อถามที่เกี่ยวข้องกับพฤติกรรมของผู้ตอบแบบสอบถาม

ประเภทของข้อถาม
1. ข้อถามแบบปลายเปิด (เขียนอะไรก็ได้ แต่จะประมวลด้วยคอมพิวเตอร์ไม่ได้ ต้องอ่านเอาเอง)
2. ข้อถามแบบปลายปิด (มี choice ให้เลือก A,B,C,D, .. อาจเพิ่มข้อ อื่นๆ (โปรดระบุ) ..)
2.1 ข้อถามปลายปิด ที่มีคำตอบ 2 ทางเลือก
2.2 มีหลายตัวเลือก แต่ต้องเลือกตัวเดียว
2.3 ข้อถามแบบ เลือกตอบได้มากกว่า 1 ตัวเลือก
2.4 ข้อถามแบบจัดอันดับ (ranking question)
2.5 ข้อถามการจัดลำดับทัศนคติ

การจัดลำดับทัศนคติ นิยมใช้ Likert Scale เป็นการให้สเกลคำตอบ 5 ระดับคือ 5 (เห็นด้วยอย่างยิ่ง) 4 (เห็นด้วย) 3 (ปานกลาง) 2 (ไม่เห็นด้วย) 1 (ไม่เห็นด้วยอย่างยิ่ง) หรือ Semantic Differential Scale เป็นการให้สเกลคำตอบ 7 ระดับ
รวดเร็ว 7 6 5 4 3 2 1 ล่าช้า
ประทับใจ 7 6 5 4 3 2 1 ไม่ประทับใจ
หรือใช้ Thurstone’ s Scale ซึ่งมี 11 ระดับ นิยมใช้ในทางการแพทย์
(อาจเติมตัวเลือก ในกรณีที่ตอบไม่ได้ ไม่เคยใช้บริการ ไม่มีความเห็น เข้าไปด้วยก็ได้)

แบบสอบถามของเรา ต้องมีทั้ง Reliable และ Valid

คุณภาพของเครื่องมือ

  1. ความเที่ยงตรง (Valid) มีความถูกต้อง เครื่องมือที่มีความเที่ยงตรง หมายถึง เครื่องมือที่สามารถวัดได้ในสิ่งที่ต้องการวัด (ไม่ใช่ถามวิชาเลข แต่ชอบใช้คำศัพท์ยากๆ ในข้อสอบ ยังกับวัดความรู้ภาษา!) ต้องเป็นความเที่ยงตรงตามเนื้อหา (Content validity) อาศัยค่าสถิติที่สำคัญคือ ค่าความสอดคล้องระหว่างข้อถามกับวัตถุประสงค์หรือเนื้อหา IOC (Index of Item Objective Congruence) หรือดัชนีความเหมาะสม ใช้ผู้เชี่ยวชาญหลายๆ คนมาวัด แล้วหาค่าเฉลี่ย ให้คะแนน +1 (ตรง) 0 (ไม่แน่ใจ) -1 (ไม่ตรง) ข้อถามที่มีค่า 05-1.0 มีค่าความเที่ยงตรงสูง ถ้าต่ำกว่า 0.5 ต้องปรับปรุง
  2. ความเชื่อมั่น (Reliability) มีความแม่นยำ วัดกี่ครั้งก็เหมือนเดิม (ถ้าเป็นข้อสอบ สอบกี่ครั้งเด็กก็ตอบได้เหมือนเดิม ถ้าไม่ไปดูหนังสือเพิ่ม) ทัศนคติ ควรคงที่ ถ้าไม่มีอะไรมากระทบ การหาความเชื่อมั่นของแบบสอบถาม ใช้สัมประสิทธิ์แอลฟา (alpha-cofficient) ของครอนบาค (Cronbach) ค่าแอลฟาที่ใช้ควรมากกว่า 0.6 ถ้าน้อยกว่านั้น ควรปรับปรุงแบบสอบถาม หรืออาจตัดบางข้อทิ้ง (Aplha if Item Deleted)
  3. ความเป็นปรนัย (Objectivity) ถ้าเป็นข้อสอบ ใครตรวจก็ได้คะแนนเหมือนกัน
  4. ความยาก (Difficulty) แบบทดสอบมาตรฐาน มีค่าความยาก อยู่ระหว่าง 0.25-2.75 (ยาก -> ง่าย) แต่ถ้าเป็นข้อสอบควรมีความยาก ต่ำกว่า 0.25 (และเห็นว่ามหาวิทยาลัย ควรทำคลังข้อสอบกันได้แล้ว!)
  5. อำนาจจำแนก (Discrimination) ในข้อสอบต้องมีตัวนี้จะได้แยกเด็กเก่ง-ไม่เก่ง แบบสอบถามทัศนคติจำเป็นต้องมีด้วยเช่นกัน .. แบ่งออกเป็น 2 กลุ่ม สูตรที่ใช้ ใช้ t-test ซึ่งขึ้นกับ degree of freedom จำนวนคนตอบ มาก->น้อย

จำนวนแบบสอบถามที่ควรแจก ใช้สูตรคำนวณว่า จำนวนแบบสอบถาม = จำนวนตัวอย่างที่ต้องการ / อัตราการตอบ ตัวอย่างเช่น ถ้าต้องการคำตอบกลับมา 50 ราย และอัตราการตอบอยู่ที่ 10% หรือ 0.1 ดังนั้นจะต้องแจกแบบสอบถามไปทั้งสิ้น 50/0.1 = 500 ชุด .. และควรทำ pre-test ด้วย เพื่อตรวจสอบคุณภาพของเครื่องมือ ซึ่งไม่มีข้อจำกัดว่าจะ pre-test สักกี่คน อาจจะ 10-15 คนก็ได้ แต่ต้องเลือกคนที่ตอบจริงใจหน่อยนะ !

การใช้โปรแกรม SPSS ในการวิเคราะห์คุณภาพของเครื่องมือ
(มหาวิทยาลัยมหิดล ซื้อ license SPSS แล้ว 1,000 users)
– ใช้วิเคราะห์ความเที่ยงตรง (Valid) : หาค่า IOC
– ใช้วิเคราะห์ความเชื่อมั่น (Reliability) : หาค่าสัมประสิทธิ์แอลฟ่า Cronbach’s Apha Coeffient (เป็นการวัดทัศนคติ ไม่ใช่วัดข้อเท็จจริง) เลือกเมนู Analyze -> Scale -> Reliability Analysis (Model = Alpha)

แบบสอบถามที่แจกไปแล้ว วิเคราะห์อะไรได้บ้าง นอกจากหาค่าร้อยละ ??

สถิติที่น่าศึกษา เช่น
ตัวเลขเชิงปริมาณ ได้แก่ น้ำหนัก ส่วนสูง อายุ รายได้ รายจ่าย คะแนน ฯลฯ เอามาหาร และหาค่าเฉลี่ยได้ ใช้ parametric test ต่างๆ เช่น t-test, f-test
ตัวเลขเชิงคุณภาพ ได้แก่ เพศ คณะ ภาควิชา ระดับการศึกษา ตำแหน่ง ฯลฯ หาค่าเฉลี่ยไม่ได้ วัดได้ว่ามีกี่ % แล้วดูว่ามีนัยสำคัญหรือไม่
ค่าคะแนนทัศนคติ 5 4 3 2 1 ดูเหมือนจะเป็นเชิงคุณภาพ แต่จะคิดเป็นเชิงปริมาณก็ได้ เช่นระดับคะแนนของนักศึกษา A=5, B=4, C=3, D=2, F=1

มาตรวัดตัวแปร
1. ตัวแปรนามบัญญัติ (Nominal Scale) แบ่งพรรคแบ่งพวกได้ เช่น เพศ คณะ ภาควิชา ตำแหน่ง ช่วงอายุ ฯลฯ ใช้สถิติความถี่ : ร้อยละ เปอร์เซ็นต์ การนำเสนอข้อมูล : เป็นรูปกราฟแท่ง กราฟวงกลม

2. ตัวแปรอันดับ (Ordinal Scale) จัดอันดับได้ เช่น เกรด A, B, C ที่ 1,2,3 (แต่ไม่รู้ว่าที่ 1 เก่งกว่าที่ 2 เท่าไหร่) ระดับความคิดเห็น คะแนนทัศนคติ (บางครั้งระดับการศึกษา เช่น ประถม มัธยม อุดมศึกษา ก็อาจเป็นตัวแปรอันดับ) สถิติที่ใช้ : ความถี่ ร้อยละ การนำเสนอข้อมูล : รูปกราฟแท่ง กราฟวงกลม

3. ตัวแปรอันตรภาค (Interval Scale) ข้อมูลเป็นตัวเลข คูณ หาร บวก ลบ ยกกำลังได้ แต่ไม่มีศูนย์แท้จริง เช่น คะแนนสอบ เกรดเฉลี่ย อุณหภูมิ (อุณหภูมิ 0 องศา ไม่ได้แปลว่าไม่มีความร้อน) คะแนนทัศนคติ สถิติที่ใช้ : ค่าเฉลี่ย ส่วนเบี่ยงเบนมาตรฐาน การนำเสนอข้อมูล : รูปแผนภูมิกล่อง แผนภูมิต้นไม้ (ต้น-ใบ) แผนภาพกระจาย

4. ตัวแปรอัตราส่วน (Ratio Scale) เช่น รายได้ รายจ่าย อายุ อายุงาน น้ำหนัก (ศูนย์สนิท เช่น มีเงิน 0 บาท หมายถึง ไม่มีเงินเลย) สถิติที่ใช้ : ค่าเฉลี่ย ส่วนเบี่ยงเบนมาตรฐาน การนำเสนอข้อมูล : รูปแผนภูมิกล่อง แผนภูมิต้นไม้ (ต้น-ใบ) แผนภาพกระจาย

(คะแนนทัศนคติ อาจเป็น Ordinal หรือ Interval ก็ได้ แล้วแต่จะมอง)

นอกจากนั้น อาจารย์ยังได้อธิบายวิธีการลงรหัส/สร้างรหัสลงบนแบบสอบถาม เพื่อเตรียมวิเคราะห์ข้อมูล เช่น เพศ 1=ชาย, 2=หญิง, 9=ไม่ระบุ (เป็น nominal) / อายุ 1=18-30 ปี, 2=31-45 ปี, 3=46-55 ปี, 4=56-60 ปี, 9=ไม่ตอบ (เป็น nominal) / อายุงาน ….ปี ใช้ค่าตามความเป็นจริง คือ 0-43 ปี, 99=ไม่ตอบ (เป็น ratio)

ต้องการวิเคราะห์เป็นรายข้อ / รายด้าน (ข้อ 1+ข้อ 2+ข้อ 3) / หรือทั้งหมด (ด้านที่ 1+ด้านที่ 2+ด้านที่ 3) อาจรวม หรือแยกถามก็ได้ ถ้ายอมรับว่าคะแนนทัศนคติเป็นตัวแปรอันตรภาค ก็จะใช้ค่าเฉลี่ย และส่วนเบี่ยงเบนมาตรฐาน และใช้แผนภูมิกล่อง หรือแผนภูมิต้น-ใบ

ถ้าถามแค่มีเพศหญิงกี่คน เพศชายกี่คน ที่ตอบแบบสอบถาม หาค่าร้อยละ .. มันน้อยไป (ถ้าไม่ใช้ ก็ไม่ต้องถาม !)
– ต้องการทราบหรือไม่ว่า … เพศที่ต่างกัน จะมีคะแนนทัศนคติที่ต่างกัน ?
– ต้องการทราบหรือไม่ว่า … หน่วยงานสังกัดที่ต่างกัน จะมีคะแนนทัศนคติที่ต่างกัน ?
– ต้องการทราบหรือไม่ว่า … อายุงานที่ต่างกัน จะมีคะแนนทัศนคติที่ต่างกัน ?

ตัวแปรต้น (หมายถึง ต้นเหตุ ที่ทำให้ตัวแปรตาม เปลี่ยนแปลงไป)
ตัวแปรต้น ได้แก่ เพศ หน่วยงานที่สังกัด ช่วงอายุ (nominal) / อายุงาน (ratio)
ตัวแปรตาม ได้แก่ คะแนนทัศนคติ (Interval)

เพศ (ชาย หญิง) และหน่วยงาน (ส่วนกลาง ส่วนภูมิภาค) แบ่งเป็น 2 ระดับ ใช้ T-independent Test
ส่วนช่วงอายุ มีมากกว่า 2 ระดับ ใช้ One-way ANOVA