Feeds:
เรื่อง
ความเห็น

Posts Tagged ‘สถิติการวิจัย’

วันเสาร์-อาทิตย์ที่ 1-2 มิถุนายน 2556 ไปรับการอบรมเชิงปฏิบัติการคอมพิวเตอร์ เรื่อง การใช้โปรแกรม Excel ในงานวิจัย โครงการนี้เป็นโครงการบริการวิชาการแก่สังคม ที่สอนโดย รศ. สำรวย กมลายุตต์ อาจารย์ประจำสาขาวิชาศิลปศาสตร์ ของ มสธ. — สนุกและได้รับความรู้มาก จึงขอสรุปและถอดบทเรียนจากการไปอบรม ดังนี้ค่ะ

  • โปรแกรมที่ใช้ในการวิเคราะหฺสถิติการวิจัย มีมากมายหลายตัว โปรแกรม SPSS นิยมใช้กันมาก แต่ถ้านำไปวิเคราะห์สถิติแล้วนำผลงานไปตีพิมพ์ จำเป็นต้องใช้ซอฟแวร์ที่มีลิขสิทธิ์ ปัจจุบันมีโปรแกรม opensource ตัวหนึ่งที่คล้ายๆกัน และตั้งชื่อเลียนแบบ SPSS โปรแกรมนั้นมีชื่อว่า PSPP อย่างไรก็ตาม หากจะวิเคราะห์สถิติแบบเบื้องต้น ใช้โปรแกรม Microsoft Excel ทำก็ได้ สะดวกดี
  • อันดับแรก ต้องทำความเข้าใจเกี่ยวกับตัวแปรต่างๆก่อน ในแง่มาตรวัด ได้แก่ ตัวแปรเชิงปริมาณ (ตัวแปรต่อเนื่อง ไม่ต่อเนื่อง / ตัวแปรช่วงหรืออันตรภาคชั้น interval scale ตัวแปรอัตราส่วน – ratio scale) ตัวแปรเชิงคุณภาพ (ตัวแปรนามบัญญัติ nominal scale และตัวแปรเรียงลำดับ ordinal scale) — และในแง่บทบาทของตัวแปรเหล่านั้น ว่า เป็นตัวแปรอิสระ (ตัวแปรที่เป็นเหตุ) หรือตัวแปรตาม (ตัวแปรที่เป็นผล) ถ้าไม่เข้าใจว่าข้อมูลที่เราไปเก็บมา เป็นตัวแปรชนิดไหน ก็จะวิเคราะห์ผิดพลาดได้
  • เมื่อตรวจสอบความถูกต้องครบถ้วนของข้อมูลที่ได้มาแล้ว ให้กำหนดรหัสให้แก่ตัวแปร กำหนดชื่อตัวแปร กำหนด format ของตัวแปรว่าเป็น numeric หรือเป็น text/character หรือเป็น date แล้วแต่ประเภทและมาตรวัดของตัวแปรนั้นๆ
  • เปิดโปรแกรม Excel แล้วสร้าง template บน worksheet ของ Excel สำหรับกรอกข้อมูล จากนั้นทำการป้อนข้อมูลลงใน template (ตัวอย่างเช่น ข้อมูลที่เก็บได้จากแบบสอบถาม)
  • อันดับต่อไป ต้องเลือกใช้ฟังก์ชั่นสถิติให้เหมาะสมกับการประมวผลตัวแปร
  • ตัวแปรเชิงคุณภาพ ใช้สถิติค่าความถี่ ร้อยละ และใช้ไคว์สแควร์เพื่อทดสอบสมมุติฐานเกี่ยวกับความสัมพันธ์ของตัวแปร / ตัวแปรเชิงปริมาณ ใช้สถิติค่าเฉลี่ย ส่วนเบี่ยงเบนมาตรฐาน ค่าความแปรปรวน ค่าความถี่ และใช้ Z-test, t-test, F-test ในการทดสอบสมมุติฐานเปรียบเทียบค่าเฉลี่ย ค่าสัดส่วน — สำคัญมาก เพราะหากเลือกใช้ฟังก์ชั่นผิด จะทำให้ผลลัพธ์ผิดไปด้วย
  • เราสามารถนำโปรแกรม Excel มาใช้คำนวณค่าสถิติแบบเบื้องต้น ที่ใช้กันทั่วไป เช่น การหาค่าความถี่และค่าร้อยละของตารางจำแนก 2 ทาง ตารางจำแนกหลายทาง (cross table) หรือการหาค่าเฉลี่ยของข้อมูลที่เป็นสเกลแบบระดับ (rating scale) เช่น ระดับความพึงพอใจ เป็นต้น
  • หาค่าความถี่ของข้อมูลที่เป็น text ใช้คำสั่ง COUNTA
  • หาค่าความถี่ของข้อมูลที่เป็น numeric ใช้คำสั่ง COUNT
  • หาค่าความถี่แบบมีเงื่อนไขเดียว ใช้คำสั่ง COUNTIF()
  • หาค่าความถี่แบบมีหลายเงื่อนไข ใช้คำสั่ง COUNTIFS()
  • เลือกแถบเมนูของโปรแกรม Excel ที่ AutoSUM -> More Functions -> COUNTA หรือเลือกที่ Formulas -> More Functions -> Statistical -> COUNTA
  • โปรแกรม Excelไม่มีฟังก์ชั่นคำนวณค่าร้อยละ ค่าสัดส่วน ค่าอัตราส่วน ต้องพิมพ์สูตรคำนวณลงไปใน formula bar เอง เช่น =(J5*100)/J7
  • หาค่าเฉลี่ย ใช้คำสั่ง AutoSUM -> AVAERAGE หาส่วนเบี่ยงเบนมาตรฐาน ใช้คำสั่ง AutoSUM -> STDEV
  • การทดสอบสมมุติฐานค่าเฉลี่ย กรณีประชากรกลุ่มเดียว ใช้สถิติ t-test ในกรณีที่ไม่ทราบค่าส่วนเบี่ยงเบนมาตรฐาน (S.D.) ของประชากร (ใช้ S.D. ของกลุ่มตัวอย่างแทน) และจำนวนกลุ่มตัวอย่างมีค่าน้อยกว่า 30 / ใช้สถิติ Z-test ในกรณีที่ทราบค่า S.D. ของประชากร และจำนวนกลุ่มตัวอย่างมีค่ามากกว่าหรือเท่ากับ 30
  • หาค่า P-value ของ Z-test ใช้คำสั่ง AutoSUM -> More Functions -> ZTEST
  • ตั้งสมมุติฐานว่าง H0 ให้น้อยกว่าหรือเท่ากับ ส่วนสมมุติฐาน H1 ให้มากกว่า ถ้าค่า p-value มีค่ามากกว่าแอลฟ่า 0.05 (หรือ 0.01) แสดงว่ายอมรับสมมุติฐานว่าง
  • การทดสอบสมมุติฐานค่าเฉลี่ย กรณีประชากรสองกลุ่ม / ตั้งสมมุติฐานว่าง H0 ให้เท่ากับ ส่วนสมมุติฐาน H1 ไม่เท่ากับ ถ้าค่า p-value มีค่ามากกว่าแอลฟ่า 0.05 (หรือ 0.01) แสดงว่ายอมรับสมมุติฐานว่าง
  • การทดสอบสมมุติฐาน ความเป็นอิสระระหว่างตัวแปร หรือทดสอบความสัมพันธ์ระหว่างตัวแปรเชิงคุณภาพ —> ให้ใช้ค่าความถี่และ สถิติไคว์สแควร์
  • ใช้คำสั่ง AutoSUM -> More Functions -> CHITEST
  • ตั้งสมมุติฐานว่าง H0 ให้เท่ากับ ส่วนสมมุติฐาน H1 ไม่เท่ากับ ถ้าค่า Chi Square ที่คำนวณได้มีค่ามากกว่าแอลฟ่า 0.05 (หรือ 0.01) แสดงว่ายอมรับสมมุติฐานว่าง คือ ไม่มีความสัมพันธ์กัน
  • การวิเคราะห์ความแปรปรวน (Analysis of Variance: ANOVA) ใช้ทดสอบความแตกต่างระหว่างค่าเฉลี่ย ตั้งแต่ 3 กลุ่มขึ้นไป ใช้ F-Test
  • กรณีกลุุ่มตัวอย่างไม่เท่ากัน ต้องคำนวณความแปรปรวนภายในกลุ่ม (Within-Group) และความแปรปรวนระหว่างกลุ่ม (Between-Group) ใช้คำสั่ง Data –> Analysis –> ANOVA: Single factor ถ้าค่า p-value ที่คำนวณได้ มากกว่า 0.05 แสดงว่ายอมรับสมมุติฐาน H0 คือทุกกลุ่มมีค่าเฉลี่ยเท่ากัน
  • กรณีกลุุ่มตัวอย่างเท่ากัน และเก็บข้อมูลมาค่าเดียว หรือเก็บข้อมูลไม่ซ้ำ ใช้คำสั่ง Data -> Analysis -> Two-ways ANOVA without replication
  • กรณีกลุุ่มตัวอย่างเท่ากัน และเก็บข้อมูลซ้ำๆหลายครั้ง ทุกกลุ่มอย่างละเท่าๆกัน ใช้คำสั่ง Data -> Analysis -> Two-ways ANOVA with replication
  • การพล็อตกราฟหาสมการถดถอย หาความสัมพันธ์ระหว่างตัวแปรอิสระ (ค่า x) และตัวแปรตาม (ค่า y) ใช้คำสั่ง Insert -> Scatter และการวิเคราะห์การถดถอย (Regression Analysis) ใช้คำสั่ง Data -> Analysis -> Regression ถ้าค่าสัมประสิทธิ์การถดถอยเป็นบวก แสดงว่า เมื่อตัวแปรอิสระเพิ่ม ตัวแปรตามจะเพิ่ม ถ้าค่าสัมประสิทธิ์การถดถอยเป็นลบ แสดงว่า เมื่อตัวแปรอิสระเพิ่ม ตัวแปรตามจะลด
  • สรุปว่า ถ้าต้องการวิเคราะห์ข้อมูลจากงานวิจัย โดยใช้สถิติเบื้องต้น — โปรแกรม Excel เป็นอีกหนึ่งทางเลือก ที่ใช้ง่ายและสะดวกมากๆ ค่ะ

    Read Full Post »

สรุปจากการไปฟังบรรยายและฝึกอบรมเรื่อง – การประยุกต์สถิติเพื่อการวิจัยทางสารสนเทศศาสตร์ ซึ่งทางหลักสูตรสารสนเทศศาสตร์ มสธ. จัดขึ้น เมื่อวันเสาร์-อาทิตย์ที่ 25-26 พฤษภาคม 2556 โดยมี รศ.พวา พันธุ์เมฆา เป็นวิทยากรผู้สอน

มีทั้งหมด 5 ตอน ตอนที่ 1 | ตอนที่ 2 | ตอนที่ 3 | ตอนที่ 4 | ตอนนี้เป็นตอนจบ (ซะที)

การวิจัยเชิงทดลอง

โดยทั่วไปการวิจัยเชิงทดลองจะมีหน่วยวิจัย 2 กลุ่มคือ กลุ่มควบคุม และกลุ่มทดลอง เพื่อเปรียบเทียบผลที่เกิดขึ้นทั้ง 2 กลุ่มว่าแตกต่างกันหรือไม่ กลุ่มควบคุม ไม่ได้รับการจัดกระทำ (treatment) ถ้าผลที่ได้แตกต่างกันโดยที่กลุ่มทดลองได้ผลดีกว่า ก็สามารถสรุปได้ว่าผลที่ดีกว่านั้นมาจากการจัดกระทำ
(การทดลองกลุ่มเดียว วัดก่อนและหลังการทดลอง เป็นการทดสอบทางเดียว การเปรียบเทียบก่อนและหลังการทดลอง ใช้ค่า t-test dependent)

การกระทำที่ให้หน่วยวิจัยกระทำ เรียกว่า ตัวแปรทดลอง (Experimental variable) ผลที่เกิดจากการกระทำเรียกว่า ตัวแปรตาม (Dependent variable)

การออกแบบการวิจัยเชิงทดลอง
ผู้วิจัยควรออกแบบการวิจัยนั้นก่อนว่าจะใช้วิธีการวิจัยแบบใดให้เหมาะสมกับสภาพความเป็นจริงที่เป็นไปได้ วิธีและรูปแบบการวิจัยเชิงทดลองจะได้กล่าวต่อไป ถ้าการวิจัยนั้นออกแบบได้ดี จะทำให้ได้ผลการวิจัยมีความถูกต้องน่าเชื่อถือ

เครื่องมือที่ใช้ในการวิจัยเชิงทดลอง
สำหรับสาขาสังคมศาสตร์ ได้แก่ แบบทดสอบ หรือบทเรียนสำเร็จรูปที่พัฒนาขึ้นอย่างมีคุณภาพ

รูปแบบการวิจัยเชิงทดลอง

  • แบบการทดลองขั้นต้น (Pre-experimental design) ใช้เพียงกลุ่มเดียว แบ่งออกเป็น 2 แบบคือ แบบศึกษากลุ่มเดียววัดหลังการทดลอง (One shot design) : มีกลุ่มทดลองกลุ่มเดียว หน่วยวิจัยมิได้มีการสุ่มเลือกมา ไม่มีการทดสอบก่อน ไม่มีกลุ่มควบคุมมาเปรียบเทียบ และแบบศึกษากลุ่มเดียววัดก่อน-หลังการทดลอง(Pretest-posttest one group design) : มีกลุ่มทดลองกลุ่มเดียวคล้ายกัน แต่มีการทดสอบก่อนการทดลอง
  • แบบการวิจัยทดลองที่แท้จริง (True experimental design) : ในทางปฏิบัติ ทำได้ยาก ส่วนใหญ่ใช้ในการวิจัยเชิงคลินิก การสุ่มหน่วยวิจัยเพื่อเข้าสู่กลุ่มควบคุมและกลุ่มทดลองนั้นต้องใช้วิธีการสุ่มแบบสมบูรณ์ คือ ทุกหน่วยวิจัยมีโอกาสถูกเลือกเท่าๆกัน
  • แบบการวิจัยกึ่งทดลอง (Quasi experimental design) : นิยมกันมาก มี 2 แบบ คือ มีกลุ่มควบคุมที่ไม่เท่าเทียมวัดหลังการทดลอง (Posttest-only Nonequivalent Control Group Design) และ มีกลุ่มควบคุมที่ไม่เท่าเทียมวัดก่อน-หลังการทดลอง (Pretest-posttest Nonequivalent Control Group Design)

Read Full Post »

สรุปจากการไปฟังบรรยายและฝึกอบรมเรื่อง – การประยุกต์สถิติเพื่อการวิจัยทางสารสนเทศศาสตร์ ซึ่งทางหลักสูตรสารสนเทศศาสตร์ มสธ. จัดขึ้น เมื่อวันเสาร์-อาทิตย์ที่ 25-26 พฤษภาคม 2556 โดยมี รศ.พวา พันธุ์เมฆา เป็นวิทยากรผู้สอน

(เล่าต่อจาก ตอนที่ 1 / ตอนที่ 2 / และ ตอนที่ 3 )

การหาความสัมพันธ์ของข้อมูล

  • ค่าสหสัมพันธ์ของเพียร์สัน : วัดความสัมพันธ์ของข้อมูล 2 รายการ
  • ค่าสหสัมพันธ์ของสเปียร์แมน : ไม่ค่อยนิยมใช้
  • การวิเคราะห์การถดถอย : วัดความสัมพันธ์ของข้อมูลมากกว่า 2 รายการ
  • การวิเคราะห์การถดถอย (Regression Analysis)

  • เป็นสถิติวัดความสัมพันธ์ระหว่างตัวแปร เพื่อต้องการทราบว่า ตัวแปรต้น (ตัวแปรอิสระ หรือตัวแปรพยากรณ์) มีผลต่อการเปลี่ยนแปลงของตัวแปรตามอย่างไร (สามารถใช้โปรแกรม SPSS หรือโปรแกรม OpenStat ในการวิเคราะห์)
  • ถ้าศึกษาปัจจัยเดียว เรียกว่า Simple regression analysis แต่ถ้ามีหลายปัจจัย เรียกว่า การวิเคราะห์การถดถอยพหุคูณ (Multiple regression analysis)
  • นิยมใช้มากในงานวิจัยทางธุรกิจ ตัวอย่างเช่น ต้องการวิเคราะห์ยอดขายของร้านค้า จำนวน 18 สาขา ว่าขึ้นกับปัจจัยอะไรบ้าง เช่น จำนวนพนักงานขาย ค่าโฆษณา ประสบการณ์ของผู้จัดการสาขา โดยทดสอบที่ระดับนัยสำคัญทางสถิติ 0.05
  • การตั้งสมมุติฐาน จะตั้ง 2 ข้อ คือ 1. ความสัมพันธ์ (Correlation) 2. ส่งผล (Regression)
  • ตัวแปรตาม (ยอดขาย) ต้องอยู่ในมาตรการวัดระดับ interval, ratio ขึ้นไป และต้องมีการแจกแจงแบบปกติ
  • ตัวแปรต้นที่นำมาใช้พยากรณ์ไม่ควรมีความสัมพันธ์กันสูงเกินไป (>.80) เพราะถ้าเข้าใกล้ 1.00 แสดงว่าเกือบจะเป็นตัวแปรเดียวกัน ควรทดสอบตัวแปรต้นเป็นคู่ๆก่อน ด้วยคำสั่ง Bivariate correlation ในโปรแกรม SPSS
  • ขั้นตอนการวิเคราะห์ Regression analysis ด้วยโปรแกรม SPSS คือ 1. ตรวจสอบลักษณะความสัมพันธ์เบื้องต้นด้วยแผนภาพ Scatter Plot ระหว่างตัวแปรพยากรณ์ (แต่ละตัว) กับตัวแปรตาม โดยใช้ Spread Sheet
  • scatter_plot

  • 2. หาค่าสถิติเชิงพรรณนาของตัวแปรต่างๆ ได้แก่ ยอดขาย จำนวนพนักงานขาย ค่าโฆษณา ประสบการณ์ของผู้จัดการสาขา ตามต้องการ เช่น N, Mean, S.D., Kurtosis, Skewness, Range, Min, Max โดยใช้คำสั่ง Descriptive
  • 3. ตรวจสอบความสัมพันธ์ระหว่างตัวแปรตาม และตัวแปรพยากรณ์แต่ละตัว โดยใช้คำสั่ง Bivariate correlation เปรียบเทียบค่า r กับตารางค่าวิกฤตของสหสัมพันธ์ของเพียร์สัน โดยนำจำนวนข้อมูล n ไปเปิดตารางที่ระดับนัยสำคัญ sig. (one-tailed) 0.05 หรือ 0.01 — ในที่นี้พบว่า ยอดขาย มีความสัมพันธ์กับจำนวนพนักงานขาย ค่าโฆษณา ประสบการณ์ของผู้จัดการสาขา อย่างมีนัยสำคัญทางสถิติ
  • 4. หาความสัมพันธ์ระหว่างตัวแปรเพื่อการพยากรณ์ ด้วยคำสั่ง Linear regression อ่านผลการตรวจสอบ พบว่า ค่าความสัมพันธ์ระหว่างตัวแปรพยากรณ์ที่นำมาเข้าสมการกับตัวแปรตาม (Multiple Regression) = 0.87 ค่าสัมประสิทธิ์การทำนาย (R Square) = 0.76 ค่า Adjusted R Square = 0.72 (ปรับลดให้เหมาะสม เนื่องจาก N มีจำนวนน้อย) และจากตาราง ANOVA ทดสอบความสัมพันธ์ระหว่างตัวแปรตามกับตัวแปรพยากรณ์ทั้งสาม พบว่า Sig. = .00 จึงปฏิเสธสมมุติฐานหลัก H0 แสดงว่ามีตัวแปรพยากรณ์อย่างน้อย 1 ตัวที่นำมาพยากรณ์ยอดขายได้ ส่วนตาราง Coefficients พบว่า มีตัวแปรเดียวคือ จำนวนพนักงานขาย ที่มีค่า Sig. = .02 ดังนั้นจึงปฎิเสธสมมุติฐาน H0 — ให้นำไปเข้าสมการถดถอยใหม่อีกครั้ง
  • 5. นำตัวแปรพยากรณ์ (จำนวนพนักงานขาย) มาเข้าสมการถดถอยอีกครั้ง ได้ผลลัพธ์ดังนี้ Multiple R. = 0.83 R Square = 0.69 Adjusted R Square = 0.69 ตาราง ANOVA พบว่า Sig.=.00 จำนวนพนักงานขายมีความสัมพันธ์กับยอดขายอย่างมีนัยสำคัญ ตาราง Coeffients Sig.=.00 สรุปได้ว่า จำนวนพนักงานขาย สามารถนำมาพยากรณ์ยอดขายได้ โดยมีประสิทธิภาพของการพยากรณ์ (R Square) สูงถึง 69%
  • การตรวจสอบลักษณะของเส้นถดถอย (Regression line) ใช้คำสั่ง X Versus Y Plot ในโปรแกรม OpenStat ในการพยากรณ์ตัวแปรตาม (ยอดขาย) ด้วยการกำหนดค่าของตัวแปรพยากรณ์ (จำนวนพนักงานขาย) จากสมการถดถอยที่ได้ จะมีความแม่นยำเพียงใดนั้น ขึ้นอยู่กับข้อมูลที่รวบรวมมาว่ามีการกระจายไปจากเส้นถดถอยมากน้อยเพียงใด สถิติที่ใช้วัดการกระจายของข้อมูลรอบๆเส้นถดถอยนี้ เรียกว่า ความคลาดเคลื่อนมาตรฐานในการพยากรณ์ (Standard Error of Estimate : SEE) ถ้า SEE มีค่าน้อย แสดงว่ามีการถดถอยน้อย ถ้า SEE มากแสดงว่ามีการถดถอยมาก

[ อ่านต่อ ตอนที่ 5 ]

Read Full Post »

สรุปจากการไปฟังบรรยายและฝึกอบรมเรื่อง – การประยุกต์สถิติเพื่อการวิจัยทางสารสนเทศศาสตร์ ซึ่งทางหลักสูตรสารสนเทศศาสตร์ มสธ. จัดขึ้น เมื่อวันเสาร์-อาทิตย์ที่ 25-26 พฤษภาคม 2556 โดยมี รศ.พวา พันธุ์เมฆา เป็นวิทยากรผู้สอน

(เล่าต่อจาก ตอนที่ 1 และ ตอนที่ 2)

ข้อมูลที่รวบรวมมาใช้ในการวิจัย แบ่งเป็น 4 ระดับ

  1. ระดับนามบัญญัติ (Nominal scale) สัญลักษณ์หรือตัวเลขที่กำหนดขึ้น เพื่อใช้แยกแยะสิ่งวิจัยออกจากกัน เช่น 1=ชาย 2=หญิง ตัวเลขไม่สามารถนำมาบวก ลบ คูณ หาร ทำได้แต่การแจงนับจำนวนเป็นความถี่เท่านั้น
  2. ระดับเรียงอันดับ (Ordinal scale) ตัวเลขที่บอกถึงอันดับมากน้อย รู้ว่าใครดีกว่าใครเท่านั้น แต่ไม่ทราบว่าแต่ละช่วงห่างกันเท่าไหร่ เช่น ระดับการศึกษา ผลการเรียน ความเก่ง สอบได้ที่ 1, 2, 3 ไม่สามารถบอกได้ว่าเก่งกว่ากันเท่าไหร่ เอาตัวเลขไปหาค่าเฉลี่ยไม่ได้ แต่สามารถนำมาบวกหรือลบกันได้
  3. ระดับอันตรภาค หรือระดับช่วง (Interval scale) ตัวเลขที่นำมาจัดอันดับได้ ความแตกต่างระหว่างอันดับเท่ากัน สามารถนำตัวเลขมาเปรียบเทียบกันได้ว่าว่ามีปริมาณมากน้อยเท่าใด แต่ไม่สามารถบอกได้ว่าเป็นกี่เท่าของกันและกัน เพราะไม่มีศูนย์ที่แท้จริง ข้อมูลนำไปหาค่าเฉลี่ยได้ นำมาบวก ลบ คูณ หรือหารกันได้ เช่น คะแนนสอบ อุณหภูมิ 0, 1, 2, 3 องศา (อุณหภูมิ 0 องศา ไม่ได้แปลว่า ไม่มีความร้อน)
  4. ระดับอัตราส่วน (Ratio scale) กำหนดค่าตัวเลขให้กับสิ่งที่ต้องการวัด มีศูนย์แท้ ใช้คำนวณได้ทุกรูปแบบ สามารถนำตัวเลขมาบวก ลบ คูณ หาร หรือหาอัตราส่วนกันได้ เช่น น้ำหนัก ความสูง ความยาว (เช่น ถนน 50 กิโลเมตร ยาวเป็น 2 เท่าของถนน 25 กิโลเมตร)

สถิติที่ใช้ในการวิเคราะห์ข้อมูล

  • สถิติบรรยาย หรือสถิติพรรณนา ใช้บอกลักษณะ เช่น สิ่งที่ต้องการศึกษามีสัดส่วนเป็นเท่าใดของทั้งหมด (ค่าร้อยละ) สิ่งที่ต้องการศึกษาส่วนใหญ่มีลักษณะอย่างไร (ใช้สถิติวัดแนวโน้มเข้าสู่ส่วนกลาง เช่น mean, median, mode) มีความแตกต่างกันภายในกลุ่มของสิ่งที่ต้องการศึกษามากน้อยแค่ไหน (ใช้สถิติวัดการกระจาย เช่น การกระจายของค่าเฉลี่ย (Mean deviation) ค่าความแปรปรวน (Variance) ส่วนเบี่ยงเบนมาตรฐาน Standard deviation หรือ S.D.))
  • การนำเสนอตารางแสดงข้อมูลส่วนตัวหรือตัวแปรต้นของกลุ่มตัวอย่าง เป็นจำนวน และร้อยละ และควรแสดงเป็น “ตารางไขว้” จะเห็นภาพได้ชัดเจนขึ้น
  • ค่าเฉลี่ย (Mean) ส่วนเบี่ยงเบนมาตรฐาน (S.D.) ใช้วิเคราะห์ตัวแปรตาม ที่เป็นความคิดเห็นจากแบบสอบถามที่ตอบแบบมาตรประมาณค่า 5 ระดับ — การนำเสนอตารางให้แสดงผล mean, S.D. และการแปรผล การแปลความหมายของค่าเฉลี่ยนิยมใช้แบบอิงเกณฑ์ ต้องมีเกณฑ์กำหนดว่าจะแปลอย่างไร (เช่นแบ่งเป็น 3 ระดับ ได้แก่ 1.00-2.00 = น้อย 2.01-4.00 = ปานกลาง 4.01-5.00 = มาก หรือแบ่งเป็น 5 ระดับ ได้แก่ 1.00-1.49 = น้อยที่สุด 1.50-2.49 = น้อย 2.50-3.49 ปานกลาง 3.50-4.49 มาก 4.50-5.00 มากที่สุด) สำหรับในกรณีที่ข้อใดมีค่า S.D. สูงกว่า 1.20 จะต้องอ่านด้วยว่า ข้อนั้นมีความแตกต่างในกลุ่มสูง หรือกลุ่มตัวอย่างมีความคิดเห็นไม่พ้องต้องกัน
  • สถิติอนุมาน หรือสถิติที่ใช้ทดสอบสมมุติฐาน ได้แก่ สถิติทดสอบเกี่ยวกับจำนวนหรือความถี่ (Chi square) สถิติทดสอบนัยสำคัญของค่าสัมประสิทธิ์สหสัมพันธ์ว่า คุณลักษณะต่างๆของสิ่งที่ศึกษามีความสัมพันธ์กันจริงหรือไม่อย่างไร (ค่าสหสัมพันธ์ Correlation) สถิติทดสอบค่าเฉลี่ย กลุ่มตัวอย่าง 2 กลุ่ม (t-test สำหรับกลุ่มตัวอย่าง 30) สถิติวิเคราะห์ความแปรปรวน (Analysis of Variance : ANOVA) และสถิติการวิเคราะห์การถดถอย (Regression analysis)
  • การทดสอบความแตกต่างระหว่างค่าเฉลี่ย ที่กลุ่มตัวอย่าง 2 กลุ่ม เกี่ยวข้องกันหรือเป็นกลุ่มเดียวกัน (t-test dependent) ใช้กับการวิจัยเชิงทดลอง มีการเปรียบเทียบคะแนนก่อน-หลังการทดลอง ภายในกลุ่ม N เดียวกัน ควรตั้งสมมุติฐานแบบมีทิศทาง (เช่น ได้คะแนนดีขึ้นหลังการทดลอง) แสดงผลก่อนและหลังการทดลองเป็นค่า N, Mean, S.D. แล้วสั่งโปรแกรม SPSS คำนวณค่า t ให้ — จากนั้น นำค่าระดับแห่งความเป็นอิสระ (degree of freedom : df) = N-1 ไปเปิดตารางค่าวิกฤต Critical value of t และดูว่า ที่ระดับนัยสำคัญ (level of significance) 0.05 มีค่า t เท่าไหร่ — ถ้าค่า t ที่คำนวณได้สูงกว่าค่า t ในตารางวิกฤต แสดงว่า ผลการทดลองสอดคล้องกับสมมุติฐานที่ตั้งไว้ อย่างมีนัยสำคัญทางสถิติที่ระดับ 0.05
  • การทดสอบความแตกต่างระหว่างค่าเฉลี่ย ที่กลุ่มตัวอย่าง 2 กลุ่ม ไม่เกี่ยวข้องกัน (t-test independent ) ใช้กับกลุ่มตัวอย่างที่มีลักษณะไม่เหมือนกัน เช่น ชาย-หญิง วุฒิการศึกษาปริญญาตรี-ปริญญาโท กลุ่มควบคุม-กลุ่มทดลอง แสดงผลทั้งสองกลุ่มเป็นค่า N, Mean, S.D. แล้วสั่งโปรแกรม SPSS คำนวณค่า t ให้ — จากนั้นเปิดตารางค่าวิกฤต Critical value of t โดยดูว่าเป็นการทดสอบแบบ 2 ทาง (two-tail test) คือกลุ่มตัวอย่าง 2 กลุ่มไม่เกี่ยวข้องกัน หรือแบบทางเดียว (one-tail test) คือกลุ่มตัวอย่าง 2 กลุ่มเกี่ยวข้องกันหรือเป็นกลุ่มเดียวกัน — นำค่าระดับแห่งความเป็นอิสระ (degree of freedom : df) = (n1+n2)-2 ไปเปิดตารางค่าวิกฤต Critical value of t และดูว่า ที่ระดับนัยสำคัญ (level of significance) 0.05 (หรือจะใช้ 0.1 ก็ได้ ถ้าเป็นสาขาทางการแพทย์) มีค่า t เท่าไหร่ ถ้าค่า t ที่คำนวณได้ ต่ำกว่าค่า t ในตารางวิกฤต แสดงว่า ผลการทดลองในกลุ่มควบคุมและกลุ่มทดลอง แตกต่างกันอย่างไม่มีนัยสำคัญทางสถิติ หรือไม่แตกต่างกันนั่นเอง
  • normal_curve

  • ความเข้าใจเกี่ยวกับค่าระดับนัยสำคัญ : การวัดสิ่งต่างๆ ที่มีจำนวนมาก แล้วนำมา plot graph มักจะมีการกระจายตัวของผลการวัดเป็น normal curve เสมอ พื้นที่ภายใต้โค้งปกติ สมมุติว่ามีค่าเป็น 1 หน่วย แบ่งครึ่งซ้ายขวาข้างละ 0.5 หน่วย ค่าที่อยู่ตรงเส้นแบ่งครึ่งมีค่าเป็น 0 วัดออกไปทางขวามือจะมีค่าเป็นบวก วัดจากซ้ายมือมีค่าเป็นลบ ค่าที่วัดได้จะแปลงจากหน่วยปกติกลายเป็นคะแนนมาตรฐาน (standard score หรือ Z score ซึ่งคำนวณได้จาก ค่าที่วัดได้-ค่าเฉลี่ย/ส่วนเบี่ยงเบนมาตรฐาน) ถ้าค่ามาตรฐานเป็นบวก คือ 1.96 จะทำให้พื้นที่ซีกขวาคือ 0.500 แบ่งเป็นพื้นที่ 2 ส่วน คือ 0.475 และส่วนที่เหลือคือ 0.025 ถ้ารวมสองด้านทั้งซ้ายและขวา พื้นที่ส่วนที่เหลือคือ 0.025+0.025=0.05 ในการทดสอบสมมุติฐาน หากคะแนนมาตรฐานที่ได้มีค่า 1.96 หรือมากกว่า เราจะยอมรับสมมุติฐานนั้น แม้จะมีความเสี่ยง แต่ก็ผิดพลาดเพียง 0.05 (หรือ 5 ครั้งใน 100 ครั้ง) เรียกว่า มีนัยสำคัญทางสถิติที่ระดับ 0.05 ในทางสังคมศาสตร์ นิยมใช้ระดับนัยสำคัญที่ 0.05 ส่วนทางการแพทย์ อาจยอมรับความผิดพลาดให้เกิดน้อยที่สุด ดังนั้นอาจใช้ 0.01 หรือน้อยกว่านั้น
  • การวิเคราะห์ความแปรปรวน การทดสอบความแตกต่างระหว่างค่าเฉลี่ยมากกว่า 2 กลุ่ม ถ้านำค่าเฉลี่ยมาเปรียบเทียบกันทีละคู่ จะเสียเวลามากและเกิดความคลาดเคลื่อน จึงนิยมใช้วิธีวิเคราะห์ความแปรปรวน ซึ่งมี 2 ตัวคือ ความแปรปรวนระหว่างกลุุ่ม และความแปรปรวนภายในกลุ่ม สถิติที่ใช้คือ f-test
  • K=จำนวนกลุ่ม N=จำนวนตัวอย่างภายในกลุ่ม ดังนั้น df ระหว่างกลุ่ม = K-1 ส่วน df ภายในกลุ่ม = N-K ตารางแสดงผลการเปรียบเทียบ จะแสดงค่า df ระหว่างกลุ่ม (b) และภายในกลุ่ม (w) ค่า Sum of square หรือผลรวมค่าความต่างยกกำลังสอง (SSt = SSb + SSw) ค่า Mean square (MSb = SSb/dfb และ MSw = SSw/dfw) และค่า F (F = MSb/MSw) จากนั้นนำค่า df ทั้งสอง ไปเปิดตารางวิกฤตการกระจายของค่า F (F-distribution) ถ้าค่าที่คำนวณได้สูงกว่าค่าในตาราง แสดงว่ายอมรับสมมุติฐาน H1 ข้อมูลทุกกลุ่มมีความแตกต่างกันจริงที่ระดับนัยสำคัญ 0.05 (หรือจะใช้ 0.01 ก็ได้) เมื่อพบความแตกต่าง ต้องนำไปทดสอบความแตกต่างเป็นรายคู่ เพื่อให้ทราบว่าข้อที่พบความแตกต่าง มีคู่ใดบ้างที่แตกต่างกัน หากแต่ละกลุ่มมีจำนวนเท่ากันจะใช้วิธีของ Turkey แต่ละกลุ่มมีจำนวนไม่เท่ากันจะใช้วิธีของ Least quare difference (LSD) วิธีของนิวแมนและคูลส์ (Newman & Keuls) หรือวิธีของ Sheffe ในการเปรียบเทียบค่าเฉลี่ยของแต่ละกลุ่ม

[ อ่านต่อ ตอนที่ 4 ]

Read Full Post »

สรุปจากการไปฟังบรรยายและฝึกอบรมเรื่อง การประยุกต์สถิติเพื่อการวิจัยทางสารสนเทศศาสตร์ ซึ่งทางหลักสูตรสารสนเทศศาสตร์ มสธ. จัดขึ้น เมื่อวันเสาร์-อาทิตย์ที่ 25-26 พฤษภาคม 2556 โดยมี รศ.พวา พันธุ์เมฆา เป็นวิทยากรผู้สอน เพื่อเป็นแนวทางในการทำวิทยานิพนธ์ ซึ่งประกอบด้วย 5 บทคือ

  • บทที่ 1 บทนำ การออกแบบการวิจัย วัตถุประสงค์การวิจัย สมมุติฐาน นิยามศัพท์
  • บทที่ 2 ทบทวนวรรณกรรมที่เกี่ยวข้อง
  • บทที่ 3 วิธีการวิจัย
  • บทที่ 4 ผลการวิจัย
  • บทที่ 5 อภิปรายผล

(เล่าต่อจากตอนที่ 1)

การกำหนดประชากรและการเลือกกลุ่มตัวอย่าง

  • ถ้าเป็นการวิจัยเชิงปริมาณที่มีประชากรจำนวนมาก ใช้วิธีการสุ่มโดยใช้ความน่าจะเป็น เช่น simple random ทุกหน่วยมีโอกาสถูกเลือกเท่ากัน สุ่มแบบ systematic สำหรับประชากรที่มีการจัดระบบเรียงไว้แล้ว เช่น รายชื่อ เลขประจำตัวนักเรียน เลขที่บ้าน เป็นต้น ถ้ามีการกำหนดตัวแปรต้นหลายตัว ต้องใช้การสุ่มแบบแบ่งชั้น (Stratefied random sampling) ซึ่งอาจเป็นแบบ แบ่งชั้นแบบสัดส่วน (ประชากรมาก สุ่มมาก ประชากรน้อย สุ่มน้อย) หรือแบ่งชั้นโควต้า (Quota stratefied random sampling) ซึ่งสุ่มแต่ละกลุ่มออกมาในจำนวนเท่าๆกัน เป็นแบบที่นิยมใช้กันมาก
  • อย่างไรก็ตาม วิทยากรผู้บรรยายให้ความเห็นว่า การเลือกกลุ่มตัวอย่างโดยใช้ตารางสุ่มของยามาเน่ (Yamane) หรือของเครซี่และมอร์แกน (Krejcie & Morgan) มักได้ประมาณ 200-400 ราย ดังนั้นจะมาสรุปเป็นภาพรวมของประชากรทั้งประเทศไม่น่าจะได้ ไม่น่าเชื่อถือ ถ้าเป็นเพียงจังหวัดหรือภูมิภาคก็น่าจะดีกว่า เพราะปกติการทำแบบทดสอบความถนัดสำหรับนักเรียน จะต้องทดสอบกับเด็กนักเรียนจำนวนเป็นหมื่นๆคน กว่าจะเป็นข้อสอบมาตรฐานได้
  • ถ้าเป็นการวิจัยเชิงคุณภาพที่มีประชากรจำนวนไม่มาก ใช้วิธีการสุ่มแบบเฉพาะเจาะจง โดยไม่ใช้ความน่าจะเป็น ตัวอย่างเช่น ศึกษาหน่วยงาน 6 แห่ง ว่ามีปัจจัยอะไรบ้างที่ทำให้ประสบความสำเร็จ ก่อนอื่นต้องศึกษาเบื้องต้นก่อนโดยการสังเกต จากนั้นสัมภาษณ์ผู้ที่เกี่ยวข้อง เช่น ผู้บริหารสูงสุด ผู้ให้บริการ และผู้รับบริการ เป็นการตรวจสอบข้อมูลแบบ 3 เส้า เพื่อเพิ่มความน่าเชื่อถือให้แก่ผลการสัมภาษณ์ จะดีกว่าการใช้แบบสอบถาม เพราะได้ข้อมูลลึกซึ้งกว่า แต่ผู้วิจัยต้องเข้าใจปัญหาวิจัยของตนเองอย่างชัดแจ้ง ต้องลองสัมภาษณ์มาสัก 2-3 รายก่อนแล้วถอดเทปดูว่า ถามได้ตรงประเด็นหรือไม่
  • จำนวนกลุ่มตัวอย่างที่ได้ เป็นจำนวนขั้นต่ำที่สามารถพยากรณ์ไปยังประชากรได้ (error .05%) เวลาเก็บข้อมูล ควรส่งแบบสอบถามออกไปให้เกินจำนวนขั้นต่ำที่กำหนดไว้ประมาณ 20% — ได้กลับคืนมา ยิ่งเยอะยิ่งดี

เครื่องมือที่ใช้ในการวิจัย

  • เครื่องมือวิจัย ได้แก่ แบบสอบถาม และแบบทดสอบ
  • ต้องนำความรู้ที่ได้ทบทวนวรรณกรรม และทฤษฎีที่เกี่ยวข้องและเชื่อถือได้ (เรียบเรียงไว้ในบทที่ 2) มาเป็นหลักในการออกแบบเครื่องมือวิจัย
  • แบบสอบถาม คำถามตอนที่ 1 เป็นตัวแปรต้น เช่น ข้อมูลส่วนตัว ตัวแปรเชิงคุณลักษณะ ทำเป็นตัวเลือกตอบ ตัวแปรเชิงปริมาณ ให้ตอบแบบเติมคำ คำถามตอนที่ 2 เป็นคำถามหลักของการวิจัย มีการใช้ทฤษฎีเป็นแนวทางในการกำหนดข้อคำถาม เป็นการถามตัวแปรตาม ควรให้ตอบแบบมาตรประมาณค่า 5 ระดับ หรือคิดเป็นคะแนนได้ ในระดับอันตรภาค (interval scale) ที่สามารถนำไปคำนวณหาค่าเฉลี่ย ส่วนเบี่ยงเบนมาตรฐานได้
  • แบบสอบถาม ควรมีคำชี้แจงในการตอบที่ชัดเจน ใช้ถ้อยคำอ่านเข้าใจง่าย สร้างเสร็จแล้วต้องให้คณะกรรมการควบคุมตรวจสอบเบื้องต้น
  • ต้องมีการหาค่าความตรง (validity) โดยอาศัยผู้เชี่ยวชาญที่มีความรู้ในเรื่องนั้นๆจำนวน 3 คน ช่วยดูว่าถามได้ตรงประเด็นหรือไม่ หาค่าความสอดคล้องระหว่างข้อคำถามแต่ละข้อกับวัตถุประสงค์ (IOC) เห็นด้วย +1 ไม่แน่ใจ 0 ไม่เห็นด้วย -1 ถ้าข้อใดมีค่าเฉลี่ยเกิน 0.5 ข้อนั้นถือว่าใช้ได้
  • การหาค่าความเที่ยง (reliability) นำไปทดสอบความเชื่อมั่นกับกลุ่มที่มีลักษณะใกล้เคียงกับกลุ่มตัวอย่างอย่างน้อยสัก 30 คน จะได้คำตอบที่ตรงกัน เป็นการหาค่าสัมประสิทธิ์ของความเชื่อมั่น ครอนแบคอัลฟา (Cronbach’s alpha)
  • แบบทดสอบต้องมีการหาค่าความยากง่าย (ลองทำสัก 30 คน ถ้าส่วนใหญ่ตอบผิด ต้องมาปรับ) ค่าอำนาจจำแนก (แยกคนเก่ง และไม่เก่งออกจากกันได้ ต้องไม่ติดลบ คือคนไม่เก่งทำได้มากกว่าคนเก่ง) และค่าความเที่ยง

การวางแผนเก็บรวบรวมข้อมูล
ทำสำเนาแบบสอบถาม หนังสือนำของบัณฑิตวิทยาลัย จดหมายนำของผู้วิจัย คำชี้แจงเรื่องแบบสอบถาม พร้อมคำขอบคุณ จะเก็บข้อมูลด้วยตนเองหรือส่งทางไปรษณีย์ หรือใช้ทั้ง 2 วิธีก็ได้ ทำสำเนาแบบสอบถามให้มากกว่าจำนวนขั้นต่ำประมาณ 20% แล้วจึงดำเนินการส่งไปยังแหล่งเป้าหมาย ต้องกำหนดกลุ่มผู้ตอบตามตัวแปรที่กำหนดไว้ให้ได้จำนวนในแต่ละตัวแปรไม่น้อยกว่า 30 คน เพื่อจะได้นำไปวิเคราะห์ข้อมูลเชิงเปรียบเทียงได้อย่างเชื่อมั่น ระหว่างรอแบบสอบถามกลับคืนมา ควรออกแบบตารางนำเสนอข้อมูล ตามลำดับวัตถุประสงค์การวิจัย (บทที่ 4) ไว้ล่วงหน้า

การจัดกระทำและการวิเคราะห์ข้อมูล

  • ตรวจสอบแบบสอบถาม คัดฉบับที่สมบูรณ์ไว้ บางข้อที่ไม่ตอบ อย่างเพิ่งทิ้ง ให้คัดแยกไว้ก่อน ถ้าแบบสอบถามที่เหลือมีจำนวนมากกว่าขั้นต่ำ แสดงว่าใช้ได้ แต่ถ้าน้อยกว่าขั้นต่ำ ให้นำฉบับไม่สมบูรณ์มาปรับแก้ โดยอนุโลมให้ใช้ระดับ 3 ปานกลาง หรืออาจสั่งคำนวณหาค่าเฉลี่ยเฉพาะข้อนั้น เพื่อนำค่ามาใช้ก็ได้
  • จากนั้นกำหนดรหัสและป้อนข้อมูลลงในโปรแกรม SPSS เมื่อครบแล้ว ตรวจทานความผิดพลาดและแก้ไขให้เรียบร้อยก่อน คำนวณค่าต่างๆตามที่ต้องการ คัดลอกค่าสถิติจาก print out ลงในตารางที่ออกแบบไว้
  • ตารางแสดงข้อมูลส่วนตัว (ตัวแปรต้น) ควรทำเป็นตารางแบบไขว้ เพราะให้รายละเอียดหรือแจงนับได้ดีกว่า ข้อมูลตัวแปรตาม ให้แสดงผลในภาพรวมก่อน (ตอบวัตถุประสงค์ข้อที่ 1 ก่อน) แล้วค่อยแสดงแต่ละข้อ แต่ละด้าน และรวมทั้งหมด
  • การนำเสนอตารางและการอ่านตาราง (เรียบเรียงบทที่ 4) วิธีอ่านคือ อ่านเฉพาะจุดเด่น หรือจุดด้อยที่พบ ไม่ต้องอ่านทั้งหมด ให้คำนึงว่า สิ่งที่พบมีอะไรสำคัญที่น่าอภิปรายถึง (เพราะคำอ่านตารางจะต้องนำไปเสนอแนะต่อในบทที่ 5) ต้องอ่านให้ครบถ้วน เช่น ตารางเปรียบเทียบ 2 กลุ่ม โดยใช้ t-test ต้องอธิบายว่า ทั้งสองกลุ่มมีความแตกต่างอย่างมีนัยสำคัญ สอดคล้องกับสมมุติฐาน และต้องแจ้งต่อด้วยว่า กลุ่มใดมีค่ามากกว่ากลุ่มใด เป็นต้น

การอภิปรายผล

  • การเรียบเรียงบทที่ 5 ให้เสนอวัตถุประสงค์การวิจัย สมมุติฐานการวิจัย (โดยคัดลอกมาจากบทที่ 1) แสดงวิธีดำเนินการวิจัย (สรุปย่อมาจากบทที่ 3) สรุปผลการวิจัย (นำมาจากคำอ่านตารางในบทที่ 4) คำบางคำไม่น่าสนใจมากนักอาจไม่ต้องนำมากล่าวในตอนสรุปนี้ก็ได้ การอภิปรายผลการวิจัย ต้องแสดงศักยภาพของตนเองให้ชัดเจน ส่วนนี้สำคัญมาก ต้องนำวรรณกรรมที่ศึกษาไว้ในบทที่ 2 มาอ้างอิงด้วย ควรคิดข้อเสนอแนะต่อผู้บริหาร หรือข้อเสนอแนะในการวิจัยครั้งต่อไป หากพบประเด็นที่น่าสนใจที่ควรศึกษาต่อจากประเด็นที่ศึกษาไว้ในครั้งนี้ (แต่ถ้าไม่มีก็ไม่ต้องเสนอ)
  • เมื่อบทที่ 5 มีคุณภาพระดับหนึ่งแล้ว นำวิทยานิพนธ์ทั้ง 5 บทส่งให้คณะกรรมการอ่านและแก้ไข ซึ่งต้องใช้เวลาพอสมควร
  • ตอนเสนอโครงร่างวิทยานิพนธ์ ให้เขียนบทที่ 1, 2, 3 ว่าจะทำอะไรบ้าง แต่พอทำวิจัยเสร็จแล้ว บทที่ 3 ต้องเขียนใหม่ตามความเป็นจริง ใช้ข้อมูลที่ปฏิบัติจริง
  • ดำเนินการแก้ไข จนคณะกรรมการเห็นชอบให้สอบปากเปล่าได้ ยื่นเรื่องขอจบ ทำสำเนาส่งเล่มตามจำนวนที่กำหนด

[ อ่านต่อ ตอนที่ 3 ]

Read Full Post »

วันเสาร์-อาทิตย์ที่ 25-26 พฤษภาคม 2556 ไปฟังบรรยายและฝึกอบรมเรื่อง การประยุกต์สถิติเพื่อการวิจัยทางสารสนเทศศาสตร์ ซึ่งทางหลักสูตรสารสนเทศศาสตร์ มสธ. จัดขึ้น โดยมีวิทยากรผู้สอนคือ รศ.พวา พันธุ์เมฆา ท่านเป็นอาจารย์ที่ มศว. แม้จะเกษียณไปแล้วหลายปี แต่ก็มีความสามารถชนิดหาตัวจับยาก สอนสนุก ตลกขบขัน อาจารย์มักยกตัวอย่างประกอบที่ได้มาจากประสบการณ์จริง และเล่าเรื่องเรียกเสียงฮาได้เป็นระยะ เนื้อหาการบรรยายในวันนั้นสรุปออกแบ่งเป็น 4 ตอน ดังนี้

  • กระบวนการวิจัย และการออกแบบการวิจัย
  • การใช้สถิติพรรณนา
  • การใช้สถิติอ้างอิง สถิติทดสอบสมมุติฐาน
  • การใช้สถิติทดสอบความแตกต่าง

กระบวนการวิจัย และการออกแบบการวิจัย

ขั้นตอนแรกของกระบวนการวิจัยคือ การเตรียมการขั้นต้น

  1. จะวิจัยเรื่องอะไร (กำหนดปัญหาวิจัย) : ป้ญหาวิจัยต้องเป็นปัญหาจริงๆ ต้องอ่าน literature เยอะๆ อาจเป็นปัญหาใกล้ตัวก็ได้
  2. วิจัยกับใคร (กำหนดสิ่งวิจัย) : ขึ้นกับสถานภาพ อาชีพของเรา หรือสาขาวิชาที่เราทำวิจัย
  3. วิจัยวิธีใด (เลือกวิธีวิจัย) : เชิงปริมาณ หรือเชิงคุณภาพ หรือเชิงผสมผสาน

การวิจัยเชิงปริมาณ ใช้หน่วยวิจัยจำนวนมาก เช่น การส่งแบบสอบถามออกไป วัดออกมาเป็นตัวเลข จำเป็นต้องใช้สถิติในการวิเคราะห์ ใช้ทฤษฎีเป็นหลัก การวิจัยเชิงคุณภาพ ใช้หน่วยวิจัยไม่มากแต่เลือกที่มีคุณภาพที่สามารถให้ข้อมูลได้ ต้องออกไปเจอ ไปสัมภาษณ์ สังเกต บันทึกข้อมูล ถอดเทปประเด็นปัญหาที่สัมภาษณ์ว่าเป็นอย่างไรแล้วสรุปผล ไปหาองค์ความรู้จากของจริง ไม่มีการกำหนดตัวแปร ส่วนการวิจัยเชิงผสมผสาน ได้แก่ แบบผสานวิธี Mixed methods research (MMR) เริ่มด้วยเชิงปริมาณ เช่น สำรวจเบื้องต้นด้วยแบบสอบถามก่อน แล้วต่อด้วยเชิงคุณภาพ เช่น การสัมภาษณ์กับกลุ่มตัวอย่างที่เลือกมา หรือเริ่มด้วยเชิงคุณภาพ คือสัมภาษณ์ก่อนว่ามีปัญหาอะไรบ้าง จากนั้นรวบรวมปัญหามาสร้างเป็นข้อคำถาม เพื่อทำแบบสอบถามและเก็บข้อมูลเชิงปริมาณ หรืออาจทำทั้งเชิงปริมาณและเชิงคุณภาพควบคู่กัน หรือ Mixed models research คือ ใช้เชิงปริมาณทั้งคู่แต่เป็นรูปแบบต่างกัน เช่น เชิงสำรวจหรือประเมินด้วยแบบทดสอบก่อนเพื่อดูว่าปัญหาอยู่ที่ข้อใด จากนั้นต่อด้วยเชิงทดลองเพื่อแก้ปัญหาในข้อนั้น หรือใช้เชิงคุณภาพทั้งคู่ เช่น การวิจัยชาติพันธุ์วรรณนา แล้วตามด้วย ปรากฎการณ์วิทยา เป็นต้น

การออกแบบการวิจัย
ถ้าเป็นการวิจัยเชืงปริมาณ จะต้องมีการกำหนดตัวแปรในการวิจัย สิ่งที่เป็นประเด็นหลักของการวิจัย คือ ตัวแปรหลัก หรือ ตัวแปรตาม ซึ่งหมายถึงสิ่งที่เราจะวิจัย ส่วนตัวแปรต้น คือ คุณลักษณะของหน่วยวิจัยที่เราศึกษา ถ้าหน่วยวิจัยมีคุณลักษณะแตกต่างกันจะส่งผลต่อตัวแปรตามหรือไม่ มีตัวแปรต้นใดที่น่าสนใจจะศึกษาหรือไม่ หรือจะศึกษาแต่ตัวแปรตามก็ได้ แต่ถ้าศึกษาตัวแปรต้นด้วย จะทำให้การแก้ปัญหาได้ตรงจุดมากกว่า
ถ้ากำหนดตัวแปรต้นและตัวแปรตามได้ชัดเจน จะทำให้เราตั้งชื่อเรื่องงานวิจัย ได้ชัดเจน รวมทั้งกำหนดวัตถุประสงค์ สมมุติฐานการวิจัย (ข้อความที่ผู้วิจัยคาดหวังไว้ล่วงหน้า) และนิยามศัพท์เฉพาะได้ชัดเจนด้วย ตัวอย่างเช่น

  • ตัวแปรตาม = ความพึงพอใจของนักท่องเที่ยวชาวไทยต่อการท่องเที่ยวเชิงสัมผัสวัฒนธรรมในรูปแบบโฮมสเตย์
  • สิ่งวิจัย / หน่วยวิจัย = ชุมชนบ้านคลองเรือ อำเภอพะโต๊ะ จังหวัดชุมพร
  • ตัวแปรต้นที่ควรศึกษามีอะไรบ้าง = เพศ อายุ รายได้
  • ชื่อเรื่อง = ตัวแปรตาม (เรื่องที่จะวิจัย) + สิ่งวิจัย (ศึกษากับใคร) = การศึกษาความพึงพอใจของนักท่องเที่ยวชาวไทยต่อการท่องเที่ยวเชิงสัมผัสวัฒนธรรมในรูปแบบโฮมสเตย์ ของชุมชนบ้านคลองเรือ อำเภอพะโต๊ะ จังหวัดชุมพร
  • วัตถุประสงค์การวิจัย (โดยรวม) = เพื่อศึกษาความพึงพอใจของนักท่องเที่ยวชาวไทยต่อการท่องเที่ยวเชิงสัมผัสวัฒนธรรมในรูปแบบโฮมสเตย์ ของชุมชนบ้านคลองเรือ อำเภอพะโต๊ะ จังหวัดชุมพร
  • วัตถุประสงค์เฉพาะ = เพื่อเปรียบเทียบความพึงพอใจของนักท่องเที่ยวชาวไทยต่อการท่องเที่ยวเชิงสัมผัสวัฒนธรรมในรูปแบบโฮมสเตย์ ของชุมชนบ้านคลองเรือ อำเภอพะโต๊ะ จังหวัดชุมพร ตามตัวแปร เพศ อายุ รายได้
  • ถ้าตัวแปรตามมี 1 ตัว จะมีวัตถุประสงค์ 2 ข้อ ถ้ามีตัวแปรตาม 2 ตัว จะมีวัตถุประสงค์ 4 ข้อ คือ 1) วัตถุประสงค์ทั่วไปของตัวแปรตามที่หนึ่ง 2) เพื่อเปรียบเทียบตัวแปรตามตัวที่หนึ่ง 3) วัตถุประสงค์ทั่วไปของตัวแปรตามที่สอง 4) เพื่อเปรียบเทียบตัวแปรตามตัวที่สอง
  • การเขียนสมมุติฐานการวิจัย ให้เอาตัวแปรต้นและตัวแปรตามมาเขียน แยกเป็นรายข้อให้ชัดเจนตามตัวแปรต้น เพราะเราจะทดสอบสมมุติฐานทีละข้อ เช่น 1) นักท่องเที่ยวชาวไทยที่มีเพศต่างกัน มีความพึงพอใจต่อการท่องเที่ยวเชิงสัมผัสวัฒนธรรมในรูปแบบโฮมสเตย์แตกต่างกัน 2) นักท่องเที่ยวชาวไทยที่มีอายุต่างกัน มีความพึงพอใจต่อการท่องเที่ยวเชิงสัมผัสวัฒนธรรมในรูปแบบโฮมสเตย์แตกต่างกัน 3) นักท่องเที่ยวชาวไทยที่มีรายได้ต่างกัน มีความพึงพอใจต่อการท่องเที่ยวเชิงสัมผัสวัฒนธรรมในรูปแบบโฮมสเตย์แตกต่างกัน (ตัวแปรตาม = 1 ข้อ ตัวแปรต้น = 3 ข้อ เขียนสมมุติฐาน = 1×3 = 3 ข้อ แต่ถ้าตัวแปรตาม = 2 ข้อ ตัวแปรต้น = 4 ข้อ เขียนสมมุติฐาน = 2×4 = 8 ข้อ)
  • นิยามศัพท์เฉพาะ เพื่ออธิบายให้ผู้อ่านเข้าใจว่าเราหมายถึงอะไร คำที่นำมานิยามคือ ตัวแปรต้น (แบ่งเป็นกี่กลุ่ม อะไรบ้าง เช่น ช่วงอายุ รายได้) ตัวแปรตาม (ต้องนิยามเชิงปฏิบัติการ บอกความหมายว่าตัวแปรนี้คืออะไร จะวัดได้อย่างไร) และคำศัพท์อื่นที่คิดว่าผู้อ่านโดยทั่วไปยังไม่เข้าใจ (คำนี้หมายถึงอะไร ในการวิจัยครั้งนี้จะวัดอะไร โดยใช้ทฤษฎีอะไร)

[ อ่านต่อ ตอนที่ 2 ]

Read Full Post »

วันที่ 26-30 ส.ค. 54 ได้ไปลงทะเบียนเข้าฟังการบรรยาย (ฟรี) ในช่วง Twilight Program (18:00-20:00 น.) ของงาน Thailand Research Expo 2011 ที่สำนักงานคณะกรรมการการวิจัยแห่งชาติ (วช.) จัดขึ้นที่ศูนย์ประชุมบางกอกคอนเวนชั่นเซ็นเตอร์ เซ็นทรัลเวิลด์ .. เลือกฟังเรื่องเกี่ยวกับสถิติเพื่อการวิจัย จากวิทยากร 2 ท่าน คือ ดร. นำชัย ศุภฤกษ์ชัยสกุล จาก มศว. และ รศ.ดร. กัลยา วานิชย์บัญชา จากภาควิชาสถิติ คณะพาณิชศาสตร์และการบัญชี จุฬาฯ .. ฟังรู้เรื่องบ้างไม่ค่อยรู้เรื่องบ้าง เพราะพื้นไม่แน่น รู้สึกว่าค่อนข้างยาก แต่ก็จะขอนำมาสรุปรวมๆกัน เท่าที่พอจะจำได้ ดังนี้

  • Variable (ตัวแปร) มาจากคำว่า Vary + Able หมายถึง อะไรก็ตามที่ค่าของมันเปลี่ยนแปลงได้
  • การวัด คือ การให้ค่าตัวเลข ต่อคุณสมบัติ (attribute) ของสิ่งที่ต้องการศึกษา (object)
  • ระดับการวัดของตัวแปร (scale) ได้แก่ nominal, ordinal, interval, ratio
  • nominal และ ordinal คือ ตัวแปรจัดกลุ่ม (categorical, non-metric)
  • interval, ratio คือ ตัวแปรเชิงปริมาณ (continuous, quantitative, metric)
  • สถิติเชิงพรรณนา (descriptive statistics) ใช้บรรยายข้อมูล เช่น การวัด central tendency (ได้แก่ mean, median, mode, geometric mean, midrange) การวัด quartile การวัด variation (ได้แก่ range, variance, standard deviation, cofficient of variation)
  • สถิติเชิงอนุมาน (inferential statistics) ใช้ในการทดสอบสมมุติฐาน เช่น t-test, ANOVA, Chi-square
  • สถิติที่ใช้เปรียบเทียบความแตกต่าง (Difference tesing statistics) ของค่าเฉลี่ย (t-test, ANOVA) ของร้อยละ (chi-square) และของอันดับ (Mann-Whitney)
  • สถิติที่ใช้วัดหรือหาขนาดความสัมพันธ์ระหว่างตัวแปร (Measures of association statistics) เช่น Pearson correlation
  • Parametric statistics สถิติที่มีการประมาณค่าพารามิเตอร์ หรือสถิติที่เกี่ยวข้องกับค่าเฉลี่ย หรือส่วนเบี่ยงเบนมาตรฐาน เช่น t-test, ANOVA (analysis of variance), Pearson correlation
  • Nonparametric statistics คือสถิติที่ไม่มีการประมาณค่าพารามิเตอร์ หรือสถิติที่เกี่ยวข้องกับความถี่ ร้อยละ หรืออันดับ เช่น Chi-square, Mann-Whitney U
  • Univariate statistics สถิติตัวแปรเดียว วิเคราะห์ตัวแปรครั้งละ 1 ตัวแปร
  • Bivariate statistics สถิติสองตัวแปร วิเคราะห์ตัวแปรครั้งละ 2 ตัวแปร
  • Multivariate statistics สถิติหลายตัวแปร ได้แก่ multiple regression, MANOVA (multivariate ANOVA), discriminant analysis, logistic regression, cluster analysis, canonical correlation analysis, factor analysis (การแบ่งกลุ่มตัวแปร เป็นเทคนิคในการสร้างตัวแปรใหม่), structural equation modeling (SEM) (สมการโครงสร้าง), multilevel analysis, multilevel structural equation modeling (MSEM)
  • โปรแกรมวิเคราะห์สถิติ ที่ได้รับความนิยมในปัจจุบัน ได้แก่ IBM SPSS, STATA, SAS, JMP, AMOS, LISREL (สำหรับวิเคราะห์ SEM)
  • การวิเคราะห์ Regression ใช้เพื่ออธิบายความสัมพันธ์ระหว่างตัวแปร และเพื่อทำนายค่า (prediction) ของตัวแปรตาม
  • การวิเคราะห์การจำแนก (discriminant analysis) ใช้เพื่ออธิบายความแตกต่างระหว่างกลุ่ม (descriptive discriminant analysis – DDA) และเพื่อทำนายการจัดเข้ากลุ่ม (predictive discriminant analysis – PDA)
  • การศึกษาความสัมพันธ์ (interdependence) หรือลูกศรสองทาง QUAN QUAN ใช้ Pearson correlation / ordinal ordinal ใช้ Spearman correlation, Gamma, Kendall Tau, Mann-Whitney U test, Mc Nemar chi-square / nominal nominal ใช้ contingency, Pearson chi-square
  • การวิเคราะห์ factor analysis มี 2 ประเภทคือ exploratory factor analysis (EFA) และ confirmatory factor analysis (CFA)
  • แบบจำลองการวิเคราะห์ SEM แบ่งเป็น measurement model (confirmatory factor analysis) structural model (path analysis – การวิเคราะห์เส้นทาง) และ full model (path analysis with latent variables)
  • การวัดซ้ำ (repeated measure) เพื่อดูพัฒนาการ ใช้ repeated ANOVA, repeated ANCOVA, repeated MANOVA
  • การวัดความอยู่รอด (survival) ได้แก่ Log Rank, Kaplan-Meier Survival, Cox regression ตัวอย่างเช่น การวิเคราะห์งบการเงิน เพื่อดูว่าองค์กรจะอยู่รอดหรือไม่

Read Full Post »

Older Posts »

ติดตาม

Get every new post delivered to your Inbox.

Join 39 other followers