การวิเคราะห์ข้อมูลเบื้องต้น
การวิเคราะห์ข้อมูลเบื้องต้น
ความหมายของคำต่างๆที่จะช่วยให้เข้าใจวิธีการทางสถิติมากขึ้น มีดังนี้
กลุ่มประชากร หมายถึง กลุ่มที่มีลักษณะที่เราสนใจ หรือกลุ่มที่เราต้องการจะศึกษาหาข้อมูลที่เกี่ยวข้อง เปรียบเหมือนเอกภพสัมพัทธ์ในเรื่องเซต
กลุ่มตัวอย่าง หมายถึง ส่วนหนึ่งของกลุ่มประชากรที่เราสนใจ
ในกรณีที่กลุ่มประชากรที่จะศึกษานั้นเป็นกลุ่มขนาดใหญ่ เกินความสามารถหรือความจำเป็นที่ต้องการ หรือเพื่อประหยัดในด้านงบประมาณและเวลา สามารถศึกษาข้อมูลเพียงบางส่วนของกลุ่มประชากรได้
ค่าพารามิเตอร์ หมายถึง ค่าต่างๆที่คำนวณมาจากกลุ่มประชากร จะถือเป็นค่าคงตัว กล่าวคือ
คำนวณกี่ครั้งๆก็จะไม่เปลี่ยนแปลง
ค่าสถิติ หมายถึง ค่าต่างๆที่คำนวณมาจากกลุ่มตัวอย่าง จะเป็นค่าที่เปลี่ยนแปลงได้ตจามกลุ่มตัวอย่างที่เลือกสุ่มมา จึงถือว่าเป็นค่าตัวแปรสุ่ม
ตัวแปร ในทางสถิติ หมายถึง ลักษณะบางอย่างที่เราสนใจ ค่าของตัวแปร
อาจอยู่ในรูปข้อความ หรือตัวเลขก็ได้
ค่าที่เป็นไปได้ หมายถึง ค่าของตัวแปรที่อาจจะเกิดขึ้นได้จริง
ค่าจากการสังเกต หมายถึง ค่าที่เก็บรวบรวมได้มาจริงๆ
การวิเคราะห์เบื้องต้นเกี่ยวกับเรื่องใดๆ เป็นการวิเคราะห์เพื่อทราบลักษณะโดยรวมเกี่ยวกับเรื่องนั้นๆ เช่น
1) การวิเคราะห์ข้อมูลเบื้องต้นเกี่ยวกับโรงเรียนใดโรงเรียนหนึ่ง ลักษณะโดยรวมของข้อมูลเกี่ยวกับโรงเรียนที่ควรจะทราบคือ
จำนวนนักเรียนจำแนกตามชั้นเรียนที่เปิดสอน
จำนวนนักเรียนโดยเฉลี่ยต่อห้อง
จำนวนครูจำแนกตามเพศ อายุ และระดับการศึกษา
2) การวิเคราะห์ข้อมูลเบื้องต้นเกี่ยวกับความเป็นอยู่ของประชาชนในท้องที่แห่งหนึ่ง ลักษณะโดยรวมของข้อมูลเกี่ยวกับความเป็นอยู่ของประชาชนที่ควรจะทราบคือ
จำนวนสมาชิกโดยเฉลี่ยของครอบครัว
จำนวนครอบครัวจำแนกตามอาชีพ
รายได้เฉลี่ยต่อครอบครัว และการกระจายรายได้ในแต่ละครอบครัว
ลักษณะโดยรวมของข้อมูลตามตัวอย่างข้างต้น จะเห็นได้ว่ามาจากการวิเคราะห์ที่เกียวกับเรื่องต่างๆต่อไปนี้ทั้งสิ้น
การแจกแจงความถี่ของข้อมูล
การหาค่ากลางของข้อมูล
การหาค่าการกระจายของข้อมูล
กล่าวได้ว่า การสรุปหรืออธิบายและนำเสนอข้อมูลด้วยค่าสถิติชุดหนึ่ง บอกลักษณะบางประการที่เป็นประโยชน์ต่อการทำความเข้าใจข้อมูลชุดนั้นได้ รวมทั้งการนำไปใช้ในเชิงวิเคราะห์หรือช่วยในการตัดสินใจ ค่าสถิติที่สำคัญมากสองค่าคือค่าที่บอกแนวโน้มสู่ส่วนกลางของข้อมูล กับค่าที่บอกถึงการกระจายของค่าต่างๆจากค่ากลางในข้อมูลชุดนั้น
การวิเคราะห์ข้อมูลเบื้องต้นเป็นการนำข้อมูลที่ได้ทั้งเชิงปริมาณและคุณภาพไปวิเคราะห์เพื่อไปสรุปลักษณะของประชากร ซึ่งผลที่ได้สามารถนำไปใช้ในการตัดสินใจต่อไปการวิเคราะห์สามารถแบ่งได้เป็น2ขั้นตอนคือ
1.การวิเคราะห์ข้อมูลเบื้องต้น หรือที่เรียกว่า สถิติพรรณนา(descriptive statistics)ได้แก่
การแจกแจงความถี่
การหาคาเฉลี่ย
การหาค่าสัดสวน
การหาค่าร้อยละ
การวดแนวโน้มสู่ศูนย์กลาง เป็นต้น
2.การวิเคราะห์ข้อมูลขั้นสูง หรือที่เรียกว่า สถิติอนุมาน(inferential statistics)ไดแกj
การประมาณค่า
การทดสอบสมมติฐานทางสถิติ
การวิเคราะห์ความแปรปรวน เป็นต้น
1.1การวัดค่ากลางของข้อมูล
ค่ากลางของข้อมูล คือ ค่าสถิติหรือตัวเลขตัวหนึ่งที่ได้จากการวิเคราะห์ ค่าที่ได้นั้นเราถือเป็นตัวแทนของข้อมูล และทำให้รู้สึกว่าค่ากลางของข้อมูลเป็นค่าที่อยู่ในตำแหน่งกลางๆของข้อมูล ดังตัวอย่างต่อไปนี้
หากผู้บริหารของโรงเรียนต้องการทราบผลการเรียนวิชาคณิตศาสตร์ของนักเรียนชั้นมัธยมศึกษาปีที่ 4,5 และ6 หัวหน้าสาขาวิชาคณิตศาสตร์ไม่จำเป็นต้องรายงานผลการเรียนของนักเรียนแต่ละคนให้ผู้บริหารทราบ แต่จะรายงานเพียงค่าเฉลี่ยหรือค่ากลางของคะแนนวิชาคณิตศาสตร์ของนักเรียนแต่ละชั้นก็เพียงพอที่จะตัดสินใจได้โดยกว้างๆว่า ผลการเรียนของนักเรียนแต่ละชั้นเป็นอย่างไร
ในการวิเคราะห์ข้อมูลเบื้องต้น นอกจากจะทำโดยสร้างตารางแจกแจงความถี่แล้ว การหาค่ากลางของข้อมูลมาเป็นตัวแทนของข้อมูลทั้งหมดจะทำให้สะดวกในการจดจำหรือสรุปเรื่องราวเกี่ยวกับข้อมูลต่างๆและจะช่วยทำให้เกิดการวิเคราะห์ข้อมูลถูกต้องมากขึ้น
การหาค่ากลางของข้อมูลมีวิธีหาหลายวิธี แต่ละวิธีมีข้อดีและข้อเสีย และมีความเหมาะสมในการนำไปใช้ไม่เหมือนกัน ขึ้นอยู่กับลักษณะข้อมูลและวัตถุประสงค์ของผู้ใช้ข้อมูลนั้นๆ
ตัวอย่าง จงพิจารณาว่าข้อมูลแต่ละชุดเหมาะที่จะใช้การวัดค่ากลางของข้อมูลชนิดใด (ค่าเฉลี่ยเลขคณิต/มัธยฐาน/ฐานนิยม)
ข้อมูลชุด ก. ได้แก่ 159 , 163 , 165 , 166 , 183 , 185 ตอบ มัธยฐาน
ข้อมูลชุด ข. ได้แก่ 15 , 16 , 15 , 18 , 17 , 14 , 16 ตอบ ค่าเฉลี่ยเลขคณิต
ข้อมูลชุด ค. ได้แก่ 3 , 3 , 4 , 4 , 5 , 6, 18 ตอบ ฐานนิยม
1.1.1ค่าเฉลี่ยเลขคณิต (Arithmetic mean)
หมายถึง การหารผลรวมของข้อมูลทั้งหมดด้วยจำนวนข้อมูลทั้งหมด
การหาค่าเฉลี่ยเลขคณิตสามารถหาได้ 2 วิธี
1. ค่าเฉลี่ยเลขคณิตของข้อมูลที่ไม่ได้แจกแจงความถี่ สามารถคำนวณได้จากสูตร
เมื่อ
ตัวอย่าง จากการสอบถามอายุของนักเรียนกลุ่มหนึ่งเป็นดังนี้ 14 , 16 , 14 , 17 , 16 , 14 , 18 , 17
1) จงหาค่าเฉลี่ยเลขคณิตของอายุนักเรียนกลุ่มนี้
2) ถ้ามีนักเรียนมาเพิ่มอีก 1 คน และมีอายุเป็น 17 ปี ค่าเฉลี่ยเลขคณิตเป็นเท่าใด
3) เมื่อ 3 ปีที่แล้ว ค่าเฉลี่ยเลขคณิตของอายุนักเรียนกลุ่มนี้เป็นเท่า
3) วิธีทำเมื่อ 3 ปีที่แล้ว 11 13 11 14 13 11 15 14 อายุปัจจุบัน 14 16 14 17 16 14 18 17
ตั
2.1 การหาค่าเฉลี่ยเลขคณิตข้อมูลที่แจกแจงความถี่ในกรณีที่ข้อมูลไม่เป็นอันตรภาคชั้น
ตัวอย่าง จากการสอบถามอายุของนักเรียนกลุ่มหนึ่งเป็นดังนี้ 14 , 16 , 14 , 17 , 16 , 14 , 18 , 17 จงหาค่าเฉลี่ยเลขคณิตของอายุนักเรียนกลุ่มนี้
วิธีทำ สร้างตารางแจกแจกความถี่ข้อมูล
ค่าข้อมูล( ถ้าให้ W1 , W2 , W3 , … , WN เป็นความสำคัญหรือน้ำหนักของค่าจากการสังเกต X1 , X2 , X3 , … , XN ตามลำดับเเล้ว ตัวอย่าง จงหาเกรดเฉลี่ยของนางสาวดา เมื่อผลการเรียนของนางสาวดา แสดงดังตาราง 1.1.2มัธยฐาน(Median) มัธยฐาน คือ ค่าที่มีตำแหน่งอยู่กึ่งกลางของข้อมูลทั้งหมด เมื่อเรียบเรียงข้อมูลจากต่าน้อยที่สุดไปหาค่าที่มากที่สุด หรือจากค่าที่มากที่สุดไปหาค่าที่น้อยที่สุด เราอาจใช้ตัวย่อ “Med” แทนค่ามัธยฐานของข้อมูล ค่ามัธยฐานอาจเป็นค่าใดค่าหนึ่งของข้อมูล หรืออาจเป็ฯค่าที่คำนวณขึ้นมาใหม่ ซึ่งไม่ตรงกับค่าของข้อมูลใดๆก็ได้ ค่ามัธยฐานนิยมใช้กับข้อมูล ซึ่งสูงกว่าหรือต่ำกว่าค่าอื่นมากๆ 1. การหาค่ามัธยฐานของข้อมูลที่ไม่แจกความถี่ เมื่อจัดเรียงข้อมูลชุดหนึ่งซึ่งมี N ค่า ตำแหน่งของมัธยฐาน จะคำนวณได้จากสูตร ตัวอย่าง จงหามัธยฐานของข้อมูลดังนี้ 5, 8, 3, 20, 100, 6 วิธีทำ เรียงข้อมูลจากน้อยไปมากได้ดังนี้ 3 5 6 8 20 100 ตำแหน่งของค่ามัธยฐาน คือ = (6+1)/2 = 3.5 ดังนั้น ค่ามัธยฐาน คือ = (6+8)/2 = 7 Ans 2. การหาค่ามัธยฐานของข้อมูลที่แจกแจงความถี่แล้ว ซึ่งสามารถหาค่ามัธยฐานได้จากสูตร เมื่อจัดเรียงข้อมูลชุดหนึ่งซึ่งมี N ค่า ตำแหน่งของมัธยฐาน จะคำนวณได้จากสูตร ตัวอย่าง จงหามัธยฐานของข้อมูลที่แจกแจงความถี่ ดังตาราง
วิธีทำ ตำแหน่งของค่ามัธยฐาน = N/2 = 40/2 = 20 L = (157+198)/2 = 157.5 แทนค่าในสูตร Med = 157.5 + [(20-14)/11]5 ≈ 160.23 ดังนั้น ค่ามัธยฐานของความสูง คือ ≈ 160.23 ตัวอย่าง อายุเฉลี่ยของเด็กกลุ่มหนึ่งมีการแจกแจงความถี่ดังนี้ ถ้ามัธยฐานของเด็กกลุ่มนี้เท่ากับ 7 ปีจงหค่า x
วิธีทำ ตำแหน่งของมัธยฐานคือ = N/2 = (13+X)/2 L = 6.5 แทนค่าในสูตร Med 7 = 6.5 + [(13+X)/2 - (3+X)]5 7 = (33/4)-(X/4) X = 5 1.1.3ฐานนิยม (Mode) ฐานนิยมคือค่ากลางของข้อมูล ซึ่งจะเป็นข้อมูลที่มีค่าของคะแนนที่ซ้ำกันมากที่สุด(มีความถี่สูงสุดของข้อมูลชุดนั้น) เช่น ข้อมูลที่เป็นขนาดรองเท้า ชนิดของน้ำมันที่ใช้กับรถยนต์ ยี่ห้อเครื่องดื่ม เป็นต้น เป็นการอธิบายลักษณะของข้อมูลชุดหนึ่งๆด้วยค่าจากข้อมูลที่มีจำนวนซ้ำมากที่สุด การหาฐานนิยมของข้อมูลหาได้จากการดูว่าข้อมูลใดมีความถี่สูงสุดหรือปรากฏบ่อยครั้งที่สุด ข้อมูลนั้นจะเป็นฐานนิยมของข้อมูลชุดนั้นซึ่งบางชุดอาจมีจำนวนซ้ำสูงสุดเพียงค่าเดียว หรือจำนวนซ้ำหลายค่าหรือบางชุดอาจไม่มีจำนวนซ้ำเลยซึ่งจะไม่สามารถบอกค่าฐานนิยมได้ ข้อควรระวังในการหาฐานนิยม 1.ถ้าข้อมูลชุดหนึ่ง มีข้อมูลแต่ละตัวมีความถี่เท่ากันหมดจะถือว่าข้อมูลนั้นไม่มีฐานนิยม 2.ถ้าข้อมูลชุดหนึ่ง มีข้อมูลที่มีความถี่สูงสุดเท่ากันมากกว่าหนึ่งข้อมูล ในที่นี่จะไม่พิจารณาหาฐานนิยม การหาค่าฐานนิยมมี2วิธีได้แก่ 1)การหาฐานนิยมกรณีที่ข้อมูลมีการแจกแจงความถี่แบบเรียงคะแนนแต่ละจำนวน 2)การหาฐานนิยมของข้อมูลที่จัดหมวดหมู่ ( Grouped Data )ในการหาฐานนิยมของข้อมูลที่จัดหมวดหมู่ การพิจารณาเลือกใช้ค่ากลางของข้อมูลควรเลือกให้เหมาะสมกับวัตถุประสงค์ เพื่อที่จะไม่ให้การสรุปผลหรือการตัดสินใจผิดพลาดได้ ค่าเฉลี่ยเลขคณิต
มัธยฐาน
ฐานนิยม
**หมายเหตุ ข้อมูลเชิงปริมาณ คือข้อมูลที่ใช้แทนขนาดหรือปริมาณซึ่งวัดออกมาเป็นจำนวนที่แน่นอน สามารถนำมาใช้เปรียบเทียบได้ ในขณะที่ข้อมูลเชิงคุณภาพไม่สามารถวัดได้โดยตรงแต่อธิบายลักษณะหรือคุณสมบัติได้ แท็ก |