Hypothesis Test for Difference of Means

- ในวิดีโอที่แล้ว, เราได้สร้างช่วงความมั่นใจ 95% สำหรับค่าเฉลี่ยน้ำหนักที่ลดลงระหว่างกลุ่มทานไขมันต่ำ กับกลุ่มควบคุม ในวิดีโอนี้, ผมอยากทดสอบสมมุติฐาน เพื่อทดสอบว่าข้อมูลนี้ทำให้เราเชื่อว่า อาหารแบบไขมันต่ำช่วยอะไรได้จริงหรือเปล่า และในการทำเช่นนั้น ลองตั้งสมมุติฐานว่างกับ ทางเลือกดู สมมุติฐานว่างของเราควรเป็น อาหารแบบไขมันต่ำไม่ได้ช่วยอะไร และถ้าอาหารแบบไขมันต่ำไม่ได้ช่วยอะไร, นั่นหมายความว่า ค่าเฉลี่ยประชากรสำหรับกลุ่มไขมันต่ำ ลบค่าเฉลี่ยประชากร ของกลุ่มควบคุมควรเท่ากับ 0 และนั่นก็หมายความว่า ค่าเฉลี่ยของการกระจายตัวตัวอย่าง สำหรับกลุ่ม ไขมันต่ำ ลบค่าเฉลี่ยของการกระจายตัวตัวอย่าง ของกลุ่มควบคุม ควรเท่ากับศูนย์ และนั่นเป็นเพราะเราเห็นนี่มาหลายครั้งแล้ว ค่าเฉลี่ยของการกระจายตัวตัวอย่าง ก็ เหมือนกับค่าเฉลี่ยประชากร นี่จึงเท่ากับอันนั้น นั่นก็เหมือนกับอันนั้น หรือ, พูดอีกอย่างคือว่า, ถ้าเราถึงค่าเฉลี่ย การกระจายตัวของ ผลต่างของ ค่าเฉลี่ยตัวอย่าง และเราพิจารณามันในวิดีโอก่อน, นั่น ควรเท่ากับ 0 เพราะเจ้านี่ตรงนี้ก็เหมือนกับ เจ้านั่นตรงนั้น นั่นคือสมมุติฐานว่างของเรา และสมมุติฐานทางเลือก ผมจะเขียนตรงนี้นะ มันก็คือมันช่วยอะไรสักอย่าง - และสมมุติว่ามันทำให้ดีขึ้น นั่นหมายความว่าเราลดน้ำหนักได้มากกว่า ถ้าเรามีค่าเฉลี่ยของกลุ่ม 1, ค่าเฉลี่ยประชากร ของกลุ่ม 1 ลบค่าเฉลี่ยประชากรของกลุ่ม 2 ควรมากกว่า 0 นี่จึงเป็นการกระจายตัวแบบหางเดียว หรือวิธีที่เรามองอีกอย่างได้, คือว่าค่าเฉลี่ยของ ผลต่างของการกระจายตัว, x1 ลบ x2 มากกว่า 0 ประโยคนี้เหมือนกัน เพราะเรารู้ว่า นี่ก็เหมือนกับอันนี้, ซึ่งเหมือนกับอันนี้, ซึ่งเหมือนกับที่ผม เขียนไว้ตรงนี้ ทีนี้, ในการทดสอบสมมติฐานไม่ว่าแบบไหน, เราต้อง เลือกระดับนัยสำคัญ - สิ่งที่เราจะทำคือว่า, เราจะสมมุติว่า สมมุติฐานว่างของเราถูกต้อง แล้วสมมุติฐานนั่น สมมติฐานว่างนั้น เป็นจริง, เราจะเห็นว่าความน่าจะเป็นของ การได้ข้อมูลตัวอย่างนี่ตรงนี้เป็นเท่าไหร่ แล้วถ้าความน่าจะเป็นนั้นต่ำกว่าขีดจำกัด, เราจะ ทิ้งสมมุติฐานว่าง แล้วเลือกสมมุติฐาน ทางเลือก ทีนี้, ขีดจำกัดความน่าจะเป็น, เราเห็นมาก่อนแล้ว เรียกว่าระดับนัยสำคัญ, บางครั้ง เรียกว่า อัลฟา และตรงนี้, เราจะเลือกระดับนัยสำคัญ ที่ 95% หรือวิธีคิดอีกอย่งคือว่า, ถ้าสมมุติว่าสมมติฐาน ว่างเป็นจริง, เราอยากให้โอกาสที่นี่จะ เกิดขึ้นไม่เกิน 5% หรือมีโอกาสทิ้งสมมุติฐานว่างไปอย่างผิดๆ ทั้ง ที่มันถูกแล้ว ไม่เกิน 5% หรือจะเรียกว่าคลาดเคลื่อนแบบที่ 1 ก็ได้ แล้วถ้ามันมีความน่าจะเป็นน้อยกว่า 5% ที่สิ่งนี้จะเกิดขึ้น, เราจะทิ้งสมมุติฐานว่างนั้น ความน่าจะเป็นน้อยกว่า 5% เมื่อกำหนดให้สมมุติฐานว่าง เป็นจริง, เราจะทิ้งสมมุติฐานว่าง และเลือก อันที่เป็นทางเลือก งั้นลองมาคิดกันดีกว่า เรามีสมมุติว่างอยู่ ขอผมวาดการกระจายตัวตรงนี้นะ สมมุติฐานว่างบอกว่า ค่าเฉลี่ยผลต่าง ของ การกระจายตัวตัวอย่าง ควรเท่ากับ 0 ทีนี้, ในกรณีนี้, พื้นที่วิกฤตของเรา คืออะไร? ทีนี้, เราต้องหาผล, เราต้อง มีค่าวิกฤตตรงนี้ เพราะนี่ไม่ใช่การกระจายตัวแบบปกติ ที่ตั้งศูนย์แล้ว แต่มันมีค่าวิกฤตค่าหนึ่งอยู๋ - และสิ่งที่ยากที่สุดในสถิติ คือ การใช้คำให้ถูก มันมีค่าวิกฤตค่าหนึ่งตรงนี้ ที่ความน่าจะเป็น ในการได้ตัวอย่างจากกระจายตัว มีค่าเหนือกว่าค่าดังกล่าว เป็น 5% - เราแค่ต้องหาว่าค่าวิกฤตนั้นคืออะไร และถ้าค่าของเรามากกว่าค่าวิกฤตนั้น, เรา ก็ทิ้งสมมุติฐานว่างได้ เพราะนั่นหมายความว่า โอกาสที่จะได้ค่านี่ น้อยกว่า 5% เราจึงสามารถทิ้งสมมุติฐานว่าง และเลือก สมมุติฐานทางเลือกได้ จำไว้, เหมือนเดิม, เราใช้คะแนน z ได้, และเรา สมมุติได้ว่านี่คือการกระจายตัวแบบปกติ เพราะ ขนาดตัวอย่างของเราใหญ่พอทั้งสองตัวอย่าง เรามีขนาดตัวอย่างเป็น 100 เพื่อหาค่า, ขั้นแรก, ถ้าเราดูที่ การกระจายตัวแบบปกติที่ตั้งศูนย์แล้ว, ค่า z วิกฤตเป็นเท่าไหร่? - เราจะได้ผลมากกว่าค่า z นั่น, มีโอกาสแค่ 5% นี่คือค่าสะสม พื้นที่นี่ตรงนี้ทั้งหมด คือ โอกาสได้ 95% เราก็แค่ดูที่ตาราง z เรามองหา 95% เราดูกรณีแบบหางเดียว ลองหา 95% นี่คืออันที่ใกล้ที่สุด เราอยากเลือกด้านที่มัน ไป ทางขวาหน่อย อย่างเช่น 95.05 ก็ดีแล้ว นั่นคือ 1.65 ค่า z วิกฤตนี้เท่ากับ 1.65 หรือวิธีมองอีกอย่างคือว่า, ระยะนี่ตรงนี้ จะเท่ากับ 1.65 ส่วนเบี่ยงเบนมาตรฐาน - ผมรู้ว่าผมเขียนตัวเล็กจริงๆ ผมแค่บอกว่า ค่าเบี่ยงเบนมาตรฐาน ของการกระจายตัวนั่น แล้วค่าเบี่ยงเบนมาตรฐานของ การกระจายตัวเป็นเท่าไหร่? เราได้คำนวณมันไปในวิดีโอก่อนแล้ว, และผม จะคำนวณมันใหม่อีกที ค่าเบี่ยงเบนมาตรฐานของการกระจายตัว ของผลต่าง ระหว่างค่าเฉลี่ยตัวอย่าง จะเท่ากับสแควร์รูท ของความแปรปรวนจากประชากรแรก ทีนี้, ความแปรปรวนของประชากรชุดแรก, เราไม่รู้ค่ามัน แต่เราสามารถประมาณมันด้วยค่าเบี่ยงเบนมาตรฐานตัวอย่าง ถ้าเราเลือกค่าเบี่ยงเบนมาตรฐานตัวอย่างมา, 4.67 แล้วคุณกำลังสองมัน, คุณจะได้ความแปรปรวนตัวอย่าง และนี่ก็คือความแปรปรวน นี่คือค่าประมาณที่ดีที่สุด สำหรับความแปรปรวน ของประชากร และเราอยากหารมันด้วยขนาดตัวอย่าง แล้วบวก ค่าประมาณที่ดีที่สุดของความแปรปรวน ของประชากรกลุ่ม 2, ซึ่งก็คือ 4.04 กำลังสอง ค่าเบี่ยงเบนมาตรฐานตัวอย่างของกลุ่ม 2 กำลังสอง นั่นให้ค่าความแปรปรวน หารด้วย 100 ผมทำมาก่อนแล้ว. บางทีมันยังอยู่ ในเครื่องคิดเลขผม ใช่, มันยังอยู่ในเครื่องคิดเลขอยู่เลย มันคือปริมาณตรงนี้ 4.67 กำลังสอง หารด้วย 100 บวก 4.04 กำลังสอง หารด้วย 100 มันคือ 0.617 เจ้านี่ตรงนี้จะเป็น 0.617 ระยะนี่ตรงนี้, จะ เท่ากับ 1.65 คูณ 0.617 ลองหากันว่ามันคืออะไร ลองหา 0.617 คูณ 1.65 มันก็คือ 1.02 ระยะนี่ตรงนี้คือ 1.02 สิ่งที่เจ้านี่บอกเราคือว่า, ถ้าเราสมมุติว่า การจำกัด อาหารไม่ได้ช่วยอะไร, มันมีโอกาสแค่ 5% ที่จะ เกิดผลต่างระหว่างค่าเฉลี่ยตัวอย่างทั้งสอง เกิด ผลต่างมากกว่า 1.02 มันมีโอกาสแค่ 5% นั่นหมายความว่าเราได้ 1.91 และนั่นอยู่สักที่ มันจึงอยู่ในเขตวิกฤตแน่นอน ความน่าจะเป็นที่จะได้ค่านี้, ถ้าสมมุติว่าสมมุติฐานว่าง เป็นจริง, จะน้อยกว่า 5% มันมีความน่าจะเป็นน้อยกว่าระดับนัยสำคัญของเราอีก ที่จริงแล้ว, ขอผมพูดให้ชัดหน่อย ระดับนัยสำคัญ, อัลฟานี่ ตรงนี้, ต้องเป็น 5% ไม่ใช่ 95% ผมว่าผมบอกไปแล้วตรงนี้ แต่ผมเขียนเลขผิดตรงนี้ ผมหักมันออกจาก 1 โดยไม่เจตนา บางทีผมอาจคิดในใจ แต่ช่างเถอะ, ระดับนัยสำคัญคือ 5% ความน่าจะเป็นหากสมมุติฐานว่างเป็นจริง, ความน่าจะเป็นที่ได้ผลอย่างที่เราได้, ความน่าจะเป็นที่ได้ผลต่างนั้น, น้อยกว่า ระดับนัยสำคัญ มันน้อยกว่า 5% จากกฎที่เราตั้งไว้ให้ตัวเอง ว่าระดับนัยสำคัญคือ 5%, เราจะทิ้งสมมุติฐานว่าง และเลือกอันทางเลือก นั่นคือ การจำกัดอหาร ทำให้คุณลดน้ำหนักได้จริง -