Tip:
Highlight text to annotate it
X
ในวิดีโอที่แล้ว เราสามารถ
คำนวณผลบวกกำลังสองรวม สำหรับจุดข้อมูล 9 ค่าตรงนี้,
จุดข้อมูล 9 จุดนี้ แบ่งออกเป็นสามกลุ่มต่างกัน
หรือถ้าคุณอยากพูดโดยทั่วไป มันแค่ออกมาเป็น "m" กลุ่มต่างๆ กัน
สิ่งที่ผมอยากทำในวิดีโอนี้ คือหาว่าผลบวกกำลังสองรวมนี้ มีอยู่เท่าไหร่
มีอยู่เท่าไหร่ที่มาจากความแปรผันภายในกลุ่ม
เทียบกับการแปรผันระหว่างกลุ่ม
นั้น, ลองหาความแปรผันรวมภายในกลุ่มก่อน
ลองดเรียมกันว่า ผลบวกกำลังสองภายในกลุ่ม, ผมจะใช้สีเหลืองนะ
ที่จริงผมใช้สีเหลืองอยู่แล้ว งั้นลองทำนี่ดู, ผมจะใช้สีฟ้านะ
ผลบวกกำลังสองภายในกลุ่ม
ขอผมบอกให้ชัดนะ, นี่แทนภายใน (within)
เราอยากรู้ว่าความแปรผัน
เนื่องจากจุดข้อมูลแต่ละจุดอยู่ห่างจากแนวโน้มของศูนย์กลางมัน
จากค่าเฉลี่ยของพวกมันไปเท่าไหร่
นี่จึงเท่ากับ -- ลองเริ่มด้วยเจ้านี่ก่อน
แทนที่จะเขียนระยะห่างระหว่างจุดข้อมูลแต่ละจุดกับค่าเฉลี่ยของค่าเฉลี่ย
ผมจะหาระยะห่างระหว่างจุดแต่ละจุดกับค่าเฉลี่ยของกลุ่ม
เพราะเราอยากยกกำลังสอง ผลบวกกำลังสองร่วม
ระหว่างจุดข้อมูลแต่ละจุด กับค่าเฉลี่ยของพวกมันเอง
3 ลบค่าเฉลี่ยตรงนี้, มันคือ 2. กำลังสอง
บกว 2 ลบ 2 กำลังสอง
บวก 1 ลบ 2 กำลังสอง
ผมจะทำอย่างนี้สำหรับทุกกลุ่ม
ในแต่ละกลุ่ม ระยะห่างระหว่างจุดข้อมูลกับค่าเฉลี่ยของกลุ่ม
จะได้ บวก ลบ 4 กำลังสอง, บวก 3 ลบ 4 กำลังสอง, บวก 4 ลบ 4 กำลังสอง
และสุดท้ายเรามีกลุ่มที่สาม
เาจะหาผลบวกกำลังสองทั้งหมดจากจุดแต่ละจุดไปยังแนวโน้มของศูนย์กลาง
ภายในกลุ่มนั้น, เราจะบวกมันเข้าด้วยกัน
แล้วเราจะหากลุ่มที่สาม, เราจะได้
5 ลบ 6 กำลังสอง, บวก 6 ลบ 6 กำลังสอง, บวก 7 ลบ 6 กำลังสอง
แล้วนี่จะเท่ากับอะไร?
นี่จะเท่ากับ, ตรงนี้, มันจะเท่ากับ 1+0+1
นั่นจะเท่ากับ 2
บวก นี่จะเท่ากับ 1+1+0, ได้ 2 อีกตัว
บวก นี่เท่ากับ 1+0+1, นั่นก็คือ 2 ตรงนี้
ดังนั้นผลบวกกำลังสองภายในกลุ่มรวมกันเป็น 6
วิธีคิดอย่างหนึ่งคือว่า, ความแปรปรวนรวมคือ 30
จากการคำนวณนั้น 6 จาก 30 นั่นมาจากการแปรผันภายในตัวอย่างเหล่านี้
ทีนี้สิ่งต่อไปที่ผมอยากคิด
คือดีกรีอิสระที่เรามีในการคำนวณนี้
มันมี, ประมาณว่า, จุดข้อมูลอิสระที่เรามี,
จากอันนี้, ตรงนี้, เรารู้ว่ามีจุดข้อมูล 'n' จุดในแต่ละกลุ่ม,
ในกรณีนี้ n เป็น 3, แต่ถ้าคุณรู้
n ลบ 1 ค่า, คุณสามารถหาตัวที่ n ได้ถ้าคุณรู้ค่าเฉลี่ยตัวอย่าง
ในกรณีนี้ สำหรับกลุ่มใดๆ ถ้าคุณรู้จุดข้อมูล 2 จุด,
คุณก็หาตัวที่สามได้เสมอ
ถ้าคุณรู้สองตัวนี้, คุณก็หา
ตัวที่สามได้ ถ้าคุณรู้ค่าเฉลี่ยตัวอย่าง
ดังนั้นลองหาดีกรีอิสระโดยทั่วไปกัน
คุณมี, ในแต่ละกลุ่ม, เวลาคุณทำอันนี้, คุณมีดีกรีอิสระเท่ากับ 'n' ลบ 1
จำไว้ 'n' เป็นจำนวนจุดข้อมูลที่คุณมีในแต่ละกลุ่ม
แล้วคุณมีดีกรีอิสระเป็น n-1 สำหรับแต่ละกลุ่มพกวนี้
มันก็คือ n-1, n-1, n-1
หรือคุณมี, ขอผมใส่มันแบบนี้นะ, คุณมี 'n-1' สำหรับแต่ละกลุ่มพวกนี้, และ
มันมีอยู่ m กลุ่ม
มันจึงมีดีกรีอิสระเป็น m คูณ n-1
ในกรณีเฉพาะนี้, แต่ละกลุ่ม n-1 เป็น 2
หรือในแต่ละกรณี, คุณมีดีกรีอิสระเป็น 2
และมันมีอยู่ 3 กลุ่ม เราจึงมีดีกรีอิสระเป็น 6
ในอนาคต เราอาจพูดคุยในรายละเอียดกันว่า ดีกรีอิสระหมายถึงอะไร
แล้วเราจะคิดในเชิงคณิตศาสตร์ว่าอย่างไร
แต่วิธีคิดที่ง่ายที่สุดคือว่า มันคือจำนวนจุดข้อมูลที่เป็นอิสระ
หากสมมุติว่าคุณรู้ค่ากลางทางสถิติในกรณีนี้
ที่เราใช้คำนวณกำลังสองของระยะห่างระหว่างจุดกับค่านั้นแต่ละตัว, ถ้าคุณรู้ค่าอยู่แล้ว
จุดข้อมูลที่สาม ก็สามารถหาได้จาก 2 ตัวที่เหลือ
คุณจึงมีดีกรีอิสระเป็น 6 ตรงนี้
ทีนี้ นั่นคือปริมาณของความแปรผันรวมที่มาจากความแปรผันในแต่ละตัวอย่าง
ทีนี้ ลองคิดดูว่ามีการแปรผันอยู่เท่าไหร่ที่มาจากการแปรผันระหว่างตัวอย่าง
และเวลาคิดค่านั้น, เราจะคำนรวณ -- เลือกสีสวยตรงนี้ --
ผมว่าผมใช้สีหมดแล้ว --
เราจะเรียกว่ามันว่าผลบวกกำลังสองระหว่างกลุ่ม, B แทนระหว่าง (between)
วิธีคิดอีกอย่างคือ, ความแปรผันรวมนี้มีอยู่เท่าไหร่
ที่มาจากการแปรผันระหว่างค่าเฉลี่ย, ระหว่างแนวโน้มของศูนย์กลาง
นั่นคือสิ่งที่เราจะคำนวณตรงนี้
มีเท่าไหร่ที่เกิดจากการแปรผันระหว่างจุดข้อมูลแต่ละจุดกับค่าเฉลี่ยของมัน
ลองหาดูว่ามีเท่าไหร่ ที่เกิดจากความแปรผันระหว่างเจ้าพวกนี่ตรงนี้
วิธีคิดอย่างหนึ่งคือว่า ในแต่ละจุดข้อมูล --
ลองคิดถึงกลุ่มแรกก่อน
สำหรับกลุ่มแรกนี้, มีความแปรผันเท่าไหร่ สำหรับแต่ละจุดนี้
ที่เกิดจากการแปรผันระหว่างค่าเฉลี่ยนี่ กับค่าเฉลี่ยของค่าเฉลี่ย
สำหรับตัวแรกบนนี้ -- ผมจะเขียนมันออกมาชัดๆ --
การแปรผันนั้น จะเท่ากับค่าเฉลี่ยตัวอย่าง, 2, ลบ ค่าเฉลี่ยของค่าเฉลี่ย, กำลังสอง
แล้วสำหรับเจ้านี่, มันก็เหมือนกัน.
ค่าเฉลี่ยตัวอย่างของมันคือ 2, ลบค่าเฉลี่ยของค่าเฉลี่ย, กำลังสอง
บวกเหมือนกับสำหรับเจ้านี่.
ค่าเฉลี่ยตัวอย่างของมันคอื 2, ลบค่าเฉลี่ยของค่าเฉลี่ย, กำลังสอง
หรือวิธีคิดอีกอย่างคือว่า, นี่เท่ากับ 3 คูณ 2-4 กำลังสอง,
ซึ่งก็เหมือนกับ 3 คูณ 4, นั่นเท่ากับ 12
ผมสามารถคิดแต่ละตัวได้. ผมอยากหาผลบวกทั้งหมด
ขอผมเขียนมันออกมาทั้งหมดนะ. ผมว่ามันเป็นสิ่งที่ง่ายที่สุดแล้ว
เจ้าพวกนี้ทั้งหมดรวมกัน
ผลบวกกำลังสอง เนื่องจากผลต่างระหว่างตัวอย่าง
นั่นก็มาจากตัวอย่างแรก, ผลมาจากตัวอย่างแรก
แล้วมาจากตัวอย่างที่สอง,
คุณมีเจ้านี่ตรงนี้ 5 - ขอโทษที, คุณต้องไม่คำนวณเจ้านี่
สำหรับจุดนี่ตรงนี้, ปริมาณการแปรผันเนื่องจากผลต่างระหว่างค่าเฉลี่ย
จะเท่ากับ 4 ลบ 4 กำลังสอง
เหมือนกันสำหรับเจ้านี่. มันคือ 4 ลบ 4 กำลังสอง
เราจะไม่เอาค่ามันมาคิด. เราเอาแค่ค่าเฉลี่ยตัวอย่างของมันมาคิดเฉยๆ
แล้วสุดท้าย บวก 4 ลบ 4 กำลังสอง
เราก็เอาอันนี้มา
ลบ เจ้านี่กำลังสอง สำหรับจุดข้อมูลพวกนี้แต่ละจุด
แล้วสุดท้าย เราก็ทำของกลุ่มสุดท้าย
ค่าเฉลี่ยตัวอย่าง คือ 6, มันจะเท่ากับ 6 ลบ 4 กำลังสอง, บวก 6 ลบ 4 กำลังสอง, บวก 6 ลบ 4 กำลังสอง
ทีนี้, ลองคิดถึง
ดีกรีอิสระที่เรามี ในการคำนวณค่านี่ตรงนี้กัน
ทีนี้, โดยทั่วไปแล้ว, ผมว่าวิธีคิดที่ง่ายที่สุดคือว่า
เรามีข้อมูลเท่าไหร่, หากสมมุติว่าเรารู้ค่าเฉลี่ยของค่าเฉลี่ย?
ถ้าเรารู้ค่าเฉลี่ยของค่าเฉลี่ย, มันมีข้อมูลใหม่อยู่กี่อัน?
ถ้าคุณรู้ 2 ค่านีี้ ถ้าคุณรู้ค่าเฉลี่ยของค่าเฉลี่ย คุณรู้ค่าเฉลี่ยตัวอย่าง 2 ค่า,
คุณก็หาตัวที่สามได้เสมอ
ถ้าคุณรู้อันนี้กับอันนี้, คุณก็หาอันนั้นได้
ถ้าคุณรู้อันนั้นกับอันนั้น, คุณก็สามารถหาอันนั้นได้
นั่นเป็นเพราะนี่คือค่าเฉลี่ยของค่าเฉลี่ยพวกนี่ตรงงนี้
โดยทั่วไปแล้ว, ถ้าคุณมี m กลุ่ม หรือคุณมีค่าเฉลี่ย m ค่า
มันจะมีดีกรีอิสระเป็น m-1 ตรงนี้
เมื่อรู้แล้ว, ในกรณีนี้ m เป็น 3
เราก็บอกว่า, มันมีดีกรีอิสรเป็น 2 สำหรับตัวอย่างนี้
งั้นลองคำนวณผลบวกกำลังสองระหว่างกลุ่มดู. นี่จะเป็นเท่าไหร่?
นี่จะเท่ากับ, เจ้านี่ตรงนี้คือ, 2 ลบ 4 เป็น ลบ 2, กำลังสองเป็น 4
แล้วเรามี 4 สามตัวตรงนี้, จึงได้ 3 คูณ 4
บวก 3 คูณ 0, บวก 3 คูณ 6 ลบ 4 กำลังสอง, ซึ่งก็คือ 3 คูณ 4. ได้ บวก 3 คูณ 4
แลเราได้ 3 คูณ 4 เป็น 12 บวก 0 บวก 12, เท่ากับ 24
ดังนั้นผลบวกกำลังสอง, หรือการแปรผันเนื่องจาก
ความแตกต่างระหว่างกลุ่ม, ระหว่างค่าเฉลี่ยเป็น 24
ที่ลองรวมพวกนี้เข้าด้วยกัน. เราบอกว่า
ความแปรผันรรวม เวลาคุณดูจุดข้อมูล 9 จุดรวมกัน คือ 30
ขอผมเขียนมันลงไปนะ
ผลบวกกำลังสองรวม เท่ากับ 30
เราหาผลรวมของกำลังสอง ระหว่างจุดข้อมูลกับแนวโน้มสู่ศูนย์กลาง, คือค่าเฉลี่ยตัวอย่าง
เราหาออกมา แล้วเรารวมทั้งหมดเข้า, เราได้ 6 เป็นผลบวกกำลังสองภายในกลุ่ม
ผลบวกของกำลังสองภายในกลุ่มเท่ากับ 6. ในกรณีนี้, มันมีดีกรีอิสระเป็น 6
ถ้าเราเขียนโดยทั่วไป, มันมีดีกรีอิสระเท่ากับ m คูณ n-1
ที่จริง คือทั้งหมดนั้น, เราหาได้ว่าดีกรีอิสระเป็น m คูณ n-1
ขอผมเขียนดีกรีอิสระในคอลัมน์นี่ตรงนี้นะ
ในกรณ๊นี้, เลขนี่กลายเป็น 8
แล้วตอนนี้, เราคำนวณผลบวกของกำลังสองระหว่างกลุ่มตัวอย่าง
ผลบวกกำลังสองระหว่างกลุ่มตัวอย่าง เท่ากับ 24
และเราหาแล้วว่ามันมีดีกรีอิสระเท่ากับ m-1 แล้วกลายเป็น 2
ทีนี้สิ่งที่น่าสนใจตรงนี้ -- นี่คือสาเหตุที่การวิเคราะห์ความแปรปรวนเข้ากันอย่างสวยงาม
ในวิดีโอหน้า เราจะคิดถึงวิธีที่เราสามารถทดสอบสมมติฐานได้
โดยใช้เครื่องมือที่เราคิดตรงนี้ --
มันคือว่า ผลบวกกำลังสองภายในกลุ่ม กับผลบวกกำลังสองระหว่างกลุ่ม
เท่ากับผลบวกกำลังสองรวม
วิธีคิดคือว่า การแปรผันรวมของข้อมูลนี่ตรงนี้
สามารถบรรยายได้ด้วยผลบวกของการแปรผันภายในกลุ่มแต่ละกลุ่ม
เมื่อคุณหาผลรวม
บวกผลบวกของการแปรผันระหว่างกลุ่มเข้าไป
และแม้แต่ดีกรีอิสระก็เป็น้ด้วย
ผลบวกกำลังสองระหว่างกลุ่มมีดีกรีอิสระเป็น 2
ผลบวกกำลังสองภายในกลุ่มแต่ละกลุ่ม มีดีกรีอิสระเป็น 6
2+6 ได้ 8
นั่นคือดีกรีอิสระรวมสำหรับข้อมูลที่เรามีทั้งหมด
มันใช้ได้ ถ้าคุณดูสูตรทั่วไป
ผลบวกกำลังสองระหว่างกลุ่มมีดีกรีอิสระเป็น m-1
ผลบวกกำลังสองภายในกลุ่า มีดีกรีอิสระ m(n-1)
นี่เท่ากับ m -1 + mn - m
เจ้าพวกนี้ตัดกัน. นี่เท่ากับดีกรีอิสระ mn-1
ซึ่งเท่ากับดีกรีอิสระรวม ที่เรามีสำหรับผลบวกกำลังสองรวม
ประเด็นของการคำนวณที่เราทำในวิดีโอที่แล้ว กับวิดีโอนี้
คือเพื่อซาบซึ้งว่า การแปรผันรวมตรงนี้
สามารถมองเป็นผลรวมของการแปรผันสองส่วนนี้,
ปริมาณการแปรผันภายในกลุ่มตัวอย่างแต่ละกลุ่ม
บวกปริมาณการแปรผันที่มีระหว่างค่าเฉลี่ยของตัวอย่าง
หวังว่ามันคงไม่งงเกินไปนะ