Tip:
Highlight text to annotate it
X
ก่อนอื่นๆเราจะแนะนำคำศัพท์พื้นฐานที่ใช้ใน AI
ซึ่งถูกใช้โดยทั่วไปในปัญญาประดิษฐ์เพื่อที่ใช้ในการแยกแยะปัญหาที่แตกต่างกัน
คำแรกสุดที่จะสอนคือ คำว่า ความสามารถสังเกตได้เต็ม (fully observable) กับ ความสังเกตได้บางส่วน (partially observable)
ในสภาวะแวดล้อมหนึ่งที่จะถูกเรียกว่า ความสามารถสังเกตุได้เต็ม ถ้าอะไรก็ตามที่ตัวแทนของเราสามารถรับรู้
ได้ทุกจุดในทุกเวลาที่เพียงพอต่อการทำให้เกิดการตัดสินใจที่เหมาะสมได้อย่างสมบูรณ์
ดังตัวอย่างเช่น ในเกมส์ประเภทไพ่หลายๆชนิด
เมื่อไพ่ทั้งหมดบนกระดาน หน้าไพ่ขณะหนึ่งของไพ่ท้้งหมด
มีความเพียงพอที่สุดต่อการการเลือกที่เหมาะสม
นั่นก็คือในทางตรงกันข้ามกับบางสภาพแวดล้อมอื่น ๆ ที่คุณต้องการหน่วยความจำ
ในด้านของตัวแทนเพื่อตัดสินใจที่ดีที่สุดที่เป็นไปได้
ตัวอย่างเช่น เกมส์โพกเกอร์ ที่ ไพ่จะไม่สามารถเปิดได้บนโต๊ะ
และต้องจดจำการจับไพ่ครั้งก่อนๆ ซึ่งจะช่วยในการตัดสินใจที่ดี
เพื่อให้เข้าใจความแตกต่างให้พิจารณาปฏิสัมพันธ์ของตัวแทน
กับสภาวะแวดล้อมกับตัวเซนเซอร์ (sensors) และ actuators ที่ต่อกัยตัวมัน
และปฏิสัมพันธ์นี้จะเกิดขึ้นมากกว่ารอบหลาย
บ่อยครั้งมันถูกเรียกว่า "perception-action cycle"
สำหรับที่หลายๆสภาวะแวดล้อม จะสะดวกเมื่อสมมุติว่า
สภาวะแวดล้อมมีการเรียงกันของสถานะภายใน
ตัวอย่างเช่นในเกมส์ไพ่ซึ่งการ์ดไม่ได้ถูกเปิดขึ้นบนโต๊ะ
สถานะอาจจะเกี่ยวข้องกับไพ่บนมือของคุณ
สภาวะแวดล้อมที่สามารถสังเกตุได้ทุกอย่างถ้าเซนเซอร์สามารถเห็นได้อย่างตลอดเวลา
ของสถานะทั้งหมดของสภาวะแวดล้อม
ความสามารถสังเกตุได้เฉพาะส่วน คือ ถ้าตัวเซนเซอร์เห็นได้เพียงบางส่วนของสถานะ
การจัดจำข้อมูลที่วัดได้ในอดีตยังคงให้ข้อมูลเพิ่มเติมของสถานะ
ที่ไม่ได้เป็นที่สังเกตได้อย่างง่ายดายในขณะนี้
ดังนั้นตัวอย่างในบางเกมส์เมื่อการเปลี่ยนแปลงของข้อมูล
ที่เกิดขึ้นบนไพ่บนมือใครคนหนึ่ง เกมส์เหล่านี้เรียกว่า ความสามารถสังเกตุได้บ่างส่วน
และต้องการความปฎิบัติที่แตกต่างกัน
บ่อยมากที่ตัวแทนเป็นจัดการกับสภาพแวดล้อมที่สังเกตได้บางส่วน
จำเป็นต้องมีรับหน่วยความจำภายในเพื่อจะเข้าใจสิ่งที่
สถานะของสภาวะแวดล้อมที่เป็น และ เราจะพูดมากขึ้นในสิ่งเหล่านี้
เมื่อเราพูดถึงเกี่ยวกับ Hidden Markov model ว่ามีลักษณะโครงสร้างอย่างไร
ซึ่งต้องการหน่วยความจำภายใน
คำศัพท์ที 2 เกี่ยวกับสภาวะแวดล้อมทีเกี่ยวข้องกับสภาวแวดล้อม
เป็น แบบ deterministic หรือ stochastic
สภาวะแวดล้อมแบบ deterministic เป็นหนึ่งในตัวแทนการกระทำของคุณ
ที่การส่งข้อมูลออกมาอย่างมีเอกลักษณ์
ดังตัวอย่างเช่นในหมากรุก ในการเคลื่อนตัวหมากในแต่ละครั้งจะไม่เป็นแบบสุ่ม
ลักษณะของการเคลื่อนที่ของตัวหมากในแต่ละชิ้นมีการกำหนดไว้ในรูปแบบตายตัว
และไม่ว่าผมจะย้ายตัวหมากไปที่ไหนผลลัพธ์ที่ได้ก็เหมือนกัน
สิ่งนี้เรียกว่า deterministic
เกมส์ที่เกี่ยวข้องกับลูกเต๋าเช่น Backgammon ถือว่าเป็น stochastic
ในขณะที่คุณยังสามารถย้ายตัวหมากได้อย่างตายตัว
แต่ผลลัพธ์ที่ได้จากการกระทำจะเกี่ยวพันกับการทอยลูกเต๋าด้วย
เราไม่สามารถคาดเดาสิ่งเหล่านี้ด้วย
ซึ่งผลจำนวนหนึ่งของการสุ่มที่เกี่ยวพันกับผลลัพธ์ของลูกเต๋า
ดังนั้นเราจะเรียกสิ่งเหล่านี้ว่า stochastic
ให้ผมพูดเกี่ยวกับ discrete กับ continuous
สภาวะแวดล้อมแบบ discrete คือ สภาวะแวดล้อมหนึ่งที่คุณมีทางเลือกของการกระทำแบบนับได้
และคุณสามารถรับรู้ได้หลายแบบที่นับได้
ตัวอย่างเช่น หมากรุก ที่มีตำแหน่งของกระดาษที่นับได้ระบุได้
และมีหลายสิ่งที่สามารถระบุได้และนับได้
ซึ่งแตกต่างจากสภาวะแวดล้อมแบบ continuous
เมื่อพื้นที่ของการกระทำที่เป็นได้หรือสิ่งที่เราสามารถรับรู้ได้เป็นแบบนับไม่ได้
ตัวอย่างเช่น การที่คุณปาเป้า มีทางเป็นได้ไม่สิ่นสุดตามมุมของลูกดอก
และแรงที่ให้กับลูกดอก
สุดท้ายนี้ เราจะแยกแยะระหว่าง สภาวะแวดล้อม แบบ benign กับ adversarial environment
สภาวะแวดล้อม แบบ benign คือสภาวะแวดล้อมที่อาจจะเป็นแบบสุ่ม
อาจจะเป็น stochastic แต่มีวัตถุประสงค์ที่ไม่เกี่ยวกับของตัวเอง
ที่จะขัดแย้งกับวัตถุประสงค์ของตัวเอง
ตัวอย่างเช่น อากาศเป็น benign
ซึ่งอาจจะเป็นแบบสุ่ม หรือ มันอาจจะเป็นผลการกระทบที่เกิดจากผลลัพธ์ของการกระทำของตัวคุณเอง
แต่มันจะไม่ได้อยู่แถวที่คุณอยู่
ตรงข้ามกับสภาวะแวดล้อมแบบ adversarial เช่น หมากรุก
เมื่อคู่ต่อสู้ของคุณจะอยู่แถวที่คุณอยู่
ซึ่งจะทำให้เกิดเกมส์ที่แยกขึ้นเพื่อที่จะหาการกระทำที่ดีในสภาวะแวดล้อมแบบ adversarial
เมื่อฝ่ายตรงข้ามสังเกตคุณอย่างแข็งขัน และ ต่อต้าน สิ่งที่คุณกำลังพยายามที่จะทำให้บรรลุ
สัมพันธ์กับสภาวะแวดล้อม benign เมื่อ สภาวะแวดล้อมเป็น stochastic เท่านั้น
แต่ไม่ได้เป็นที่สนใจจริงๆที่จะทำให้ชีวิตของคุณเลวร้ายลง
ดังนั้นเราให้ดูในขอบเขตที่คำเหล่านี้สิ่งที่ทำให้รู้สึกถึงคุณ
ต่อไปก็ทดสอบ
มี 4 แนวความคิด ได้แก่ สามารถสังเกตุได้เต็มและบางส่วน
stochastic กับ deterministic และ continuous กับ discrete,
และ adversarial กับ benign.
และให้ผมถามคุณเกี่ยวกับหมากฮอส
ลองตรวจสอบคุณลักษณะที่สามารถนำไปประยุกต์กับมันได้
ดังถ้าคุณคิดว่าตัวตรวจสอบที่มีความสามารถเฉพาะส่วน ให้กำหนดเพียงข้อเดียว
อย่างอื่นไม่ต้องกำหนด
ถ้าคุณคิดว่ามันเป็นแบบ stochastic กำหนดมันมันไว้
แบบ continuous ให้กำหนด หรือ แบบ adversarial ให้เลือกด้วย
ถ้าคุณไม่รู้เกี่ยวกับหมากฮอส ลองหาจาก web หรือ google
เพื่อที่จะหาข้อมูลที่ไม่มากนักเกี่ยวกับหมากฮอส