การเรียนรู้ของเครื่องภายใต้การดูแล: คืออะไร Algorithms ด้วยตัวอย่าง
การเรียนรู้ของเครื่องภายใต้การดูแลคืออะไร?
การเรียนรู้ของเครื่องภายใต้การดูแล เป็นอัลกอริทึมที่เรียนรู้จากข้อมูลการฝึกอบรมที่มีป้ายกำกับเพื่อช่วยคุณคาดการณ์ผลลัพธ์สำหรับข้อมูลที่ไม่คาดคิด ในการเรียนรู้แบบมีผู้สอน คุณจะฝึกเครื่องโดยใช้ข้อมูลที่มี "ป้ายกำกับ" อย่างดี หมายความว่าข้อมูลบางส่วนถูกแท็กคำตอบที่ถูกต้องแล้ว เปรียบได้กับการเรียนรู้ต่อหน้าหัวหน้างานหรือครู
สร้าง ปรับขนาด และปรับใช้ได้สำเร็จ ถูกต้อง โมเดลการเรียนรู้ของเครื่องภายใต้การดูแลต้องใช้เวลาและความเชี่ยวชาญทางเทคนิคจากทีมนักวิทยาศาสตร์ข้อมูลที่มีทักษะสูง นอกจากนี้, ข้อมูล นักวิทยาศาสตร์จะต้องสร้างใหม่ โมเดล เพื่อให้แน่ใจว่าข้อมูลเชิงลึกที่ให้ไว้ยังคงเป็นจริงจนกว่าข้อมูลจะมีการเปลี่ยนแปลง
การเรียนรู้แบบมีผู้สอนทำงานอย่างไร
การเรียนรู้ของเครื่องภายใต้การดูแลใช้ชุดข้อมูลการฝึกอบรมเพื่อให้ได้ผลลัพธ์ที่ต้องการ ชุดข้อมูลเหล่านี้ประกอบด้วยอินพุตและเอาต์พุตที่ถูกต้องซึ่งช่วยให้โมเดลเรียนรู้ได้เร็วขึ้น ตัวอย่างเช่น คุณต้องการฝึกเครื่องจักรเพื่อช่วยคุณคาดการณ์ว่าจะใช้เวลานานแค่ไหนในการขับรถกลับบ้านจากที่ทำงาน
ที่นี่ คุณจะเริ่มต้นด้วยการสร้างชุดข้อมูลที่ติดป้ายกำกับ ข้อมูลนี้ประกอบด้วย:
- สภาพอากาศ
- เวลาของวัน
- เที่ยว
รายละเอียดทั้งหมดเหล่านี้เป็นข้อมูลที่คุณป้อนในตัวอย่างการเรียนรู้แบบมีผู้สอน ผลลัพธ์คือระยะเวลาที่ใช้ในการขับรถกลับบ้านในวันนั้น
คุณรู้โดยสัญชาตญาณว่าหากข้างนอกฝนตก คุณจะต้องใช้เวลาขับรถกลับบ้านนานขึ้น แต่เครื่องต้องการข้อมูลและสถิติ
มาดูตัวอย่างการเรียนรู้แบบมีผู้สอนเกี่ยวกับวิธีที่คุณสามารถพัฒนารูปแบบการเรียนรู้แบบมีผู้สอนตามตัวอย่างนี้ ซึ่งจะช่วยให้ผู้ใช้กำหนดเวลาการเดินทางได้ สิ่งแรกที่คุณต้องสร้างคือชุดฝึกซ้อม ชุดการฝึกนี้จะประกอบด้วยเวลาในการเดินทางทั้งหมดและปัจจัยที่เกี่ยวข้อง เช่น สภาพอากาศ เวลา ฯลฯ จากชุดการฝึกนี้ เครื่องของคุณอาจเห็นว่ามีความสัมพันธ์โดยตรงระหว่างปริมาณฝนกับเวลาที่คุณจะกลับบ้าน
ดังนั้นจึงมั่นใจได้ว่ายิ่งฝนตกมากเท่าไหร่คุณก็จะยิ่งขับรถกลับบ้านนานขึ้นเท่านั้น นอกจากนี้ยังอาจเห็นความเชื่อมโยงระหว่างเวลาที่คุณเลิกงานและเวลาที่คุณจะเดินทาง
ยิ่งใกล้หกโมงเย็นก็ยิ่งกลับบ้านนานขึ้น เครื่องของคุณอาจพบความสัมพันธ์บางอย่างกับข้อมูลที่ติดป้ายกำกับของคุณ

นี่คือจุดเริ่มต้นของโมเดลข้อมูลของคุณ เริ่มส่งผลต่อการที่ฝนส่งผลต่อวิธีการขับขี่ของผู้คน นอกจากนี้ยังเริ่มเห็นว่ามีผู้คนเดินทางมากขึ้นในช่วงเวลาหนึ่งของวัน
ประเภทของการเรียนรู้ของเครื่องภายใต้การดูแล Algorithms
ต่อไปนี้เป็นประเภทของอัลกอริทึมการเรียนรู้ของเครื่องจักรที่ได้รับการกำกับดูแล:
การถอยหลัง
เทคนิคการถดถอยทำนายค่าเอาท์พุตเดียวโดยใช้ข้อมูลการฝึก
ตัวอย่าง: คุณสามารถใช้การถดถอยเพื่อทำนายราคาบ้านจากข้อมูลการฝึกอบรมได้ ตัวแปรอินพุตจะเป็นพื้นที่ ขนาดบ้าน ฯลฯ
จุดแข็ง: เอาต์พุตจะมีการตีความความน่าจะเป็นเสมอ และอัลกอริทึมสามารถทำให้เป็นมาตรฐานได้เพื่อหลีกเลี่ยงไม่ให้มีการติดตั้งมากเกินไป
จุดอ่อน:การถดถอยแบบลอจิสติกส์อาจมีประสิทธิภาพต่ำกว่ามาตรฐานเมื่อมีขอบเขตการตัดสินใจหลายขอบเขตหรือแบบไม่เชิงเส้น วิธีนี้ไม่มีความยืดหยุ่น จึงไม่สามารถจับภาพความสัมพันธ์ที่ซับซ้อนมากขึ้นได้
การถดถอยโลจิสติก:
วิธีการถดถอยโลจิสติกใช้ในการประมาณค่าที่ไม่ต่อเนื่องโดยพิจารณาจากชุดตัวแปรอิสระที่กำหนด ช่วยให้คุณคาดการณ์ความน่าจะเป็นที่เหตุการณ์จะเกิดขึ้นโดยปรับข้อมูลให้เข้ากับฟังก์ชัน logit ดังนั้นจึงเรียกอีกอย่างว่าการถดถอยโลจิสติก เนื่องจากทำนายความน่าจะเป็น ค่าเอาต์พุตจะอยู่ระหว่าง 0 ถึง 1
ต่อไปนี้เป็นประเภทการถดถอยบางส่วน Algorithms
การจัดหมวดหมู่
การจำแนกประเภทหมายถึงการจัดกลุ่มผลลัพธ์ภายในชั้นเรียน หากอัลกอริธึมพยายามระบุอินพุตออกเป็นสองคลาสที่แตกต่างกัน จะเรียกว่าการจำแนกไบนารี การเลือกระหว่างมากกว่าสองคลาสเรียกว่าการจำแนกประเภทหลายคลาส
ตัวอย่าง: การพิจารณาว่าจะมีผู้ผิดนัดชำระหนี้หรือไม่
จุดแข็ง: แผนผังการจำแนกประเภททำงานได้ดีมากในทางปฏิบัติ
จุดอ่อน: ต้นไม้แต่ละต้นไม่มีข้อจำกัด มีแนวโน้มที่จะมีการจัดวางมากเกินไป
ต่อไปนี้เป็นประเภทการจำแนกประเภทบางส่วน Algorithms
ตัวแยกประเภท Naive Bayes
โมเดล Naive Bayesian (NBN) สร้างง่ายและมีประโยชน์มากสำหรับชุดข้อมูลขนาดใหญ่ วิธีการนี้ประกอบด้วยกราฟอะไซคลิกโดยตรงกับกราฟหลักหนึ่งรายการและรายการย่อยหลายรายการ มันถือว่าความเป็นอิสระระหว่างโหนดย่อยที่แยกจากพาเรนต์
ต้นไม้แห่งการตัดสินใจ
แผนผังการตัดสินใจจะแยกประเภทอินสแตนซ์โดยการจัดเรียงตามค่าคุณลักษณะ ในวิธีนี้ แต่ละโหมดถือเป็นคุณลักษณะของอินสแตนซ์ ควรจัดประเภท และทุกสาขาแสดงถึงค่าที่โหนดสามารถรับได้ เป็นเทคนิคที่ใช้กันอย่างแพร่หลายในการจำแนกประเภท ในวิธีนี้ การจำแนกประเภทคือแผนผังต้นไม้ซึ่งเรียกว่าแผนผังการตัดสินใจ
ช่วยให้คุณประมาณมูลค่าที่แท้จริงได้ (ค่าใช้จ่ายในการซื้อรถยนต์ จำนวนการโทร ยอดขายรวมต่อเดือน ฯลฯ)
สนับสนุนเครื่องเวกเตอร์
Support vector machine (SVM) เป็นอัลกอริทึมการเรียนรู้ประเภทหนึ่งที่พัฒนาขึ้นในปี 1990 วิธีการนี้อิงตามผลลัพธ์จากทฤษฎีการเรียนรู้ทางสถิติที่ Vap Nik นำมาใช้
เครื่อง SVM ยังเชื่อมต่ออย่างใกล้ชิดกับฟังก์ชันเคอร์เนลซึ่งเป็นแนวคิดหลักสำหรับงานการเรียนรู้ส่วนใหญ่ เคอร์เนลเฟรมเวิร์กและ SVM ถูกใช้ในหลากหลายสาขา ซึ่งรวมถึงการเรียกค้นข้อมูลมัลติมีเดีย ชีวสารสนเทศศาสตร์ และการจดจำรูปแบบ
เทคนิคการเรียนรู้ของเครื่องแบบมีผู้ดูแลและไม่ได้รับการดูแล
ขึ้นอยู่กับ | เทคนิคการเรียนรู้ของเครื่องภายใต้การดูแล | เทคนิคการเรียนรู้ของเครื่องที่ไม่ได้รับการดูแล |
---|---|---|
ป้อนข้อมูล | Algorithms ได้รับการฝึกอบรมโดยใช้ข้อมูลที่ติดป้ายกำกับ | Algorithms ใช้กับข้อมูลที่ไม่มีป้ายกำกับ |
ความซับซ้อนในการคำนวณ | การเรียนรู้แบบมีผู้สอนเป็นวิธีที่ง่ายกว่า | การเรียนรู้แบบไม่มีผู้ดูแลมีความซับซ้อนในการคำนวณ |
ความถูกต้อง | วิธีการที่แม่นยำและเชื่อถือได้สูง | Less วิธีการที่แม่นยำและเชื่อถือได้ |
ความท้าทายในการเรียนรู้ของเครื่องภายใต้การดูแล
นี่คือความท้าทายที่ต้องเผชิญในการเรียนรู้ของเครื่องภายใต้การดูแล:
- คุณลักษณะอินพุตที่ไม่เกี่ยวข้องข้อมูลการฝึกอบรมในปัจจุบันอาจให้ผลลัพธ์ที่ไม่ถูกต้อง
- การเตรียมข้อมูลและการประมวลผลล่วงหน้าถือเป็นเรื่องท้าทายเสมอ
- ความแม่นยำจะลดลงเมื่อป้อนค่าที่เป็นไปไม่ได้ ไม่น่าจะเป็นไปได้ และไม่สมบูรณ์เป็นข้อมูลการฝึก
- หากไม่มีผู้เชี่ยวชาญที่เกี่ยวข้อง วิธีการอื่นคือ "การใช้กำลังดุร้าย" หมายความว่าคุณต้องคิดว่าคุณสมบัติที่เหมาะสม (ตัวแปรอินพุต) ในการฝึกเครื่อง มันอาจจะไม่ถูกต้อง
ข้อดีของการเรียนรู้แบบมีผู้สอน
ข้อดีของการเรียนรู้ของเครื่องภายใต้การดูแลมีดังนี้
- การกำกับดูแลการเรียนรู้ใน เครื่องเรียนรู้ ช่วยให้คุณสามารถรวบรวมข้อมูลหรือสร้างเอาต์พุตข้อมูลจากประสบการณ์ก่อนหน้า
- ช่วยให้คุณปรับเกณฑ์ประสิทธิภาพให้เหมาะสมโดยใช้ประสบการณ์
- การเรียนรู้ของเครื่องภายใต้การดูแลช่วยให้คุณแก้ปัญหาการประมวลผลในโลกแห่งความเป็นจริงประเภทต่างๆ
ข้อเสียของการเรียนรู้แบบมีผู้สอน
ด้านล่างนี้คือข้อเสียของ Supervised Machine Learning:
- ขอบเขตการตัดสินใจอาจถูกฝึกมากเกินไปหากชุดการฝึกของคุณไม่มีตัวอย่างที่คุณต้องการมีในชั้นเรียน
- คุณต้องเลือกตัวอย่างที่ดีมากมายจากแต่ละคลาสในขณะที่คุณกำลังฝึกตัวแยกประเภท
- การจำแนก ข้อมูลขนาดใหญ่ อาจเป็นความท้าทายที่แท้จริง
- การฝึกอบรมการเรียนรู้แบบมีผู้สอนต้องใช้เวลาในการคำนวณมาก
แนวทางปฏิบัติที่ดีที่สุดสำหรับการเรียนรู้แบบมีผู้สอน
- ก่อนที่จะดำเนินการใดๆ คุณต้องตัดสินใจว่าจะใช้ข้อมูลประเภทใดเป็นชุดการฝึก
- คุณต้องตัดสินใจเกี่ยวกับโครงสร้างของฟังก์ชันที่เรียนรู้และอัลกอริทึมการเรียนรู้
- รวบรวมผลลัพธ์ที่เกี่ยวข้องจากผู้เชี่ยวชาญที่เป็นมนุษย์หรือจากการวัดผล
สรุป
- ในอัลกอริทึมการเรียนรู้แบบมีผู้ดูแล คุณจะฝึกเครื่องจักรโดยใช้ข้อมูลที่ "ติดป้ายกำกับ" ไว้อย่างดี
- คุณต้องการฝึกอบรมเครื่องจักรที่ช่วยให้คุณคาดการณ์ได้ว่าจะใช้เวลานานแค่ไหนในการขับรถกลับบ้านจากที่ทำงาน นี่คือตัวอย่างของการเรียนรู้แบบมีผู้สอน
- การถดถอยและการจำแนกประเภทเป็นสองมิติของอัลกอริทึมการเรียนรู้ของเครื่องภายใต้การดูแล
- การเรียนรู้ภายใต้การดูแล เป็นวิธีที่ง่ายกว่า ในขณะที่การเรียนรู้แบบไม่มีผู้ดูแลเป็นวิธีการที่ซับซ้อน
- ความท้าทายที่ใหญ่ที่สุดในการเรียนรู้แบบมีผู้สอนคือคุณลักษณะการป้อนข้อมูลที่ไม่เกี่ยวข้องในปัจจุบันข้อมูลการฝึกอบรมอาจให้ผลลัพธ์ที่ไม่ถูกต้อง
- ข้อได้เปรียบหลักของการเรียนรู้แบบมีผู้สอนคือช่วยให้คุณสามารถรวบรวมข้อมูลหรือสร้างเอาต์พุตข้อมูลจากประสบการณ์ครั้งก่อนได้
- ข้อเสียของโมเดลนี้คือขอบเขตการตัดสินใจอาจมีมากเกินไป หากชุดการฝึกของคุณไม่มีตัวอย่างที่คุณต้องการให้มีในชั้นเรียน
- ตามแนวทางปฏิบัติที่ดีที่สุดในการเรียนรู้แบบมีการควบคุม ก่อนอื่นคุณต้องตัดสินใจว่าควรใช้ข้อมูลประเภทใดเป็นชุดการฝึกอบรม