การเรียนรู้ของเครื่องภายใต้การดูแล: คืออะไร Algorithms ด้วยตัวอย่าง

การเรียนรู้ของเครื่องภายใต้การดูแลคืออะไร?

การเรียนรู้ของเครื่องภายใต้การดูแล เป็นอัลกอริทึมที่เรียนรู้จากข้อมูลการฝึกอบรมที่มีป้ายกำกับเพื่อช่วยคุณคาดการณ์ผลลัพธ์สำหรับข้อมูลที่ไม่คาดคิด ในการเรียนรู้แบบมีผู้สอน คุณจะฝึกเครื่องโดยใช้ข้อมูลที่มี "ป้ายกำกับ" อย่างดี หมายความว่าข้อมูลบางส่วนถูกแท็กคำตอบที่ถูกต้องแล้ว เปรียบได้กับการเรียนรู้ต่อหน้าหัวหน้างานหรือครู

สร้าง ปรับขนาด และปรับใช้ได้สำเร็จ ถูกต้อง โมเดลการเรียนรู้ของเครื่องภายใต้การดูแลต้องใช้เวลาและความเชี่ยวชาญทางเทคนิคจากทีมนักวิทยาศาสตร์ข้อมูลที่มีทักษะสูง นอกจากนี้, ข้อมูล นักวิทยาศาสตร์จะต้องสร้างใหม่ โมเดล เพื่อให้แน่ใจว่าข้อมูลเชิงลึกที่ให้ไว้ยังคงเป็นจริงจนกว่าข้อมูลจะมีการเปลี่ยนแปลง

การเรียนรู้แบบมีผู้สอนทำงานอย่างไร

การเรียนรู้ของเครื่องภายใต้การดูแลใช้ชุดข้อมูลการฝึกอบรมเพื่อให้ได้ผลลัพธ์ที่ต้องการ ชุดข้อมูลเหล่านี้ประกอบด้วยอินพุตและเอาต์พุตที่ถูกต้องซึ่งช่วยให้โมเดลเรียนรู้ได้เร็วขึ้น ตัวอย่างเช่น คุณต้องการฝึกเครื่องจักรเพื่อช่วยคุณคาดการณ์ว่าจะใช้เวลานานแค่ไหนในการขับรถกลับบ้านจากที่ทำงาน

ที่นี่ คุณจะเริ่มต้นด้วยการสร้างชุดข้อมูลที่ติดป้ายกำกับ ข้อมูลนี้ประกอบด้วย:

  • สภาพอากาศ
  • เวลาของวัน
  • เที่ยว

รายละเอียดทั้งหมดเหล่านี้เป็นข้อมูลที่คุณป้อนในตัวอย่างการเรียนรู้แบบมีผู้สอน ผลลัพธ์คือระยะเวลาที่ใช้ในการขับรถกลับบ้านในวันนั้น

การเรียนรู้ของเครื่องภายใต้การดูแลทำงานอย่างไร

คุณรู้โดยสัญชาตญาณว่าหากข้างนอกฝนตก คุณจะต้องใช้เวลาขับรถกลับบ้านนานขึ้น แต่เครื่องต้องการข้อมูลและสถิติ

มาดูตัวอย่างการเรียนรู้แบบมีผู้สอนเกี่ยวกับวิธีที่คุณสามารถพัฒนารูปแบบการเรียนรู้แบบมีผู้สอนตามตัวอย่างนี้ ซึ่งจะช่วยให้ผู้ใช้กำหนดเวลาการเดินทางได้ สิ่งแรกที่คุณต้องสร้างคือชุดฝึกซ้อม ชุดการฝึกนี้จะประกอบด้วยเวลาในการเดินทางทั้งหมดและปัจจัยที่เกี่ยวข้อง เช่น สภาพอากาศ เวลา ฯลฯ จากชุดการฝึกนี้ เครื่องของคุณอาจเห็นว่ามีความสัมพันธ์โดยตรงระหว่างปริมาณฝนกับเวลาที่คุณจะกลับบ้าน

ดังนั้นจึงมั่นใจได้ว่ายิ่งฝนตกมากเท่าไหร่คุณก็จะยิ่งขับรถกลับบ้านนานขึ้นเท่านั้น นอกจากนี้ยังอาจเห็นความเชื่อมโยงระหว่างเวลาที่คุณเลิกงานและเวลาที่คุณจะเดินทาง

ยิ่งใกล้หกโมงเย็นก็ยิ่งกลับบ้านนานขึ้น เครื่องของคุณอาจพบความสัมพันธ์บางอย่างกับข้อมูลที่ติดป้ายกำกับของคุณ

การทำงานของการเรียนรู้ของเครื่องภายใต้การดูแล
การทำงานของการเรียนรู้ของเครื่องภายใต้การดูแล

นี่คือจุดเริ่มต้นของโมเดลข้อมูลของคุณ เริ่มส่งผลต่อการที่ฝนส่งผลต่อวิธีการขับขี่ของผู้คน นอกจากนี้ยังเริ่มเห็นว่ามีผู้คนเดินทางมากขึ้นในช่วงเวลาหนึ่งของวัน

ประเภทของการเรียนรู้ของเครื่องภายใต้การดูแล Algorithms

ต่อไปนี้เป็นประเภทของอัลกอริทึมการเรียนรู้ของเครื่องจักรที่ได้รับการกำกับดูแล:

การถอยหลัง

เทคนิคการถดถอยทำนายค่าเอาท์พุตเดียวโดยใช้ข้อมูลการฝึก

ตัวอย่าง: คุณสามารถใช้การถดถอยเพื่อทำนายราคาบ้านจากข้อมูลการฝึกอบรมได้ ตัวแปรอินพุตจะเป็นพื้นที่ ขนาดบ้าน ฯลฯ

จุดแข็ง: เอาต์พุตจะมีการตีความความน่าจะเป็นเสมอ และอัลกอริทึมสามารถทำให้เป็นมาตรฐานได้เพื่อหลีกเลี่ยงไม่ให้มีการติดตั้งมากเกินไป

จุดอ่อน:การถดถอยแบบลอจิสติกส์อาจมีประสิทธิภาพต่ำกว่ามาตรฐานเมื่อมีขอบเขตการตัดสินใจหลายขอบเขตหรือแบบไม่เชิงเส้น วิธีนี้ไม่มีความยืดหยุ่น จึงไม่สามารถจับภาพความสัมพันธ์ที่ซับซ้อนมากขึ้นได้

การถดถอยโลจิสติก:

วิธีการถดถอยโลจิสติกใช้ในการประมาณค่าที่ไม่ต่อเนื่องโดยพิจารณาจากชุดตัวแปรอิสระที่กำหนด ช่วยให้คุณคาดการณ์ความน่าจะเป็นที่เหตุการณ์จะเกิดขึ้นโดยปรับข้อมูลให้เข้ากับฟังก์ชัน logit ดังนั้นจึงเรียกอีกอย่างว่าการถดถอยโลจิสติก เนื่องจากทำนายความน่าจะเป็น ค่าเอาต์พุตจะอยู่ระหว่าง 0 ถึง 1

ต่อไปนี้เป็นประเภทการถดถอยบางส่วน Algorithms

การจัดหมวดหมู่

การจำแนกประเภทหมายถึงการจัดกลุ่มผลลัพธ์ภายในชั้นเรียน หากอัลกอริธึมพยายามระบุอินพุตออกเป็นสองคลาสที่แตกต่างกัน จะเรียกว่าการจำแนกไบนารี การเลือกระหว่างมากกว่าสองคลาสเรียกว่าการจำแนกประเภทหลายคลาส

ตัวอย่าง: การพิจารณาว่าจะมีผู้ผิดนัดชำระหนี้หรือไม่

จุดแข็ง: แผนผังการจำแนกประเภททำงานได้ดีมากในทางปฏิบัติ

จุดอ่อน: ต้นไม้แต่ละต้นไม่มีข้อจำกัด มีแนวโน้มที่จะมีการจัดวางมากเกินไป

ต่อไปนี้เป็นประเภทการจำแนกประเภทบางส่วน Algorithms

ตัวแยกประเภท Naive Bayes

โมเดล Naive Bayesian (NBN) สร้างง่ายและมีประโยชน์มากสำหรับชุดข้อมูลขนาดใหญ่ วิธีการนี้ประกอบด้วยกราฟอะไซคลิกโดยตรงกับกราฟหลักหนึ่งรายการและรายการย่อยหลายรายการ มันถือว่าความเป็นอิสระระหว่างโหนดย่อยที่แยกจากพาเรนต์

ต้นไม้แห่งการตัดสินใจ

แผนผังการตัดสินใจจะแยกประเภทอินสแตนซ์โดยการจัดเรียงตามค่าคุณลักษณะ ในวิธีนี้ แต่ละโหมดถือเป็นคุณลักษณะของอินสแตนซ์ ควรจัดประเภท และทุกสาขาแสดงถึงค่าที่โหนดสามารถรับได้ เป็นเทคนิคที่ใช้กันอย่างแพร่หลายในการจำแนกประเภท ในวิธีนี้ การจำแนกประเภทคือแผนผังต้นไม้ซึ่งเรียกว่าแผนผังการตัดสินใจ

ช่วยให้คุณประมาณมูลค่าที่แท้จริงได้ (ค่าใช้จ่ายในการซื้อรถยนต์ จำนวนการโทร ยอดขายรวมต่อเดือน ฯลฯ)

สนับสนุนเครื่องเวกเตอร์

Support vector machine (SVM) เป็นอัลกอริทึมการเรียนรู้ประเภทหนึ่งที่พัฒนาขึ้นในปี 1990 วิธีการนี้อิงตามผลลัพธ์จากทฤษฎีการเรียนรู้ทางสถิติที่ Vap Nik นำมาใช้

เครื่อง SVM ยังเชื่อมต่ออย่างใกล้ชิดกับฟังก์ชันเคอร์เนลซึ่งเป็นแนวคิดหลักสำหรับงานการเรียนรู้ส่วนใหญ่ เคอร์เนลเฟรมเวิร์กและ SVM ถูกใช้ในหลากหลายสาขา ซึ่งรวมถึงการเรียกค้นข้อมูลมัลติมีเดีย ชีวสารสนเทศศาสตร์ และการจดจำรูปแบบ

เทคนิคการเรียนรู้ของเครื่องแบบมีผู้ดูแลและไม่ได้รับการดูแล

ขึ้นอยู่กับ เทคนิคการเรียนรู้ของเครื่องภายใต้การดูแล เทคนิคการเรียนรู้ของเครื่องที่ไม่ได้รับการดูแล
ป้อนข้อมูล Algorithms ได้รับการฝึกอบรมโดยใช้ข้อมูลที่ติดป้ายกำกับ Algorithms ใช้กับข้อมูลที่ไม่มีป้ายกำกับ
ความซับซ้อนในการคำนวณ การเรียนรู้แบบมีผู้สอนเป็นวิธีที่ง่ายกว่า การเรียนรู้แบบไม่มีผู้ดูแลมีความซับซ้อนในการคำนวณ
ความถูกต้อง วิธีการที่แม่นยำและเชื่อถือได้สูง Less วิธีการที่แม่นยำและเชื่อถือได้

ความท้าทายในการเรียนรู้ของเครื่องภายใต้การดูแล

นี่คือความท้าทายที่ต้องเผชิญในการเรียนรู้ของเครื่องภายใต้การดูแล:

  • คุณลักษณะอินพุตที่ไม่เกี่ยวข้องข้อมูลการฝึกอบรมในปัจจุบันอาจให้ผลลัพธ์ที่ไม่ถูกต้อง
  • การเตรียมข้อมูลและการประมวลผลล่วงหน้าถือเป็นเรื่องท้าทายเสมอ
  • ความแม่นยำจะลดลงเมื่อป้อนค่าที่เป็นไปไม่ได้ ไม่น่าจะเป็นไปได้ และไม่สมบูรณ์เป็นข้อมูลการฝึก
  • หากไม่มีผู้เชี่ยวชาญที่เกี่ยวข้อง วิธีการอื่นคือ "การใช้กำลังดุร้าย" หมายความว่าคุณต้องคิดว่าคุณสมบัติที่เหมาะสม (ตัวแปรอินพุต) ในการฝึกเครื่อง มันอาจจะไม่ถูกต้อง

ข้อดีของการเรียนรู้แบบมีผู้สอน

ข้อดีของการเรียนรู้ของเครื่องภายใต้การดูแลมีดังนี้

  • การกำกับดูแลการเรียนรู้ใน เครื่องเรียนรู้ ช่วยให้คุณสามารถรวบรวมข้อมูลหรือสร้างเอาต์พุตข้อมูลจากประสบการณ์ก่อนหน้า
  • ช่วยให้คุณปรับเกณฑ์ประสิทธิภาพให้เหมาะสมโดยใช้ประสบการณ์
  • การเรียนรู้ของเครื่องภายใต้การดูแลช่วยให้คุณแก้ปัญหาการประมวลผลในโลกแห่งความเป็นจริงประเภทต่างๆ

ข้อเสียของการเรียนรู้แบบมีผู้สอน

ด้านล่างนี้คือข้อเสียของ Supervised Machine Learning:

  • ขอบเขตการตัดสินใจอาจถูกฝึกมากเกินไปหากชุดการฝึกของคุณไม่มีตัวอย่างที่คุณต้องการมีในชั้นเรียน
  • คุณต้องเลือกตัวอย่างที่ดีมากมายจากแต่ละคลาสในขณะที่คุณกำลังฝึกตัวแยกประเภท
  • การจำแนก ข้อมูลขนาดใหญ่ อาจเป็นความท้าทายที่แท้จริง
  • การฝึกอบรมการเรียนรู้แบบมีผู้สอนต้องใช้เวลาในการคำนวณมาก

แนวทางปฏิบัติที่ดีที่สุดสำหรับการเรียนรู้แบบมีผู้สอน

  • ก่อนที่จะดำเนินการใดๆ คุณต้องตัดสินใจว่าจะใช้ข้อมูลประเภทใดเป็นชุดการฝึก
  • คุณต้องตัดสินใจเกี่ยวกับโครงสร้างของฟังก์ชันที่เรียนรู้และอัลกอริทึมการเรียนรู้
  • รวบรวมผลลัพธ์ที่เกี่ยวข้องจากผู้เชี่ยวชาญที่เป็นมนุษย์หรือจากการวัดผล

สรุป

  • ในอัลกอริทึมการเรียนรู้แบบมีผู้ดูแล คุณจะฝึกเครื่องจักรโดยใช้ข้อมูลที่ "ติดป้ายกำกับ" ไว้อย่างดี
  • คุณต้องการฝึกอบรมเครื่องจักรที่ช่วยให้คุณคาดการณ์ได้ว่าจะใช้เวลานานแค่ไหนในการขับรถกลับบ้านจากที่ทำงาน นี่คือตัวอย่างของการเรียนรู้แบบมีผู้สอน
  • การถดถอยและการจำแนกประเภทเป็นสองมิติของอัลกอริทึมการเรียนรู้ของเครื่องภายใต้การดูแล
  • การเรียนรู้ภายใต้การดูแล เป็นวิธีที่ง่ายกว่า ในขณะที่การเรียนรู้แบบไม่มีผู้ดูแลเป็นวิธีการที่ซับซ้อน
  • ความท้าทายที่ใหญ่ที่สุดในการเรียนรู้แบบมีผู้สอนคือคุณลักษณะการป้อนข้อมูลที่ไม่เกี่ยวข้องในปัจจุบันข้อมูลการฝึกอบรมอาจให้ผลลัพธ์ที่ไม่ถูกต้อง
  • ข้อได้เปรียบหลักของการเรียนรู้แบบมีผู้สอนคือช่วยให้คุณสามารถรวบรวมข้อมูลหรือสร้างเอาต์พุตข้อมูลจากประสบการณ์ครั้งก่อนได้
  • ข้อเสียของโมเดลนี้คือขอบเขตการตัดสินใจอาจมีมากเกินไป หากชุดการฝึกของคุณไม่มีตัวอย่างที่คุณต้องการให้มีในชั้นเรียน
  • ตามแนวทางปฏิบัติที่ดีที่สุดในการเรียนรู้แบบมีการควบคุม ก่อนอื่นคุณต้องตัดสินใจว่าควรใช้ข้อมูลประเภทใดเป็นชุดการฝึกอบรม