การเรียนรู้แบบมีผู้สอนและแบบไม่มีผู้ดูแล: ความแตกต่างระหว่างพวกเขา
ความแตกต่างที่สำคัญระหว่างการเรียนรู้แบบมีผู้สอนและแบบไม่มีผู้ดูแล
- ในการเรียนรู้แบบมีผู้สอน คุณจะฝึกเครื่องจักรโดยใช้ข้อมูลที่มี "ป้ายกำกับ" เป็นอย่างดี
- การเรียนรู้แบบไม่มีผู้ดูแลเป็นเทคนิคการเรียนรู้ของเครื่อง ซึ่งคุณไม่จำเป็นต้องควบคุมโมเดล
- การเรียนรู้แบบมีผู้สอนช่วยให้คุณสามารถรวบรวมข้อมูลหรือสร้างผลลัพธ์จากประสบการณ์ครั้งก่อนได้
- การเรียนรู้ของเครื่องที่ไม่ได้รับการดูแลช่วยให้คุณค้นหารูปแบบที่ไม่รู้จักทุกประเภทในข้อมูล
- การถดถอยและการจำแนกประเภทเป็นเทคนิคการเรียนรู้ของเครื่องภายใต้การดูแลสองประเภท
- Clusterไอเอ็นจีและสมาคมเป็นการเรียนรู้แบบไม่มีผู้ดูแลสองประเภท
- ในรูปแบบการเรียนรู้แบบมีผู้สอน จะมีการให้ตัวแปรอินพุตและเอาต์พุต ในขณะที่โมเดลการเรียนรู้แบบไม่มีผู้ดูแลจะให้เฉพาะข้อมูลอินพุตเท่านั้น
การเรียนรู้ของเครื่องภายใต้การดูแลคืออะไร?
ในการเรียนรู้แบบมีผู้สอน คุณจะฝึกเครื่องจักรโดยใช้ข้อมูลที่ดี “มีป้ายกำกับ- หมายความว่าข้อมูลบางส่วนถูกแท็กคำตอบที่ถูกต้องแล้ว เปรียบได้กับการเรียนรู้ที่เกิดขึ้นต่อหน้าหัวหน้างานหรือครู
อัลกอริธึมการเรียนรู้แบบมีผู้สอนเรียนรู้จากข้อมูลการฝึกอบรมที่มีป้ายกำกับ ช่วยให้คุณคาดการณ์ผลลัพธ์สำหรับข้อมูลที่ไม่คาดคิด การสร้าง ปรับขนาด และปรับใช้การเรียนรู้ของเครื่องที่มีการดูแลที่แม่นยำได้สำเร็จ แบบจำลองวิทยาศาสตร์ข้อมูลต้องใช้เวลาและความเชี่ยวชาญทางเทคนิคจากทีมนักวิทยาศาสตร์ข้อมูลที่มีทักษะสูง นอกจากนี้ นักวิทยาศาสตร์ด้านข้อมูลจะต้องสร้างแบบจำลองขึ้นใหม่เพื่อให้แน่ใจว่าข้อมูลเชิงลึกที่ให้ไว้ยังคงเป็นจริงจนกว่าข้อมูลจะมีการเปลี่ยนแปลง
Unsupervised Learning คืออะไร?
การเรียนรู้แบบไม่มีผู้ดูแลเป็นเทคนิคการเรียนรู้ของเครื่อง ซึ่งคุณไม่จำเป็นต้องควบคุมโมเดล แต่คุณต้องอนุญาตให้โมเดลทำงานด้วยตัวเองเพื่อค้นหาข้อมูลแทน โดยส่วนใหญ่จะเกี่ยวข้องกับข้อมูลที่ไม่มีป้ายกำกับ
อัลกอริธึมการเรียนรู้แบบไม่มีผู้ดูแลช่วยให้คุณทำงานประมวลผลที่ซับซ้อนกว่าเมื่อเทียบกับการเรียนรู้แบบมีผู้ดูแล แม้ว่าการเรียนรู้แบบไม่มีผู้ดูแลอาจคาดเดาได้ยากกว่าเมื่อเทียบกับวิธีการเรียนรู้เชิงลึกและการเรียนรู้เชิงเสริมแรงแบบธรรมชาติอื่นๆ
ทำไมต้องมีการเรียนรู้แบบมีผู้สอน?
- การเรียนรู้แบบมีผู้สอนช่วยให้คุณสามารถรวบรวมข้อมูลหรือสร้างผลลัพธ์จากประสบการณ์ครั้งก่อนได้
- ช่วยให้คุณปรับเกณฑ์ประสิทธิภาพให้เหมาะสมโดยใช้ประสบการณ์
- การเรียนรู้ของเครื่องภายใต้การดูแลช่วยให้คุณแก้ปัญหาการประมวลผลในโลกแห่งความเป็นจริงประเภทต่างๆ
ทำไมต้องเรียนรู้แบบไม่มีผู้ดูแล?
นี่คือเหตุผลสำคัญสำหรับการใช้การเรียนรู้แบบไม่มีผู้ดูแล:
- การเรียนรู้ของเครื่องที่ไม่ได้รับการดูแลจะค้นหารูปแบบที่ไม่รู้จักทุกประเภทในข้อมูล
- วิธีการที่ไม่มีผู้ดูแลช่วยให้คุณค้นหาคุณลักษณะที่เป็นประโยชน์สำหรับการจัดหมวดหมู่
- มันเกิดขึ้นแบบเรียลไทม์ ดังนั้นข้อมูลที่ป้อนทั้งหมดจะถูกวิเคราะห์และติดป้ายกำกับต่อหน้าผู้เรียน
- การได้รับข้อมูลที่ไม่มีป้ายกำกับจากคอมพิวเตอร์นั้นง่ายกว่าข้อมูลที่ติดป้ายกำกับซึ่งจำเป็นต้องมีการแทรกแซงด้วยตนเอง
การเรียนรู้แบบมีผู้สอนทำงานอย่างไร
ตัวอย่างเช่น คุณต้องการฝึกเครื่องจักรเพื่อช่วยคุณคาดการณ์ว่าจะใช้เวลานานแค่ไหนในการขับรถกลับบ้านจากที่ทำงาน ที่นี่ คุณจะเริ่มต้นด้วยการสร้างชุดข้อมูลที่ติดป้ายกำกับ ข้อมูลนี้ได้แก่
- สภาพอากาศ
- เวลาของวัน
- เที่ยว
รายละเอียดทั้งหมดนี้เป็นข้อมูลที่คุณป้อนเข้าไป ส่วนข้อมูลผลลัพธ์คือระยะเวลาที่ใช้ในการขับรถกลับบ้านในวันนั้น
คุณรู้โดยสัญชาตญาณว่าหากข้างนอกฝนตก คุณจะต้องใช้เวลาขับรถกลับบ้านนานขึ้น แต่เครื่องต้องการข้อมูลและสถิติ
มาดูกันว่าคุณจะพัฒนาโมเดลการเรียนรู้แบบมีผู้สอนตามตัวอย่างนี้ได้อย่างไร ซึ่งจะช่วยให้ผู้ใช้กำหนดเวลาการเดินทางได้ สิ่งแรกที่คุณต้องสร้างคือชุดข้อมูลการฝึกอบรม ชุดการฝึกนี้จะประกอบด้วยเวลาในการเดินทางทั้งหมดและปัจจัยที่เกี่ยวข้อง เช่น สภาพอากาศ เวลา ฯลฯ จากชุดการฝึกนี้ เครื่องของคุณอาจเห็นว่ามีความสัมพันธ์โดยตรงระหว่างปริมาณฝนกับเวลาที่คุณจะกลับบ้าน
ดังนั้นจึงมั่นใจได้ว่ายิ่งฝนตกมากเท่าไหร่คุณก็จะยิ่งขับรถกลับบ้านนานขึ้นเท่านั้น นอกจากนี้ยังอาจเห็นความเชื่อมโยงระหว่างเวลาที่คุณเลิกงานและเวลาที่คุณจะเดินทาง
ยิ่งใกล้หกโมงเย็นก็ยิ่งใช้เวลานานในการกลับบ้าน เครื่องของคุณอาจพบความสัมพันธ์บางอย่างกับข้อมูลที่ติดป้ายกำกับของคุณ
นี่คือจุดเริ่มต้นของโมเดลข้อมูลของคุณ เริ่มส่งผลต่อการที่ฝนส่งผลต่อวิธีการขับขี่ของผู้คน นอกจากนี้ยังเริ่มเห็นว่ามีผู้คนเดินทางมากขึ้นในช่วงเวลาหนึ่งของวัน
การเรียนรู้แบบไม่มีผู้ดูแลทำงานอย่างไร
มาดูกรณีเด็กทารกและสุนัขของครอบครัวเธอกันดีกว่า
เธอรู้จักและระบุตัวตนของสุนัขตัวนี้ได้ ไม่กี่สัปดาห์ต่อมา เพื่อนของครอบครัวก็พาสุนัขมาและพยายามเล่นกับเด็กทารก
ที่รักไม่เคยเห็นสุนัขตัวนี้มาก่อน แต่รับรู้ถึงลักษณะหลายอย่าง (2 หู ตา เดิน 4 ขา) เหมือนสุนัขเลี้ยงของเธอ เธอระบุสัตว์ชนิดใหม่เช่นสุนัข นี่คือการเรียนรู้แบบไม่มีผู้ดูแล ซึ่งคุณไม่ได้รับการสอน แต่คุณเรียนรู้จากข้อมูล (ในกรณีนี้คือข้อมูลเกี่ยวกับสุนัข) หากการเรียนรู้แบบมีผู้สอน เพื่อนในครอบครัวคงจะบอกทารกว่าเป็นสุนัข
ประเภทของเทคนิคการเรียนรู้ของเครื่องภายใต้การดูแล
การถอยหลัง
เทคนิคการถดถอยทำนายค่าเอาท์พุตเดียวโดยใช้ข้อมูลการฝึก
ตัวอย่าง: คุณสามารถใช้การถดถอยเพื่อทำนายราคาบ้านจากข้อมูลการฝึกอบรมได้ ตัวแปรอินพุตจะเป็นพื้นที่ ขนาดบ้าน ฯลฯ
การจัดหมวดหมู่
การจำแนกประเภทหมายถึงการจัดกลุ่มผลลัพธ์ภายในชั้นเรียน หากอัลกอริธึมพยายามระบุอินพุตออกเป็นสองคลาสที่แตกต่างกัน จะเรียกว่าการจำแนกไบนารี การเลือกระหว่างมากกว่าสองคลาสเรียกว่าการจำแนกประเภทหลายคลาส
ตัวอย่าง: การพิจารณาว่าจะมีผู้ผิดนัดชำระหนี้หรือไม่
จุดแข็ง: เอาต์พุตจะมีการตีความความน่าจะเป็นเสมอ และอัลกอริทึมสามารถทำให้เป็นมาตรฐานได้เพื่อหลีกเลี่ยงไม่ให้มีการติดตั้งมากเกินไป
จุดอ่อน:การถดถอยแบบลอจิสติกส์อาจมีประสิทธิภาพต่ำกว่ามาตรฐานเมื่อมีขอบเขตการตัดสินใจหลายขอบเขตหรือแบบไม่เชิงเส้น วิธีนี้ไม่มีความยืดหยุ่น จึงไม่สามารถจับภาพความสัมพันธ์ที่ซับซ้อนมากขึ้นได้
ประเภทของเทคนิคการเรียนรู้ของเครื่องแบบไม่มีผู้ดูแล
ปัญหาการเรียนรู้โดยไม่มีผู้ดูแลจะถูกจัดกลุ่มเพิ่มเติมเป็นปัญหาด้านการจัดกลุ่มและการเชื่อมโยง
Clusterไอเอ็นจี
Clustering เป็นแนวคิดที่สำคัญเมื่อพูดถึงการเรียนรู้แบบไม่มีผู้ดูแล ส่วนใหญ่จะเกี่ยวข้องกับการค้นหาโครงสร้างหรือรูปแบบในการรวบรวมข้อมูลที่ไม่มีการจัดหมวดหมู่ Clusterอัลกอริธึมจะประมวลผลข้อมูลของคุณและค้นหาคลัสเตอร์ธรรมชาติ (กลุ่ม) หากมีอยู่ในข้อมูล คุณยังสามารถปรับเปลี่ยนจำนวนคลัสเตอร์ที่อัลกอริธึมของคุณควรระบุได้ ซึ่งจะช่วยให้คุณปรับความละเอียดของกลุ่มเหล่านี้ได้
สมาคม
กฎการเชื่อมโยงช่วยให้คุณสามารถสร้างการเชื่อมโยงระหว่างวัตถุข้อมูลภายในฐานข้อมูลขนาดใหญ่ได้ เทคนิคที่ไม่ได้รับการดูแลนี้เป็นการค้นหาความสัมพันธ์ที่น่าตื่นเต้นระหว่างตัวแปรในฐานข้อมูลขนาดใหญ่ ตัวอย่างเช่น คนที่ซื้อบ้านใหม่มักจะซื้อเฟอร์นิเจอร์ใหม่
ตัวอย่างอื่น ๆ :
- กลุ่มย่อยของผู้ป่วยโรคมะเร็งที่จัดกลุ่มตามการวัดการแสดงออกของยีน
- กลุ่มนักช้อปตามประวัติการเข้าชมและการซื้อ
- กลุ่มภาพยนตร์ตามเรตติ้งที่กำหนดโดยผู้ชมภาพยนตร์
ความแตกต่างระหว่างการเรียนรู้แบบมีผู้สอนและแบบไม่มีผู้ดูแล
พารามิเตอร์ | เทคนิคการเรียนรู้ของเครื่องภายใต้การดูแล | เทคนิคการเรียนรู้ของเครื่องที่ไม่ได้รับการดูแล |
---|---|---|
กระบวนการ | ในโมเดลการเรียนรู้แบบมีผู้สอน จะมีการให้ตัวแปรอินพุตและเอาต์พุต | ในรูปแบบการเรียนรู้แบบไม่มีผู้ดูแล จะมีการป้อนข้อมูลเท่านั้น |
ป้อนข้อมูล | Algorithms ได้รับการฝึกอบรมโดยใช้ข้อมูลที่ติดป้ายกำกับ | Algorithms ใช้กับข้อมูลที่ไม่มีป้ายกำกับ |
Algorithms เคย | รองรับเครื่องเวกเตอร์ โครงข่ายประสาทเทียม การถดถอยเชิงเส้นและลอจิสติกส์ ฟอเรสต์แบบสุ่ม และแผนผังการจำแนกประเภท | อัลกอริทึมที่ไม่มีการดูแลสามารถแบ่งออกเป็นหมวดหมู่ต่างๆ เช่น Cluster อัลกอริทึม K-means การจัดกลุ่มแบบลำดับชั้น ฯลฯ |
ความซับซ้อนในการคำนวณ | การเรียนรู้แบบมีผู้สอนเป็นวิธีที่ง่ายกว่า | การเรียนรู้แบบไม่มีผู้ดูแลมีความซับซ้อนในการคำนวณ |
การใช้ข้อมูล | โมเดลการเรียนรู้แบบมีผู้สอนใช้ข้อมูลการฝึกอบรมเพื่อเรียนรู้การเชื่อมโยงระหว่างอินพุตและเอาต์พุต | การเรียนรู้แบบไม่มีผู้ดูแลไม่ได้ใช้ข้อมูลเอาท์พุต |
ความแม่นยำของผลลัพธ์ | วิธีการที่แม่นยำและเชื่อถือได้สูง | Less วิธีการที่แม่นยำและเชื่อถือได้ |
การเรียนรู้แบบเรียลไทม์ | วิธีการเรียนรู้เกิดขึ้นแบบออฟไลน์ | วิธีการเรียนรู้เกิดขึ้นแบบเรียลไทม์ |
จำนวนคลาส | ทราบจำนวนคลาสแล้ว | ไม่ทราบจำนวนชั้นเรียน |
ข้อเสียเปรียบหลัก | การจัดประเภทข้อมูลขนาดใหญ่อาจเป็นความท้าทายอย่างแท้จริงในการเรียนรู้แบบมีผู้สอน | คุณไม่สามารถรับข้อมูลที่แม่นยำเกี่ยวกับการเรียงลำดับข้อมูลได้ และผลลัพธ์ที่เป็นข้อมูลที่ใช้ในการเรียนรู้แบบไม่มีผู้ดูแลจะมีป้ายกำกับและไม่เป็นที่รู้จัก |