บทช่วยสอน Talend – เครื่องมือ ETL ของ Talend คืออะไร
สรุปบทช่วยสอน Talend
ในบทช่วยสอน Talend นี้ คุณจะได้เรียนรู้แนวคิดทั้งหมดตั้งแต่เริ่มต้น บทช่วยสอนนี้ครอบคลุมหัวข้อพื้นฐานไปจนถึงขั้นสูง เช่น Talend คืออะไร ประวัติของเครื่องมือ Talend ข้อมูลขนาดใหญ่ของ Talend ประโยชน์ของการรวมข้อมูลโดยใช้เครื่องมือ Talend สถาปัตยกรรมโอเพ่นสตูดิโอ และส่วนขยายของโอเพ่นสตูดิโอของ Talend บทช่วยสอน Talend นี้ไม่มีค่าใช้จ่ายใดๆ
ทาเลนด์คืออะไร?
Talend เป็นแพลตฟอร์มซอฟต์แวร์โอเพ่นซอร์สที่นำเสนอโซลูชั่นการบูรณาการข้อมูลและการจัดการข้อมูล Talend เชี่ยวชาญในการบูรณาการข้อมูลขนาดใหญ่ เครื่องมือนี้มีคุณสมบัติต่างๆ เช่น คลาวด์ ข้อมูลขนาดใหญ่ การบูรณาการแอปพลิเคชันระดับองค์กร คุณภาพข้อมูล และการจัดการข้อมูลหลัก นอกจากนี้ยังมีพื้นที่เก็บข้อมูลแบบรวมเพื่อจัดเก็บและนำข้อมูลเมตากลับมาใช้ใหม่
มีทั้งแบบโอเพ่นซอร์สและเวอร์ชันพรีเมี่ยม เป็นหนึ่งในเครื่องมือที่ดีที่สุดสำหรับการประมวลผลแบบคลาวด์และ ข้อมูลขนาดใหญ่ บูรณาการ
ประวัติความเป็นมาของพรสวรรค์
ปี | ขั้น |
---|---|
2002 | วิจัยและพัฒนา |
2005 | การสร้างบริษัท - การจัดหาเงินทุนรอบแรกของ AGF ไพรเวทอิควิตี้ และ Galle Partners |
2006 | Open Studio V1.0 เปิดตัวการดำเนินงานในสหรัฐอเมริกา |
2007 | ชุดบูรณาการ/ปิดการจัดหาเงินทุนรอบที่สอง |
2008 | เปิด Profiler/ คุณภาพข้อมูล |
2009 | การได้มาซึ่งชุดบูรณาการ RTx/MPx/ MDM |
2010 | IDM รุ่นชุมชน / MDM รุ่นองค์กร |
เปิดสตูดิโอ วี | |
2014 | OW2 สุดยอดโครงการ |
2015 | ผลิตภัณฑ์นำเทรนด์ที่ได้รับการยอมรับ |
2016 | ดีบีทีเอ 100 |
2017 | Gartner Magic Quadrant สำหรับเครื่องมือการรวมข้อมูล |
2021 | บูรณาการพื้นเมืองของ Stitch ด้วย Amazon คอนโซลเรดชิฟท์ |
ชุดผลิตภัณฑ์ Talend
Talend Product Suites ประกอบด้วย 3 ผลิตภัณฑ์หลักตามที่กล่าวไว้ด้านล่าง:
ทาเลนด์บิ๊กดาต้า
เครื่องมือ Talend สามารถทำให้การรวมข้อมูลขนาดใหญ่เข้ากับเครื่องมือกราฟิกและวิซาร์ดเป็นอัตโนมัติได้อย่างง่ายดาย ช่วยให้องค์กรสามารถพัฒนาสภาพแวดล้อมให้ทำงานร่วมกับ Apache Hadoop ได้อย่างง่ายดาย Sparkและ ฐานข้อมูล NoSQL สำหรับงานบนคลาวด์หรือในองค์กร
ปัจจุบันบริษัทหลายแห่งใช้ Hadoop เพื่อประหยัดต้นทุนและปรับปรุงประสิทธิภาพ บ่อยครั้งที่บริษัทต่างๆ ใช้เวลาประมวลผลราคาแพงกับโซลูชันระดับองค์กร ด้วย Hadoop ข้อมูลจะถูกแปลงให้สะอาดและสมบูรณ์ และบูรณาการสำหรับปริมาณงานการวิเคราะห์ที่สูงขึ้น
Talend Sandbox มีกรณีการใช้งานสี่กรณี
- การเพิ่มประสิทธิภาพคลังข้อมูล
- การวิเคราะห์คลิกสตรีม
- การวิเคราะห์ความรู้สึกของโซเชียลมีเดีย
- การวิเคราะห์เว็บบล็อกของ Apache
คุณสามารถสร้างกรณีการใช้งานที่ซับซ้อนของคุณเองได้
ประโยชน์ที่ได้รับ Talend สำหรับ Big data Hadoop
- ปรับปรุงประสิทธิภาพของการออกแบบงานข้อมูลขนาดใหญ่โดยการจัดเรียงและกำหนดค่าในส่วนต่อประสานกราฟิก
- เพิ่มคุณภาพข้อมูล ความสามารถในการปรับขนาด และฟังก์ชันการจัดการ
- คุณสมบัติ MapReduce ช่วยให้การประมวลผลข้อมูลแบบขนานเร็วขึ้น
- พื้นที่เก็บข้อมูลที่ใช้ร่วมกันและการปรับใช้ระยะไกล
- คุณภาพข้อมูลและการทำโปรไฟล์ด้วย Data Cleaning
- ปรับปรุงประสิทธิภาพของการออกแบบงานข้อมูลขนาดใหญ่ด้วยอินเทอร์เฟซ GUI
- การสนับสนุนพื้นเมืองสำหรับ เอชเบส, เอชดีเอฟเอส, รังผึ้ง, สกู๊ปพิก
- ฝังอยู่ในแพลตฟอร์มข้อมูล Hortonworks
การรวมข้อมูล
Talend ซอฟต์แวร์รวมข้อมูล เครื่องมือนี้มีสถาปัตยกรรมแบบเปิดที่ปรับขนาดได้ ช่วยให้ตอบสนองต่อคำขอทางธุรกิจได้รวดเร็วยิ่งขึ้น เครื่องมือนี้ช่วยให้พัฒนาและปรับใช้การทำงานบูรณาการข้อมูลได้เร็วกว่าการเขียนโค้ดด้วยมือ
ช่วยให้คุณรวมข้อมูลทั้งหมดของคุณเข้ากับคลังข้อมูลอื่น ๆ หรือซิงโครไนซ์ข้อมูลระหว่างระบบได้อย่างง่ายดาย การรวมข้อมูลเกี่ยวข้องกับการรวมข้อมูลที่จัดเก็บในแหล่งต่าง ๆ และให้ผู้ใช้เห็นข้อมูลเหล่านี้ในมุมมองแบบรวม ช่วยให้คุณสามารถจัดการงาน ETL ต่าง ๆ และช่วยให้ผู้ใช้สามารถจัดเตรียมข้อมูลด้วยตนเองได้อย่างง่ายดาย
ประโยชน์ที่ได้รับ Talend สำหรับการรวมข้อมูล
การบูรณาการที่คล่องตัว: ตอบสนองต่อคำขอทางธุรกิจได้เร็วขึ้นโดยไม่ต้องเขียนโค้ดโดยใช้ตัวเชื่อมต่อที่ใช้งานได้ทันทีมากกว่า 1000 ตัว Eclipseเครื่องมือทางกราฟิกและเครื่องสร้างโค้ดที่ได้รับการปรับให้เหมาะสมเพื่อประสิทธิภาพสูงสุด
ผลผลิตของทีม: ทำงานร่วมกันโดยใช้เวอร์ชันที่มีประสิทธิภาพ การวิเคราะห์ผลกระทบ การทดสอบและการดีบัก และการจัดการเมตาดาต้า
การจัดการที่ง่าย: เครื่องมือนี้นำเสนอคุณสมบัติการตั้งเวลาและการตรวจสอบขั้นสูง ให้การบูรณาการข้อมูลแบบเรียลไทม์กับแดชบอร์ดและการควบคุมแบบรวมศูนย์เพื่อการปรับใช้ที่รวดเร็วบนหลายโหนด
ก้าวไปข้างหน้าในการแข่งขัน: หากคุณใช้เครื่องมือนี้ คุณจะไม่ต้องรอใช้คุณสมบัติการรวมข้อมูลล่าสุดและเจ๋งที่สุด
จ่ายราคาต่ำสุดสำหรับการเป็นเจ้าของ: เครื่องมือ Talend นำเสนอรูปแบบการกำหนดราคาตามการสมัครสมาชิก คุณต้องจ่ายเงินตามจำนวนนักพัฒนาที่ใช้ Talend Studio ซึ่งจะช่วยให้คุณประหยัดเงินเมื่อเทียบกับสิทธิ์การใช้งานแบบคงที่
บูรณาการคลาวด์
คุณสามารถเร่งโครงการบูรณาการข้อมูลบนคลาวด์และภายในองค์กรได้โดยใช้แพลตฟอร์ม as-a-service (iPaaS) บนคลาวด์ที่ปรับขนาดได้และปลอดภัยสูง เครื่องมือคลาวด์บูรณาการ Talend นำเสนอการเชื่อมต่อ คุณภาพข้อมูลในตัว และการสร้างโค้ดแบบเนทีฟ
Talend เป็นแพลตฟอร์มบูรณาการระบบคลาวด์ที่ปลอดภัย ซึ่งช่วยให้ผู้ใช้ไอทีและธุรกิจสามารถเชื่อมต่อร่วมกันทั้งที่สามารถทำได้และในองค์กร ปลดล็อกพลังของงานออกแบบบนคลาวด์เนื่องจากสามารถจัดการ ตรวจสอบ และควบคุมในระบบคลาวด์ได้
ต่อไปในบทช่วยสอน Talend พร้อมตัวอย่าง เราจะเรียนรู้เกี่ยวกับประโยชน์ของระบบคลาวด์การรวม Talend เหนือเครื่องมืออื่นๆ
ประโยชน์จากการรวมระบบคลาวด์
Talend บูรณาการคลาวด์ | เครื่องมืออื่น ๆ |
---|---|
ส่วนประกอบแบบลากและวางมากกว่า 900 รายการ | การเขียนโค้ดด้วยมือซึ่งไม่ได้ผล |
สร้างโค้ดที่ปรับให้เหมาะสม | ต้องการทักษะพิเศษ |
การทำงานร่วมกันและการจัดการ | ยากที่จะรักษา |
การสนับสนุนระดับทอง (SLA) | การสนับสนุนที่ จำกัด |
Talend Open Studio คืออะไร?
Talend Open Studio เป็นสถาปัตยกรรมแบบเปิดสำหรับการบูรณาการข้อมูล การจัดทำโปรไฟล์ข้อมูล บิ๊กดาต้า การบูรณาการคลาวด์ และอื่นๆ อีกมากมาย
เป็นสภาพแวดล้อม GUI ที่มีตัวเชื่อมต่อที่สร้างไว้ล่วงหน้ามากกว่า 1000 ตัว ทำให้การดำเนินการต่างๆ เช่น แปลงไฟล์ โหลดข้อมูล ย้าย และเปลี่ยนชื่อไฟล์ เป็นเรื่องง่าย ช่วยให้แต่ละส่วนประกอบสามารถกำหนดกระบวนการที่ซับซ้อนได้
งานบูรณาการถูกสร้างขึ้นจากส่วนประกอบ Talend ที่ได้รับการกำหนดค่าแทนการเข้ารหัส นอกจากนี้ งานสามารถรันได้จากภายในสภาพแวดล้อมการพัฒนา หรือสามารถดำเนินการเป็นสคริปต์แบบสแตนด์อโลนก็ได้
ประโยชน์ของการใช้ Talend Open studio
- ช่วยลดเวลาที่ใช้ในการพัฒนาบูรณาการจากหลายสัปดาห์และหลายเดือน เหลือเพียงไม่กี่วันหรือไม่กี่ชั่วโมง
- แปลงและอัพเดตข้อมูลปัจจุบันจากแหล่งต่างๆ
- ตรวจสอบและจัดการการปรับใช้งานที่ยากลำบากได้อย่างง่ายดาย
- คุณสามารถมีต้นทุนการเป็นเจ้าของโซลูชันใดๆ ก็ได้ต่ำที่สุด
- Talend Open Source สามารถรวม แปลง และอัปเดตข้อมูลที่นำเสนอจากแหล่งต่างๆ ได้อย่างง่ายดาย
- เครื่องมือ Talend Open Source สืบทอดศักยภาพของแพลตฟอร์มการเขียนโปรแกรม
- ตัวเชื่อมต่อต้นทาง/เป้าหมายที่มีให้เลือกมากมายทำให้เป็นตัวเลือกที่ดีที่สุดในอุตสาหกรรม
- มาพร้อมความสามารถที่แข็งแกร่งของไฟล์บันทึก/รายงานการกระทบยอดหลายรูปแบบ (การไหลของข้อมูลหลังการโพสต์/การโยกย้าย)
ETL เดิม | Talend |
---|---|
เครื่องยนต์ที่เหมาะสม | จุดเปิด |
ยากที่จะปรับขนาด Big Data | สร้างโค้ดเนทิฟ |
แพง | TCO ต่ำ |
Talend Open Studio- Archiเทคเจอร์
ในบทช่วยสอน Talend Open Studio นี้ เราจะเรียนรู้เกี่ยวกับสถาปัตยกรรม Talend Open Studio ต่อไปนี้คือส่วนประกอบหลัก 3 ประการของ Talend Open Studio Archiเทคเจอร์

ลูกค้าของเรา
กลุ่มไคลเอนต์ประกอบด้วย Talend Studio และเว็บเบราว์เซอร์หนึ่งรายการขึ้นไปที่ใช้เครื่องเดียวกันหรือต่างกัน Talend Studio ช่วยให้คุณสามารถดำเนินการบูรณาการข้อมูลได้โดยไม่คำนึงถึงระดับปริมาณข้อมูลและความซับซ้อนของกระบวนการ
เซิร์ฟเวอร์ Talend
เซิร์ฟเวอร์ Talend เป็นอีกหนึ่งบล็อกที่สำคัญซึ่งรวมถึงแอปพลิเคชันเซิร์ฟเวอร์บนเว็บ ช่วยให้สามารถบริหารจัดการและบำรุงรักษาโครงการทั้งหมดได้ ประกอบด้วยบัญชีผู้ใช้ สิทธิ์การเข้าถึง และการอนุญาตโครงการในฐานข้อมูลการดูแลระบบ
ฐานข้อมูล
ส่วนประกอบฐานข้อมูลประกอบด้วยการบริหารระบบ การตรวจสอบ และการตรวจสอบฐานข้อมูล ส่วนประกอบนี้ช่วยในการจัดการบัญชีผู้ใช้ สิทธิ์การเข้าถึง และการอนุญาตโครงการ ฐานข้อมูลการตรวจสอบช่วยในการประเมินแง่มุมต่างๆ ของงานเพื่อการพัฒนาระบบสนับสนุนการตัดสินใจที่มุ่งเน้นกระบวนการในอุดมคติ
พื้นที่ทำงาน
ใน Talend พื้นที่ทำงานคือไดเร็กทอรีที่คุณจัดเก็บโฟลเดอร์โปรเจ็กต์ทั้งหมด อย่างไรก็ตาม คุณจะต้องมีไดเร็กทอรีพื้นที่ทำงานอย่างน้อยหนึ่งไดเร็กทอรีต่อการเชื่อมต่อ (การเชื่อมต่อที่เก็บข้อมูล) Talend อนุญาตให้เชื่อมต่อกับไดเร็กทอรีพื้นที่ทำงานต่างๆ ในกรณีที่คุณไม่ต้องการใช้ไดเร็กทอรีเริ่มต้น
กรุ
พื้นที่เก็บข้อมูลคือพื้นที่เก็บข้อมูลที่เครื่องมือ TOS ใช้เพื่อรวบรวมข้อมูลเพื่ออธิบายโมเดลธุรกิจหรือเพื่อออกแบบงาน
ส่วนขยาย Talend Open Studio
ในบทช่วยสอน Talend ETL นี้ เราจะเรียนรู้เกี่ยวกับส่วนขยายสตูดิโอแบบเปิดของ Talend:
- ชุดรวม Talend
- นิทานออนดีมานด์
- คุณภาพข้อมูล Talend
- ทาเลนด์ อีเอสบี
- Talend บูรณาการข้อมูลขนาดใหญ่
สรุป
- Talend เป็นแพลตฟอร์มซอฟต์แวร์โอเพ่นซอร์สที่นำเสนอโซลูชันการบูรณาการข้อมูลและการจัดการข้อมูล
- ซอฟต์แวร์ Talend สามารถทำให้การรวมข้อมูลขนาดใหญ่เข้ากับเครื่องมือกราฟิกและวิซาร์ดเป็นอัตโนมัติได้อย่างง่ายดาย
- Talend Product Suite ประกอบด้วย 3 ผลิตภัณฑ์หลัก 1) Talend Big Data 2) Data Integration 3) Integration Cloud
- Talend นำเสนอความสมบูรณ์ของข้อมูล การทำแผนที่ข้อมูล และการประมวลผลเป็นชุดสำหรับการรวมข้อมูลขนาดใหญ่และข้อมูล
- Talend เครื่องมือ ETL ปรับปรุงประสิทธิภาพของการออกแบบงานข้อมูลขนาดใหญ่โดยการจัดเรียงและกำหนดค่าในส่วนต่อประสานกราฟิก
- เครื่องมือซอฟต์แวร์บูรณาการข้อมูล Talend มีสถาปัตยกรรมแบบเปิดที่ปรับขนาดได้ ช่วยให้ตอบสนองต่อคำขอทางธุรกิจได้รวดเร็วยิ่งขึ้น
- เครื่องมือคลาวด์บูรณาการ Talend นำเสนอการเชื่อมต่อ คุณภาพข้อมูลในตัว และการสร้างโค้ดแบบเนทีฟ
- Talend Open Studio เป็นสถาปัตยกรรมแบบเปิดสำหรับการบูรณาการข้อมูล การจัดทำโปรไฟล์ข้อมูล บิ๊กดาต้า การบูรณาการคลาวด์ และอื่นๆ อีกมากมาย
- ส่วนขยายสตูดิโอ Talend ห้ารายการได้แก่: Talend Integration Suite, Talend On Demand, Talend Data Quality, Talend Seanad Talend Big Data Integration