บทช่วยสอน Talend – เครื่องมือ ETL ของ Talend คืออะไร

สรุปบทช่วยสอน Talend

ในบทช่วยสอน Talend นี้ คุณจะได้เรียนรู้แนวคิดทั้งหมดตั้งแต่เริ่มต้น บทช่วยสอนนี้ครอบคลุมหัวข้อพื้นฐานไปจนถึงขั้นสูง เช่น Talend คืออะไร ประวัติของเครื่องมือ Talend ข้อมูลขนาดใหญ่ของ Talend ประโยชน์ของการรวมข้อมูลโดยใช้เครื่องมือ Talend สถาปัตยกรรมโอเพ่นสตูดิโอ และส่วนขยายของโอเพ่นสตูดิโอของ Talend บทช่วยสอน Talend นี้ไม่มีค่าใช้จ่ายใดๆ

ทาเลนด์คืออะไร?

Talend เป็นแพลตฟอร์มซอฟต์แวร์โอเพ่นซอร์สที่นำเสนอโซลูชั่นการบูรณาการข้อมูลและการจัดการข้อมูล Talend เชี่ยวชาญในการบูรณาการข้อมูลขนาดใหญ่ เครื่องมือนี้มีคุณสมบัติต่างๆ เช่น คลาวด์ ข้อมูลขนาดใหญ่ การบูรณาการแอปพลิเคชันระดับองค์กร คุณภาพข้อมูล และการจัดการข้อมูลหลัก นอกจากนี้ยังมีพื้นที่เก็บข้อมูลแบบรวมเพื่อจัดเก็บและนำข้อมูลเมตากลับมาใช้ใหม่

มีทั้งแบบโอเพ่นซอร์สและเวอร์ชันพรีเมี่ยม เป็นหนึ่งในเครื่องมือที่ดีที่สุดสำหรับการประมวลผลแบบคลาวด์และ ข้อมูลขนาดใหญ่ บูรณาการ

ประวัติความเป็นมาของพรสวรรค์

ปี ขั้น
2002 วิจัยและพัฒนา
2005 การสร้างบริษัท - การจัดหาเงินทุนรอบแรกของ AGF ไพรเวทอิควิตี้ และ Galle Partners
2006 Open Studio V1.0 เปิดตัวการดำเนินงานในสหรัฐอเมริกา
2007 ชุดบูรณาการ/ปิดการจัดหาเงินทุนรอบที่สอง
2008 เปิด Profiler/ คุณภาพข้อมูล
2009 การได้มาซึ่งชุดบูรณาการ RTx/MPx/ MDM
2010 IDM รุ่นชุมชน / MDM รุ่นองค์กร
เปิดสตูดิโอ วี
2014 OW2 สุดยอดโครงการ
2015 ผลิตภัณฑ์นำเทรนด์ที่ได้รับการยอมรับ
2016 ดีบีทีเอ 100
2017 Gartner Magic Quadrant สำหรับเครื่องมือการรวมข้อมูล
2021 บูรณาการพื้นเมืองของ Stitch ด้วย Amazon คอนโซลเรดชิฟท์

ชุดผลิตภัณฑ์ Talend

Talend Product Suites ประกอบด้วย 3 ผลิตภัณฑ์หลักตามที่กล่าวไว้ด้านล่าง:

ทาเลนด์บิ๊กดาต้า

เครื่องมือ Talend สามารถทำให้การรวมข้อมูลขนาดใหญ่เข้ากับเครื่องมือกราฟิกและวิซาร์ดเป็นอัตโนมัติได้อย่างง่ายดาย ช่วยให้องค์กรสามารถพัฒนาสภาพแวดล้อมให้ทำงานร่วมกับ Apache Hadoop ได้อย่างง่ายดาย Sparkและ ฐานข้อมูล NoSQL สำหรับงานบนคลาวด์หรือในองค์กร

ปัจจุบันบริษัทหลายแห่งใช้ Hadoop เพื่อประหยัดต้นทุนและปรับปรุงประสิทธิภาพ บ่อยครั้งที่บริษัทต่างๆ ใช้เวลาประมวลผลราคาแพงกับโซลูชันระดับองค์กร ด้วย Hadoop ข้อมูลจะถูกแปลงให้สะอาดและสมบูรณ์ และบูรณาการสำหรับปริมาณงานการวิเคราะห์ที่สูงขึ้น

Talend Sandbox มีกรณีการใช้งานสี่กรณี

  1. การเพิ่มประสิทธิภาพคลังข้อมูล
  2. การวิเคราะห์คลิกสตรีม
  3. การวิเคราะห์ความรู้สึกของโซเชียลมีเดีย
  4. การวิเคราะห์เว็บบล็อกของ Apache

คุณสามารถสร้างกรณีการใช้งานที่ซับซ้อนของคุณเองได้

ประโยชน์ที่ได้รับ Talend สำหรับ Big data Hadoop

  • ปรับปรุงประสิทธิภาพของการออกแบบงานข้อมูลขนาดใหญ่โดยการจัดเรียงและกำหนดค่าในส่วนต่อประสานกราฟิก
  • เพิ่มคุณภาพข้อมูล ความสามารถในการปรับขนาด และฟังก์ชันการจัดการ
  • คุณสมบัติ MapReduce ช่วยให้การประมวลผลข้อมูลแบบขนานเร็วขึ้น
  • พื้นที่เก็บข้อมูลที่ใช้ร่วมกันและการปรับใช้ระยะไกล
  • คุณภาพข้อมูลและการทำโปรไฟล์ด้วย Data Cleaning
  • ปรับปรุงประสิทธิภาพของการออกแบบงานข้อมูลขนาดใหญ่ด้วยอินเทอร์เฟซ GUI
  • การสนับสนุนพื้นเมืองสำหรับ เอชเบส, เอชดีเอฟเอส, รังผึ้ง, สกู๊ปพิก
  • ฝังอยู่ในแพลตฟอร์มข้อมูล Hortonworks

การรวมข้อมูล

Talend ซอฟต์แวร์รวมข้อมูล เครื่องมือนี้มีสถาปัตยกรรมแบบเปิดที่ปรับขนาดได้ ช่วยให้ตอบสนองต่อคำขอทางธุรกิจได้รวดเร็วยิ่งขึ้น เครื่องมือนี้ช่วยให้พัฒนาและปรับใช้การทำงานบูรณาการข้อมูลได้เร็วกว่าการเขียนโค้ดด้วยมือ

ช่วยให้คุณรวมข้อมูลทั้งหมดของคุณเข้ากับคลังข้อมูลอื่น ๆ หรือซิงโครไนซ์ข้อมูลระหว่างระบบได้อย่างง่ายดาย การรวมข้อมูลเกี่ยวข้องกับการรวมข้อมูลที่จัดเก็บในแหล่งต่าง ๆ และให้ผู้ใช้เห็นข้อมูลเหล่านี้ในมุมมองแบบรวม ช่วยให้คุณสามารถจัดการงาน ETL ต่าง ๆ และช่วยให้ผู้ใช้สามารถจัดเตรียมข้อมูลด้วยตนเองได้อย่างง่ายดาย

ประโยชน์ที่ได้รับ Talend สำหรับการรวมข้อมูล

การบูรณาการที่คล่องตัว: ตอบสนองต่อคำขอทางธุรกิจได้เร็วขึ้นโดยไม่ต้องเขียนโค้ดโดยใช้ตัวเชื่อมต่อที่ใช้งานได้ทันทีมากกว่า 1000 ตัว Eclipseเครื่องมือทางกราฟิกและเครื่องสร้างโค้ดที่ได้รับการปรับให้เหมาะสมเพื่อประสิทธิภาพสูงสุด

ผลผลิตของทีม: ทำงานร่วมกันโดยใช้เวอร์ชันที่มีประสิทธิภาพ การวิเคราะห์ผลกระทบ การทดสอบและการดีบัก และการจัดการเมตาดาต้า

การจัดการที่ง่าย: เครื่องมือนี้นำเสนอคุณสมบัติการตั้งเวลาและการตรวจสอบขั้นสูง ให้การบูรณาการข้อมูลแบบเรียลไทม์กับแดชบอร์ดและการควบคุมแบบรวมศูนย์เพื่อการปรับใช้ที่รวดเร็วบนหลายโหนด

ก้าวไปข้างหน้าในการแข่งขัน: หากคุณใช้เครื่องมือนี้ คุณจะไม่ต้องรอใช้คุณสมบัติการรวมข้อมูลล่าสุดและเจ๋งที่สุด

จ่ายราคาต่ำสุดสำหรับการเป็นเจ้าของ: เครื่องมือ Talend นำเสนอรูปแบบการกำหนดราคาตามการสมัครสมาชิก คุณต้องจ่ายเงินตามจำนวนนักพัฒนาที่ใช้ Talend Studio ซึ่งจะช่วยให้คุณประหยัดเงินเมื่อเทียบกับสิทธิ์การใช้งานแบบคงที่

บูรณาการคลาวด์

คุณสามารถเร่งโครงการบูรณาการข้อมูลบนคลาวด์และภายในองค์กรได้โดยใช้แพลตฟอร์ม as-a-service (iPaaS) บนคลาวด์ที่ปรับขนาดได้และปลอดภัยสูง เครื่องมือคลาวด์บูรณาการ Talend นำเสนอการเชื่อมต่อ คุณภาพข้อมูลในตัว และการสร้างโค้ดแบบเนทีฟ

Talend เป็นแพลตฟอร์มบูรณาการระบบคลาวด์ที่ปลอดภัย ซึ่งช่วยให้ผู้ใช้ไอทีและธุรกิจสามารถเชื่อมต่อร่วมกันทั้งที่สามารถทำได้และในองค์กร ปลดล็อกพลังของงานออกแบบบนคลาวด์เนื่องจากสามารถจัดการ ตรวจสอบ และควบคุมในระบบคลาวด์ได้

ต่อไปในบทช่วยสอน Talend พร้อมตัวอย่าง เราจะเรียนรู้เกี่ยวกับประโยชน์ของระบบคลาวด์การรวม Talend เหนือเครื่องมืออื่นๆ

ประโยชน์จากการรวมระบบคลาวด์

Talend บูรณาการคลาวด์ เครื่องมืออื่น ๆ
ส่วนประกอบแบบลากและวางมากกว่า 900 รายการ การเขียนโค้ดด้วยมือซึ่งไม่ได้ผล
สร้างโค้ดที่ปรับให้เหมาะสม ต้องการทักษะพิเศษ
การทำงานร่วมกันและการจัดการ ยากที่จะรักษา
การสนับสนุนระดับทอง (SLA) การสนับสนุนที่ จำกัด

Talend Open Studio คืออะไร?

Talend Open Studio เป็นสถาปัตยกรรมแบบเปิดสำหรับการบูรณาการข้อมูล การจัดทำโปรไฟล์ข้อมูล บิ๊กดาต้า การบูรณาการคลาวด์ และอื่นๆ อีกมากมาย

เป็นสภาพแวดล้อม GUI ที่มีตัวเชื่อมต่อที่สร้างไว้ล่วงหน้ามากกว่า 1000 ตัว ทำให้การดำเนินการต่างๆ เช่น แปลงไฟล์ โหลดข้อมูล ย้าย และเปลี่ยนชื่อไฟล์ เป็นเรื่องง่าย ช่วยให้แต่ละส่วนประกอบสามารถกำหนดกระบวนการที่ซับซ้อนได้

งานบูรณาการถูกสร้างขึ้นจากส่วนประกอบ Talend ที่ได้รับการกำหนดค่าแทนการเข้ารหัส นอกจากนี้ งานสามารถรันได้จากภายในสภาพแวดล้อมการพัฒนา หรือสามารถดำเนินการเป็นสคริปต์แบบสแตนด์อโลนก็ได้

ประโยชน์ของการใช้ Talend Open studio

  • ช่วยลดเวลาที่ใช้ในการพัฒนาบูรณาการจากหลายสัปดาห์และหลายเดือน เหลือเพียงไม่กี่วันหรือไม่กี่ชั่วโมง
  • แปลงและอัพเดตข้อมูลปัจจุบันจากแหล่งต่างๆ
  • ตรวจสอบและจัดการการปรับใช้งานที่ยากลำบากได้อย่างง่ายดาย
  • คุณสามารถมีต้นทุนการเป็นเจ้าของโซลูชันใดๆ ก็ได้ต่ำที่สุด
  • Talend Open Source สามารถรวม แปลง และอัปเดตข้อมูลที่นำเสนอจากแหล่งต่างๆ ได้อย่างง่ายดาย
  • เครื่องมือ Talend Open Source สืบทอดศักยภาพของแพลตฟอร์มการเขียนโปรแกรม
  • ตัวเชื่อมต่อต้นทาง/เป้าหมายที่มีให้เลือกมากมายทำให้เป็นตัวเลือกที่ดีที่สุดในอุตสาหกรรม
  • มาพร้อมความสามารถที่แข็งแกร่งของไฟล์บันทึก/รายงานการกระทบยอดหลายรูปแบบ (การไหลของข้อมูลหลังการโพสต์/การโยกย้าย)
ETL เดิม Talend
เครื่องยนต์ที่เหมาะสม จุดเปิด
ยากที่จะปรับขนาด Big Data สร้างโค้ดเนทิฟ
แพง TCO ต่ำ

Talend Open Studio- Archiเทคเจอร์

ในบทช่วยสอน Talend Open Studio นี้ เราจะเรียนรู้เกี่ยวกับสถาปัตยกรรม Talend Open Studio ต่อไปนี้คือส่วนประกอบหลัก 3 ประการของ Talend Open Studio Archiเทคเจอร์

ทาเลนด์ โอเพ่น สตูดิโอ Archiเทคเจอร์
ทาเลนด์ โอเพ่น สตูดิโอ Archiเทคเจอร์

ลูกค้าของเรา

กลุ่มไคลเอนต์ประกอบด้วย Talend Studio และเว็บเบราว์เซอร์หนึ่งรายการขึ้นไปที่ใช้เครื่องเดียวกันหรือต่างกัน Talend Studio ช่วยให้คุณสามารถดำเนินการบูรณาการข้อมูลได้โดยไม่คำนึงถึงระดับปริมาณข้อมูลและความซับซ้อนของกระบวนการ

เซิร์ฟเวอร์ Talend

เซิร์ฟเวอร์ Talend เป็นอีกหนึ่งบล็อกที่สำคัญซึ่งรวมถึงแอปพลิเคชันเซิร์ฟเวอร์บนเว็บ ช่วยให้สามารถบริหารจัดการและบำรุงรักษาโครงการทั้งหมดได้ ประกอบด้วยบัญชีผู้ใช้ สิทธิ์การเข้าถึง และการอนุญาตโครงการในฐานข้อมูลการดูแลระบบ

ฐานข้อมูล

ส่วนประกอบฐานข้อมูลประกอบด้วยการบริหารระบบ การตรวจสอบ และการตรวจสอบฐานข้อมูล ส่วนประกอบนี้ช่วยในการจัดการบัญชีผู้ใช้ สิทธิ์การเข้าถึง และการอนุญาตโครงการ ฐานข้อมูลการตรวจสอบช่วยในการประเมินแง่มุมต่างๆ ของงานเพื่อการพัฒนาระบบสนับสนุนการตัดสินใจที่มุ่งเน้นกระบวนการในอุดมคติ

พื้นที่ทำงาน

ใน Talend พื้นที่ทำงานคือไดเร็กทอรีที่คุณจัดเก็บโฟลเดอร์โปรเจ็กต์ทั้งหมด อย่างไรก็ตาม คุณจะต้องมีไดเร็กทอรีพื้นที่ทำงานอย่างน้อยหนึ่งไดเร็กทอรีต่อการเชื่อมต่อ (การเชื่อมต่อที่เก็บข้อมูล) Talend อนุญาตให้เชื่อมต่อกับไดเร็กทอรีพื้นที่ทำงานต่างๆ ในกรณีที่คุณไม่ต้องการใช้ไดเร็กทอรีเริ่มต้น

กรุ

พื้นที่เก็บข้อมูลคือพื้นที่เก็บข้อมูลที่เครื่องมือ TOS ใช้เพื่อรวบรวมข้อมูลเพื่ออธิบายโมเดลธุรกิจหรือเพื่อออกแบบงาน

ส่วนขยาย Talend Open Studio

ในบทช่วยสอน Talend ETL นี้ เราจะเรียนรู้เกี่ยวกับส่วนขยายสตูดิโอแบบเปิดของ Talend:

  • ชุดรวม Talend
  • นิทานออนดีมานด์
  • คุณภาพข้อมูล Talend
  • ทาเลนด์ อีเอสบี
  • Talend บูรณาการข้อมูลขนาดใหญ่

สรุป

  • Talend เป็นแพลตฟอร์มซอฟต์แวร์โอเพ่นซอร์สที่นำเสนอโซลูชันการบูรณาการข้อมูลและการจัดการข้อมูล
  • ซอฟต์แวร์ Talend สามารถทำให้การรวมข้อมูลขนาดใหญ่เข้ากับเครื่องมือกราฟิกและวิซาร์ดเป็นอัตโนมัติได้อย่างง่ายดาย
  • Talend Product Suite ประกอบด้วย 3 ผลิตภัณฑ์หลัก 1) Talend Big Data 2) Data Integration 3) Integration Cloud
  • Talend นำเสนอความสมบูรณ์ของข้อมูล การทำแผนที่ข้อมูล และการประมวลผลเป็นชุดสำหรับการรวมข้อมูลขนาดใหญ่และข้อมูล
  • Talend เครื่องมือ ETL ปรับปรุงประสิทธิภาพของการออกแบบงานข้อมูลขนาดใหญ่โดยการจัดเรียงและกำหนดค่าในส่วนต่อประสานกราฟิก
  • เครื่องมือซอฟต์แวร์บูรณาการข้อมูล Talend มีสถาปัตยกรรมแบบเปิดที่ปรับขนาดได้ ช่วยให้ตอบสนองต่อคำขอทางธุรกิจได้รวดเร็วยิ่งขึ้น
  • เครื่องมือคลาวด์บูรณาการ Talend นำเสนอการเชื่อมต่อ คุณภาพข้อมูลในตัว และการสร้างโค้ดแบบเนทีฟ
  • Talend Open Studio เป็นสถาปัตยกรรมแบบเปิดสำหรับการบูรณาการข้อมูล การจัดทำโปรไฟล์ข้อมูล บิ๊กดาต้า การบูรณาการคลาวด์ และอื่นๆ อีกมากมาย
  • ส่วนขยายสตูดิโอ Talend ห้ารายการได้แก่: Talend Integration Suite, Talend On Demand, Talend Data Quality, Talend Seanad Talend Big Data Integration