บทช่วยสอนการรวมข้อมูลของ Pentaho: เครื่องมือ ETL ของ Pentaho คืออะไร
Pentaho BI คืออะไร?
ซอฟต์แวร์ Pentaho เป็นเครื่องมือ Business Intelligence ที่ให้บริการโซลูชั่น Business Intelligence ที่หลากหลายแก่ลูกค้า มีความสามารถในการรายงาน การวิเคราะห์ข้อมูล การรวมข้อมูล การทำเหมืองข้อมูล ฯลฯ Pentaho ยังมีชุดฟีเจอร์ BI ที่ครอบคลุมซึ่งช่วยให้คุณปรับปรุงประสิทธิภาพและประสิทธิภาพของธุรกิจได้
คุณสมบัติของเพนทาโฮ
ต่อไปนี้คือคุณสมบัติที่สำคัญของ Pentaho:
- ความสามารถ ETL สำหรับความต้องการระบบธุรกิจอัจฉริยะ
- ทำความเข้าใจกับผู้ออกแบบรายงาน Pentaho
- ความเชี่ยวชาญด้านผลิตภัณฑ์
- เสนอรายงานย่อยแบบเคียงข้างกัน
- ปลดล็อกความสามารถใหม่ๆ
- การสนับสนุนระดับมืออาชีพ
- แบบสอบถามและการรายงาน
- เสนอฟังก์ชันการทำงานที่ได้รับการปรับปรุง
- การสนับสนุนเมตาดาต้ารันไทม์แบบเต็มจากแหล่งข้อมูล
ชุด Pentaho BI
ตอนนี้ เราจะเรียนรู้เกี่ยวกับชุด Pentaho BI ในบทช่วยสอน Pentaho นี้:
Pentaho BI Suite ประกอบด้วยส่วนประกอบต่อไปนี้:
การรายงาน Pentaho
การรายงาน Pentaho ขึ้นอยู่กับโครงการ JFreeReport ช่วยให้คุณตอบสนองความต้องการในการรายงานธุรกิจของคุณ ส่วนประกอบนี้ยังนำเสนอการเผยแพร่รายงานทั้งตามกำหนดเวลาและตามความต้องการในรูปแบบยอดนิยม เช่น XLS, PDF, TXT และ HTML
การวิเคราะห์
มีการวิเคราะห์ที่หลากหลายพร้อมคุณสมบัติที่หลากหลายซึ่งรวมถึงมุมมองตารางสรุปข้อมูล เครื่องมือนี้มีคุณสมบัติ GUI ที่ได้รับการปรับปรุง (โดยใช้ Flash หรือ SVG) วิดเจ็ตแดชบอร์ดแบบรวม พอร์ทัล และการรวมเวิร์กโฟลว์
นอกจากนี้ Pentaho Spreadsheet Services ยังช่วยให้ผู้ใช้เรียกดู หมุน และใช้แผนภูมิจากภายใน MS Excel
แผงควบคุม
แดชบอร์ดนำเสนอการรายงานและการวิเคราะห์ ซึ่งสนับสนุนเนื้อหาให้กับแดชบอร์ด Pentaho ตัวออกแบบแดชบอร์ดแบบบริการตนเองมีเทมเพลตและโครงร่างแดชบอร์ดในตัวที่ครอบคลุม ช่วยให้ผู้ใช้ทางธุรกิจสามารถสร้างแดชบอร์ดส่วนบุคคลโดยอาศัยการฝึกอบรมเพียงเล็กน้อย
การทำเหมืองข้อมูล
เครื่องมือขุดข้อมูล ค้นพบรูปแบบและตัวบ่งชี้ที่ซ่อนอยู่ของประสิทธิภาพในอนาคต โดยนำเสนอชุดอัลกอริทึมการเรียนรู้ของเครื่องที่ครอบคลุมที่สุดจากโครงการ Weka ซึ่งรวมถึงการจัดกลุ่ม ต้นไม้การตัดสินใจ ป่าสุ่ม การวิเคราะห์องค์ประกอบหลัก และเครือข่ายประสาท
ช่วยให้คุณสามารถดูข้อมูลแบบกราฟิก โต้ตอบกับข้อมูลโดยทางโปรแกรม หรือใช้แหล่งข้อมูลหลายแหล่งสำหรับรายงาน การวิเคราะห์เพิ่มเติม และกระบวนการอื่นๆ
การรวมข้อมูล Pentaho
ส่วนประกอบนี้ใช้เพื่อรวมข้อมูลไม่ว่าจะอยู่ที่ไหนก็ตาม
ไลบรารีการแปลงข้อมูลที่สมบูรณ์พร้อมวัตถุการทำแผนที่ที่พร้อมใช้งานมากกว่า 150 รายการ
รองรับแหล่งข้อมูลที่หลากหลายซึ่งรวมถึงโอเพ่นซอร์สมากกว่า 30 แพลตฟอร์มและแพลตฟอร์มฐานข้อมูลที่เป็นกรรมสิทธิ์ ไฟล์แบบเรียบ นอกจากนี้ยังช่วย การวิเคราะห์ข้อมูลขนาดใหญ่ ด้วยการบูรณาการและการจัดการข้อมูล Hadoop
ใครบ้างที่ใช้ Pentaho BI?
Pentaho BI เป็นเครื่องมือที่ใช้กันอย่างแพร่หลายโดยผู้เชี่ยวชาญด้านซอฟต์แวร์เช่น:
- โปรแกรมซอฟต์แวร์โอเพ่นซอร์ส
- นักวิเคราะห์ธุรกิจและนักวิจัย
- นักเรียนวิทยาลัย
- สมาชิกสภาข่าวกรองธุรกิจ
วิธีการติดตั้ง Pentaho ใน AWS
ต่อไปนี้เป็นกระบวนการทีละขั้นตอนเกี่ยวกับวิธีการติดตั้ง Pentaho ใน AWS
ขั้นตอน 1) คลิกดำเนินการต่อเพื่อสมัครสมาชิก
ไปที่ https://aws.amazon.com/marketplace/pp/prodview-mce2xdbgie4ro และคลิกดำเนินการต่อ
ขั้นตอน 2) ยอมรับข้อกำหนดและเงื่อนไข
ในหน้าถัดไป ยอมรับข้อตกลงใบอนุญาต
ขั้นตอน 3) คลิกดำเนินการต่อเพื่อกำหนดค่า
ดำเนินการกำหนดค่า
ขั้นตอน 4) คลิกดำเนินการต่อเพื่อเปิดตัว
คงการตั้งค่าเริ่มต้นไว้ และคลิกเพื่อเปิดใช้
ขั้นตอน 5) รอประมาณ 5 นาทีเพื่อเปิดอินสแตนซ์
ตรวจสอบคำแนะนำการใช้งานแล้วรอ
ขั้นตอน 6) รับ IP สาธารณะ
คัดลอก IP สาธารณะของอินสแตนซ์
ขั้นตอน 7) ใช้ IP สาธารณะเพื่อเข้าสู่ระบบ
วาง IP สาธารณะของอินสแตนซ์เพื่อเข้าถึง Pentaho
ข้อกำหนดเบื้องต้นของ Pentaho
- ความต้องการทางฮาร์ดแวร์
- ความต้องการด้านซอฟต์แวร์
- การดาวน์โหลดและติดตั้ง Bl suite
- เริ่มต้นชุด Bl
- การบริหารงานของ Bl suite
ข้อกำหนดฮาร์ดแวร์
ซอฟต์แวร์ Pentaho Bl Suite ไม่มีข้อจำกัดในการแก้ไขใดๆ บนคอมพิวเตอร์หรือฮาร์ดแวร์เครือข่าย ตราบใดที่คุณมีคุณสมบัติตรงตามข้อกำหนดขั้นต่ำของซอฟต์แวร์ การติดตั้งเครื่องมือ Business Intelligence นี้เป็นเรื่องง่าย อย่างไรก็ตาม ชุดข้อกำหนดของระบบที่แนะนำ:
แรม | ขั้นต่ำ 2GB |
พื้นที่ฮาร์ดไดรฟ์ | ขั้นต่ำ 1GB |
หน่วยประมวลผล | ดูอัลคอร์ EM64T หรือ AMD64 |
ความต้องการด้านซอฟต์แวร์
- การติดตั้ง Sun JRE 5.0
- สภาพแวดล้อมอาจเป็นแบบ 32 บิตหรือ 64 บิตก็ได้
- ที่สนับสนุน Operaระบบติ้ง: Linux, Solaris, Windows, แมค
- เวิร์กสเตชันที่มีอินเทอร์เฟซเว็บเบราว์เซอร์ที่ทันสมัย เช่น Chrome, Internet Explorer, Firefox
เพื่อเริ่ม Bl-server
- On Windows ตั้งแต่เริ่มต้นให้คลิกปุ่มเริ่มต้นที่ไอคอนเริ่มเซิร์ฟเวอร์ Bl
- บน Linux OS ให้รันสคริปต์ start-pentaho บน /biserver-ce/directory
เพื่อเริ่มเซิร์ฟเวอร์ผู้ดูแลระบบ
- On Windows จากปุ่มเริ่มต้นคลิกที่เริ่มเซิร์ฟเวอร์องค์กร Bl
- สำหรับ Linux: ไปที่หน้าต่างคำสั่งและรันสคริปต์เริ่มต้นใน /biserver-ce/administration-console/directory
เพื่อหยุดเซิร์ฟเวอร์ผู้ดูแลระบบ
- หากต้องการหยุดเซิร์ฟเวอร์ใน Windows ให้คลิกที่ไอคอนหยุดสองเซิร์ฟเวอร์
- บนลินุกซ์ คุณต้องไปที่เทอร์มินัลแล้วไปที่ไดเร็กทอรีที่ติดตั้งแล้วรัน stop.bat
คอนโซลการดูแลระบบ Pentaho
ผู้ออกแบบรายงาน
เป็นเครื่องมือสร้างรายงานขั้นสูง นี่เป็นเครื่องมือที่เหมาะสำหรับคุณหากคุณต้องการสร้างรายงานไดรฟ์ข้อมูลที่สมบูรณ์ เครื่องมือนี้มีความยืดหยุ่นและฟังก์ชันการทำงานมากกว่าความสามารถในการรายงานเฉพาะกิจของคอนโซลผู้ใช้ Pentaho
สตูดิโอดีไซน์
มันเป็น a Eclipse- เครื่องมือพื้นฐาน ช่วยให้คุณสามารถแก้ไขรายงานหรือการวิเคราะห์ด้วยตนเองได้ มีการใช้กันอย่างแพร่หลายในการเพิ่มการแก้ไขรายงานที่มีอยู่ซึ่งไม่สามารถเพิ่มด้วย Report Designer ได้
นักออกแบบการรวมกลุ่ม
เครื่องมือกราฟิกนี้ช่วยให้คุณปรับปรุงประสิทธิภาพลูกบาศก์ Mondrian
ตัวแก้ไขข้อมูลเมตา
ใช้เพื่อเพิ่มชั้นข้อมูลเมตาที่กำหนดเองลงในแหล่งข้อมูลที่มีอยู่
การรวมข้อมูล Pentaho
เครื่องมือแยก แปลง และโหลด (ETL) ของ Kettle ซึ่งเปิดใช้งาน
เครื่องมือ Pentaho กับ BI stack
เครื่องมือเพนทาโฮ | บีไอสแต็ค |
---|---|
บูรณาการข้อมูล (PDI) | ETL |
มันมีตัวแก้ไขข้อมูลเมตา | มันมีการจัดการข้อมูลเมตา |
เพนทาโฮ บ | บทวิเคราะห์ |
ผู้ออกแบบรายงาน | Operaการรายงานตามความเป็นจริง |
ไซคุ | การรายงานเฉพาะกิจ |
CDE | แผงควบคุม |
คอนโซลผู้ใช้ Pentaho (PUC) | การกำกับดูแล/การติดตามผล |
ข้อดีของเพนทาโฮ
ในบทช่วยสอนการรวมข้อมูลของ Pentaho เราจะเรียนรู้เกี่ยวกับข้อดีบางประการของ Pentaho Business Intelligence Tool:
- Pentaho BI เป็นเครื่องมือที่ใช้งานง่าย เพียงมีแนวคิดพื้นฐานบางประการ คุณก็สามารถใช้งานมันได้
- เครื่องมือ Business Intelligence ที่เรียบง่ายและใช้งานง่าย
- นำเสนอความสามารถ BI ที่หลากหลายซึ่งรวมถึงการรายงาน แดชบอร์ด การวิเคราะห์เชิงโต้ตอบ การรวมข้อมูล การทำเหมืองข้อมูล ฯลฯ
- มาพร้อมกับอินเทอร์เฟซที่ใช้งานง่ายและมีเครื่องมือต่างๆ ในการดึงข้อมูลจากแหล่งข้อมูลหลายแหล่ง
- เสนอแพ็คเกจเดียวเพื่อทำงานกับข้อมูล
- มีรุ่นชุมชนที่มีผู้สนับสนุนจำนวนมากพร้อมกับรุ่น Enterprise
- ความสามารถในการทำงานบนคลัสเตอร์ Hadoop
- Javaโค้ดสคริปต์ที่เขียนในส่วนประกอบขั้นตอนสามารถนำไปใช้ซ้ำในส่วนประกอบอื่นได้
ข้อเสียของเพนทาโฮ
นี่คือข้อเสีย/ข้อเสียของการใช้เครื่องมือ Pentaho BI:
- การออกแบบอินเทอร์เฟซอาจไม่ดี และไม่มีอินเทอร์เฟซแบบรวมสำหรับส่วนประกอบทั้งหมด
- การพัฒนาเครื่องมือช้ากว่ามากเมื่อเทียบกับเครื่องมือ BI อื่นๆ
- การวิเคราะห์ธุรกิจของ Pentaho มีส่วนประกอบจำนวนจำกัด
- การสนับสนุนจากชุมชนไม่ดี ดังนั้น หากคุณไม่ได้รับส่วนประกอบที่ใช้งานได้ คุณต้องรอจนกว่าจะมีการเปิดตัวเวอร์ชันถัดไป
สรุป
- Pentaho เป็นเครื่องมือ Business Intelligence ที่ให้บริการที่หลากหลาย ระบบธุรกิจอัจฉริยะ โซลูชั่นให้กับลูกค้า
- มีความสามารถ ETL สำหรับความต้องการระบบธุรกิจอัจฉริยะ
- ชุด Pentaho มีส่วนประกอบต่างๆ เช่น รายงาน การวิเคราะห์ แดชบอร์ด และการขุดข้อมูล
- Pentaho Business Intelligence ถูกนำมาใช้กันอย่างแพร่หลายโดย 1) นักวิเคราะห์ธุรกิจ 2) โปรแกรมเมอร์ซอฟต์แวร์โอเพ่นซอร์ส 3) นักวิจัย และ 4) นักศึกษาวิทยาลัย
- กระบวนการติดตั้ง Pentaho ประกอบด้วย: 1) ข้อกำหนดด้านฮาร์ดแวร์ 2) ข้อกำหนดซอฟต์แวร์ 3) การดาวน์โหลด Bl suite 4) การเริ่ม Bl suite และ 5) การดูแลระบบ Bl suite
- ส่วนประกอบที่สำคัญของคอนโซลการดูแลระบบ Pentaho ได้แก่ 1) Report Designer, 2) Design Studio, 3) Aggregation Designer 4) Metadata Editor 5) Pentaho Data Integration
- Pentaho เป็นเครื่องมือ Data Integration (PDI) ในขณะที่ BI stack เป็น เครื่องมือ ETL.
- ข้อได้เปรียบที่ใหญ่ที่สุดของ Pentaho คือเครื่องมือ Business Intelligence ที่เรียบง่ายและใช้งานง่าย
- ข้อเสียเปรียบหลักของ Pentaho คือการพัฒนาเครื่องมือช้ากว่ามากเมื่อเทียบกับเครื่องมือ BI อื่นๆ