SSIS บทช่วยสอนสำหรับผู้เริ่มต้น: คืออะไร Archiเทคเจอร์, แพ็คเกจ

SSIS คืออะไร?

บริการการรวมเซิร์ฟเวอร์ SQL (SSIS) เป็นส่วนประกอบของไฟล์ Microsoft SQL Server ซอฟต์แวร์ฐานข้อมูลที่สามารถใช้เพื่อดำเนินการย้ายข้อมูลได้หลากหลาย SSIS เป็นเครื่องมือคลังข้อมูลที่รวดเร็วและยืดหยุ่น ซึ่งใช้สำหรับการดึงข้อมูล การโหลด และการแปลงข้อมูล เช่น การล้าง การรวมรวม การรวมข้อมูล ฯลฯ

ทำให้ง่ายต่อการย้ายข้อมูลจากฐานข้อมูลหนึ่งไปยังฐานข้อมูลอื่น SSIS สามารถดึงข้อมูลจากแหล่งต่างๆ มากมาย เช่น ฐานข้อมูล SQL Server, ไฟล์ Excel, Oracle และฐานข้อมูล DB2 เป็นต้น

SSIS ยังประกอบด้วยเครื่องมือและตัวช่วยด้านกราฟิกสำหรับดำเนินการฟังก์ชันเวิร์กโฟลว์ เช่น การส่งข้อความอีเมล การดำเนินการ FTP แหล่งข้อมูลและปลายทาง

ทำไมเราถึงใช้ SSIS?

ต่อไปนี้เป็นเหตุผลสำคัญในการใช้เครื่องมือ SSIS:

  • เครื่องมือ SSIS ช่วยให้คุณรวมข้อมูลจากที่เก็บข้อมูลต่างๆ
  • ทำให้ฟังก์ชันการดูแลระบบและการโหลดข้อมูลเป็นแบบอัตโนมัติ
  • เติม Data Marts และคลังข้อมูล
  • ช่วยให้คุณทำความสะอาดและสร้างมาตรฐานข้อมูล
  • การสร้าง BI ในกระบวนการแปลงข้อมูล
  • ฟังก์ชันการดูแลระบบอัตโนมัติและการโหลดข้อมูล
  • SIS มี GUI ที่ช่วยให้ผู้ใช้แปลงข้อมูลได้อย่างง่ายดายแทนที่จะเขียนโปรแกรมขนาดใหญ่
  • สามารถโหลดแถวหลายล้านแถวจากแหล่งข้อมูลหนึ่งไปยังอีกแหล่งหนึ่งได้ในเวลาไม่กี่นาที
  • การระบุ การจับ และการประมวลผลการเปลี่ยนแปลงข้อมูล
  • การประสานงานการบำรุงรักษา การประมวลผล หรือการวิเคราะห์ข้อมูล
  • SSIS ขจัดความต้องการของโปรแกรมเมอร์ตัวยง
  • SSIS นำเสนอการจัดการข้อผิดพลาดและเหตุการณ์ที่มีประสิทธิภาพ

ประวัติความเป็นมาของ SSIS

ก่อนหน้านี้ SSIS, SQL Server, Data Transformation Services (DTS) ถูกใช้ ซึ่งเป็นส่วนหนึ่งของ SQL Server 7 และ 2000

เวอร์ชั่น รายละเอียด
2005 SQL Server โครงการ Microsoft ทีมงานตัดสินใจปรับปรุง DTS อย่างไรก็ตาม แทนที่จะอัปเดต DTS พวกเขาตัดสินใจตั้งชื่อผลิตภัณฑ์ Integration Services (SSIS)
เวอร์ชันเซิร์ฟเวอร์ SQL ปี 2008 มีการปรับปรุงประสิทธิภาพมากมายใน SSIS มีการแนะนำแหล่งข้อมูลใหม่ด้วย
2012 SQL Server นับเป็นการเปิดตัวครั้งใหญ่ที่สุดของ SSIS โดยเวอร์ชันนี้นำเสนอแนวคิดของโมเดลการปรับใช้โครงการ ซึ่งช่วยให้สามารถปรับใช้โครงการทั้งหมดและแพ็คเกจต่างๆ ไปยังเซิร์ฟเวอร์แทนที่จะใช้แพ็คเกจเฉพาะ
2014 SQL Server ในเวอร์ชันนี้ SSIS มีการเปลี่ยนแปลงไม่มากนัก แต่มีการเพิ่มแหล่งที่มาหรือการเปลี่ยนแปลงใหม่ๆ ซึ่งทำได้โดยการดาวน์โหลดแยกกันผ่านโค้ดPlex หรือชุดคุณลักษณะเซิร์ฟเวอร์ SQL
ในเซิร์ฟเวอร์ SQL 2016 เวอร์ชันนี้อนุญาตให้คุณปรับใช้ทั้งโปรเจ็กต์ แทนการใช้แต่ละแพ็คเกจ มีแหล่งข้อมูลเพิ่มเติมโดยเฉพาะระบบคลาวด์ และแหล่งข้อมูลขนาดใหญ่และมีการเปลี่ยนแปลงเล็กน้อยในแค็ตตาล็อก

คุณสมบัติเด่นของ SSIS

นี่คือคุณสมบัติพื้นฐานที่สำคัญบางประการของ SSIS:

  • สภาพแวดล้อมในสตูดิโอ
  • ฟังก์ชันการรวมข้อมูลที่เกี่ยวข้อง
  • ความเร็วในการใช้งานที่มีประสิทธิภาพ
  • การบูรณาการอย่างแนบแน่นกับผู้อื่น Microsoft ตระกูล SQL
  • การแปลงแบบสอบถามการทำเหมืองข้อมูล
  • การค้นหาแบบคลุมเครือและการเปลี่ยนแปลงการจัดกลุ่ม
  • การแยกคำและการเปลี่ยนแปลงการค้นหาคำ
  • ส่วนประกอบการเชื่อมต่อข้อมูลความเร็วสูงเช่นการเชื่อมต่อกับ SAP or Oracle

SSIS Archiเทคเจอร์

SSIS Archiเทคเจอร์
SSIS Archiเทคเจอร์

ต่อไปนี้เป็นส่วนประกอบของสถาปัตยกรรม SSIS:

  • โฟลว์การควบคุม (จัดเก็บคอนเทนเนอร์และงาน)
  • กระแสข้อมูล (แหล่งที่มา ปลายทาง การเปลี่ยนแปลง)
  • ตัวจัดการเหตุการณ์ (การส่งข้อความ, อีเมล์)
  • Package Explorer (เสนอมุมมองเดียวสำหรับทุกคนในแพ็คเกจ)
  • พารามิเตอร์ (การโต้ตอบของผู้ใช้)

มาทำความเข้าใจแต่ละองค์ประกอบโดยละเอียด:

1. การควบคุมการไหล

โฟลว์การควบคุมเป็นสมองของแพ็คเกจ SSIS ช่วยให้คุณจัดลำดับการดำเนินการสำหรับส่วนประกอบทั้งหมด ส่วนประกอบประกอบด้วยคอนเทนเนอร์และงานที่ได้รับการจัดการโดยข้อจำกัดที่มีความสำคัญ

2. ข้อจำกัดลำดับความสำคัญ

ข้อจำกัดลำดับความสำคัญคือส่วนประกอบของแพ็คเกจที่สั่งงานให้ดำเนินการตามลำดับที่กำหนดไว้ล่วงหน้า นอกจากนี้ยังกำหนดขั้นตอนการทำงานของแพ็คเกจ SSIS ทั้งหมด โดยจะควบคุมการปฏิบัติงานของทั้งสองงานที่เชื่อมโยงกันโดยดำเนินงานปลายทางโดยยึดตามผลลัพธ์ของงานก่อนหน้านี้ ซึ่งก็คือกฎเกณฑ์ทางธุรกิจซึ่งกำหนดโดยใช้นิพจน์พิเศษ

3. งาน

'งาน' คือหน่วยงานหนึ่งของงาน มันเหมือนกับวิธีการ/ฟังก์ชั่นที่ใช้ในภาษาการเขียนโปรแกรม อย่างไรก็ตาม ใน SSIS คุณไม่ได้ใช้วิธีการเขียนโค้ด คุณจะใช้เทคนิคการลากและวางเพื่อออกแบบพื้นผิวและกำหนดค่าแทน

4 ตู้คอนเทนเนอร์

คอนเทนเนอร์เป็นหน่วยสำหรับจัดกลุ่มงานเข้าด้วยกันเป็นหน่วยของงาน นอกเหนือจากการนำเสนอความสอดคล้องของภาพแล้ว ยังช่วยให้คุณสามารถประกาศตัวแปรและตัวจัดการเหตุการณ์ที่ควรอยู่ในขอบเขตของคอนเทนเนอร์เฉพาะนั้นได้

คอนเทนเนอร์สี่ประเภทใน SSIS ได้แก่:

  • คอนเทนเนอร์ลำดับ
  • A สำหรับคอนเทนเนอร์แบบวนรอบ
  • คอนเทนเนอร์ Foreach ห่วง

คอนเทนเนอร์ลำดับ: ช่วยให้คุณสามารถจัดระเบียบงานย่อยโดยการจัดกลุ่ม และช่วยให้คุณสามารถใช้ธุรกรรมหรือกำหนดการบันทึกให้กับคอนเทนเนอร์ได้

สำหรับคอนเทนเนอร์แบบวนรอบ:ให้ฟังก์ชันการทำงานเดียวกันกับคอนเทนเนอร์ลำดับ ยกเว้นว่าจะช่วยให้คุณรันงานได้หลายครั้งด้วย อย่างไรก็ตาม ขึ้นอยู่กับเงื่อนไขการประเมิน เช่น การวนซ้ำจาก 1 ถึง 100

สำหรับแต่ละคอนเทนเนอร์ลูป: นอกจากนี้ยังช่วยให้วนซ้ำได้ แต่ความแตกต่างที่แทนที่จะใช้นิพจน์เงื่อนไข การวนซ้ำที่ทำกับชุดของวัตถุ ชอบไฟล์ในโฟลเดอร์

5. การไหลของข้อมูล

การใช้งานหลักของเครื่องมือ SSIS คือการแยกข้อมูลลงในหน่วยความจำของเซิร์ฟเวอร์ แปลงข้อมูล และเขียนไปยังปลายทางอื่น ถ้า Control Flow คือสมอง Data Flow ก็คือหัวใจของ SSIS

6. แพ็คเกจ SSIS

ส่วนประกอบหลักอีกประการหนึ่งของ SSIS คือแนวคิดของแพ็คเกจ ซึ่งเป็นชุดของงานต่างๆ ที่ทำงานอย่างมีระเบียบ ในกรณีนี้ ข้อจำกัดของประธานจะช่วยจัดการลำดับที่งานต่างๆ จะต้องดำเนินการ

แพ็คเกจสามารถช่วยให้คุณบันทึกไฟล์ลงในไฟล์ SQL Serverใน msdb หรือฐานข้อมูลแค็ตตาล็อกแพ็คเกจ สามารถบันทึกเป็นไฟล์ .dtsx ซึ่งเป็นไฟล์ที่มีโครงสร้างคล้ายกับไฟล์ .rdl ของ Reporting Services

แพ็คเกจ SSIS

7 พารามิเตอร์

พารามิเตอร์มีลักษณะการทำงานเหมือนกับตัวแปร แต่มีข้อยกเว้นหลักบางประการ สามารถตั้งค่านอกแพ็คเกจได้อย่างง่ายดาย สามารถกำหนดเป็นค่าที่ต้องส่งผ่านเพื่อให้แพ็คเกจเริ่มต้นได้

ประเภทงาน SSIS

ในเครื่องมือ SSIS คุณสามารถเพิ่มงานเพื่อควบคุมโฟลว์ได้ มีงานหลายประเภทซึ่งทำงานประเภทต่างๆ

งาน SSIS ที่สำคัญบางประการมีการกล่าวถึงด้านล่าง:

ชื่องาน Descriptไอออน
ดำเนินการงาน SQL ตามชื่อของมัน มันจะรันคำสั่ง SQL กับฐานข้อมูลเชิงสัมพันธ์
งานการไหลของข้อมูล งานนี้สามารถอ่านข้อมูลจากแหล่งข้อมูลตั้งแต่หนึ่งแหล่งขึ้นไป แปลงข้อมูลเมื่ออยู่ในหน่วยความจำและเขียนลงในปลายทางตั้งแต่หนึ่งแห่งขึ้นไป
งานการประมวลผลบริการการวิเคราะห์ ใช้งานนี้เพื่อประมวลผลอ็อบเจ็กต์ของโมเดล Tabular หรือเป็นคิวบ์ SSAS
ดำเนินการงานแพ็คเกจ การใช้งานสามารถใช้ภารกิจ SSIS นี้เพื่อรันแพ็คเกจอื่นจากภายในโปรเจ็กต์เดียวกัน
ดำเนินการงานกระบวนการ ด้วยความช่วยเหลือของงานนี้ คุณสามารถระบุพารามิเตอร์บรรทัดคำสั่งได้
งานระบบไฟล์ มันดำเนินการจัดการในระบบไฟล์ เช่นการย้าย เปลี่ยนชื่อ ลบไฟล์ และการสร้างไดเร็กทอรี
งาน FTP ช่วยให้คุณสามารถใช้งานฟังก์ชัน FTP ขั้นพื้นฐานได้
งานสคริปต์ นี่เป็นงานเปล่า คุณสามารถเขียนโค้ด NET ซึ่งทำงานอะไรก็ได้ คุณต้องการที่จะแสดง
ส่ง Mail งาน คุณสามารถส่งอีเมล์เพื่อแจ้งให้ผู้ใช้ทราบว่าแพ็คเกจของคุณเสร็จสิ้นแล้ว หรือเกิดข้อผิดพลาดบางอย่าง
งานแทรกจำนวนมาก การใช้งานสามารถโหลดข้อมูลลงในตารางโดยใช้คำสั่งแทรกจำนวนมาก
งานสคริปต์ รันชุดของ VB.NET หรือการเขียนโค้ด C# ในสภาพแวดล้อม Visual Studio
งานบริการเว็บ มันดำเนินการวิธีการบนบริการเว็บ
งานเฝ้าดูเหตุการณ์ WMI งานนี้อนุญาตให้แพ็คเกจ SSIS รอและตอบสนองต่อเหตุการณ์ WMI บางอย่าง
งาน XML งานนี้ช่วยให้คุณสามารถผสาน แยก หรือฟอร์แมตไฟล์ XML ใดๆ ได้

เครื่องมือ ETL ที่สำคัญอื่น ๆ

  • SAP บริการข้อมูล
  • การจัดการข้อมูล SAS
  • Oracle ผู้สร้างคลังสินค้า (OWB)
  • พาวเวอร์เซ็นเตอร์ อินฟอร์เมติกา
  • IBM เซิร์ฟเวอร์ข้อมูลอินโฟสเฟียร์
  • Elixir Repertoire สำหรับข้อมูล ETL
  • กระแสข้อมูลซาร์เจนท์

ข้อดีและข้อเสียของการใช้ SSIS

เครื่องมือ SSIS มีข้อดีดังต่อไปนี้:

  • เอกสารและการสนับสนุนที่กว้างขวาง
  • ความง่ายและรวดเร็วในการดำเนินการ
  • บูรณาการอย่างแน่นหนากับ SQL Server และ สตูดิโอภาพ
  • การรวมข้อมูลที่ได้มาตรฐาน
  • นำเสนอความสามารถตามข้อความแบบเรียลไทม์
  • รองรับรูปแบบการจัดจำหน่าย
  • ช่วยคุณลบเครือข่ายที่เป็นคอขวดสำหรับการแทรกข้อมูลโดย SSIS ลงใน SQL
  • SISS อนุญาตให้คุณใช้ SQL Server Destination แทน OLE DB เพื่อโหลดข้อมูลได้เร็วขึ้น

ข้อเสียของ SSIS

ข้อเสียบางประการของการใช้เครื่องมือ SSIS มีดังนี้:

  • บางครั้งอาจสร้างปัญหาในสภาพแวดล้อมที่ไม่ใช่ Windows
  • วิสัยทัศน์และกลยุทธ์ที่ไม่ชัดเจน
  • SSIS ขาดการสนับสนุนสำหรับรูปแบบการรวมข้อมูลทางเลือก
  • การบูรณาการที่มีปัญหากับผลิตภัณฑ์อื่น

ตัวอย่างแนวทางปฏิบัติที่ดีที่สุดของ SSIS

  • SSIS เป็นไปป์ไลน์ในหน่วยความจำ นั่นเป็นเหตุผลสำคัญที่ต้องแน่ใจว่าการเปลี่ยนแปลงทั้งหมดเกิดขึ้นในหน่วยความจำ
  • พยายามลดการดำเนินการที่บันทึกไว้ให้เหลือน้อยที่สุด
  • วางแผนกำลังการผลิตโดยการทำความเข้าใจการใช้ทรัพยากร
  • ปรับการแปลงการค้นหา SQL แหล่งข้อมูล และปลายทางให้เหมาะสม
  • กำหนดเวลาและแจกจ่ายอย่างถูกต้อง

สรุป

  • SSIS รูปแบบเต็มคือ SQL Server Integration Services
  • เครื่องมือ SSIS ช่วยให้คุณรวมข้อมูลจากที่เก็บข้อมูลต่างๆ
  • เวอร์ชันสำคัญของ SQL Server Integration Service คือ 2005, 2008, 2012, 2014 และ 216
  • สภาพแวดล้อมของสตูดิโอ ฟังก์ชันการรวมข้อมูลที่เกี่ยวข้อง และความเร็วในการใช้งานที่มีประสิทธิภาพคือคุณสมบัติที่สำคัญบางประการของ SSIS
  • การควบคุมการไหล การไหลของข้อมูล ตัวจัดการเหตุการณ์ ตัวสำรวจแพ็คเกจ และพารามิเตอร์เป็นส่วนประกอบสถาปัตยกรรม SSIS ที่สำคัญ
  • ดำเนินการงาน SQL, งานกระแสข้อมูล, งานประมวลผลบริการการวิเคราะห์, ดำเนินการงานแพ็คเกจ, ดำเนินการงานกระบวนการ, งานระบบไฟล์, งาน FTP, ส่ง Mail งาน งานบริการเว็บมีความสำคัญบางประการ
  • เอกสารและการสนับสนุนที่กว้างขวาง
  • ข้อเสียเปรียบที่ใหญ่ที่สุดของ SSIS คือขาดการสนับสนุนสำหรับรูปแบบการรวมข้อมูลทางเลือก
  • SAP บริการข้อมูล, การจัดการข้อมูล SAS, Oracle ผู้สร้างคลังสินค้า (OWB), PowerCenter Informatica, IBM เซิร์ฟเวอร์ข้อมูลอินโฟสเฟียร์
  • SSIS เป็นไปป์ไลน์ในหน่วยความจำ ดังนั้นจึงจำเป็นอย่างยิ่งที่จะต้องแน่ใจว่าการเปลี่ยนแปลงทั้งหมดเกิดขึ้นในหน่วยความจำ