Tutorial SSIS untuk Pemula: Apa itu, Architekstur, Paket
Apa itu SSIS?
Layanan Integrasi SQL Server (SSIS) adalah komponen dari Microsoft SQL Server perangkat lunak basis data yang dapat digunakan untuk menjalankan berbagai tugas migrasi data. SSIS adalah alat pergudangan data yang cepat & fleksibel yang digunakan untuk ekstraksi, pemuatan, dan transformasi data seperti pembersihan, agregasi, penggabungan data, dll.
Memudahkan pemindahan data dari satu database ke database lainnya. SSIS dapat mengekstrak data dari berbagai sumber seperti database SQL Server, file Excel, Oracle dan database DB2, dll.
SSIS juga menyertakan alat grafis & panduan untuk menjalankan fungsi alur kerja seperti mengirim pesan email, operasi FTP, sumber data, dan tujuan.
Mengapa kami menggunakan SSIS?
Berikut adalah alasan utama menggunakan alat SSIS:
- Alat SSIS membantu Anda menggabungkan data dari berbagai penyimpanan data
- Mengotomatiskan Fungsi Administratif dan Pemuatan Data
- Mengisi Data Mart & Gudang Data
- Membantu Anda membersihkan dan menstandardisasi data
- Membangun BI menjadi Proses Transformasi Data
- Mengotomatiskan Fungsi Administratif dan Pemuatan Data
- SIS berisi GUI yang membantu pengguna mengubah data dengan mudah daripada menulis program besar
- Itu dapat memuat jutaan baris dari satu sumber data ke sumber data lainnya dalam beberapa menit
- Mengidentifikasi, menangkap, dan memproses perubahan data
- Mengkoordinasikan pemeliharaan, pemrosesan, atau analisis data
- SSIS menghilangkan kebutuhan akan programmer yang keras
- SSIS menawarkan penanganan kesalahan dan kejadian yang tangguh
Sejarah SSIS
Sebelum SSIS, SQL Server, Data Transformation Services (DTS) digunakan, yang merupakan bagian dari SQL Server 7 dan 2000
Versi | Detil |
---|---|
SQL Server 2005 | Microsoft tim memutuskan untuk merombak DTS. Namun, alih-alih memperbarui DTS, mereka memutuskan untuk memberi nama produk tersebut Layanan Integrasi (SSIS). |
Versi server SQL 2008 | Banyak peningkatan kinerja dilakukan pada SSIS. Sumber-sumber baru juga diperkenalkan. |
SQL Server 2012 | Itu adalah rilis terbesar bagi SSIS. Dengan versi ini, konsep model penerapan proyek diperkenalkan. Hal ini memungkinkan seluruh proyek, dan paket-paketnya disebarkan ke server, sebagai pengganti paket-paket tertentu. |
SQL Server 2014 | Pada versi ini, tidak banyak perubahan yang dilakukan untuk SSIS. Namun sumber atau transformasi baru ditambahkan yang dilakukan dengan pengunduhan terpisah melalui KodePlex atau Paket Fitur SQL Server. |
Di SQL Server 2016 | Versi ini memungkinkan Anda untuk menyebarkan seluruh proyek, bukan paket individual. Ada sumber tambahan terutama cloud, dan sumber data besar serta sedikit perubahan yang dilakukan pada katalog. |
Fitur Penting SSIS
Berikut adalah beberapa fitur dasar SSIS yang penting:
- Lingkungan Studio
- Fungsi integrasi data yang relevan
- Kecepatan implementasi yang efektif
- Integrasi yang erat dengan yang lain Microsoft keluarga SQL
- Transformasi Kueri Penambangan Data
- Pencarian Fuzzy dan Transformasi Pengelompokan
- Ekstraksi Istilah dan Transformasi Pencarian Istilah
- Komponen konektivitas data berkecepatan lebih tinggi seperti konektivitas ke SAP or Oracle
SSIS Architekstur
Berikut ini adalah komponen arsitektur SSIS:
- Aliran Kontrol (Menyimpan kontainer dan Tugas)
- Aliran Data (Sumber, Tujuan, Transformasi)
- Event Handler (pengiriman pesan, Email)
- Package Explorer (Menawarkan satu tampilan untuk semua dalam paket)
- Parameter (Interaksi Pengguna)
Mari kita pahami setiap komponen secara detail:
1. Aliran Kontrol
Aliran kontrol adalah otak dari paket SSIS. Ini membantu Anda mengatur urutan eksekusi untuk semua komponennya. Komponen berisi kontainer dan tugas yang dikelola berdasarkan batasan prioritas.
2. Kendala Prioritas
Batasan prioritas adalah komponen paket yang mengarahkan tugas untuk dieksekusi dalam urutan yang telah ditentukan. Ini juga mendefinisikan alur kerja seluruh paket SSIS. Ia mengontrol eksekusi dua tugas terkait dengan mengeksekusi tugas tujuan berdasarkan hasil tugas sebelumnya — aturan bisnis yang ditentukan menggunakan ekspresi khusus.
3. Tugas
'Tugas' adalah unit kerja individual. Sama halnya dengan metode/fungsi yang digunakan dalam bahasa pemrograman. Namun, di SSIS, Anda tidak menggunakan metode coding. Sebagai gantinya, Anda akan menggunakan teknik drag & drop untuk mendesain permukaan dan mengkonfigurasinya.
4. Wadah
Wadahnya adalah unit-unit untuk mengelompokkan tugas-tugas menjadi satuan-satuan kerja. Selain menawarkan konsistensi visual, ini juga memungkinkan Anda mendeklarasikan variabel dan event handler yang harus berada dalam cakupan container spesifik tersebut.
Empat jenis container di SSIS adalah:
- Wadah Urutan
- A Untuk Kontainer Loop
- Kontainer Loop Depan
Wadah Urutan: memungkinkan Anda mengatur tugas tambahan dengan mengelompokkannya, dan memungkinkan Anda menerapkan transaksi atau menetapkan logging ke kontainer.
Untuk wadah lingkaran:Menyediakan fungsionalitas yang sama dengan urutan Kontainer, hanya saja ia juga memungkinkan Anda menjalankan tugas beberapa kali. Namun, hal ini didasarkan pada kondisi evaluasi, seperti perulangan dari 1 hingga 100.
Untuk setiap Kontainer Loop: Ini juga memungkinkan perulangan. Namun perbedaannya adalah alih-alih menggunakan ekspresi kondisi, loop dilakukan pada sekumpulan objek, seperti file dalam folder.
5. Aliran data
Kegunaan utama alat SSIS adalah mengekstrak data ke dalam memori server, mengubahnya, dan menulisnya ke tujuan lain. Jika Control Flow adalah otaknya, Data Flow adalah jantungnya SSIS
6. Paket SSIS
Komponen inti lain dari SSIS adalah gagasan tentang paket. Paket adalah kumpulan tugas yang dijalankan secara teratur. Di sini, batasan presiden membantu mengatur urutan pelaksanaan tugas.
Sebuah paket dapat membantu Anda menyimpan file ke a SQL Server, di msdb atau database katalog paket. Ini dapat disimpan sebagai file .dtsx, yang merupakan file terstruktur yang sangat mirip dengan file .rdl pada Layanan Pelaporan.
7. Parameter
Parameter berperilaku seperti variabel tetapi dengan beberapa pengecualian utama. Itu dapat diatur di luar paket dengan mudah. Ini dapat ditetapkan sebagai nilai yang harus diteruskan agar paket dapat dimulai.
Jenis Tugas SSIS
Di alat SSIS, Anda dapat menambahkan tugas untuk mengontrol aliran. Ada berbagai jenis tugas yang melakukan berbagai jenis pekerjaan.
Beberapa tugas penting SSIS disebutkan di bawah ini:
Nama tugas | Description |
---|---|
Jalankan Tugas SQL | Seperti namanya, ini akan mengeksekusi pernyataan SQL terhadap database relasional. |
Tugas Aliran Data | Tugas ini dapat membaca data dari satu atau lebih sumber. Transformasikan data saat berada di memori dan tuliskan ke satu atau lebih tujuan. |
Tugas Pemrosesan Layanan Analisis | Gunakan tugas ini untuk memproses objek model Tabular atau sebagai kubus SSAS. |
Jalankan Tugas Paket | Penggunaan dapat menggunakan tugas SSIS ini untuk mengeksekusi paket lain dari dalam proyek yang sama. |
Jalankan Tugas Proses | Dengan bantuan tugas ini, Anda dapat menentukan parameter baris perintah. |
Tugas Sistem File | Ia melakukan manipulasi dalam sistem file. Seperti memindahkan, mengganti nama, menghapus file, dan membuat direktori. |
Tugas FTP | Ini memungkinkan Anda untuk melakukan fungsi dasar FTP. |
Tugas Naskah | Ini adalah tugas kosong. Anda dapat menulis kode NET yang melakukan tugas apa pun; Anda ingin tampil. |
Kirim Mail tugas | Anda dapat mengirim email untuk memberitahukan pengguna bahwa paket Anda telah selesai, atau terjadi kesalahan. |
Tugas Penyisipan Massal | Penggunaan dapat memuat data ke dalam tabel dengan menggunakan perintah penyisipan massal. |
Tugas Naskah | Menjalankan satu set VB.NET atau pengkodean C# di dalam lingkungan Visual Studio. |
Tugas Layanan Web | Itu mengeksekusi metode pada layanan web. |
Tugas Pengawas Peristiwa WMI | Tugas ini memungkinkan paket SSIS untuk menunggu dan merespons peristiwa WMI tertentu. |
Tugas XML | Tugas ini membantu Anda menggabungkan, membagi, atau memformat ulang file XML apa pun. |
Alat ETL Penting lainnya
- SAP Layanan data
- Manajemen Data SAS
- Oracle Pembangun Gudang (OWB)
- PowerCenter Informatika
- IBM Server Informasi Infosfer
- Repertoar Elixir untuk Data ETL
- Aliran Data Sargent
Keuntungan dan Kerugian menggunakan SSIS
Alat SSIS menawarkan keuntungan berikut:
- Dokumentasi dan dukungan yang luas
- Kemudahan dan kecepatan implementasi
- Integrasi yang erat dengan SQL Server dan Studio visual
- Integrasi data standar
- Menawarkan kemampuan berbasis pesan secara real-time
- Dukungan untuk model distribusi
- Membantu Anda menghilangkan jaringan sebagai penghambat penyisipan data oleh SSIS ke dalam SQL
- SISS memungkinkan Anda menggunakan SQL Server Destination alih-alih OLE DB untuk memuat data lebih cepat
Kekurangan SSIS
Beberapa kelemahan menggunakan alat SSIS adalah sebagai berikut:
- Terkadang menimbulkan masalah di lingkungan non-Windows
- Visi dan strategi yang tidak jelas
- SSIS tidak memiliki dukungan untuk gaya integrasi data alternatif
- Integrasi yang bermasalah dengan produk lain
Contoh Praktik Terbaik SSIS
- SSIS adalah saluran dalam memori. Itu sebabnya penting untuk memastikan bahwa semua transformasi terjadi dalam memori
- Cobalah untuk meminimalkan operasi yang dicatat
- Rencanakan kapasitas dengan memahami pemanfaatan sumber daya
- Optimalkan transformasi pencarian SQL, sumber data, dan tujuan
- Jadwalkan dan distribusikan dengan benar
Kesimpulan
- Bentuk lengkap SSIS adalah Layanan Integrasi SQL Server
- Alat SSIS membantu Anda menggabungkan data dari berbagai penyimpanan data
- Versi penting dari Layanan Integrasi SQL Server adalah 2005, 2008, 2012, 2014 dan 216
- Lingkungan Studio, Fungsi integrasi data yang relevan, dan kecepatan implementasi yang efektif adalah beberapa fitur penting SSIS
- Control Flow, Data Flow, Event Handler, Package Explorer, dan Parameter adalah komponen penting arsitektur SSIS
- Jalankan Tugas SQL, Tugas Aliran Data, Tugas Pemrosesan Layanan Analisis, Jalankan Tugas Paket, Jalankan Tugas Proses, Tugas Sistem File, Tugas FTP, Kirim Mail Tugas, Tugas Layanan Web adalah beberapa yang penting
- Dokumentasi dan dukungan yang luas
- Kelemahan terbesar SSIS adalah kurangnya dukungan untuk gaya integrasi data alternatif
- SAP Layanan Data, Manajemen Data SAS, Oracle Pembangun Gudang (OWB), PowerCenter Informatica, IBM Server Informasi Infosfer
- SSIS adalah saluran dalam memori. Oleh karena itu, penting untuk memastikan bahwa semua transformasi terjadi dalam memori