บทช่วยสอนการทดสอบ ETL

การทดสอบ ETL คืออะไร?

การทดสอบ ETL ดำเนินการเพื่อให้แน่ใจว่าข้อมูลที่โหลดจากต้นทางไปยังปลายทางหลังจากการเปลี่ยนแปลงทางธุรกิจมีความถูกต้อง นอกจากนี้ยังเกี่ยวข้องกับการตรวจสอบข้อมูลในขั้นตอนกลางต่างๆ ที่ใช้ระหว่างต้นทางและปลายทาง ETL ย่อมาจาก Extract-Transform-Load

การทดสอบ ETL

การทดสอบคลังข้อมูล

การทดสอบคลังข้อมูล เป็นวิธีการทดสอบซึ่งข้อมูลภายในคลังข้อมูลได้รับการทดสอบความสมบูรณ์ ความน่าเชื่อถือ ความถูกต้อง และความสม่ำเสมอ เพื่อให้สอดคล้องกับกรอบข้อมูลของบริษัท วัตถุประสงค์หลักของการทดสอบคลังข้อมูลคือเพื่อให้แน่ใจว่าข้อมูลที่รวมอยู่ภายในคลังข้อมูลมีความน่าเชื่อถือเพียงพอสำหรับบริษัทในการตัดสินใจ

ETL คืออะไร

ETL ย่อมาจาก Extract-Transform-Load และเป็นกระบวนการโหลดข้อมูลจากระบบต้นทางไปยังคลังข้อมูล ข้อมูลจะถูกดึงมาจากฐานข้อมูล OLTP ซึ่งแปลงให้ตรงกับสคีมาคลังข้อมูล และโหลดลงในฐานข้อมูลคลังข้อมูล คลังข้อมูลหลายแห่งยังรวมข้อมูลจากระบบที่ไม่ใช่ OLTP เช่น ไฟล์ข้อความ ระบบเดิม และสเปรดชีต

มาดูกันว่ามันทำงานอย่างไร

ตัวอย่างเช่น มีร้านค้าปลีกซึ่งมีแผนกต่างๆ เช่น การขาย การตลาด โลจิสติกส์ เป็นต้น โดยแต่ละแผนกจะจัดการข้อมูลลูกค้าอย่างเป็นอิสระ และวิธีที่พวกเขาจัดเก็บข้อมูลนั้นแตกต่างกันมาก ฝ่ายขายจะจัดเก็บไว้ตามชื่อลูกค้า ในขณะที่ฝ่ายการตลาดจะจัดเก็บไว้ตามรหัสลูกค้า

หากตอนนี้พวกเขาต้องการตรวจสอบประวัติของลูกค้าและต้องการทราบว่าลูกค้าซื้อผลิตภัณฑ์ต่างๆ อะไรบ้างจากแคมเปญการตลาดที่แตกต่างกัน นั่นคงจะเป็นเรื่องน่าเบื่อมาก

วิธีแก้ไขคือการใช้ ข้อมูลคลังสินค้า เพื่อจัดเก็บข้อมูลจากแหล่งต่าง ๆ ไว้ในโครงสร้างที่เหมือนกันโดยใช้ ETL ETL สามารถแปลงชุดข้อมูลที่แตกต่างกันให้เป็นโครงสร้างแบบรวมได้Later ใช้เครื่องมือ BI เพื่อรับข้อมูลเชิงลึกและรายงานที่มีความหมายจากข้อมูลนี้

แผนภาพต่อไปนี้ในบทช่วยสอนการทดสอบ ETL นี้จะให้แผนที่เส้นทางของกระบวนการทดสอบ ETL และแนวคิดการทดสอบ ETL ต่างๆ:

แยก-แปลง-โหลด

  1. สารสกัด
  • ดึงข้อมูลที่เกี่ยวข้อง
  1. แปลง
  • แปลงข้อมูลเป็นรูปแบบ DW (คลังข้อมูล)
  • คีย์การสร้าง – คีย์คือแอตทริบิวต์ข้อมูลตั้งแต่หนึ่งรายการขึ้นไปที่ระบุเอนทิตีโดยไม่ซ้ำกัน หลากหลาย ประเภทของกุญแจ ได้แก่คีย์หลัก คีย์สำรอง คีย์นอก คีย์ผสม คีย์ตัวแทน คลังข้อมูลเป็นเจ้าของคีย์เหล่านี้และไม่อนุญาตให้หน่วยงานอื่นมอบหมายคีย์เหล่านี้
  • การล้างข้อมูล : หลังจากดึงข้อมูลแล้ว จะเข้าสู่ขั้นตอนถัดไปของการล้างข้อมูลและการจัดรูปแบบข้อมูล การทำความสะอาดจะช่วยละเว้นข้อมูลรวมถึงการระบุและแก้ไขข้อผิดพลาด ความสอดคล้องหมายถึงการแก้ไขข้อขัดแย้งระหว่างข้อมูลที่เข้ากันไม่ได้ เพื่อให้สามารถนำไปใช้ในคลังข้อมูลขององค์กรได้ นอกจากนี้ ระบบนี้ยังสร้างเมตาดาต้าที่ใช้ในการวินิจฉัยปัญหาระบบต้นทางและปรับปรุงคุณภาพข้อมูลอีกด้วย
  1. โหลด
  • โหลดข้อมูลเข้า DW (คลังข้อมูล)
  • สร้างข้อมูลรวม – การสร้างข้อมูลรวมคือการสรุปและจัดเก็บข้อมูลที่มีอยู่ใน ตารางข้อเท็จจริง เพื่อปรับปรุงประสิทธิภาพการสืบค้นของผู้ใช้ปลายทาง

กระบวนการทดสอบ ETL

เช่นเดียวกับกระบวนการทดสอบอื่นๆ ETL ก็ผ่านขั้นตอนต่างๆ เช่นกัน ขั้นตอนต่างๆ ของกระบวนการทดสอบ ETL มีดังนี้

กระบวนการทดสอบ ETL

การทดสอบ ETL ดำเนินการในห้าขั้นตอน

  1. การระบุแหล่งข้อมูลและข้อกำหนด
  2. ข้อมูลที่ได้มา
  3. ใช้ตรรกะทางธุรกิจและการสร้างแบบจำลองมิติ
  4. สร้างและเติมข้อมูล
  5. สร้างรายงาน

กระบวนการทดสอบ ETL

ประเภทของการทดสอบ ETL

ประเภทของการทดสอบ กระบวนการทดสอบ
การทดสอบการตรวจสอบการผลิต “การปรับสมดุลตาราง” หรือ “การกระทบยอดการผลิต” การทดสอบ ETL ประเภทนี้ดำเนินการกับข้อมูลในขณะที่ข้อมูลถูกย้ายไปยังระบบการใช้งานจริง เพื่อสนับสนุนการตัดสินใจทางธุรกิจของคุณ ข้อมูลในระบบการผลิตของคุณจะต้องอยู่ในลำดับที่ถูกต้อง สารสนเทศ ตัวเลือกการตรวจสอบความถูกต้องของข้อมูลมอบความสามารถในการทดสอบอัตโนมัติและการจัดการ ETL เพื่อให้แน่ใจว่าระบบการผลิตจะไม่ถูกบุกรุกโดยข้อมูล
ที่มาที่ Target การทดสอบ (การทดสอบการตรวจสอบ) การทดสอบประเภทดังกล่าวดำเนินการเพื่อตรวจสอบว่าค่าข้อมูลที่แปลงเป็นค่าข้อมูลที่คาดหวังหรือไม่
การใช้งาน Upgrades การทดสอบ ETL ประเภทดังกล่าวสามารถสร้างขึ้นได้โดยอัตโนมัติ ซึ่งช่วยประหยัดเวลาในการพัฒนาการทดสอบได้อย่างมาก การทดสอบประเภทนี้จะตรวจสอบว่าข้อมูลที่ดึงมาจากแอปพลิเคชันหรือพื้นที่เก็บข้อมูลรุ่นเก่านั้นเหมือนกันทุกประการกับข้อมูลในพื้นที่เก็บข้อมูลหรือแอปพลิเคชันใหม่
การทดสอบข้อมูลเมตา การทดสอบข้อมูลเมตาประกอบด้วยการทดสอบการตรวจสอบประเภทข้อมูล การตรวจสอบความยาวของข้อมูล และการตรวจสอบดัชนี/ข้อจำกัด
การทดสอบความสมบูรณ์ของข้อมูล เพื่อตรวจสอบว่าข้อมูลที่คาดหวังทั้งหมดถูกโหลดไปยังเป้าหมายจากแหล่งที่มา การทดสอบความสมบูรณ์ของข้อมูลจึงเสร็จสิ้น การทดสอบบางอย่างที่สามารถทำได้คือการเปรียบเทียบและตรวจสอบความถูกต้องของการนับ การรวม และข้อมูลจริงระหว่างแหล่งที่มาและเป้าหมายสำหรับคอลัมน์ที่มีการแปลงอย่างง่ายหรือไม่มีการแปลง
การทดสอบความถูกต้องของข้อมูล การทดสอบนี้ทำเพื่อให้แน่ใจว่าข้อมูลได้รับการโหลดและแปลงอย่างถูกต้องตามที่คาดไว้
การทดสอบการเปลี่ยนแปลงข้อมูล การทดสอบการแปลงข้อมูลเสร็จสิ้นในหลายกรณี ไม่สามารถทำได้โดยการเขียนแหล่งข้อมูลเดียว SQL สอบถามและเปรียบเทียบผลลัพธ์กับเป้าหมาย อาจจำเป็นต้องเรียกใช้แบบสอบถาม SQL หลายรายการสำหรับแต่ละแถวเพื่อตรวจสอบกฎการเปลี่ยนแปลง
การทดสอบคุณภาพข้อมูล การทดสอบคุณภาพข้อมูลประกอบด้วยการทดสอบไวยากรณ์และการอ้างอิง เพื่อหลีกเลี่ยงข้อผิดพลาดใดๆ อันเนื่องมาจากวันที่หรือหมายเลขคำสั่งซื้อในระหว่างกระบวนการทางธุรกิจ การทดสอบคุณภาพข้อมูลจึงเสร็จสิ้น

การทดสอบไวยากรณ์: มันจะรายงานข้อมูลที่สกปรก ตามอักขระที่ไม่ถูกต้อง รูปแบบอักขระ ลำดับตัวพิมพ์ใหญ่หรือตัวพิมพ์เล็กที่ไม่ถูกต้อง ฯลฯ

การทดสอบอ้างอิง: จะตรวจสอบข้อมูลตามแบบจำลองข้อมูล ตัวอย่างเช่น: รหัสลูกค้า

การทดสอบคุณภาพข้อมูล ได้แก่ การตรวจสอบตัวเลข การตรวจสอบวันที่ การตรวจสอบความแม่นยำ การตรวจสอบข้อมูล การตรวจสอบค่าว่าง ฯลฯ

การทดสอบ ETL แบบเพิ่มหน่วย การทดสอบนี้ทำขึ้นเพื่อตรวจสอบความสมบูรณ์ของข้อมูลเก่าและข้อมูลใหม่ด้วยการเพิ่มข้อมูลใหม่ การทดสอบส่วนเพิ่มจะตรวจสอบว่าส่วนแทรกและการอัพเดตกำลังได้รับการประมวลผลตามที่คาดไว้ในระหว่างกระบวนการ ETL ส่วนเพิ่ม
การทดสอบ GUI/การนำทาง การทดสอบนี้ทำเพื่อตรวจสอบการนำทางหรือลักษณะ GUI ของรายงานส่วนหน้า

วิธีสร้างกรณีทดสอบ ETL

การทดสอบ ETL เป็นแนวคิดที่สามารถนำไปใช้กับเครื่องมือและฐานข้อมูลต่างๆ ในอุตสาหกรรมการจัดการข้อมูลได้ วัตถุประสงค์ของการทดสอบ ETL คือเพื่อให้แน่ใจว่าข้อมูลที่โหลดจากต้นทางไปยังปลายทางหลังจากการเปลี่ยนแปลงทางธุรกิจมีความแม่นยำ นอกจากนี้ยังเกี่ยวข้องกับการตรวจสอบข้อมูลในขั้นตอนกลางต่างๆ ที่ใช้ระหว่างต้นทางและปลายทาง

ในขณะที่ทำการทดสอบ ETL เอกสารสองฉบับที่ผู้ทดสอบ ETL มักจะใช้คือ

  1. แผ่นการแมป ETL:แผ่นการแมป ETL ประกอบด้วยข้อมูลทั้งหมดของตารางต้นทางและปลายทาง รวมถึงแต่ละคอลัมน์และการค้นหาในตารางอ้างอิง ผู้ทดสอบ ETL จำเป็นต้องคุ้นเคยกับการสืบค้น SQL เนื่องจากการทดสอบ ETL อาจเกี่ยวข้องกับการเขียนการสืบค้นขนาดใหญ่ที่มีการรวมหลายรายการเพื่อตรวจสอบความถูกต้องของข้อมูลในทุกขั้นตอนของ ETL เอกสารการแมป ETL ให้ความช่วยเหลือที่สำคัญในขณะที่เขียนแบบสอบถามเพื่อการตรวจสอบข้อมูล
  2. DB Schema ของแหล่งที่มา Target: ควรเก็บไว้สะดวกเพื่อตรวจสอบรายละเอียดใดๆ ในแผ่นแผนที่

สถานการณ์การทดสอบ ETL และกรณีทดสอบ

สถานการณ์ทดสอบ กรณีทดสอบ
การตรวจสอบเอกสารการทำแผนที่ ตรวจสอบเอกสารการแมปว่ามีการระบุข้อมูล ETL ที่เกี่ยวข้องหรือไม่ บันทึกการเปลี่ยนแปลงควรเก็บไว้ในเอกสารการแมปทุกฉบับ
การตรวจสอบ
  1. ตรวจสอบความถูกต้องของโครงสร้างตารางต้นทางและเป้าหมายกับเอกสารการแมปที่เกี่ยวข้อง
  2. ประเภทข้อมูลต้นฉบับและประเภทข้อมูลเป้าหมายควรเหมือนกัน
  3. ความยาวของประเภทข้อมูลทั้งในแหล่งที่มาและเป้าหมายควรเท่ากัน
  4. ตรวจสอบว่ามีการระบุประเภทและรูปแบบของฟิลด์ข้อมูล
  5. ความยาวประเภทข้อมูลต้นฉบับไม่ควรน้อยกว่าความยาวประเภทข้อมูลเป้าหมาย
  6. ตรวจสอบชื่อของคอลัมน์ในตารางกับเอกสารการแมป
การตรวจสอบข้อจำกัด ตรวจสอบให้แน่ใจว่ามีการกำหนดข้อจำกัดสำหรับตารางเฉพาะตามที่คาดไว้
ปัญหาความสอดคล้องของข้อมูล
  1. ชนิดข้อมูลและความยาวของแอตทริบิวต์เฉพาะอาจแตกต่างกันในไฟล์หรือตาราง แม้ว่าคำจำกัดความความหมายจะเหมือนกันก็ตาม
  2. การใช้ข้อจำกัดด้านความซื่อสัตย์ในทางที่ผิด
ประเด็นความสมบูรณ์
  1. ตรวจสอบให้แน่ใจว่าข้อมูลที่คาดหวังทั้งหมดถูกโหลดลงในตารางเป้าหมาย
  2. เปรียบเทียบจำนวนบันทึกระหว่างแหล่งที่มาและเป้าหมาย
  3. ตรวจสอบบันทึกที่ถูกปฏิเสธ
  4. ตรวจสอบข้อมูลไม่ควรถูกตัดทอนในคอลัมน์ของตารางเป้าหมาย
  5. ตรวจสอบการวิเคราะห์ค่าขอบเขต
  6. เปรียบเทียบค่าที่ไม่ซ้ำกันของฟิลด์คีย์ระหว่างข้อมูลที่โหลดไปยัง WH และข้อมูลต้นทาง
ปัญหาความถูกต้อง
  1. ข้อมูลที่สะกดผิดหรือบันทึกไม่ถูกต้อง
  2. ข้อมูลว่าง ไม่ซ้ำกัน หรืออยู่นอกช่วง
การแปลง การแปลง
คุณภาพของข้อมูล
  1. การตรวจสอบหมายเลข: จำเป็นต้องตรวจสอบหมายเลขและตรวจสอบความถูกต้อง
  2. การตรวจสอบวันที่: ต้องเป็นไปตามรูปแบบวันที่ และควรเหมือนกันในทุกเรกคอร์ด
  3. ตรวจสอบความแม่นยำ
  4. ตรวจสอบข้อมูล
  5. ตรวจสอบเป็นโมฆะ
ตรวจสอบความถูกต้องเป็นโมฆะ ตรวจสอบค่า Null โดยระบุ "Not Null" สำหรับคอลัมน์ใดคอลัมน์หนึ่ง
ตรวจสอบซ้ำ
  1. จำเป็นต้องตรวจสอบคีย์เฉพาะ คีย์หลัก และคอลัมน์อื่นๆ ไม่ควรซ้ำกันตามความต้องการทางธุรกิจที่มีแถวที่ซ้ำกัน
  2. ตรวจสอบว่ามีค่าที่ซ้ำกันในคอลัมน์ใดๆ ที่แยกมาจากหลายคอลัมน์ในแหล่งที่มาและรวมเป็นคอลัมน์เดียวหรือไม่
  3. ตามความต้องการของลูกค้า จะต้องตรวจสอบให้แน่ใจว่าไม่มีการซ้ำกันในการรวมกันของหลายคอลัมน์ภายในเป้าหมายเท่านั้น
การตรวจสอบวันที่ ค่าวันที่กำลังใช้หลายพื้นที่ในการพัฒนา ETL สำหรับ

  1. เพื่อทราบวันที่สร้างแถว
  2. ระบุบันทึกที่ใช้งานอยู่ตามมุมมองการพัฒนา ETL
  3. ระบุบันทึกที่ใช้งานอยู่ตามมุมมองของความต้องการทางธุรกิจ
  4. บางครั้งการอัปเดตและการแทรกจะถูกสร้างขึ้นตามค่าวันที่
ตรวจสอบข้อมูลให้เสร็จสมบูรณ์
  1. เพื่อตรวจสอบความถูกต้องของชุดข้อมูลทั้งหมดในตารางต้นทางและเป้าหมายลบแบบสอบถามด้วยวิธีแก้ปัญหาที่ดีที่สุด
  2. เราจำเป็นต้องหาแหล่งที่มาลบเป้าหมายและเป้าหมายลบแหล่งที่มา
  3. ถ้าแบบสอบถามแบบลบส่งกลับค่าใดๆ ค่าเหล่านั้นควรถือเป็นแถวที่ไม่ตรงกัน
  4. จำเป็นต้องจับคู่แถวระหว่างแหล่งที่มาและเป้าหมายโดยใช้คำสั่งตัดกัน
  5. จำนวนที่ส่งคืนโดยจุดตัดควรตรงกับจำนวนตารางแหล่งที่มาและเป้าหมายแต่ละรายการ
  6. ถ้าค่าลบแบบสอบถามส่งคืนแถวและจำนวนตัดกันน้อยกว่าจำนวนแหล่งที่มาหรือตารางเป้าหมาย เราก็สามารถพิจารณาว่ามีแถวที่ซ้ำกันอยู่
ความสะอาดของข้อมูล ควรลบคอลัมน์ที่ไม่จำเป็นออกก่อนที่จะโหลดลงในพื้นที่จัดเตรียม

ประเภทของข้อบกพร่อง ETL

ประเภทของข้อบกพร่อง ETL

ประเภทของแมลง Descriptไอออน
ข้อบกพร่องของอินเทอร์เฟซผู้ใช้/ข้อบกพร่องด้านความงาม
  • เกี่ยวข้องกับ GUI ของแอปพลิเคชัน
  • ลักษณะแบบอักษร ขนาดแบบอักษร สี การจัดตำแหน่ง การสะกดผิด การนำทาง และอื่นๆ
ข้อผิดพลาดที่เกี่ยวข้องกับการวิเคราะห์มูลค่าขอบเขต (BVA)
  • ค่าต่ำสุดและสูงสุด
ข้อผิดพลาดที่เกี่ยวข้องกับการแบ่งพาร์ติชันคลาส Equivalence (ECP)
  • ประเภทที่ถูกต้องและไม่ถูกต้อง
ข้อบกพร่องอินพุต/เอาท์พุต
  • ไม่ยอมรับค่าที่ถูกต้อง
  • ยอมรับค่าที่ไม่ถูกต้อง
ข้อผิดพลาดในการคำนวณ
  • ข้อผิดพลาดทางคณิตศาสตร์
  • ผลลัพธ์สุดท้ายไม่ถูกต้อง
โหลดข้อบกพร่องเงื่อนไข
  • ไม่อนุญาตให้ผู้ใช้หลายคน
  • ไม่อนุญาตให้ลูกค้าโหลดตามที่คาดหวัง
ข้อบกพร่องของสภาพการแข่งขัน
  • ระบบขัดข้อง & หยุดทำงาน
  • ระบบไม่สามารถรันแพลตฟอร์มไคลเอนต์ได้
ข้อบกพร่องในการควบคุมเวอร์ชัน
ข้อบกพร่องของ H/W
  • อุปกรณ์ไม่ตอบสนองต่อแอปพลิเคชัน
ช่วยเหลือ แหล่งที่มาของข้อบกพร่อง
  • ข้อผิดพลาดในเอกสารช่วยเหลือ

ความแตกต่างระหว่างการทดสอบฐานข้อมูลและการทดสอบ ETL

การทดสอบ ETL การทดสอบฐานข้อมูล
ตรวจสอบว่าข้อมูลถูกย้ายตามที่คาดไว้หรือไม่ เป้าหมายหลักคือการตรวจสอบว่าข้อมูลเป็นไปตามกฎ/มาตรฐานที่กำหนดไว้ในแบบจำลองข้อมูลหรือไม่
ตรวจสอบว่าการนับในแหล่งที่มาและเป้าหมายตรงกันหรือไม่

ตรวจสอบว่าข้อมูลที่แปลงเป็นไปตามที่คาดไว้หรือไม่

ตรวจสอบว่าไม่มีบันทึกเด็กกำพร้าและรักษาความสัมพันธ์คีย์หลักต่างประเทศไว้
ตรวจสอบว่าความสัมพันธ์คีย์หลักต่างประเทศถูกรักษาไว้ในช่วง ETL ตรวจสอบว่าไม่มีตารางที่ซ้ำซ้อนและฐานข้อมูลได้รับการปรับให้เป็นมาตรฐานอย่างเหมาะสมที่สุด
ตรวจสอบความซ้ำซ้อนในข้อมูลที่โหลด ตรวจสอบว่าข้อมูลหายไปในคอลัมน์ตามที่จำเป็นหรือไม่

ความรับผิดชอบของผู้ทดสอบ ETL

ความรับผิดชอบหลักของผู้ทดสอบ ETL แบ่งออกเป็นสามประเภท

  • ตารางเวที/SFS หรือ MFS
  • ใช้ตรรกะการเปลี่ยนแปลงทางธุรกิจ
  • Target กำลังโหลดตารางจากไฟล์สเตจหรือตารางหลังจากใช้การแปลง

ความรับผิดชอบบางประการของผู้ทดสอบ ETL คือ

  • ทดสอบซอฟต์แวร์ ETL
  • ทดสอบส่วนประกอบของคลังข้อมูล ETL
  • ดำเนินการทดสอบที่ขับเคลื่อนด้วยข้อมูลแบ็กเอนด์
  • สร้าง ออกแบบ และดำเนินการ กรณีทดสอบแผนการทดสอบ และชุดทดสอบ
  • ระบุปัญหาและให้แนวทางแก้ไขปัญหาที่อาจเกิดขึ้น
  • อนุมัติข้อกำหนดและข้อกำหนดการออกแบบ
  • การถ่ายโอนข้อมูลและทดสอบไฟล์แฟลต
  • การเขียน SQL Queries3 สำหรับสถานการณ์ต่างๆ เช่น การทดสอบการนับ

การทดสอบประสิทธิภาพใน ETL

การทดสอบประสิทธิภาพใน ETL เป็นเทคนิคการทดสอบเพื่อให้แน่ใจว่าระบบ ETL สามารถรองรับโหลดของผู้ใช้และธุรกรรมหลายรายการได้ เป้าหมายหลักของ ETL การทดสอบประสิทธิภาพ คือการเพิ่มประสิทธิภาพและปรับปรุงประสิทธิภาพเซสชันโดยการระบุและขจัดปัญหาคอขวดของประสิทธิภาพ ฐานข้อมูลต้นทางและเป้าหมาย การแมป เซสชัน และระบบอาจมีปัญหาคอขวดด้านประสิทธิภาพ

หนึ่งในเครื่องมือที่ดีที่สุดที่ใช้สำหรับการทดสอบ/ปรับแต่งประสิทธิภาพคือ Informatica

ระบบอัตโนมัติของการทดสอบ ETL

วิธีการทั่วไปของการทดสอบ ETL คือการใช้สคริปต์ SQL หรือทำการ "ตรวจดูข้อมูล" ของข้อมูล วิธีการทดสอบ ETL เหล่านี้ใช้เวลานาน เกิดข้อผิดพลาดได้ง่าย และไม่ค่อยให้ข้อมูลที่ครบถ้วนสมบูรณ์ ครอบคลุมการทดสอบ- เพื่อเร่ง ปรับปรุงความครอบคลุม ลดต้นทุน ปรับปรุง ข้อบกพร่อง ปันส่วนการตรวจสอบการทดสอบ ETL ในสภาพแวดล้อมการผลิตและการพัฒนาระบบอัตโนมัติเป็นสิ่งจำเป็นของชั่วโมง เครื่องมือหนึ่งดังกล่าวคือ Informatica

แนวทางปฏิบัติที่ดีที่สุดสำหรับการทดสอบ ETL

  1. ตรวจสอบให้แน่ใจว่าข้อมูลได้รับการแปลงอย่างถูกต้อง
  2. ข้อมูลที่คาดการณ์ไว้ควรถูกโหลดลงในคลังข้อมูลโดยไม่มีการสูญหายของข้อมูลและการตัดทอนข้อมูล
  3. ตรวจสอบให้แน่ใจว่าแอปพลิเคชัน ETL ปฏิเสธอย่างเหมาะสมและแทนที่ด้วยค่าเริ่มต้นและรายงานข้อมูลที่ไม่ถูกต้อง
  4. ต้องแน่ใจว่าข้อมูลที่โหลดในคลังข้อมูลภายในกรอบเวลาที่กำหนดและคาดหวังเพื่อยืนยันความสามารถในการขยายขนาดและประสิทธิภาพ
  5. วิธีการทั้งหมดควรมีการทดสอบหน่วยที่เหมาะสมโดยไม่คำนึงถึงการมองเห็น
  6. เพื่อวัดประสิทธิผล การทดสอบทุกหน่วยควรใช้เทคนิคความครอบคลุมที่เหมาะสม
  7. พยายามยืนยันหนึ่งครั้งต่อกรณีทดสอบ
  8. สร้างบัญชีตัวแทน การทดสอบหน่วย ข้อยกเว้นที่เป็นเป้าหมาย

เช็คเอาท์ - คำถามและคำตอบสัมภาษณ์การทดสอบ ETL