Data Mart ใน Data Warehouse คืออะไร? ประเภทและตัวอย่าง

Data Mart คืออะไร?

A ข้อมูลมาร์ท มุ่งเน้นไปที่พื้นที่การทำงานเดียวขององค์กรและมีชุดย่อยของข้อมูลที่จัดเก็บไว้ในคลังข้อมูล Data Mart เป็น Data Warehouse เวอร์ชันย่อและได้รับการออกแบบเพื่อใช้โดยแผนก หน่วย หรือกลุ่มผู้ใช้เฉพาะในองค์กร เช่น การตลาด การขาย ทรัพยากรบุคคล หรือการเงิน มักถูกควบคุมโดยแผนกเดียวในองค์กร

Data Mart มักจะดึงข้อมูลจากแหล่งเพียงไม่กี่แหล่งเมื่อเปรียบเทียบกับคลังข้อมูล ดาต้ามาร์ทมีขนาดเล็กและมีความยืดหยุ่นมากกว่าเมื่อเทียบกับคลังข้อมูล

ทำไมเราต้องมี Data Mart?

  • Data Mart ช่วยเพิ่มเวลาตอบสนองของผู้ใช้เนื่องจากปริมาณข้อมูลลดลง
  • ช่วยให้เข้าถึงข้อมูลที่ร้องขอบ่อยได้อย่างง่ายดาย
  • Data mart ใช้งานง่ายกว่าเมื่อเปรียบเทียบกับ Datawarehouse ขององค์กร ในขณะเดียวกัน ค่าใช้จ่ายในการใช้งาน Data Mart ก็ต่ำกว่าอย่างแน่นอนเมื่อเทียบกับการใช้คลังข้อมูลเต็มรูปแบบ
  • เมื่อเปรียบเทียบกับ Data Warehouse แล้ว ดาต้ามาร์ทมีความคล่องตัว ในกรณีที่มีการเปลี่ยนแปลงโมเดล ดาต้ามาร์ทสามารถสร้างได้เร็วขึ้นเนื่องจากมีขนาดที่���ล็กลง
  • Datamart ถูกกำหนดโดยผู้เชี่ยวชาญเฉพาะด้านเพียงคนเดียว ในทางตรงกันข้าม คลังข้อมูลถูกกำหนดโดย SME แบบสหวิทยาการจากหลากหลายโดเมน ดังนั้น Data mart จึงเปิดกว้างต่อการเปลี่ยนแปลงมากกว่า Datawarehouse
  • ข้อมูลถูกแบ่งพาร์ติชันและให้สิทธิ์การควบคุมการเข้าถึงที่ละเอียดมาก
  • ข้อมูลสามารถแบ่งส่วนและจัดเก็บไว้ในแพลตฟอร์มฮาร์ดแวร์/ซอฟต์แวร์ที่แตกต่างกันได้

ประเภทของดาต้ามาร์ท

Data Mart มีสามประเภทหลัก:

  1. ขึ้นอยู่กับ:ฐานข้อมูลที่พึ่งพากันจะถูกสร้างขึ้นโดยการดึงข้อมูลโดยตรงจากแหล่งปฏิบัติการ แหล่งภายนอก หรือทั้งสองแหล่ง
  2. อิสระ: ดาต้ามาร์ทอิสระถูกสร้างขึ้นโดยไม่ต้องใช้คลังข้อมูลส่วนกลาง
  3. เป็นลูกผสม:ดาต้ามาร์ทประเภทนี้สามารถรับข้อมูลจากคลังข้อมูลหรือระบบปฏิบัติการได้

ขึ้นอยู่กับ Data Mart

ดาต้ามาร์ทแบบพึ่งพาช่วยให้สามารถจัดหาข้อมูลขององค์กรจากคลังข้อมูลเดียว เป็นหนึ่งในตัวอย่างดาต้ามาร์ทที่ให้ประโยชน์ของการรวมศูนย์ หากคุณต้องการพัฒนา Data Mart ทางกายภาพตั้งแต่หนึ่งรายการขึ้นไป คุณจะต้องกำหนดค่าให้เป็น Data Mart ที่ต้องพึ่งพา

Data Mart ที่พึ่งพาในคลังข้อมูลสามารถสร้างได้สองวิธีที่แตกต่างกัน ไม่ว่าผู้ใช้จะสามารถเข้าถึงทั้งดาต้ามาร์ทและคลังข้อมูลได้ ขึ้นอยู่กับความต้องการ หรือในกรณีที่การเข้าถึงถูกจำกัดไว้แค่ดาต้ามาร์ทเท่านั้น แนวทางที่สองไม่เหมาะสมเนื่องจากบางครั้งเรียกว่าคลังข้อมูล ในแหล่งขยะข้อมูล ข้อมูลทั้งหมดเริ่มต้นด้วยแหล่งที่มาทั่วไป แต่จะถูกทิ้งและส่วนใหญ่เป็นขยะ

ขึ้นอยู่กับ Data Mart
ขึ้นอยู่กับ Data Mart

อิสระข้อมูลมาร์ท

ดาต้ามาร์ทอิสระถูกสร้างขึ้นโดยไม่ต้องใช้คลังข้อมูลส่วนกลาง Data Mart ประเภทนี้เป็นตัวเลือกที่เหมาะสำหรับกลุ่มเล็กๆ ภายในองค์กร

ดาต้ามาร์ทอิสระไม่มีความสัมพันธ์กับคลังข้อมูลขององค์กรหรือกับดาต้ามาร์ทอื่นๆ ใน Independent data mart ข้อมูลจะถูกป้อนแยกกัน และการวิเคราะห์ก็ดำเนินการโดยอัตโนมัติเช่นกัน

การใช้ดาต้ามาร์ทอิสระนั้นตรงกันข้ามกับแรงจูงใจในการสร้างคลังข้อมูล ก่อนอื่น คุณต้องมีการจัดเก็บข้อมูลองค์กรแบบรวมศูนย์ที่สม่ำเสมอ ซึ่งสามารถวิเคราะห์ได้โดยผู้ใช้หลายรายที่มีความสนใจต่างกัน ที่ต้องการข้อมูลที่แตกต่างกันอย่างกว้างขวาง

อิสระข้อมูลมาร์ท

อิสระข้อมูลมาร์ท

ไฮบริดดาต้ามาร์ท

ไฮบริดดาต้ามาร์ทรวมอินพุตจากแหล่งที่มานอกเหนือจากคลังข้อมูล ซึ่งอาจเป็นประโยชน์เมื่อคุณต้องการบูรณาการเฉพาะกิจ เช่น หลังจากเพิ่มกลุ่มหรือผลิตภัณฑ์ใหม่ลงในองค์กร

นี่คือตัวอย่างดาต้ามาร์ทที่ดีที่สุดซึ่งเหมาะสำหรับสภาพแวดล้อมฐานข้อมูลที่หลากหลายและการดำเนินการที่รวดเร็วสำหรับองค์กรใดๆ และยังต้องใช้ความพยายามในการล้างข้อมูลน้อยที่สุดอีกด้วย Hybrid Data mart ยังรองรับโครงสร้างการจัดเก็บข้อมูลขนาดใหญ่ และเหมาะที่สุดสำหรับความยืดหยุ่นสำหรับแอปพลิเคชันที่เน้นข้อมูลเป็นศูนย์กลางขนาดเล็ก

ไฮบริดดาต้ามาร์ท

ไฮบริดดาต้ามาร์ท

ขั้นตอนในการใช้งาน Datamart

ขั้นตอนในการใช้งาน Datamart

การนำ Data Mart มาใช้ถือเป็นขั้นตอนที่คุ้มค��าแต่ซับซ้อน ต่อไปนี้คือขั้นตอนโดยละเอียดในการนำ Data Mart มาใช้:

การออกแบบ

การออกแบบเป็นขั้นตอนแรกของการนำ Data Mart ไปใช้ โดยครอบคลุมงานทั้งหมดตั้งแต่การเริ่มคำขอศูนย์ข้อมูลไปจนถึงการรวบรวมข้อมูลเกี่ยวกับข้อกำหนด สุดท้ายนี้ เราสร้างการออกแบบ Data Mart แบบลอจิคัลและฟิสิคัล

ขั้นตอนการออกแบบเกี่ยวข้องกับงานต่อไปนี้:

  • การรวบรวมข้อกำหนดทางธุรกิจและทางเทคนิค และการระบุแหล่งข้อมูล
  • การเลือกชุดย่อยของข้อมูลที่เหมาะสม
  • การออกแบบโครงสร้างเชิงตรรกะและทางกายภาพของดาต้ามาร์ท

ข้อมูลสามารถแบ่งพาร์ติชั่นได้ตามเกณฑ์ต่อไปนี้:

  • วันที่
  • หน่วยธุรกิจหรือหน่วยงาน
  • ภูมิศาสตร์
  • การรวมกันของข้างต้นใดๆ

ข้อมูลสามารถแบ่งพาร์ติชันได้ที่ระดับแอปพลิเคชันหรือ DBMS แม้ว่าจะแนะนำให้แบ่งพาร์ติชันในระดับแอปพลิเคชัน เนื่องจากจะทำให้มีโมเดลข้อมูลที่แตกต่างกันในแต่ละปีตามการเปลี่ยนแปลงในสภาพแวดล้อมทางธุรกิจ

คุณต้องการผลิตภัณฑ์และเทคโนโลยีอะไรบ้าง?

ปากกาและกระดาษธรรมดาๆ ก็���พียงพอแล้ว แม้ว่าเครื่องมือที่ช่วยคุณสร้าง UML หรือ แผนภาพเอ้อ จะผนวกข้อมูลเมตาเข้ากับการออกแบบเชิงตรรกะและกายภาพของคุณด้วย

การสร้าง

นี่เป็นระยะที่สองของการดำเนินการ มันเกี่ยวข้องกับการสร้าง ฐานข้อมูลทางกายภาพและโครงสร้างเชิงตรรกะ.

ขั้นตอนนี้เกี่ยวข้องกับงานต่อไปนี้:

  • การใช้ฐานข้อมูลทางกายภาพที่ออกแบบในระยะก่อนหน้า ตัวอย่างเช่น ออบเจ็กต์สคีมาฐานข้อมูล เช่น ตาราง ดัชนี มุมมอง ฯลฯ จะถูกสร้างขึ้น

คุณต้องการผลิตภัณฑ์และเทคโนโลยีอะไรบ้าง?

คุณต้องการ ระบบจัดการฐานข้อมูลเชิงสัมพันธ์ เพื่อสร้างดาต้ามาร์ท RDBMS มีคุณสมบัติหลายประการที่จำเป็นสำหรับความสำเร็จของ Data Mart

  • การจัดการพื้นที่เก็บข้อมูล: RDBMS จัดเก็บและจัดการข้อมูลเพื่อสร้าง เพิ่ม และลบข้อมูล
  • การเข้าถึงข้อมูลที่รวดเร็ว: ด้วยการสืบค้น SQL คุณสามารถเข้าถึงข้อมูลตามเงื่อนไข/ตัวกรองบางอย่างได้อย่างง่ายดาย
  • การป้องกันข้อมูล: ระบบ RDBMS ยังนำเสนอวิธีการกู้คืนจากความล้มเหลวของระบบ เช่น ไฟฟ้าขัดข้อง นอกจากนี้ยังช่วยให้สามารถกู้คืนข้อมูลจากข้อมูลสำรองเหล่านี้ในกรณีที่ดิสก์ล้มเหลว
  • การสนับสนุนผู้ใช้หลายคน: ระบบการจัดการข้อมูลนำเสนอการเข้าถึงพร้อมกัน ความสามารถสำหรับผู้ใช้หลายรายในการเข้าถึงและแก้ไขข้อมูลโดยไม่รบกวนหรือเขียนทับการเปลี่ยนแปลงที่ทำโดยผู้ใช้รายอื่น
  • การรักษาความปลอดภัย: ระบบ RDMS ยังให้วิธีการควบคุมการเข้าถึงวัตถุและการดำเนินการบางประเภทโดยผู้ใช้อีกด้วย

กำลังประชากร

ในระยะที่สาม ข้อมูลจะถูกเติมลงในดาต้ามาร์ท

ขั้นตอนการเติมข้อมูลเกี่ยวข้องกับงานต่อไปนี้:

  • การแปลงข้อมูลจากแหล่งต้นทางเป็นข้อมูลเป้าหมายping
  • Extracการระบุข้อมูลต้นทาง
  • การดำเนินการทำความสะอาดและการแปลงข้อมูล
  • กำลังโหลดข้อมูลลงในดาต้ามาร์ท
  • การสร้างและจัดเก็บข้อมูลเมตา

คุณต้องการผลิตภัณฑ์และเทคโนโลยีอะไรบ้าง?

คุณทำงานประชากรเหล่านี้ให้สำเร็จโดยใช้ อีทีแอล (เช่น)tracเครื่องมือ (t แปลงโหลด)เครื่องมือนี้ช่วยให้คุณสามารถตรวจสอบแหล่งข้อมูลและทำการแปลงข้อมูลจากแหล่งข้อมูลไปยังเป้าหมายได้ping, เช่นtracนำข้อมูลมาแปลง ทำความสะอาด และโหลดกลับเข้าไปในดาต้ามาทอีกครั้ง

ในกระบวนการนี้ เครื่องมือจะสร้างข้อมูลเมตาบางส่วนที่เกี่ยวข้องกับสิ่งต่างๆ เช่น ที่มาของข้อมูล ความล่าสุดของข้อมูล ประเภทของการเปลี่ยนแปลงที่เกิดขึ้นกับข้อมูล และระดับการสรุปที่ดำเนินการ

การเข้าถึง

การเข้าถึงเป็นขั้นตอนที่สี่ที่เกี่ยวข้องกับการนำข้อมูลไปใช้: การสอบถามข้อมูล การสร้างรายงาน แผนภูมิ และการเผยแพร่ข้อมูล ผู้ใช้ส่งแบบสอบถามไปยังฐานข้อมูลและแสดงผลลัพธ์ของแบบสอบถาม

ขั้นตอนการเข้าถึงจำเป็นต้องดำเนินการดังต่อไปนี้:

  • ตั้งค่าเมตาเลเยอร์ที่แปลโครงสร้างฐานข้อมูลและชื่อออบเจ็กต์เป็นเงื่อนไขทางธุรกิจ ซึ่งจะช่วยให้ผู้ใช้ที่ไม่ใช่ด้านเทคนิคสามารถเข้าถึง Data mart ���ด้อย่างง่ายดาย
  • ตั้งค่าและบำรุงรักษาโครงสร้างฐานข้อมูล
  • ตั้งค่า API และอินเทอร์เฟซหากจำเป็น

คุณต้องการผลิตภัณฑ์และเทคโนโลยีอะไรบ้าง?

คุณสามารถเข้าถึงดาต้ามาร์ทได้โดยใช้บรรทัดคำสั่งหรือ GUI แนะนำให้ใช้ GUI เนื่องจากสามารถสร้างกราฟได้ง่ายและใช้งานง่ายเมื่อเทียบกับบรรทัดคำสั่ง

ผู้จัดการ

นี่เป็นขั้นตอนสุดท้ายของกระบวนการปรับใช้ Data Mart ขั้นตอนนี้ครอบคลุมถึงงานด้านการจัดการ เช่น-

  • การจัดการการเข้าถึงของผู้ใช้อย่างต่อเนื่อง
  • การเพิ่มประสิทธิภาพระบบและการปรับแต่งอย่างละเอียดเพื่อให้ได้ประสิทธิภาพที่เพิ่มขึ้น
  • การเพิ่มและการจัดการข้อมูลใหม่เข้าสู่ดาต้ามาร์ท
  • การวางแผนสถานการณ์การกู้คืนและรับรองความพร้อมใช้งานของระบบในกรณีที่ระบบล้มเหลว

คุณต้องการผลิตภัณฑ์และเทคโนโลยีอะไรบ้าง?

คุณสามารถใช้ GUI หรือบรรทัดคำสั่งสำหรับการจัดการดาต้ามาร์ทได้

แนวทางปฏิบัติที่ดีที่สุดสำหรับการนำ Data Marts ไปใช้

ต่อไปนี้เป็นแนวทางปฏิบัติที่ดีที่สุดที่คุณจำเป็นต้องปฏิบัติตามในกระบวนการนำ Data Mart ไปใช้:

  • แหล่งที่มาของ Data Mart ควรมีโครงสร้างเป็นแผนก
  • วงจรการใช้งาน Data Mart ควรวัดในช่วงเวลาสั้นๆ เช่น เป็นสัปดาห์แทนที่จะเป็นเดือนหรือเป็นปี
  • สิ่งสำคัญคือต้องให้ผู้มีส่วนได้ส่วนเสียทั้งหมดมีส่วนร่วมในขั้นตอนการวางแผนและการออกแบบ เนื่องจากการนำข้อมูลมาตรส่วนมาใช้อาจมีความซับซ้อน
  • ต้นทุนด้านฮาร์ดแวร์/ซอฟต์แวร์ เครือข่าย และการใช้งานของ Data Mart ควรได้รับการกำหนดงบประมาณอย่างถูกต้องในแผนของคุณ
  • แม้ว่า Data mart จะถูกสร้างขึ้นบนฮาร์ดแวร์เดียวกัน แต่พวกเขาก็อาจต้องใช้ซอฟต์แวร์ที่แตกต่างกันเพื่อจัดการกับคำถามของผู้ใช้ พลังการประมวลผลเพิ่มเติมและข้อกำหนดพื้นที่จัดเก็บดิสก์ควรได้รับการประเมินเพื่อการตอบสนองของผู้ใช้ที่รวดเร็ว
  • ศูนย์ข้อมูลอาจอยู่ในตำแหน่งที่แตกต่างจากคลังข้อมูล นั่นเป็นเหตุผลว่าทำไมจึงเป็นสิ่งสำคัญที่จะต้องแน่ใจว่าพวกเขามีความจุเครือข่ายเพียงพอในการจัดการปริมาณข้อมูลที่จำเป็นในการถ่ายโอนข้อมูลไปยังดาต้ามาร์ท.
  • ต้นทุนการใช้งานควรจัดสรรเวลาที่ใช้ในการโหลด Datamart เวลาในการโหลดจะเพิ่มขึ้นตามความซับซ้อนของการแปลงที่เพิ่มขึ้น

ข้อดีและข้อเสียของ Data Mart

ข้อดี

  • ดาต้ามาร์ทประกอบด้วยชุดย่อยของข้อมูลทั่วทั้งองค์กร ข้อมูลนี้มีคุณค่าต่อกลุ่มบุคคลในองค์กร
  • เป็นทางเลือกที่คุ้มค่าแก่การก คลังข้อมูลซึ่งอาจใช้ต้นทุนการก่อสร้างสูง
  • Data Mart ช่วยให้เข้าถึงข้อมูลได้เร็วขึ้น
  • Data Mart ใช้งานง่ายเนื่องจากได้รับการออกแบบมาโดยเฉพาะเพื่อตอบสนองความต้องการของผู้ใช้ ดังนั้นดาต้ามาร์ทจึงสามารถเร่งกระบวนการทางธุรกิจได้
  • Data Marts ต้องการเวลาในการดำเนินการน้อยกว่าเมื่อเปรียบเทียบกับระบบ Data Warehouse การใช้งาน Data Mart นั้นเร็วกว่า เนื่องจากคุณเพียงแค่ต้องรวมข้อมูลเพียงชุดย่อยเท่านั้น
  • ประกอบด้วยข้อมูลในอดีตซึ่งช่วยให้นักวิเคราะห์สามารถกำหนดแนวโน้มของข้อมูลได้

ข้อเสีย

  • หลายครั้งที่องค์กรสร้างศูนย์ข้อมูลที่แตกต่างกันและไม่เกี่ยวข้องกันมากเกินไปโดยไม่เกิดประโยชน์มากนัก มันอาจกลายเป็นอุปสรรคใหญ่ในการรักษาได้
  • Data Mart ไม่สามารถให้บริการได้ทั่วทั้งบริษัท การวิเคราะห์ข้อมูล เนื่องจากชุดข้อมูลมีจำกัด

สรุป

  • กำหนด Data Mart : Data Mart ถูกกำหนดให้เป็นชุดย่อยของ Data Warehouse ที่มุ่งเน้นไปที่พื้นที่การทำงานเดียวขององค์กร
  • Data Mart ช่วยเพิ่มเวลาตอบสนองของผู้ใช้เนื่องจากปริมาณข้อมูลลดลง
  • ดาต้ามาร์ทสามประเภทคือ 1) ขึ้นอยู่กับ 2) อิสระ 3) ไฮบริด
  • ขั้นตอนการดำเนินงานที่สำคัญของ Data Mart คือ 1) การออกแบบ 2) การสร้าง 3 การเติมข้อมูล 4) การเข้าถึง และ 5) การจัดการ
  • วงจรการใช้งาน Data Mart ควรวัดในช่วงเวลาสั้นๆ เช่น เป็นสัปดาห์แทนที่จะเป็นเดือนหรือเป็นปี
  • ดาต้ามาร์ทเป็นทางเลือกที่คุ้มค่าแทนคลังข้อมูล ซึ่งอาจต้องใช้ต้นทุนสูงในการสร้าง
  • Data Mart ไม่สามารถให้บริการวิเคราะห์ข้อมูลทั่วทั้งบริษัทได้ เนื่องจากชุดข้อมูลมีจำกัด

สรุปโพสต์นี้ด้วย: