Data Mart ใน Data Warehouse คืออะไร? ประเภทและตัวอย่าง
Data Mart คืออะไร?
A ข้อมูลมาร์ท มุ่งเน้นไปที่พื้นที่การทำงานเดียวขององค์กรและมีชุดย่อยของข้อมูลที่จัดเก็บไว้ในคลังข้อมูล Data Mart เป็น Data Warehouse เวอร์ชันย่อและได้รับการออกแบบเพื่อใช้โดยแผนก หน่วย หรือกลุ่มผู้ใช้เฉพาะในองค์กร เช่น การตลาด การขาย ทรัพยากรบุคคล หรือการเงิน มักถูกควบคุมโดยแผนกเดียวในองค์กร
Data Mart มักจะดึงข้อมูลจากแหล่งเพียงไม่กี่แหล่งเมื่อเปรียบเทียบกับคลังข้อมูล ดาต้ามาร์ทมีขนาดเล็กและมีความยืดหยุ่นมากกว่าเมื่อเทียบกับคลังข้อมูล
ทำไมเราต้องมี Data Mart?
- Data Mart ช่วยเพิ่มเวลาตอบสนองของผู้ใช้เนื่องจากปริมาณข้อมูลลดลง
- ช่วยให้เข้าถึงข้อมูลที่ร้องขอบ่อยได้อย่างง่ายดาย
- Data mart ใช้งานง่ายกว่าเมื่อเปรียบเทียบกับ Datawarehouse ขององค์กร ในขณะเดียวกัน ค่าใช้จ่ายในการใช้งาน Data Mart ก็ต่ำกว่าอย่างแน่นอนเมื่อเทียบกับการใช้คลังข้อมูลเต็มรูปแบบ
- เมื่อเปรียบเทียบกับ Data Warehouse แล้ว ดาต้ามาร์ทมีความคล่องตัว ในกรณีที่มีการเปลี่ยนแปลงโมเดล ดาต้ามาร์ทสามารถสร้างได้เร็วขึ้นเนื่องจากมีขนาดที่���ล็กลง
- Datamart ถูกกำหนดโดยผู้เชี่ยวชาญเฉพาะด้านเพียงคนเดียว ในทางตรงกันข้าม คลังข้อมูลถูกกำหนดโดย SME แบบสหวิทยาการจากหลากหลายโดเมน ดังนั้น Data mart จึงเปิดกว้างต่อการเปลี่ยนแปลงมากกว่า Datawarehouse
- ข้อมูลถูกแบ่งพาร์ติชันและให้สิทธิ์การควบคุมการเข้าถึงที่ละเอียดมาก
- ข้อมูลสามารถแบ่งส่วนและจัดเก็บไว้ในแพลตฟอร์มฮาร์ดแวร์/ซอฟต์แวร์ที่แตกต่างกันได้
ประเภทของดาต้ามาร์ท
Data Mart มีสามประเภทหลัก:
- ขึ้นอยู่กับ:ฐานข้อมูลที่พึ่งพากันจะถูกสร้างขึ้นโดยการดึงข้อมูลโดยตรงจากแหล่งปฏิบัติการ แหล่งภายนอก หรือทั้งสองแหล่ง
- อิสระ: ดาต้ามาร์ทอิสระถูกสร้างขึ้นโดยไม่ต้องใช้คลังข้อมูลส่วนกลาง
- เป็นลูกผสม:ดาต้ามาร์ทประเภทนี้สามารถรับข้อมูลจากคลังข้อมูลหรือระบบปฏิบัติการได้
ขึ้นอยู่กับ Data Mart
ดาต้ามาร์ทแบบพึ่งพาช่วยให้สามารถจัดหาข้อมูลขององค์กรจากคลังข้อมูลเดียว เป็นหนึ่งในตัวอย่างดาต้ามาร์ทที่ให้ประโยชน์ของการรวมศูนย์ หากคุณต้องการพัฒนา Data Mart ทางกายภาพตั้งแต่หนึ่งรายการขึ้นไป คุณจะต้องกำหนดค่าให้เป็น Data Mart ที่ต้องพึ่งพา
Data Mart ที่พึ่งพาในคลังข้อมูลสามารถสร้างได้สองวิธีที่แตกต่างกัน ไม่ว่าผู้ใช้จะสามารถเข้าถึงทั้งดาต้ามาร์ทและคลังข้อมูลได้ ขึ้นอยู่กับความต้องการ หรือในกรณีที่การเข้าถึงถูกจำกัดไว้แค่ดาต้ามาร์ทเท่านั้น แนวทางที่สองไม่เหมาะสมเนื่องจากบางครั้งเรียกว่าคลังข้อมูล ในแหล่งขยะข้อมูล ข้อมูลทั้งหมดเริ่มต้นด้วยแหล่งที่มาทั่วไป แต่จะถูกทิ้งและส่วนใหญ่เป็นขยะ

อิสระข้อมูลมาร์ท
ดาต้ามาร์ทอิสระถูกสร้างขึ้นโดยไม่ต้องใช้คลังข้อมูลส่วนกลาง Data Mart ประเภทนี้เป็นตัวเลือกที่เหมาะสำหรับกลุ่มเล็กๆ ภายในองค์กร
ดาต้ามาร์ทอิสระไม่มีความสัมพันธ์กับคลังข้อมูลขององค์กรหรือกับดาต้ามาร์ทอื่นๆ ใน Independent data mart ข้อมูลจะถูกป้อนแยกกัน และการวิเคราะห์ก็ดำเนินการโดยอัตโนมัติเช่นกัน
การใช้ดาต้ามาร์ทอิสระนั้นตรงกันข้ามกับแรงจูงใจในการสร้างคลังข้อมูล ก่อนอื่น คุณต้องมีการจัดเก็บข้อมูลองค์กรแบบรวมศูนย์ที่สม่ำเสมอ ซึ่งสามารถวิเคราะห์ได้โดยผู้ใช้หลายรายที่มีความสนใจต่างกัน ที่ต้องการข้อมูลที่แตกต่างกันอย่างกว้างขวาง
ไฮบริดดาต้ามาร์ท
ไฮบริดดาต้ามาร์ทรวมอินพุตจากแหล่งที่มานอกเหนือจากคลังข้อมูล ซึ่งอาจเป็นประโยชน์เมื่อคุณต้องการบูรณาการเฉพาะกิจ เช่น หลังจากเพิ่มกลุ่มหรือผลิตภัณฑ์ใหม่ลงในองค์กร
นี่คือตัวอย่างดาต้ามาร์ทที่ดีที่สุดซึ่งเหมาะสำหรับสภาพแวดล้อมฐานข้อมูลที่หลากหลายและการดำเนินการที่รวดเร็วสำหรับองค์กรใดๆ และยังต้องใช้ความพยายามในการล้างข้อมูลน้อยที่สุดอีกด้วย Hybrid Data mart ยังรองรับโครงสร้างการจัดเก็บข้อมูลขนาดใหญ่ และเหมาะที่สุดสำหรับความยืดหยุ่นสำหรับแอปพลิเคชันที่เน้นข้อมูลเป็นศูนย์กลางขนาดเล็ก
ขั้นตอนในการใช้งาน Datamart
การนำ Data Mart มาใช้ถือเป็นขั้นตอนที่คุ้มค��าแต่ซับซ้อน ต่อไปนี้คือขั้นตอนโดยละเอียดในการนำ Data Mart มาใช้:
การออกแบบ
การออกแบบเป็นขั้นตอนแรกของการนำ Data Mart ไปใช้ โดยครอบคลุมงานทั้งหมดตั้งแต่การเริ่มคำขอศูนย์ข้อมูลไปจนถึงการรวบรวมข้อมูลเกี่ยวกับข้อกำหนด สุดท้ายนี้ เราสร้างการออกแบบ Data Mart แบบลอจิคัลและฟิสิคัล
ขั้นตอนการออกแบบเกี่ยวข้องกับงานต่อไปนี้:
- การรวบรวมข้อกำหนดทางธุรกิจและทางเทคนิค และการระบุแหล่งข้อมูล
- การเลือกชุดย่อยของข้อมูลที่เหมาะสม
- การออกแบบโครงสร้างเชิงตรรกะและทางกายภาพของดาต้ามาร์ท
ข้อมูลสามารถแบ่งพาร์ติชั่นได้ตามเกณฑ์ต่อไปนี้:
- วันที่
- หน่วยธุรกิจหรือหน่วยงาน
- ภูมิศาสตร์
- การรวมกันของข้างต้นใดๆ
ข้อมูลสามารถแบ่งพาร์ติชันได้ที่ระดับแอปพลิเคชันหรือ DBMS แม้ว่าจะแนะนำให้แบ่งพาร์ติชันในระดับแอปพลิเคชัน เนื่องจากจะทำให้มีโมเดลข้อมูลที่แตกต่างกันในแต่ละปีตามการเปลี่ยนแปลงในสภาพแวดล้อมทางธุรกิจ
คุณต้องการผลิตภัณฑ์และเทคโนโลยีอะไรบ้าง?
ปากกาและกระดาษธรรมดาๆ ก็���พียงพอแล้ว แม้ว่าเครื่องมือที่ช่วยคุณสร้าง UML หรือ แผนภาพเอ้อ จะผนวกข้อมูลเมตาเข้ากับการออกแบบเชิงตรรกะและกายภาพของคุณด้วย
การสร้าง
นี่เป็นระยะที่สองของการดำเนินการ มันเกี่ยวข้องกับการสร้าง ฐานข้อมูลทางกายภาพและโครงสร้างเชิงตรรกะ.
ขั้นตอนนี้เกี่ยวข้องกับงานต่อไปนี้:
- การใช้ฐานข้อมูลทางกายภาพที่ออกแบบในระยะก่อนหน้า ตัวอย่างเช่น ออบเจ็กต์สคีมาฐานข้อมูล เช่น ตาราง ดัชนี มุมมอง ฯลฯ จะถูกสร้างขึ้น
คุณต้องการผลิตภัณฑ์และเทคโนโลยีอะไรบ้าง?
คุณต้องการ ระบบจัดการฐานข้อมูลเชิงสัมพันธ์ เพื่อสร้างดาต้ามาร์ท RDBMS มีคุณสมบัติหลายประการที่จำเป็นสำหรับความสำเร็จของ Data Mart
- การจัดการพื้นที่เก็บข้อมูล: RDBMS จัดเก็บและจัดการข้อมูลเพื่อสร้าง เพิ่ม และลบข้อมูล
- การเข้าถึงข้อมูลที่รวดเร็ว: ด้วยการสืบค้น SQL คุณสามารถเข้าถึงข้อมูลตามเงื่อนไข/ตัวกรองบางอย่างได้อย่างง่ายดาย
- การป้องกันข้อมูล: ระบบ RDBMS ยังนำเสนอวิธีการกู้คืนจากความล้มเหลวของระบบ เช่น ไฟฟ้าขัดข้อง นอกจากนี้ยังช่วยให้สามารถกู้คืนข้อมูลจากข้อมูลสำรองเหล่านี้ในกรณีที่ดิสก์ล้มเหลว
- การสนับสนุนผู้ใช้หลายคน: ระบบการจัดการข้อมูลนำเสนอการเข้าถึงพร้อมกัน ความสามารถสำหรับผู้ใช้หลายรายในการเข้าถึงและแก้ไขข้อมูลโดยไม่รบกวนหรือเขียนทับการเปลี่ยนแปลงที่ทำโดยผู้ใช้รายอื่น
- การรักษาความปลอดภัย: ระบบ RDMS ยังให้วิธีการควบคุมการเข้าถึงวัตถุและการดำเนินการบางประเภทโดยผู้ใช้อีกด้วย
กำลังประชากร
ในระยะที่สาม ข้อมูลจะถูกเติมลงในดาต้ามาร์ท
ขั้นตอนการเติมข้อมูลเกี่ยวข้องกับงานต่อไปนี้:
- การแปลงข้อมูลจากแหล่งต้นทางเป็นข้อมูลเป้าหมายping
- Extracการระบุข้อมูลต้นทาง
- การดำเนินการทำความสะอาดและการแปลงข้อมูล
- กำลังโหลดข้อมูลลงในดาต้ามาร์ท
- การสร้างและจัดเก็บข้อมูลเมตา
คุณต้องการผลิตภัณฑ์และเทคโนโลยีอะไรบ้าง?
คุณทำงานประชากรเหล่านี้ให้สำเร็จโดยใช้ อีทีแอล (เช่น)tracเครื่องมือ (t แปลงโหลด)เครื่องมือนี้ช่วยให้คุณสามารถตรวจสอบแหล่งข้อมูลและทำการแปลงข้อมูลจากแหล่งข้อมูลไปยังเป้าหมายได้ping, เช่นtracนำข้อมูลมาแปลง ทำความสะอาด และโหลดกลับเข้าไปในดาต้ามาทอีกครั้ง
ในกระบวนการนี้ เครื่องมือจะสร้างข้อมูลเมตาบางส่วนที่เกี่ยวข้องกับสิ่งต่างๆ เช่น ที่มาของข้อมูล ความล่าสุดของข้อมูล ประเภทของการเปลี่ยนแปลงที่เกิดขึ้นกับข้อมูล และระดับการสรุปที่ดำเนินการ
การเข้าถึง
การเข้าถึงเป็นขั้นตอนที่สี่ที่เกี่ยวข้องกับการนำข้อมูลไปใช้: การสอบถามข้อมูล การสร้างรายงาน แผนภูมิ และการเผยแพร่ข้อมูล ผู้ใช้ส่งแบบสอบถามไปยังฐานข้อมูลและแสดงผลลัพธ์ของแบบสอบถาม
ขั้นตอนการเข้าถึงจำเป็นต้องดำเนินการดังต่อไปนี้:
- ตั้งค่าเมตาเลเยอร์ที่แปลโครงสร้างฐานข้อมูลและชื่อออบเจ็กต์เป็นเงื่อนไขทางธุรกิจ ซึ่งจะช่วยให้ผู้ใช้ที่ไม่ใช่ด้านเทคนิคสามารถเข้าถึง Data mart ���ด้อย่างง่ายดาย
- ตั้งค่าและบำรุงรักษาโครงสร้างฐานข้อมูล
- ตั้งค่า API และอินเทอร์เฟซหากจำเป็น
คุณต้องการผลิตภัณฑ์และเทคโนโลยีอะไรบ้าง?
คุณสามารถเข้าถึงดาต้ามาร์ทได้โดยใช้บรรทัดคำสั่งหรือ GUI แนะนำให้ใช้ GUI เนื่องจากสามารถสร้างกราฟได้ง่ายและใช้งานง่ายเมื่อเทียบกับบรรทัดคำสั่ง
ผู้จัดการ
นี่เป็นขั้นตอนสุดท้ายของกระบวนการปรับใช้ Data Mart ขั้นตอนนี้ครอบคลุมถึงงานด้านการจัดการ เช่น-
- การจัดการการเข้าถึงของผู้ใช้อย่างต่อเนื่อง
- การเพิ่มประสิทธิภาพระบบและการปรับแต่งอย่างละเอียดเพื่อให้ได้ประสิทธิภาพที่เพิ่มขึ้น
- การเพิ่มและการจัดการข้อมูลใหม่เข้าสู่ดาต้ามาร์ท
- การวางแผนสถานการณ์การกู้คืนและรับรองความพร้อมใช้งานของระบบในกรณีที่ระบบล้มเหลว
คุณต้องการผลิตภัณฑ์และเทคโนโลยีอะไรบ้าง?
คุณสามารถใช้ GUI หรือบรรทัดคำสั่งสำหรับการจัดการดาต้ามาร์ทได้
แนวทางปฏิบัติที่ดีที่สุดสำหรับการนำ Data Marts ไปใช้
ต่อไปนี้เป็นแนวทางปฏิบัติที่ดีที่สุดที่คุณจำเป็นต้องปฏิบัติตามในกระบวนการนำ Data Mart ไปใช้:
- แหล่งที่มาของ Data Mart ควรมีโครงสร้างเป็นแผนก
- วงจรการใช้งาน Data Mart ควรวัดในช่วงเวลาสั้นๆ เช่น เป็นสัปดาห์แทนที่จะเป็นเดือนหรือเป็นปี
- สิ่งสำคัญคือต้องให้ผู้มีส่วนได้ส่วนเสียทั้งหมดมีส่วนร่วมในขั้นตอนการวางแผนและการออกแบบ เนื่องจากการนำข้อมูลมาตรส่วนมาใช้อาจมีความซับซ้อน
- ต้นทุนด้านฮาร์ดแวร์/ซอฟต์แวร์ เครือข่าย และการใช้งานของ Data Mart ควรได้รับการกำหนดงบประมาณอย่างถูกต้องในแผนของคุณ
- แม้ว่า Data mart จะถูกสร้างขึ้นบนฮาร์ดแวร์เดียวกัน แต่พวกเขาก็อาจต้องใช้ซอฟต์แวร์ที่แตกต่างกันเพื่อจัดการกับคำถามของผู้ใช้ พลังการประมวลผลเพิ่มเติมและข้อกำหนดพื้นที่จัดเก็บดิสก์ควรได้รับการประเมินเพื่อการตอบสนองของผู้ใช้ที่รวดเร็ว
- ศูนย์ข้อมูลอาจอยู่ในตำแหน่งที่แตกต่างจากคลังข้อมูล นั่นเป็นเหตุผลว่าทำไมจึงเป็นสิ่งสำคัญที่จะต้องแน่ใจว่าพวกเขามีความจุเครือข่ายเพียงพอในการจัดการปริมาณข้อมูลที่จำเป็นในการถ่ายโอนข้อมูลไปยังดาต้ามาร์ท.
- ต้นทุนการใช้งานควรจัดสรรเวลาที่ใช้ในการโหลด Datamart เวลาในการโหลดจะเพิ่มขึ้นตามความซับซ้อนของการแปลงที่เพิ่มขึ้น
ข้อดีและข้อเสียของ Data Mart
ข้อดี
- ดาต้ามาร์ทประกอบด้วยชุดย่อยของข้อมูลทั่วทั้งองค์กร ข้อมูลนี้มีคุณค่าต่อกลุ่มบุคคลในองค์กร
- เป็นทางเลือกที่คุ้มค่าแก่การก คลังข้อมูลซึ่งอาจใช้ต้นทุนการก่อสร้างสูง
- Data Mart ช่วยให้เข้าถึงข้อมูลได้เร็วขึ้น
- Data Mart ใช้งานง่ายเนื่องจากได้รับการออกแบบมาโดยเฉพาะเพื่อตอบสนองความต้องการของผู้ใช้ ดังนั้นดาต้ามาร์ทจึงสามารถเร่งกระบวนการทางธุรกิจได้
- Data Marts ต้องการเวลาในการดำเนินการน้อยกว่าเมื่อเปรียบเทียบกับระบบ Data Warehouse การใช้งาน Data Mart นั้นเร็วกว่า เนื่องจากคุณเพียงแค่ต้องรวมข้อมูลเพียงชุดย่อยเท่านั้น
- ประกอบด้วยข้อมูลในอดีตซึ่งช่วยให้นักวิเคราะห์สามารถกำหนดแนวโน้มของข้อมูลได้
ข้อเสีย
- หลายครั้งที่องค์กรสร้างศูนย์ข้อมูลที่แตกต่างกันและไม่เกี่ยวข้องกันมากเกินไปโดยไม่เกิดประโยชน์มากนัก มันอาจกลายเป็นอุปสรรคใหญ่ในการรักษาได้
- Data Mart ไม่สามารถให้บริการได้ทั่วทั้งบริษัท การวิเคราะห์ข้อมูล เนื่องจากชุดข้อมูลมีจำกัด
สรุป
- กำหนด Data Mart : Data Mart ถูกกำหนดให้เป็นชุดย่อยของ Data Warehouse ที่มุ่งเน้นไปที่พื้นที่การทำงานเดียวขององค์กร
- Data Mart ช่วยเพิ่มเวลาตอบสนองของผู้ใช้เนื่องจากปริมาณข้อมูลลดลง
- ดาต้ามาร์ทสามประเภทคือ 1) ขึ้นอยู่กับ 2) อิสระ 3) ไฮบริด
- ขั้นตอนการดำเนินงานที่สำคัญของ Data Mart คือ 1) การออกแบบ 2) การสร้าง 3 การเติมข้อมูล 4) การเข้าถึง และ 5) การจัดการ
- วงจรการใช้งาน Data Mart ควรวัดในช่วงเวลาสั้นๆ เช่น เป็นสัปดาห์แทนที่จะเป็นเดือนหรือเป็นปี
- ดาต้ามาร์ทเป็นทางเลือกที่คุ้มค่าแทนคลังข้อมูล ซึ่งอาจต้องใช้ต้นทุนสูงในการสร้าง
- Data Mart ไม่สามารถให้บริการวิเคราะห์ข้อมูลทั่วทั้งบริษัทได้ เนื่องจากชุดข้อมูลมีจำกัด

