برنامج تعليمي لتكامل بيانات Pentaho

⚡ ملخص ذكي

يقدم برنامج Pentaho Data Integration Tutorial منصة ETL مفتوحة المصدر والمعروفة أيضًا باسم Kettle. Lessتغطي هذه المواضيع التاريخ والتطبيقات والمتطلبات الأساسية والمكونات والتحويلات والوظائف والتثبيت ومزايا وعيوب استخدام Pentaho.

  • 🛠️ ما هو برنامج بنتاهو؟ Pentaho عبارة عن مجموعة برامج ذكاء أعمال مفتوحة المصدر تتميز بأدوات ETL وإعداد التقارير وOLAP واستخراج البيانات.
  • 🔁 غلاية ETL: تقوم أداة Pentaho Data Integration، المسماة Kettle، بإنشاء عمليات تحويل ETL ووظائف مرئية.
  • 📋 التحولات مقابل الوظائف: تقوم عمليات التحويل بمعالجة صفوف تدفق البيانات؛ وتتولى الوظائف تنسيق التحكم في سير العمل على مستوى أعلى.
  • 🌐 اتصال واسع: يتصل بقواعد البيانات العلائقية، ومصادر البيانات الضخمة، والملفات، والتخزين السحابي، وواجهات برمجة تطبيقات SaaS.
  • 📊 مجموعة التقارير: توفر التقارير المدمجة ولوحات المعلومات وبرنامج Mondrian OLAP التحليلات لمستخدمي الأعمال.
  • 🤖 تكامل الذكاء الاصطناعي: قم بربط Pentaho ETL بخدمات الذكاء الاصطناعي للحصول على نتائج تنبؤية وجودة بيانات مؤتمتة.

برنامج تعليمي لتكامل بيانات Pentaho

ما هو بنتاهو بي آي؟

Pentaho هي أداة ذكاء الأعمال التي توفر مجموعة واسعة من حلول ذكاء الأعمال للعملاء. إنه قادر على إعداد التقارير وتحليل البيانات وتكامل البيانات واستخراج البيانات وما إلى ذلك. كما يقدم Pentaho مجموعة شاملة من ميزات ذكاء الأعمال التي تسمح لك بتحسين أداء الأعمال وكفاءتها.

مميزات بنتاهو

فيما يلي الميزات الهامة لـ Pentaho:

  • قدرات ETL لاحتياجات ذكاء الأعمال
  • فهم مصمم تقرير Pentaho
  • خبرة المنتج
  • يقدم تقارير فرعية جنبًا إلى جنب
  • إطلاق العنان لقدرات جديدة
  • الدعم الاحترافي
  • الاستعلام والإبلاغ
  • يقدم وظائف محسنة
  • دعم كامل للبيانات التعريفية لوقت التشغيل من مصادر البيانات

جناح بنتاهو بي

الآن، سوف نتعرف على مجموعة Pentaho BI في هذا البرنامج التعليمي لـ Pentaho:

جناح Pentaho BI
جناح Pentaho BI

يتضمن Pentaho BI Suite المكونات التالية:

تقرير بنتاهو

تعتمد تقارير Pentaho على مشروع JFreeReport. يساعدك على تلبية احتياجات إعداد تقارير الأعمال الخاصة بك. يوفر هذا المكون أيضًا نشر التقارير المجدولة وعند الطلب بتنسيقات شائعة مثل XLS وPDF وTXT وHTML.

تحليل الأداء

فهو يقدم نطاقًا واسعًا من التحليلات ومجموعة واسعة من الميزات التي تتضمن عرض الجدول المحوري. توفر الأداة ميزات واجهة المستخدم الرسومية المحسنة (باستخدام Flash أو SVG)، وعناصر واجهة المستخدم المدمجة للوحة المعلومات، والبوابة، وتكامل سير العمل.

علاوة على ذلك، تسمح خدمات جداول البيانات Pentaho للمستخدم بتصفح المخطط وتدويره واستخدامه من داخل MS Excel.

لوحات القيادة

توفر لوحة المعلومات التقارير والتحليلات، التي تساهم في المحتوى في لوحات معلومات Pentaho. يشتمل مصمم لوحة المعلومات ذات الخدمة الذاتية على قوالب وتخطيطات لوحة معلومات مدمجة واسعة النطاق. فهو يتيح لمستخدمي الأعمال إنشاء لوحات معلومات مخصصة مع القليل من التدريب.

تنقيب في البيانات

أداة استخراج البيانات يكتشف الأنماط المخفية ومؤشرات الأداء المستقبلي. ويقدم المجموعة الأكثر شمولاً من خوارزميات التعلم الآلي من مشروع Weka، والتي تتضمن التجميع وأشجار القرار والغابات العشوائية وتحليل المكونات الرئيسية والشبكات العصبية.

فهو يتيح لك عرض البيانات بيانيًا أو التفاعل معها برمجيًا أو استخدام مصادر بيانات متعددة للتقارير والتحليل الإضافي والعمليات الأخرى.

بينتاهو تكامل البيانات

يستخدم هذا المكون لدمج البيانات أينما وجدت.

مكتبة تحويل غنية تضم أكثر من 150 خريطة جاهزة للاستخدامping شاء.

وهو يدعم مجموعة واسعة من مصادر البيانات التي تتضمن أكثر من 30 منصة مفتوحة المصدر وقاعدة بيانات خاصة وملفات مسطحة. كما أنه يساعد تحليلات البيانات الضخمة مع تكامل وإدارة بيانات Hadoop.

من يستخدم Pentaho BI؟

Pentaho BI هي أداة تستخدم على نطاق واسع من قبل محترفي البرمجيات مثل:

  • برامج حاسوبية مفتوحة المصدر
  • محلل أعمال وباحث
  • طلاب الكلية
  • مستشار ذكاء الأعمال

كيفية تثبيت Pentaho في AWS

فيما يلي عملية خطوة بخطوة حول كيفية تثبيت Pentaho في AWS.

الخطوة 1) انقر فوق متابعة الاشتراك
انتقل إلى البرنامج المساعد في التأليف https://aws.amazon.com/marketplace/pp/prodview-mce2xdbgie4ro ثم انقر على متابعة

قم بتثبيت Pentaho في AWS

الخطوة 2) قبول الشروط والأحكام
في الصفحة التالية، قم بقبول اتفاقية الترخيص

قم بتثبيت Pentaho في AWS

الخطوة 3) انقر فوق متابعة التكوين
المضي قدما في التكوين

قم بتثبيت Pentaho في AWS

الخطوة 4) انقر فوق متابعة الإطلاق
احتفظ بالإعدادات الافتراضية، ثم انقر للتشغيل

قم بتثبيت Pentaho في AWS

الخطوة 5) انتظر لمدة 5 دقائق على سبيل الم��ال لبدء التشغيل
تحقق من تعليمات الاستخدام وانتظر

قم بتثبيت Pentaho في AWS

الخطوة 6) احصل على IP العام
انسخ عنوان IP العام للمثيل.

قم بتثبيت Pentaho في AWS

الخطوة 7) استخدم IP العام لتسجيل الدخول
الصق عنوان IP العام للمثيل للوصول إلى Pentaho.

قم بتثبيت Pentaho في AWS

شرط بنتاهو

  • متطلبات الأجهزة
  • متطلبات البرنامج
  • تنزيل وتثبيت Bl suite
  • بدء تشغيل مجموعة Bl
  • إدارة جناح Bl

متطلبات الأجهزة

لا يحتوي برنامج Pentaho Bl Suite على أي حدود للإصلاح على جهاز الكمبيوتر أو أجهزة الشبكة طالما يمكنك تلبية الحد الأدنى من متطلبات البرنامج. من السهل تثبيت أداة ذكاء الأعمال هذه. ومع ذلك، مجموعة موصى بها من مواصفات النظام:

رامات 2 جيجابايت كحد أدنى
مساحة القرص الصلب 1 جيجابايت كحد أدنى
المعالج ثنائي النواة EM64T أو AMD64

متطلبات البرنامج

  • تركيب صن JRE 5.0
  • يمكن أن تكون البيئة إما 32 بت أو 64 بت
  • عائلات Operaأنظمة تينغ: لينكس، Solaris, Windows، ماك
  • محطة عمل تحتوي على واجهة متصفح ويب حديثة مثل Chrome وInternet Explorer و Firefox

لبدء خادم Bl

  • On Windows من البداية، انقر على زر بدء تشغيل أيقونة الخادم Bl.
  • في نظام التشغيل Linux، قم بتشغيل البرنامج النصي start-pentaho على /biserver-ce/directory

لبدء خادم المسؤول

  • On Windows من زر البداية انقر على بدء خادم المؤسسة Bl.
  • بالنسبة لنظام التشغيل Linux: انتقل إلى نافذة الأوامر وقم بتشغيل البرنامج النصي لبدء التشغيل في /biserver-ce/administration-console/directory.

لإيقاف خادم المسؤول

  • لإيقاف الخادم في نظام التشغيل Windows، انقر فوق أيقونات إيقاف الخادم الثنائي.
  • على لينكس. أنت بحاجة للذهاب إلى المحطة والانتقال إلى الدليل المثبت وتشغيل stop.bat

وحدة التحكم الإدارية بنتاهو

مصمم التقارير

إنها أداة متقدمة لإنشاء التقارير. هذه أداة مثالية لك إذا كنت تريد إنشاء تقرير كامل لمحرك البيانات. توفر هذه الأداة الكثير من المرونة والوظائف مقارنة بإمكانيات إعداد التقارير المخصصة لوحدة تحكم مستخدم Pentaho.

أستوديو التصميم

إنه ل Eclipseأداة تعتمد على. يسمح لك بتحرير التقرير أو التحليل يدويًا. يتم استخدامه على نطاق واسع لإضافة تعديلات على تقرير موجود لا يمكن إضافته باستخدام مصمم التقارير.

مصمم التجميع

تتيح لك هذه الأداة الرسومية تحسين كفاءة مكعب موندريان.

محرر البيانات

يتم استخدامه لإضافة طبقة بيانات التعريف المخصصة إلى أي مصدر بيانات موجود.

بينتاهو تكامل البيانات

ذا كيتل إكسtracأداة ETL (التحويل والتحميل)، التي تُمكّن

أداة Pentaho مقابل مكدس BI

أداة بنتاهو بي المكدس
تكامل البيانات (PDI) ETL
ويقدم محرر البيانات الوصفية ويوفر إدارة البيانات الوصفية
بنتاهو با التحليلات
مصمم التقارير Operaالتقارير الوطنية
سايكو تقارير مخصصة
CDE لوحات القيادة
وحدة تحكم مستخدم Pentaho (PUC) الحوكمة/الرصد

مميزات بنتاهو

الآن في هذا البرنامج التعليمي لتكامل بيانات Pentaho، سنتعرف على بعض مزايا أداة Pentaho Business Intelligence:

  • Pentaho BI هي أداة سهلة الاستخدام للغاية. من خلال بعض المفاهيم الأساسية، يمكنك العمل بها.
  • أداة ذكاء الأعمال بسيطة وسهلة الاستخدام
  • يقدم مجموعة واسعة من إمكانيات ذكاء الأعمال التي تشمل إعداد التقارير ولوحة المعلومات والتحليل التفاعلي وتكامل البيانات واستخراج البيانات وما إلى ذلك.
  • يأتي مزودًا بواجهة سهلة الاستخدام ويوفر أدوات متنوعة لاسترداد البيانات من مصادر بيانات متعددة
  • يقدم حزمة واحدة للعمل على البيانات
  • يحتوي على إصدار مجتمعي يحتوي على الكثير من المساهمين بالإضافة إلى إصدار Enterprise.
  • القدرة على التشغيل على مجموعة Hadoop
  • Javaيمكن إعادة استخدام الكود النصي المكتوب في مكونات الخطوة في مكونات أخرى.

عيوب بنتاهو

فيما يلي سلبيات/عيوب استخدام أداة Pentaho BI:

  • من الممكن أن يكون تصميم الواجهة ضعيفًا، ولا توجد واجهة موحدة لجميع المكونات.
  • تطور أبطأ بكثير للأداة مقارنة بأدوات ذكاء الأعمال الأخرى.
  • تقدم تحليلات Pentaho Business عددًا محدودًا من المكونات.
  • دعم المجتمع ضعيف. لذا، إذا لم تحصل على مكون يعمل، فيتعين عليك الانتظار حتى إصدار الإصدار التالي.

الأسئلة الشائعة

Kettle هو الاسم الأصلي لـ Pentaho Data Integration، وهو مكون ETL. أما Pentaho فهو مجموعة أوسع تضم Kettle مع أدوات إعداد التقارير، ومعالجة البيانات التحليلية الفورية (OLAP)، ولوحات المعلومات، وأدوات استخراج البيانات.

نعم. يقوم مساعدو الذكاء الاصطناعي بإنشاء خطوات التحويل، واقتراح عمليات الربط، وشرح تعابير Kettle. كما أنهم يسرعون عملية الإعداد ويقترحون تنسيقًا مثاليًا للمهام لمهندسي البيانات الجدد.

يتكامل الذكاء الاصطناعي مع بنتاهو عن طريق استدعاء خدمات تسجيل النقاط الخارجية أو Python خطوات. يقوم بتحديد الحالات الشاذة، ويتنبأ بانحراف المخطط، ويو��ي بقواعد تلتقط البيانات غير النظيفة قبل تحميل المستودع.

نعم. تُوفر شركة هيتاشي فانتارا إصدار Pentaho Community Edition إلى جانب الإصدار التجاري Enterprise. تتضمن إصدارات Community ميزات أساسية لعمليات استخراج البيانات وتحويلها وتحميلها (ETL)، وإعداد التقارير، والتحليلات لعمليات النشر ذاتية الاستضافة.

تُجري عملية التحويل على صفوف البيانات التي تمر عبر خطوات متزامنة. أما المهمة فتُنسق عملية التحكم في التدفق على مستوى أعلى، حيث تُنفذ عمليات التحويل بالتسلسل مع مراعاة الشروط وإعادة المحاولات ومعالجة الأخطاء.

بنتاهو يتصل بـ MySQL, PostgreSQL, Oracleخادم SQL، هادوب، Spark، REST APIs، CSV، JSON، XML، التخزين السحابي، والعديد من تطبيقات SaaS من خلال المكونات الإضافية المدمجة وبرامج تشغيل JDBC.

نعم. يمكن نشر Pentaho على AWS، Azure, Google Cloudوتستخدم هيتاشي صور الحاويات، بالإضافة إلى Kubernetes. كما توفر خدمات مُدارة وهياكل مرجعية لعمليات نشر ETL السحابية الأصلية.

يبني المبتدئون أول عملية تحويل لهم في أسبوع. أما إتقان تنسيق المهام، وتحسين الأداء، والتنفيذ المجمع، فيستغرق عادةً من ثلاثة إلى ستة أشهر من العمل العملي على مشاريع ETL.

تلخيص هذه التدوينة بـ: