Учебное пособие по интеграции данных Pentaho

⚡ Умное резюме

В этом руководстве по интеграции данных Pentaho представлена ​​платформа ETL с открытым исходным кодом, также известная как Kettle. LessВ ходе обсуждения рассматриваются история, области применения, предварительные условия, компоненты, преобразования, задачи, установка, а также преимущества и недостатки использования Pentaho.

  • 🇧🇷 Что такое Pentaho: Pentaho — это пакет инструментов бизнес-аналитики с открытым исходным кодом, включающий в себя средства ETL, создания отчетов, OLAP-решения и интеллектуального анализа данных.
  • 🔁 Kettle ETL: Инструмент Pentaho Data Integration, называемый Kettle, позволяет создавать визуальные ETL-преобразования и задания.
  • 📋 Трансформации против рабочих мест: Преобразования обрабатывают строки потока данных; задания управляют рабочим процессом на более высоком уровне.
  • 🌐 Широкие возможности подключения: Подключается к реляционным базам данных, источникам больших данных, файлам, облачным хранилищам и API SaaS.
  • 📊 Пакет инструментов для создания отчетов: Встроенные системы отчетности, панели мониторинга и Mondrian OLAP предоставляют бизнес-пользователям аналитические возможности.
  • 🤖 Интеграция ИИ: Сочетайте Pentaho ETL с сервисами искусственного интеллекта для прогнозирования и автомати��ированного обеспечения качества данных.

Учебное пособие по интеграции данных Pentaho

Что такое Пентахо БИ?

Pentaho это инструмент бизнес-аналитики, который предоставляет клиентам широкий спектр решений бизнес-аналитики. Он способен составлять отчеты, анализировать данные, интегрировать данные, извлекать данные и т. д. Pentaho также предлагает полный набор функций BI, которые позволяют повысить производительность и эффективность бизнеса.

Особенности Пентахо

Ниже приведены важные особенности Pentaho:

  • Возможности ETL для нужд бизнес-аналитики
  • Понимание дизайнера отчетов Pentaho
  • Экспертиза продукта
  • Предлагает параллельные подотчеты
  • Открывая новые возможности
  • Профессиональная поддержка
  • Запросы и отчеты
  • Предлагает расширенную функциональность
  • Полная поддержка метаданных во время выполнения из источников данных

Люкс «Пентахо БИ»

Теперь мы узнаем о пакете Pentaho BI в этом уроке Pentaho:

Люкс Pentaho BI
Люкс Pentaho BI

Pentaho BI Suite включает в себя следующие компоненты:

Отчетность Пентахо

Pentaho Reporting зависит от проекта JFreeReport. Это поможет вам удовлетворить ваши потребности в деловой отчетности. Этот компонент также предлагает публикацию отчетов как по расписанию, так и по требованию в популярных форматах, таких как XLS, PDF, TXT и HTML.

Анализ

Он предлагает широкий спектр анализа и широкий спектр функций, включая представление сводной таблицы. Инструмент предоставляет расширенные функции графического пользовательского интерфейса (с использованием Flash или SVG), интегрированные виджеты информационной панели, портал и интеграцию рабочих процессов.

Более того, Pentaho Spreadsheet Services позволяет пользователю просматривать, поворачивать и использовать диаграммы из MS Excel.

Dashboards

Панель мониторинга предлагает отчеты и анализ, которые добавляют контент в панели мониторинга Pentaho. Конструктор информационной панели самообслуживания включает обширные встроенные шаблоны и макеты информационной панели. Он позволяет бизнес-пользователям создавать персонализированные информационные панели без особого обучения.

Добыча данных

Инструмент интеллектуального анализа данных обнаруживает скрытые закономерности и показатели будущей производительности. Он предлагает наиболее полный набор алгоритмов машинного обучения из проекта Weka, который включает в себя кластеризацию, деревья решений, случайные леса, анализ главных компонентов, нейронные сети.

Он позволяет просматривать данные графически, взаимодействовать с ними программно или использовать несколько источников данных для отчетов, дальнейшего анализа и других процессов.

Интеграция данных Pentaho

Этот компонент используется для интеграции данных, где бы они ни находились.

Обширная библиотека преобразований, содержащая более 150 готовых карт.ping объекты.

Он поддерживает широкий спектр источников данных, включая более 30 платформ баз данных с открытым исходным кодом и собственных, а также плоские файлы. Это также помогает Аналитика больших данных с интеграцией и управлением данными Hadoop.

Кто использует Pentaho BI?

Pentaho BI — это широко используемый инструмент многими профессионалами в области программного обеспечения, такими как:

  • Программное обеспечение с открытым исходным кодом
  • Бизнес-аналитик и исследователь
  • Студенты
  • Советник по бизнес-разведке

Как установить Pentaho в AWS

Ниже приведен пошаговый процесс установки Pentaho в AWS.

Шаг 1) Нажмите «Продолжить», чтобы подписаться
Перейдите на https://aws.amazon.com/marketplace/pp/prodview-mce2xdbgie4ro и нажмите Продолжить

Установите Pentaho в AWS

Шаг 2) Принять условия и положения
На следующей странице примите лицензионное соглашение.

Установите Pentaho в AWS

Шаг 3) Нажмите Продолжить настройку.
Приступить к настройке

Установите Pentaho в AWS

Шаг 4) Нажмите «Продолжить», чтобы запустить
Оставьте настройки по умолчанию и нажмите «Запустить».

Установите Pentaho в AWS

Шаг 5) Подождите 5 минут, например, для запуска
Ознакомьтесь с инструкциями по использованию и подождите.

Установите Pentaho в AWS

Шаг 6) Получить публичный IP
Скопируйте общедоступный IP-адрес экземпляра.

Установите Pentaho в AWS

Шаг 7) Используйте общедоступный IP-адрес для входа в систему.
Вставьте общедоступный IP-адрес экземпляра для доступа к Pentaho.

Установите Pentaho в AWS

Обязательное условие Пентахо

  • требования к оборудованию
  • требования к программному обеспечению
  • Загрузка и установка пакета Bl
  • Запуск пакета Bl
  • Администрация пакета Bl

Требования к оборудованию

Программное обеспечение Pentaho Bl Suite не имеет ограничений по исправлениям на компьютере или сетевом оборудовании, если вы соответствуете минимальным требованиям к программному обеспечению. Этот инструмент бизнес-аналитики легко установить. Однако рекомендуемый набор системных характеристик:

Оперативная память Минимум 2GB
Место на жестком диске Минимум 1GB
процессор Двухъядерный EM64T или AMD64

требования к программному обеспечению

  • Установка Sun JRE 5.0
  • Среда может быть как 32-битной, так и 64-битной.
  • Поддержанный Operaсистемы: Linux, Solaris, WindowsMac
  • Рабочая станция с современным интерфейсом веб-браузера, например Chrome, Internet Explorer, Firefox

Запустить Бл-сервер

  • On Windows с самого начала нажмите кнопку на значке запуска сервера Bl.
  • В ОС Linux запустите сценарий start-pentaho в каталоге /biserver-ce/.

Запуск сервера администратора

  • On Windows от кнопки «Пуск» нажмите «Запустить корпоративный сервер Bl».
  • Для Linux: перейдите в командное окно и запустите сценарий запуска в каталоге /biserver-ce/administration-console/.

Остановить сервер администратора

  • Чтобы остановить сервер в Windows, нажмите на значки остановки двухсерверов.
  • В Линуксе. Вам нужно зайти в терминал, перейти в установленный каталог и запустить stop.bat.

Консоль администрирования Pentaho

Дизайнер отчетов

Это расширенный инструмент для создания отчетов. Это идеальный инструмент для вас, если вы хотите создать полный отчет о дисках данных. Этот инструмент предлагает большую гибкость и функциональность, чем возможности специальных отчетов пользовательской консоли Pentaho.

Студия дизайна

Это Eclipse-основанный инструмент. Это позволяет редактировать отчет или анализ вручную. Он широко используется для внесения изменений в существующий отчет, которые невозможно добавить с помощью дизайнера отчетов.

Дизайнер агрегирования

Этот графический инструмент позволяет повысить эффективность куба Мондриана.

Редактор метаданных

Он используется для добавления пользовательского слоя метаданных к любому существующему источнику данных.

Интеграция данных Pentaho

Чайник extracинструмент ETL (преобразование и загрузка), который позволяет

Pentaho Tool против стека BI

Инструмент Пентахо BI-стек
Интеграция данных (PDI) ETL
Он предлагает редактор метаданных Он обеспечивает управление метаданными
Пентахо, Б.А. Аналитика
Дизайнер отчетов Operational Reporting
Сайку Специальная отчетность
CDE Dashboards
Пользовательская консоль Pentaho (PUC) Управление/мониторинг

Преимущества Пентахо

В этом руководстве по интеграции данных Pentaho мы узнаем о некоторых преимуществах инструмента бизнес-аналитики Pentaho:

  • Pentaho BI — очень интуитивно понятный инструмент. Имея некоторые базовые понятия, вы можете с этим работать.
  • Простой и удобный инструмент бизнес-аналитики
  • Предлагает широкий спектр возможностей BI, включая отчеты, информационные панели, интерактивный анализ, интеграцию данных, интеллектуальный анализ данных и т. д.
  • Поставляется с удобным интерфейсом и предоставляет раз��ичные инструменты для получения данных из нескольких источников данных.
  • Предлагает единый пакет для работы с данными
  • Имеет версию сообщества с большим количеством участников наряду с версией Enterprise.
  • Возможность работы в кластере Hadoop.
  • JavaКод скрипта, написанный в компонентах шага, можно повторно использовать в других компонентах.

Недостатки Пентахо

Вот минусы/недостатки использования инструмента Pentaho BI:

  • Дизайн интерфейса может быть слабым, а единого интерфейса для всех компонентов не существует.
  • Значительно более медленная эволюция инструмента по сравнению с другими инструментами BI.
  • Pentaho Business Analytics предлагает ограниченное количество компонентов.
  • Плохая поддержка сообщества. Итак, если вы не получили работающий компонент, вам нужно дождаться выхода следующей версии.

Часто задаваемые вопросы (FAQ)

Kettle — это первоначальное название Pentaho Data Integration, компонента ETL. Pentaho — это более широкий пакет, который включает в себя Kettle, инструменты для создания отчетов, OLAP-анализа, информационных панелей и интеллектуального анализа данных.

Да. Искусственный интеллект-ассистенты генерируют шаги преобразования, предлагают варианты объединения и объясняют выражения Kettle. Они ускоряют процесс адаптации и предлагают оптимизированную организацию задач для новых инженеров данных.

Искусственный интеллект интегрируется с Pentaho путем вызова внешних сервисов оценки или Python этапы. Он выявляет аномалии, прогнозирует изменение схемы и рекомендует правила, которые обнаруживают некорректные данные до загрузки в хранилище.

Да. Hitachi Vantara поддерживает Pentaho Community Edition наряду с коммерческим корпоративным уровнем. В релизы Community Edition включен�� основные функции ETL, отчетности и аналитики для развертывания на собственных серверах.

Преобразование работает со строками данных, проходящими через этапы одновременно. Задача управляет потоком данных на более высоком уровне, выполняя преобразования последовательно с условиями, повторными попытками и обработкой ошибок.

Pentaho подключается к MySQL, PostgreSQL, OracleSQL Server, Hadoop, SparkREST API, CSV, JSON, XML, облачное хранилище и множество SaaS-приложений благодаря встроенным плагинам и JDBC-драйверам.

Да. Pentaho можно развернуть на WS. Azure, Google Cloudи Kubernetes с использованием образов контейнеров. Hitachi предоставляет управляемые сервисы и эталонные архитектуры для развертывания ETL-процессов в облаке.

Новички создают свою первую трансформацию за неделю. Освоение оркестрации заданий, оптимизации производительности и кластерного выполнения обычно занимает от трех до шести месяцев практической работы над проектами ETL.

Подведем итог этой публикации следующим образом: