Pentaho-tietojen integrointiopas

⚡ Älykäs yhteenveto

Pentaho Data Integration -opetusohjelmassa esitellään avoimen lähdekoodin ETL-alusta, joka tunnetaan myös nimellä Kettle. LessOpasteet kattavat historian, sovellukset, edellytykset, komponentit, muunnokset, työt, asennuksen sekä Pentahon käytön edut ja haitat.

  • 🛠️ Mikä on Pentaho: Pentaho on avoimen lähdekoodin BI-ohjelmistopaketti, joka sisältää ETL-, raportointi-, OLAP- ja tiedonlouhintatyökaluja.
  • 🔁 Vedenkeittimen ETL: Pentahon dataintegraatiotyökalu nimeltä Kettle rakentaa visuaalisia ETL-muunnoksia ja -töitä.
  • 📋 Muutokset vs. työpaikat: Transformaatiot käsittelevät tietovirran rivejä; työt organisoivat korkeamman tason työnkulun hallintaa.
  • 🌐 Laaja yhteys: Yhdistää relaatiotietokantoihin, big data -lähteisiin, tiedostoihin, pilvitallennustilaan ja SaaS-rajapintoihin.
  • 📊 Raportointipaketti: Upotetut raportoinnit, koontinäytöt ja Mondrian OLAP tarjoavat analytiikkaa yrityskäyttäjille.
  • 🤖 AI-integraatio: Yhdistä Pentaho ETL tekoälypalveluihin ennakoivaa pisteytystä ja automatisoitua datan laatua varten.

Pentaho-tietojen integrointiopas

Mikä on Pentaho BI?

Pentaho on Business Intelligence -työkalu, joka tarjoaa asiakkailleen laajan valikoiman business intelligence -ratkaisuja. Se pystyy raportoimaan, analysoimaan, integroimaan, louhimaan jne. Pentaho tarjoaa myös kattavan BI-ominaisuuksien joukon, jonka avulla voit parantaa liiketoiminnan suorituskykyä ja tehokkuutta.

Pentahon ominaisuudet

Seuraavat ovat tärkeitä Pentahon ominaisuuksia:

  • ETL-ominaisuudet liiketoimintatiedon tarpeisiin
  • Pentaho Report Designerin ymmärtäminen
  • Tuoteasiantuntemus
  • Tarjoaa vierekkäisiä aliraportteja
  • Uusien ominaisuuksien avaaminen
  • Ammatillinen tuki
  • Kysely ja raportointi
  • Tarjoaa parannettuja toimintoja
  • Täysi suorituksenaikainen metatietojen tuki tietolähteistä

Pentaho BI -sviitti

Nyt opimme Pentaho BI -ohjelmistopaketista tässä Pentaho-opetusohjelmassa:

Pentaho BI Suite
Pentaho BI Suite

Pentaho BI Suite sisältää seuraavat komponentit:

Pentahon raportointi

Pentahon raportointi riippuu JFreeReport-projektista. Se auttaa sinua täyttämään yrityksesi raportointitarpeesi. Tämä komponentti tarjoaa myös sekä ajoitetun että tilattavan raporttien julkaisun suosituissa muodoissa, kuten XLS, PDF, TXT ja HTML.

analyysi

Se tarjoaa laajan valikoiman analyysiä ja laajan valikoiman ominaisuuksia, joihin kuuluu pivot-taulukkonäkymä. Työkalu tarjoaa parannettuja GUI-ominaisuuksia (käyttämällä Flashia tai SVG:tä), integroidut kojelautawidgetit, portaalin ja työnkulun integroinnin.

Lisäksi Pentaho Spreadsheet Services mahdollistaa käyttäjän selata, kääntää ja käyttää kaavioita MS Excelissä.

Mittaristot

Kojelauta tarjoaa raportointia ja analyysia, jotka tuovat sisältöä Pentaho Dashboardsille. Itsepalvelukojelautasuunnittelija sisältää laajat sisäänrakennetut kojelautamallit ja asettelun. Sen avulla yrityskäyttäjät voivat rakentaa henkilökohtaisia ​​kojetauluja pienellä koulutuksella.

Data Mining

Tietojen louhintatyökalu löytää piilotettuja malleja ja indikaattoreita tulevasta suorituskyvystä. Se tarjoaa Weka-projektin kattavimman koneoppimisalgoritmien joukon, joka sisältää klusteroinnin, päätöspuut, satunnaiset metsät, pääkomponenttianalyysin, neuroverkot.

Sen avulla voit tarkastella tietoja graafisesti, olla vuorovaikutuksessa niiden kanssa ohjelmallisesti tai käyttää useita tietolähteitä raportteihin, lisäanalyyseihin ja muihin prosesseihin.

Pentaho Data Integration

Tätä komponenttia käytetään tietojen integroimiseen kaikkialla, missä niitä on.

Laaja muunnoskirjasto, jossa on yli 150 käyttövalmista karttaaping esineitä.

Se tukee laajaa valikoimaa tietolähdettä, joka sisältää yli 30 avoimen lähdekoodin ja omaa tietokantaalustaa, litteitä tiedostoja. Se myös auttaa Big Data -analytiikka Hadoop-tietojen integroinnin ja hallinnan kanssa.

Ketkä käyttävät Pentaho BI:tä?

Pentaho BI on ohjelmistoalan ammattilaisten, kuten:

  • Avoimen lähdekoodin ohjelmistot
  • Liiketoiminnan analyytikko ja tutkija
  • Opiskelijat
  • Business Intelligence neuvonantaja

Kuinka asentaa Pentaho AWS:ään

Seuraavassa on vaiheittainen prosessi Pentahon asentamisesta AWS:ään.

Vaihe 1) Napsauta Jatka tilaamaan
Mene https://aws.amazon.com/marketplace/pp/prodview-mce2xdbgie4ro ja napsauta Jatka

Asenna Pentaho AWS:ään

Vaihe 2) Hyväksy ehdot ja ehdot
Seuraavalla sivulla Hyväksy käyttöoikeussopimus

Asenna Pentaho AWS:ään

Vaihe 3) Napsauta Jatka kokoonpanoon
Jatka määrittämistä varten

Asenna Pentaho AWS:ään

Vaihe 4) Napsauta Jatka käynnistääksesi
Säilytä oletusasetukset ja napsauta käynnistääksesi

Asenna Pentaho AWS:ään

Vaihe 5) Odota esimerkiksi 5 minuuttia käynnistystä
Tarkista käyttöohjeet ja odota

Asenna Pentaho AWS:ään

Vaihe 6) Hanki julkinen IP
Kopioi ilmentymän julkinen IP.

Asenna Pentaho AWS:ään

Vaihe 7) Käytä kirjautumiseen julkista IP-osoitetta
Liitä esiintymän julkinen IP käyttääksesi Pentahoa.

Asenna Pentaho AWS:ään

Pentahon edellytys

  • Laitteistovaatimukset
  • Ohjelmistovaatimukset
  • Bl Suiten lataaminen ja asentaminen
  • Bl-sarjan käynnistäminen
  • Bl-sviitin hallinto

Laitteistovaatimus

Pentaho Bl Suite -ohjelmistolla ei ole korjausrajoituksia tietokoneelle tai verkkolaitteistolle, kunhan pystyt täyttämään ohjelmiston vähimmäisvaatimukset. Tämä Business Intelligence -työkalu on helppo asentaa. Suositeltu järjestelmämääritysten joukko kuitenkin:

RAM Vähintään 2GB
Kiintolevytila Vähintään 1GB
Suoritin Kaksiytiminen EM64T tai AMD64

Ohjelmistovaatimukset

  • Sun JRE 5.0:n asennus
  • Ympäristö voi olla joko 32-bittinen tai 64-bittinen
  • Tuetut Operating-järjestelmät: Linux, Solaris, Windows, Mac
  • Työasema, jossa on moderni verkkoselainkäyttöliittymä, kuten Chrome, Internet Explorer, Firefox

Bl-palvelimen käynnistäminen

  • On Windows alusta, napsauta Käynnistä Bl-palvelinkuvaketta.
  • Linux-käyttöjärjestelmässä aja start-pentaho-skripti hakemistossa /biserver-ce/directory

Järjestelmänvalvojan palvelimen käynnistäminen

  • On Windows aloituspainikkeesta napsauta Käynnistä Bl-yrityspalvelin.
  • Linux: Siirry komentoikkunaan ja suorita käynnistysskripti hakemistossa /biserver-ce/administration-console/directory.

Pysäytä järjestelmänvalvojapalvelin

  • Pysäytä palvelin Windowsissa napsauttamalla Pysäytä kahden palvelimen kuvakkeita.
  • Linuxilla. Sinun on mentävä terminaaliin ja siirryttävä asennettuun hakemistoon ja suoritettava stop.bat

Pentahon hallintakonsoli

Raporttien suunnittelija

Se on edistynyt raporttien luontityökalu. Tämä on ihanteellinen työkalu sinulle, jos haluat luoda täydellisen data-asemaraportin. Tämä työkalu tarjoaa paljon joustavuutta ja toimintoja kuin Pentaho User Consolen ad hoc -raportointiominaisuudet.

Suunnittelustudio

Se on Eclipse-pohjainen työkalu. Sen avulla voit muokata raporttia tai analyysiä käsin. Sitä käytetään laajalti sellaisten muutosten lisäämiseen olemassa olevaan raporttiin, joita ei voi lisätä Report Designerilla.

Aggregaatiosuunnittelija

Tämän graafisen työkalun avulla voit parantaa Mondrian-kuution tehokkuutta.

Metadata-editori

Sitä käytetään mukautetun metatietokerroksen lisäämiseen mihin tahansa olemassa olevaan tietolähteeseen.

Pentaho Data Integration

Vedenkeitin extract-muunnos- ja lataustyökalu (ETL), joka mahdollistaa

Pentaho Tool vs. BI pino

Pentaho työkalu BI-pino
Data Integration (PDI) ETL
Se tarjoaa metatietoeditorin Se tarjoaa metatietojen hallinnan
Pentaho BA Analytics
Raporttien suunnittelija Operakansallinen raportointi
Saiku Ad-hoc-raportointi
YKK Mittaristot
Pentaho User Console (PUC) Hallinto/seuranta

Pentahon edut

Nyt tässä Pentaho-tietojen integroinnin opetusohjelmassa opimme joistakin Pentaho Business Intelligence Toolin eduista:

  • Pentaho BI on erittäin intuitiivinen työkalu. Joidenkin peruskäsitteiden avulla voit työskennellä sen kanssa.
  • Yksinkertainen ja helppokäyttöinen Business Intelligence -työkalu
  • Tarjoaa laajan valikoiman BI-ominaisuuksia, kuten raportoinnin, kojelaudan, interaktiivisen analyysin, tietojen integroinnin, tiedon louhinnan jne.
  • Mukana käyttäjäystävällinen käyttöliittymä ja tarjoaa erilaisia ​​työkaluja tietojen hakemiseen useista tietolähteistä
  • Tarjoaa yksittäisen paketin tietojen käsittelyyn
  • Siinä on yhteisöversio, jossa on paljon avustajia, sekä Enterprise-versio.
  • Mahdollisuus toimia Hadoop-klusterissa
  • JavaVaihekomponentteihin kirjoitettu komentosarjakoodi voidaan käyttää uudelleen muissa komponenteissa.

Pentahon huonot puolet

Tässä on Pentaho BI -työkalun käytön haittoja/haittoja:

  • Käyttöliittymän suunnittelu voi olla heikko, eikä kaikille komponenteille ole yhtenäistä käyttöliittymää.
  • Paljon hitaampi työkalujen kehitys verrattuna muihin BI-työkaluihin.
  • Pentaho Business analytics tarjoaa rajoitetun määrän komponentteja.
  • Huono yhteisön tuki. Joten jos et saa toimivaa komponenttia, sinun on odotettava, kunnes seuraava versio julkaistaan.

UKK

Kettle on Pentaho Data Integrationin, ETL-komponentin, alkuperäinen nimi. Pentaho on laajempi ohjelmistopaketti, joka yhdistää Kettleen raportoinnin, OLAPin, raporttinäkymät ja tiedonlouhintatyökalut.

Kyllä. Tekoälyavustajat luovat transformaatiovaiheita, ehdottavat liitoksia ja selittävät Kettle-lausekkeita. Ne nopeuttavat perehdytystä ja ehdottavat optimoitua työorganisaatiota uusille datainsinööreille.

Tekoäly integroituu Pentahoon soittamalla ulkoisiin pisteytyspalveluihin tai Python Se merkitsee poikkeavuuksia, ennustaa skeeman ajautumisen ja suosittelee sääntöjä, jotka havaitsevat likaisen datan ennen varaston lastausta.

Kyllä. Hitachi Vantara ylläpitää Pentaho Community Editionia kaupallisen Enterprise-tason rinnalla. Yhteisöjulkaisut sisältävät ydin-ETL-, raportointi- ja analytiikkaominaisuudet itse isännöityjä käyttöönottoja varten.

Transformaatio käsittelee samanaikaisesti vaiheiden läpi kulkevia tietorivejä. Työ orkestroi korkeamman tason virtauksenohjausta suorittamalla muunnoksia peräkkäin ehtojen, uudelleenyritysten ja virheidenkäsittelyn kera.

Pentaho yhdistyy MySQL, PostgreSQL, Oracle, SQL Server, Hadoop, Spark, REST-rajapintoja, CSV:tä, JSON:ia, XML:ää, pilvitallennusta ja monia SaaS-sovelluksia sisäänrakennettujen laajennusten ja JDBC-ajurien kautta.

Kyllä. Pentaho voidaan ottaa käyttöön AWS:ssä. Azure, Google Cloudja Kubernetes konttikuvia käyttäen. Hitachi tarjoaa hallittuja palveluita ja referenssiarkkitehtuureja pilvinatiiveihin ETL-käyttöönottoihin.

Aloittelijat rakentavat ensimmäisen transformaationsa viikossa. Työn orkestroinnin, suorituskyvyn hienosäädön ja klusteroidun toteutuksen hallitseminen vie tyypillisesti kolmesta kuuteen kuukautta käytännönläheistä ETL-projektityötä.

Tiivistä tämä viesti seuraavasti: