Post on 26-Apr-2018
transcript
BI Fachzeitschrift für Business Intelligenceund Data WarehousingEine Publikation des TDWI Germany e.V.
Spektrum
Ausgabe 4 u 6. Jahrgang 2011 u D e18,00 A e21,50 SFR 33,25IS
SN 1
862-
5789
SchwerpunktGleicht die ROI-Berechnung der Quadratur des Kreises?
Open-Source-BI-Suiten im Vergleich: Pentaho versus JasperSoft
BuchbesprechungProzessintegration mit SAP NetWeaver® PI 7.1
Fachartikel
Social Media Analytics: Vielstimmiger Buzz – doch wo ist der Nutzen?
Basel II: Best Practice für standardisiertes Reporting
So lassen sich aggregierte Abfragen um ein Vielfaches beschleunigen
Schwerpunkt wirtSchaftlichkeit
von Bi-löSungen
Sonderdruck für
Open-Source-BI-Suiten im Vergleich:
Pentaho versus JasperSoft
Pentaho und JasperSoft
Open-Source-BI- Suiten im Vergleich Open-Source-Produkte sind auf dem Vormarsch – auch in Business Intelligence. Anwender haben heute bereits die Auswahl zwischen mehreren integrierten Suiten, die im Funktionsumfang klassischen Herstellerprodukten kaum nachstehen. Interessenten, die auf den Zug aufspringen wollen, stehen angesichts der erheblichen Dynamik im Markt jedoch vor der Frage: Welches Pferd ist das richti-ge, das heißt, welches Produkt schützt meine Investition am besten? Ist die Lösung wirtschaftlich? Der Artikel vergleicht die beiden ausgereiftesten Suiten von Jasper-Soft und Pentaho im Hinblick auf ihre Zukunftssicherheit nach den Kriterien Produkteigenschaften, Produktstrate-gie und Marktakzeptanz.
Mangelnde Interoperabilität und unklare Lizenzbedin-gungen, verbunden mit hohen Kosten, sind oftmals Hin-dernisse auf dem Weg zur erfolgreichen Bereitstellung einer neuen BI-Lösung. Eine mögliche Antwort darauf stellt Open-Source-BI (OSBI) dar. Hier haben sich in den letzten Jahren einige interessante Produkte herausge-schält, die ihren kommerziellen Konkurrenten in Funk-tionsumfang und Performance kaum nachstehen. So schafften es beispielsweise JasperSoft und Actuate dieses Jahr in den Magic Quadrant der Marktforscher von Gart-ner [Gar11].Der Markt ist heiß umkämpft und entsprechend dyna-misch: Viele Player, häufige Releases, unterschiedliche Geschäftsmodelle und Zukunftsaussichten machen die Auswahl des richtigen Werkzeugs schwierig. Der Open-Source-Interessent steht also vor der Frage: „Auf welches Pferd soll ich setzen?“Unter den Open-Source-Lösungen bieten Pentaho und JasperSoft die breiteste Palette an Funktionen. Beide tre-ten mit ganzen Suiten an, die ähnlich zu denen großer Hersteller wie IBM/Cognos oder SAP/Business Objects vom ETL bis zur Benutzeroberfläche alles abdecken wol-
len. Im Folgenden betrachten wir den kürzlich erschiene-nen Releasekandidat 1 der Version 4 von Pentaho sowie JasperSoft in Version 4.0.1.Die Suite von Pentaho gruppiert sich um den BI-Platt-form-Server, der die Infrastruktur für alle BI-Prozesse darstellt. Data Integration steht als ETL-Komponente zur Verfügung. Außerdem integriert Pentaho die Open-Source-Projekte JFreeReport (Report Designer), Mond-rian (ROLAP) und Weka (Data Mining) und entwickelt diese weiter. Die JasperSoft BI Suite umfasst den Reporting Server, eine Benutzeroberfläche zur grafischen Erstellung von Berichten (iReport), OLAP sowie ein Java-API. Bei JasperETL handelt es sich um eine Anpassung des be-währten Open-Source-ETL-Werkzeugs von Talend. Jas-perSoft kann ebenso wie Pentaho sowohl freistehend eingesetzt als auch in eigene Lösungen integriert werden. Beide Plattformen stehen auch in einer freien Commu-nity Edition zur Verfügung, die mindestens eine zeitlich unbegrenzte, kostenlose Evaluierung ermöglicht, etwa im Rahmen einer Prototyp-Phase. Um die Frage nach der Zukunftssicherheit beider Suiten zu beantworten, haben wir drei übergreifende Aspekte untersucht. Zunächst ist die Produktstrategie beziehungsweise das Geschäftsmodell des Herstellers von Interesse. Wie sieht zum Beispiel das Lizenzmodell aus und mit welchen Einschränkungen müssen Nutzer der Community Edi-tion leben? Schafft es der Hersteller, etwa über eine ent-sprechende Community, Kunden und Interessenten lang-fristig zu binden und damit wirtschaftlich erfolgreich zu sein?Ebenfalls wichtig sind natürlich die Produkteigenschaf-ten. Welche sprechen für einen Einsatz im eigenen Un-ternehmen? Hierunter fallen Fragen nach Features, aber auch nach der Dokumentation. Bei Evaluierungen in einem bestimmten Projektkontext stehen die Produktei-genschaften in der Regel im Vordergrund. Sie sind für eine Bewertung der Zukunftssicherheit aber nicht hinrei-chend.Zusätzlich muss deshalb die Marktakzeptanz betrachtet werden. Wie groß ist die Verbreitung? (Daraus lässt sich mit einiger Berechtigung auf die Nachhaltigkeit schlie-ßen.) Zusätzlich weist die Behandlung in der Fachpresse darauf hin, wie viel Durchschlagskraft dem Produkt zu-zutrauen ist. Im Folgenden werden JasperSoft und Pentaho unter die-sen Kriterien genau beleuchtet.
Produktstrategie
Lizenzen und Versionen Pentaho wird in einer Community Edition (CE) und drei kommerziellen Versionen angeboten: Basic, Professional und Enterprise. Die CE steht unter GNU Public Li cense (GPL) v2, zum Teil auch unter der Lesser GPL v2, der Common Public License und Mozilla Public License
Johannes Dieterich verantwortet bei der iteratec GmbH den Bereich Business Intelli-gence mit Schwerpunkten Open-Source-BI, Kennzahlensysteme und Usability. E-Mail: johannes.dieterich@iteratec.deHüseyin Kagba ist Software-Berater bei der iteratec GmbH. Als JEE-Experte interessiert er sich besonders für die Einsatzmöglichkeiten von OSBI als Systemkomponenten.E-Mail: Hueseyin.Kagba@iteratec.de
02
BI-SPEKTRUM 04-2011
Sch
wer
punk
t
zur Verfügung. All diese Lizenzen verhindern nicht den kommerziellen Einsatz der Software in Kundenprojekten, schränken allerdings die Entwicklung darauf basierender Produkte ein, die ihrerseits wieder unter der entsprechen-den Lizenz erscheinen müssen [Liz]. Pentaho entwickelt die fortschrittlichsten Features seiner Suite als Closed Source weiter und bietet diese entspre-chend nur in Kaufversionen an. Dazu gehört zum Bei-spiel die 2009 von LucidEra akquirierte Analysefunk-tionalität. Laut CTO James Dixon strebt Pentaho einen Open-Closed-Source-Mix von 50:50 an [Alv09].JasperSofts Community Edition ist unter LGPL verfüg-bar. Außerdem gibt es ebenfalls drei kommerzielle Pa-ckages. Basic heißt hier Express und verzichtet zunächst auf die ETL-Komponente, die aber optional hinzugefügt werden kann. Überhaupt ist das Editionenmodell von JasperSoft durch optionale Bestandteile flexibler, jedoch auch komplexer. Bei den übrigen beiden Editionen han-
delt es sich ebenso wie bei Pentaho um Professional- und Enterprise-Editionen. Erst die Enterprise-Version bringt fortgeschrit-tene Analyse-Funktionen mit.Wie bei Open-Source-Projekten üblich, stellen beide Hersteller unterschiedliche
Versionen jeder Edition zur Verfügung: als Source Code, Continuous Integration Builds (aktuellster Stand) und Released Builds (qualitätsgesichert und stabil).
Aktive CommunityIn der Strategie beider Hersteller spielt die jeweilige Community eine wichtige Rolle. Kunden, Interessenten und Fans liefern Bug Reports, Features, gegenseitigen Support und wichtige Hinweise für die Weiterentwick-lung.Pentaho betreibt eine eigene Community-Website, in der alle Ressourcen der CE zu finden sind, wie API, Wiki, Downloads, Foren etc. Das dort gehostete Forum hat rund 33.500 (August 2011) Mitglieder, davon zirka 1.000 aktive. Die Anzahl zahlender Kunden und Produktimple-mentierungen konnte für Pentaho nicht ermittelt werden. Die Community von JasperSoft verfügte im August 2011 nach eigenen Angaben über mehr als 230.000 Mitglieder
Anzahl Community-Commits - Januar 2010 bis April 2011
SVN-Commits
0
500
1000
1500
2000
2500
3000
3500
4000
4500
Pentaho
JasperSoft
Anzahl aktiver Community-User in 2010
User
0
10
20
30
40
50
60
70
80
90
100
Pentaho
JasperSoft
OSBI-Suite Pentaho JasperSoftEdition Community Basic Professional Enterprise Community Express Professional EnterpriseETL
Grafischer Designer X X X X X optional X XDatenqualität X X X X X optional X XKonnektoren X X X X X optional X XJob Scheduler X X X X optional X XParallele Ausführung X X X XDatenbrowser X X optional optional X
Reporting & DashboardsGrundlegendes Reporting X X X X X X X XGrafischer Report-Designer X X X X X X X XInteraktive Reports X X X X X X XReiche Visualisierungen X X X X XMobile-Unterstützung X X * * * *Reporting-API X X X X X X X XDashboard-Designer X X X X X X X
AnalyseAd-hoc-Analyse X X X optional XOLAP X X X optional XData-Mining X XIn-Memory-Analyse optional X
EnterpriseSecurity-Integration X X X X X X XZentrale Administration X X X X X X XMandantenfähigkeit optional X
*) Mobile-Unterstützung angekündigt. Derzeit noch unklar in welcher Version und Edition
Abb. 1: Vergleich
Anzahl der Com-
munity-Commits
von Januar 2010
bis April 2011
Abb. 2: Vergleich
der Anzahl aktiver
Community-User
Tab. 1: OSBI-Features
03
BI-SPEKTRUM 04-2011
Sch
wer
punk
t
herum. Eine entsprechende Komponente fehlt bei JasperSoft gänzlich. Beide Hersteller bemü-hen sich um Mobile-Funktionalität. Hier scheint Pentaho zurzeit leicht die Nase vorn zu haben.Für Sandboxes und Teststellungen in der IT soll-ten die CE-Versionen ausreichen, für größere Vorhaben mangelt es an Komfort, insbesondere wenn User Self Services (wie Design von Be-richten und Analysen durch IT-fremde Anwen-der) eine Rolle spielen. Hier bleibt dann nur der Griff zu den umfangreicheren Editionen, die dann auch den entsprechenden Support bieten.
DokumentationWas die Dokumentation betrifft, ist die erste Anlaufstelle auf beiden Seiten die Community-
Website. Beide Hersteller stellen dort umfangreiche Do-kumentation, Tutorials, Foren und Wikis bereit. Öffentli-che Bugtracker runden die Sache ab.JasperSoft versorgt die Community dabei mit besonders vielen und zugänglichen Informationen über die BI-Suite [vgl. zum Beispiel Jas]. Detaillierte Handbücher sind ge-gen Gebühr zusätzlich erhältlich und nicht mit dem Er-werb kommerzieller Versionen verknüpft.Jenseits davon bieten vor allem Bücher über die Open-Source-BI-Produkte einen Mehrwert. Eine Recherche über Google Books lieferte für JasperSoft 16 Titel, für Pentaho 11 (August 2011), vergleichende Literatur eingeschlossen. Trotz leichtem Vorsprung für JasperSoft ist die unabhängi-ge Wissensbasis bei beiden also relativ dünn. Erschwerend kommt hinzu, dass sich die verfügbaren Bücher durch die Bank auf deutlich ältere Versionen beziehen. Man ist also weitestgehend auf die Community angewiesen, wie es bei jungen Open-Source-Projekten häufig der Fall ist.
Marktakzeptanz
Unabhängige Statistiken zur Verbreitung von OSBI-Lö-sungen existieren leider nicht. Stattdessen beurteilen wir die Marktakzeptanz anhand der Download-Zahlen und des Medienechos.
DownloadsDie Download-Zahlen repräsentieren die Verbreitung der Produkte und wurden für den Zeitraum von August 2010 bis Juli 2011 ermittelt (12 Monate). Abbildung 3 zeigt die kumulierte Anzahl der Downloads der einzel-nen Komponenten. Die bei den Features ausgemachten Schwerpunkte von Pentaho im ETL und JasperReports im Reporting schlagen sich deutlich nieder. Beim Thema ETL liegt Pentaho deutlich vorne. Interessiert man sich für die Marktdurchdringung von JasperSoft, lohnt sich allerdings zusätzlich der Blick auf die Download-Zahlen von Talend, das ja die ETL-Komponente von JasperSoft darstellt. Beim Reporting liegt JasperSoft dagegen weit in Führung.
und 13.500 zahlende Kunden. Im Februar 2011 zählte die Community rund 160.000 Produktimplementierungen. Für die Community stellt JasperSoft wie Pentaho eine eigene Projektseite, JasperForge, zur Verfügung. Jede Komponente (Server, Reporting, ETL) wird dort als ei-genständiges Projekt verwaltet. Auf der Projektseite be-finden sich Links auf die SVN-Repositories, zum Bug-tracking, zu Dokumentationen, zum Wiki etc. Um den Grad der Aktivität in der Community einzu-schätzen, haben wir uns die Anzahl der Commits der zu-gehörigen Projekte angesehen (Abbildung 1).Hier stellt sich die Pentaho-Community deutlich aktiver dar. Den zirka 3.800 Commits stehen etwas mehr als 700 der JasperSoft-Community gegenüber. Betrachtet man die Anzahl aktiver User, bestätigt sich das Bild: Hier konnten für Pentaho im Jahr 2010 rund 100 beitragende User gezählt werden, verglichen mit etwa 35 bei Jasper-Soft, also einer relativ kleinen Zahl (Abbildung 2). Beide Zahlen erlauben lediglich eine Aussage über die Aktivi-tät der Community, da ein großer Teil der Weiterentwick-lung beider Hersteller intern und teils als Closed Source ausgeführt wird.
Produkteigenschaften
FeaturesTabelle 1 zeigt die Features beider Suiten in der Über-sicht. Die CE von JasperSofts BI Suite enthält nahezu alle Komponenten, die auch in der Professional und Enterprise Edition (EE) enthalten sind. Lediglich der Ex-cel Connector fehlt in der CE, der optional für die Profes-sional Edition erhältlich und fester Bestandteil der EE ist. Während Pentaho eine besonders ausgereifte ETL-Funk-tionalität inklusive Multi-Threading anbietet, liegen Jas-perSofts Stärken trotz der Partnerschaft mit den ETL-Ex-perten von Talend mehr im Frontend. JasperSoft ist auch freigiebiger in Bezug auf die Enterprise-Funktionen wie Directory-Anbindung, die dort schon in der Community Edition zum Umfang gehört. Wer integrierte Data-Mining-Funktionalität benötigt, kommt dafür um Pentaho nicht
Anzahl Downloads - August 2010 bis Juli 2011
0
100000
200000
300000
400000
500000
600000
700000
BI Server ETL Reporting Analyse
Pentaho
JasperSoft
Talend
Abb. 3: Vergleich Anzahl der Downloads
04
BI-SPEKTRUM 04-2011
Sch
wer
punk
t
sich vor allem Pentahos ETL-Komponente gegen Jasper-Soft, aber auch gegen kommerzielle Produkte behaupten. Ein Alleinstellungsmerkmal ist die Data-Mining-Kom-ponente. JasperSofts Stärken liegen dagegen im grafi-schen Reporting. Die Projektanforderungen sollten hier den Ausschlag geben. Auch eine Kombination im Sinne eines Best-of-Breed-Ansatzes kann sinnvoll sein. Das Kopf-an-Kopf-Rennen wird nach derzeitigem Stand der Dinge noch eine Weile so weitergehen. Ganz falsch liegt man also mit keinem der beiden Produkte. Jasper-Softs Vorsprung im Reporting dürfte Pentaho nur schwer knacken können. Die Zusammenarbeit von JasperSoft mit Talend im ETL-Bereich ist deshalb besonders interessant. Hierin und wohl auch im Mobile-Anwendungsbereich stecken Chance und Risiken im Wettrennen mit Pentaho.
Referenzen
[Alv09] http://pedroalves-bi.blogspot.com/2009/10/pentaho- lucidera-excuse-for-big.html[Liz] www.netzrebellen.de/artikel/open-source-%E2% 80%93-eine-alternative/[HPo] www.heise.de/open/artikel/Datenqualitaet- messen-mit-Pentaho-763951.html[HJa] www.heise.de/firma/Jaspersoft[Gar11] www.microstrategy.com/Company/Gartner Quadrant.asp[jmp] www.jaspersoft.com/press/dcm-backed-jasper soft-paycycle-and-pgp-named-jmp%E2%80%99s-% E2%80%9Chot-100%E2%80%9D-report[Jas] www.jaspersoft.com/resources
MedienechoSowohl JasperSoft als auch Pentaho erhielten in der Vergangenheit viel positive Presse und auch einige Aus-zeichnungen. Außer unzähligen Erwähnungen in Online-Artikeln und Blogs verdienen folgende Punkte besondere Aufmerksamkeit:◆◆ Pentaho wurde von heise.de in einer Untersuchung
zur Datenqualität von ETL-Werkzeugen mit zwei kommerziellen Produkten verglichen [HPo]. Bei der Analyse kam es auf konsistente und homogene In-formationen in verschiedenen Systemen an. Pentaho hatte insgesamt die Nase vorn. Auch JasperSoft findet Beachtung durch heise.de in Form einer Themenseite rund um Entwicklungen und Neuigkeiten von Jasper-Soft [HJa].
◆◆ Im BI Survey 9 von BARC erzielte Pentaho im Ran-king unter 18 Kandidaten den neunten Platz. Einbe-zogen waren bei der BARC-Studie insbesondere die Business-Intelligence-Suiten der großen kommerzi-ellen Player wie Microsoft, SAP und Oracle. Bewer-tungskriterien waren hier unter anderem Bereitstel-lung, Kosten und Anwendung, Probleme, Vertrieb, Fähigkeit zum Umgang mit großen Datenvolumen und Performanz. Pentaho stach dabei besonders durch Performanz hervor.
◆◆ Wie erwähnt platzierte sich JasperSoft in Gartner’s Ma-gic Quadrant, was von diversen Medien aufgegriffen und thematisiert wurde. Außerdem erschien JasperSoft in der Liste der „100 besten Softwarefirmen in Privatbe-sitz“ der Investment-Bank JMP Securities. In der Unter-suchung wurden die führenden Softwareunternehmen aus den Bereichen Anwendungs-, Infrastruktur-, Analy-se- und Datenintegrationssoftware bewertet [jmp].
Fazit
Unterm Strich machen beide Suiten einen ausgereiften Eindruck und haben eine hohe, nachhaltige Verbreitung. Die Pentaho-Community ist etwas aktiver, dafür infor-miert JasperSoft seine Community besonders vorbildlich. Richtet sich der Blick auf die Produkteigenschaften, kann
Produktstrategie Produkteigenschaften MarktakzeptanzLizenzen Community Features Dokumentation Downloads Medienecho
Pentaho Community Edition unter verschiedenen
Open-Source-Lizenzen Basic Edition
Professional EditionEnterprise Edition
Pentaho-Communityca. 32.000 Mitglieder
Mehr Community-Beiträge zum
Quellcode
ETLReporting
DashboardingOLAP
Data-MiningMobile BI
SDK
Tuturial, FAQ, Api-Docs, Wiki, Forum
gratisWenige Bücher
ETL: ca. 215.000Reporting: ca. 41.000
Viel, Gewinner POC
Datenqualität von heise.de
Gute Bewertung im BARC BI Survey 9
JasperSoft Community Edition unter LGPL
Express EditionProfessional EditionEnterprise EditionOptionale Module
JasperForgeCa. 230.000 Mitglieder
Ca. 13.500 zahlende Kunden
Ca. 160.000 Implementierungen
ETLReporting
DashboardingOLAPSDK
Tuturial, FAQ, Api-Docs, Wiki, Forum
gratisWeitere
Dokumentation gegen Gebühr
Wenige Bücher
ETL: ca. 26.000Reporting: ca. 607.000
Viel,Aufnahme in Gartner
Magic Quadrant 2011,Auszeichnung von
JMP Securities
Tab. 2: Übersicht über die gewonnenen Erkenntnisse
BI-SPEKTRUM ist eine Fachpublikation des Verlags:SIGS DATACOM GmbH | Lindlaustraße 2c | 53842 TroisdorfTel.: +49 (0) 22 41.2341-100 | Fax: +49 (0) 22 41.2341-199
E-mail: info@sigs-datacom.dewww.javaspektrum.de | www.objektspektrum.de
www.bi-spektrum.de
05
BI-SPEKTRUM 04-2011
Sch
wer
punk
t