Post on 06-Feb-2018
transcript
© areto consulting gmbh 2014 Seite 2
Inhaltsverzeichnis
Impressum ..................................................................................................................................................... 3
Über areto consulting gmbh .......................................................................................................................... 4
Über diese Marktstudie ................................................................................................................................. 5
Marktbetrachtung ......................................................................................................................................... 6
Unterstützte Datenbanken und Dateiformate .............................................................................................. 8
Stärken der vorgestellten ETL-Lösungen ...................................................................................................... 13
Übersicht der kommerziellen Aspekte und Details ....................................................................................... 14
Übersicht der Anbieter .................................................................................................................................. 16
Cubeware GmbH .................................................................................................................................... 17
Information Builders (Deutschland) GmbH ............................................................................................ 23
Microsoft Deutschland GmbH ................................................................................................................ 31
n³ data & software science GmbH ......................................................................................................... 38
Oracle Deutschland BV & Co. KG ........................................................................................................... 45
Pentaho EMEA ....................................................................................................................................... 53
SAP SE ..................................................................................................................................................... 62
Syncsort GmbH....................................................................................................................................... 69
Talend Germany GmbH .......................................................................................................................... 76
Theobald Software GmbH ...................................................................................................................... 84
© areto consulting gmbh 2014 Seite 3
Impressum
Copyright © 2014 areto consulting gmbh
Alle Rechte vorbehalten, insbesondere das Recht der Vervielfältigung und Verbreitung sowie der Übersetzung. Kein Teil des Werkes darf
in irgendeiner Form (Druck, Fotokopie, Mikrofilm oder andere Verfahren) ohne schriftliche Genehmigung von areto consulting gmbh
reproduziert oder unter Verwendung elektronischer Systeme verarbeitet, vervielfältigt oder verbreitet werden.
Haftungsausschluss
Die Autoren versuchen mit größtmöglicher Sorgfalt, in der vorliegenden Studie richtige, vollständige und aktualisierte Informationen zur
Verfügung zu stellen. Fehler können jedoch nicht völlig ausgeschlossen werden. Es wird daher keinerlei Haftung oder Garantie für die
Richtigkeit, Vollständigkeit, Qualität und/oder Aktualität der veröffentlichten Informationen übernommen, es sei denn, die Fehler wur-
den vorsätzlich oder grob fahrlässig aufgenommen. Dies betrifft sowohl materielle als auch immaterielle Schäden Dritter, die durch die
Nutzung des Informationsangebots verursacht werden.
areto consulting gmbh
Schanzenstr. 6-20
51063 Köln
Phone +49 221 66 95 75-0
Fax +49 221 66 95 75-99
Geschäftsführer: Reinhard Mense, Jan Strackbein
HRB-Nr.: 73109 Amtsgericht Köln
http://www.areto-consulting.de
info@areto-consulting.de
Autoren:
Reinhard Mense, Geschäftsführender Gesellschafter und CTO
Ulrich Kramer, Leiter Marketing und Vertrieb
© areto consulting gmbh 2014 Seite 4
Über areto consulting gmbh
Die areto consulting gmbh mit Sitz in Köln ist als IT-Beratungshaus spezialisiert auf die Themen Business Intelligence und Data Warehou-
sing.
areto ist ein langjähriger Partner führender Hersteller im BI-Sektor wie Oracle, EXASOL oder Informatica und bietet ihren zahlreichen
Kunden im gesamten deutschsprachigen Raum Standard- und Individuallösungen sowie eigenentwickelte Applikationen und Tools.
areto unterstützt mittelständische und Großunternehmen mit umfangreichen Professional Services bei der Konzeption und Einführung,
beim Betrieb und bei der Weiterentwicklung von BI-Systemen. Zu den Leistungen gehören u.a. die Analyse der Geschäftsprozesse und
Daten, die Datenmodellierung sowie die Entwicklung von ETL-Prozessen und Reports. Weiterhin bietet areto individuelle Schulungs- und
Coachingmaßnahmen vor allem für SAP BO-Lösungen und die Entwicklung sowie die Übernahme von BI-Anwendungen von Oracle und
SAP als Managed Service.
Das Lösungsangebot von areto umfasst insbesondere Tools und Methoden, die maßgeblich zur Steigerung der Effektivität und Effizienz
bei der Nutzung von BI-Systemen beitragen:
BI CONNECT for ODI
BI CONVERT for Informatica
BI SELECT
ETL Lineage for OWB
Für einen schnellen und sicheren Wechsel vom OWB auf Informatica PowerCenter oder eine andere ETL-/ELT-Lösung steht mit
BI CONVERT ein leistungsstarkes Werkzeug zur Verfügung.
BI CONNECT verbindet den Oracle Data Integrator direkt mit dem führenden In-Memory-Datenbanksystem EXASolution von EXASOL und
schafft so die Grundlage, selbst komplexeste Datenbestände in Echtzeit zu analysieren.
Mit dem Dienstleistungspaket BI SELECT unterstützt areto Sie bei der systematischen Auswahl einer geeigneten und für Sie passen-
den BI-Lösung.
ETL Lineage for OWB ermöglicht im Oracle Warehouse Builder eine Lineage-Analyse bis hinunter auf Attribut-Ebene. ETL Lineage ist ein
unverzichtbares Tool bei der Durchführung von Migrationen vom Oracle Warehouse Builder auf eine neue Lösung und klärt zweifelsfrei
die Herkunft von Kennzahlen, Attributen und Daten.
areto veröffentlicht regelmäßig Studien, White Paper und Präsentationen und betreibt ab 15. Dezember 2014 unter der Adresse
www.bi-labor.de einen Blog zu allen relevanten Themen rund um Business Intelligence.
Im Frühjahr 2015 sind weitere Studien im Umfeld von In-Memory-Datenbanken sowie Predictive Analytics mit vielen Informationen über
relevante Technologien und Methoden inklusive einer umfassenden Marktübersicht geplant.
© areto consulting gmbh 2014 Seite 5
Über diese Marktstudie
Es gibt zahllose Marktstudien zu Business-Intelligence-Tools ‒ warum also eine weitere? Ganz einfach: In Projekten stellen Kunden im-
mer wieder die Frage nach der für sie passenden ETL-Lösung. Eine Frage, die aus unserer Sicht gar nicht so einfach zu beantworten ist.
Wir sind der Meinung, dass eine sinnvolle Auswahl eines geeigneten Tools auf mehr beruhen muss als der bloßen Gegenüberstellung von
Features und Kosten. Vielmehr ist es wichtig, Kriterien und Fragen zu definieren, die wirklich relevante Aufgaben in BI-/DWH-Projekten
beschreiben und die am Ende einen echten und dauerhaften Nutzen bringen.
Dieser nachvollziehbare Anspruch wird in unserer Marktstudie zum Beispiel durch Fragen nach Standards und Möglichkeiten zur Auto-
matisierung sowie nach Verfügbarkeit fertiger Komponenten für typische Aufgaben in ETL-Prozessen abgebildet. Dabei haben wir uns
keineswegs auf das Auflisten von Features beschränkt, sondern die Teilnehmer an dieser Studie aufgefordert, beispielhafte ETL-Prozesse
für konkrete Fragestellungen zu skizzieren.
Die gestellten Fragen und zu behandelnden Kriterien erforderten von den Teilnehmern eine intensive Auseinandersetzung, so dass teil-
weise mehrere Personen für die Beantwortung herangezogen wurden. Ich möchte mich deshalb bei allen Teilnehmern der Studie herz-
lich für ihre Unterstützung und die aufgebrachte Zeit bedanken!
Wir wollen uns stets verbessern und weiterentwickeln. Deshalb möchten wir sowohl Sie, liebe Leserinnen und Leser, als auch die Teil-
nehmer der Studie aufrufen: Teilen Sie uns mit, was Ihnen gefallen hat, was Ihnen fehlt oder was Sie sich anders gewünscht hätten! Wir
werden dies bei den nächsten Updates dieser Studie und bei weiteren Studien berücksichtigen.
Abschließend möchte ich Sie auch auf zwei neue Studien hinweisen, die im Frühjahr 2015 erscheinen werden: Mit In-Memory-
Datenbanken und Predictive Analytics werden wir zwei derzeit besonders stark im Fokus stehende Themen behandeln. Wenn Sie recht-
zeitig über das Erscheinen der Studien informiert werden möchten, teilen Sie uns das einfach per eMail mit.
Ich wünsche Ihnen viel Vergnügen beim Lesen!
Reinhard Mense
Geschäftsführender Gesellschafter und CTO
areto consulting gmbh
© areto consulting gmbh 2014 Seite 6
Marktbetrachtung
Der Markt in Deutschland für Business Intelligence-Lösungen und -Werkzeuge wächst weiter kräftig: Auf rund 1,5 Milliarden Euro sum-
mierten sich laut einer Studie des Nürnberger BARC-Instituts1 die Umsätze für Lizenzen und Wartung von BI-Systemen in 2013 ‒ ein An-
stieg von satten 11 Prozent. Darin eingeschlossen sind sowohl die Verkaufszahlen bei Backend- als auch bei Frontend-Lösungen wie bei-
spielsweise Dashboard- oder Reporting-Anwendungen. Vor allem im Bereich der Datenmanagement-Software waren vergleichsweise
hohe Zuwachsraten zu verzeichnen. Um etwa 20 Prozent stiegen laut BARC die Erlöse bei Backend-Programmen, getrieben durch neue
Anforderungen (zum Beispiel die Integration von Social Media Daten oder zunehmende Big-Data-Initiativen), durch neue Technologien
und Methoden (In-Memory-Datenbanken, Predictive Analytics) oder neue fachliche und gesetzliche Vorgaben. Auch die zunehmende
Durchdringung von SAP HANA trug kräftig zum Umsatz bei. Der Markt für ETL- oder Datenintegrationssysteme präsentiert sich uneinheit-
lich: Einerseits haben die Anbieter von klassischen ERP- und CRM-Anwendungen immer mehr Funktionalität für die Integration der Daten
und deren Aufbereitung in ihre Suiten eingebaut, andererseits umfasst das Marktangebot auch viele Teilgebiete, die durch spezialisierte
Hersteller abgedeckt werden. Das Marktforschungsunternehmen Gartner2 kommt in diesem Bereich zu folgender Einteilung:
Datenerfassung für Business Intelligence (BI), Analytik und Data Warehousing
Konsolidierung und Bereitstellung von Stammdaten zur Unterstützung des Stammdatenmanagements
(Master Data Management ‒ MDM)
Datenmigration / Datenkonvertierung
Die Synchronisation von Daten zwischen operativen Anwendungen
Datenaustausch und Datennutzung in verbundenen Unternehmen
Bereitstellung von Datendiensten in Verbindung mit Service-orientierten Architekturen (SOA)
Integration Cloud-basierter Daten
Big Data Initiativen
Gartner2 schätzt das Marktvolumen nur für Integrationslösung auf etwa 2,2 Milliarden Dollar ‒ umgerechnet rund 1,8 Milliarden Euro.
Damit wurden im Vorjahr etwa 9,4% mehr erzielt als in 2012. Bis zum Jahre 2018 sollen die Erlöse gar auf 2,9 Milliarden Euro steigen.
Diese Einschätzung ist leicht nachvollziehbar, denn der Anspruch an Datenmanagementsysteme wird weiter steigen: Viele neue Techno-
logien wie In-Memory-Datenbanken, Frameworks wie Hadoop und ähnliche Verfahren werden innovative Anwendungen ermöglichen
und weitere Initiativen zur Nutzung der internen und externen Datenbestände in den Unternehmen begründen. Laut einer Studie des
Dienstleistungsunternehmens Lünendonk GmbH3 sehen Manager und Anwender in naher Zukunft folgende Anwendungsschwerpunkte:
Datenkonsolidierung, Datenintegration, Verbesserung der Datenqualität
Management Reporting und Dashboards
Finanzreporting
Planung/Budgetierung
Big Data
Risikomanagement/Unternehmenssteuerung
Die meisten dieser Themen berühren Aspekte der Datenintegration und des Datenmanagements. Insbesondere Big Data und darauf auf-
setzende Verfahren wie Predictive Analytics verlangen neben der Einbeziehung neuer Datenbestände (zum Beispiel aus NoSQL- und
NewSQL-Systemen) auch eine sehr hohe Datenqualität ‒ durchaus ein Bereich, wo viele Unternehmen erheblichen Nachholbedarf haben
und sich so manche Schwäche einer unzureichenden Datenmodellierung und einer verkümmerten Data Governance offenbart. Insbeson-
dere Banken und Finanzdienstleistungen werden mit der Umsetzung der gesetzlichen Vorgaben Datenstrukturen aufbauen müssen, die
eine flexible, zuverlässige und schnelle Bereitstellung relevanter Daten und Berichte ermöglicht. Aber auch für alle übrigen Unternehmen
gilt es, das Optimum aus der Datenflut und den im Unternehmen verborgenen Datenschätzen zu holen. Und dies hat stets mit der inten-
siven Nutzung von Lösungen zur Integration und Aufbereitung von Informationen zu tun.
1 Der Markt für Business Intelligence in Deutschland 2013; Business Application Research Center ‒ BARC GmbH; Juli 2014 2 Magic Quadrant for Data Integration Tools; Gartner Inc.; Juli 2014 3 Lünendonk®-Marktstichprobe 2014 ‒ Business Intelligence als Kernkompetenz; Lünendonk GmbH, 2014
© areto consulting gmbh 2014 Seite 7
Unterstützte Relationale Datenbanken I
Cubeware Andere relationale Datenbanken per ODBC/JDBC (Quelle und Ziel): EXASolution
Information Builders Unterstützung IBM DB/2: 9.5, 9.7, 10 cli, 10 Leightweight Client Unterstützung Microsoft SQL Server 2005, 2008 2012 Unterstützung Oracle Database 9.2, 10g, 11g, 12c Andere relationale Datenbanken per ODBC/JDBC (Quelle): Cache, Excel (via ODBC), Greenplum DB, Hive, JBoss, Netezza, PostgreSql, Teradata Andere relationale Datenbanken per ODBC/JDBC (Ziel): Greenplum DB, Netezza, PostgreSql, Teradata Andere relationale Datenbanken per nativer Anbindung (Quelle): Hyperstage, Nucleus/SAND,IBM i Access, IDMS/SQL,Informix, Ingres,Interplex/Unisys DMS 1100, Oracle Times Ten, parAccel, Progress, PSQL, Redbrick, Sybase, UniData, UniVerse Andere relationale Datenbanken per nativer Anbindung (Ziel): Hyperstage, Nucleus/SAND, Informix, Ingres, Progress, PSQL, Redbrick, Sybase
Microsoft Andere relationale Datenbanken per ODBC/JDBC (Quelle): alle für die ein Windows ODBC Treiber erhältlich ist Andere relationale Datenbanken per ODBC/JDBC (Ziel): alle für die ein Windows ODBC Treiber erhältlich ist Andere relationale Datenbanken per nativer Anbindung (Quelle): alle für die ein Windows OLEDB Treiber erhältlich ist; zusätzlich ist ein Teradata, SAP BO, Oracle CDC, REST Zugriff möglich Andere relationale Datenbanken per nativer Anbindung (Ziel): alle für die ein Windows OLEDB Treiber erhältlich ist; zusätzlich ist ein Teradata, SAP BO, Oracle CDC, REST Zugriff möglich
Datenbanken
IBM
DB
/2
Micro
soft
SQL Server
MySQ
L
Oracle
SAP
HA
NA
OD
BC
/JDB
C
and
ere Daten
ban
ken p
er OD
BC
/JDB
C
and
ere Daten
ban
ken p
er nati
ver An
bin
du
ng
IBM
DB
/2
Micro
soft
SQL Server
MySQ
L
Oracle
SAP
HA
NA
OD
BC
/JDB
C
and
ere Daten
ban
ken p
er OD
BC
/JDB
C
and
ere Daten
ban
ken p
er nati
ver An
bin
du
ng
Anbieter als Quelle als Ziel
Cubeware J / O J / O J / O J / O J / O ● ● --- J / O J / O J / O J / O J / O ● ● ---
Information Builders ● ● J ● ● ● ● ● ● ● J ● ● ● ● ●
Microsoft ● ● J / O ● J / O ● ● ● ● ● J / O ● J / O ● ● ●
n3 data & software science J / O J / O J / O J / O J / O ● ● --- J / O J / O J / O J / O J / O ● ● ---
Oracle ● ● ● ● --- ● ● ● ● ● ● ● --- ● ● ●
Pentaho J / O J / O J / O J / O J / O ● ● ● J / O J / O J / O J / O J / O ● ● ●
SAP ● J / O J / O ● J / O ● ● ● ● J / O J / O ● J / O ● ● ●
Syncsort ● ● J / O ● --- ● ● ● ● ● J / O ● --- ● ● ●
Talend ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ●
Theobald Software --- --- --- --- --- --- --- ● ● ● --- ● J / O ● --- ●
● : (native) Unterstützung J : JDBC-Anbindung O : ODBC-Anbindung J / O : JDBC/ODBC-Anbindung -- keine/keine Angaben
© areto consulting gmbh 2014 Seite 8
n3 data & software science Andere relationale Datenbanken per ODBC/JDBC (Quelle) und Ziel: Alle mit JDBC-Treiber
Oracle Andere relationale Datenbanken per ODBC/JDBC (Quelle und Ziel): Times Ten 11.2+, Apache Derby 10.x, Apache Hive 0.7.1, IBM Netezza NPS 3.x, 4.x, 5.x, 6.x, Ingres 2006, Interbase 2007, Paradox 9.x, 10.x, Persavive PSQL 8, 9, 10, Postgres 7.x, 8.x, 9.x, Progress Open Edge 8.x, 9.x, 10.x, Teradata 12.x, 13.x, 14.x, dBase III, IV, V, LDAP V3, MS Access/Excel/Word 2000, 2007, GoldenGate 10.4+, E-Business Suite 10.5.10*, 12.0*, 12.1*, Oracle Internet Direcotry 10.1.4.3.0, Oracle Mediator, 10.1.3.4.0, 11.1.1.3.0, Oracle Service Bus 11.1.1.3.0, Tuxedo 11.1.1.1.0, Vsam CiCs, IBM MQ Series, MS Active Directory Andere relationale Datenbanken per nativer Anbindung (Quelle): Times Ten 11.2+, Apache Derby 10.x, Apache Hive 0.7.1, IBM Netezza NPS 3.x, 4.x, 5.x, 6.x, Ingres 2006, Persavive PSQL 8, 9, 10, Postgres 7.x, 8.x, 9.x, Progress Open Edge 8.x, 9.x, 10.x, SAP BW 7.0, Teradata 12.x, 13.x, 14.x, GoldenGate 10.4+, E-Business Suite 10.5.10*, 12.0*, 12.1*, Oracle Internet Direcotry 10.1.4.3.0, Oracle Mediator, 10.1.3.4.0, 11.1.1.3.0, Oracle Service Bus 11.1.1.3.0, Tuxedo 11.1.1.1.0, SAP ERP 4.6c, 4.7, 7.0+, SAP ERP ECC 5.0, 6.0, Vsam CiCs, IBM MQ Series, MS Active Directory Andere relationale Datenbanken per nativer Anbindung (Ziel): Times Ten 11.2+, Apache Derby 10.x, Apache Hive 0.7.1, IBM Netezza NPS 3.x, 4.x, 5.x, 6.x, Paradox 9.x, 10.x, Persavive PSQL 8, 9, 10, Postgres 7.x, 8.x, 9.x, Progress Open Edge 8.x, 9.x, 10.x, SAP BW 7.0, Teradata 12.x, 13.x, 14.x, dBase III, IV, V, LDAP V3, GoldenGate 10.4+, E-Business Suite 10.5.10*, 12.0*, 12.1*, Oracle Internet Direcotry 10.1.4.3.0, Oracle Mediator, 10.1.3.4.0, 11.1.1.3.0, Oracle Service Bus 11.1.1.3.0, Tuxedo 11.1.1.1.0, SAP ERP 4.6c, 4.7, 7.0+, SAP ERP ECC 5.0, 6.0, Vsam CiCs, IBM MQ Series, MS Active Directory
Pentaho Andere relationale Datenbanken per ODBC/JDBC (Quelle und Ziel): Apache Derby, AS/400, InfiniDB, Exasol 4, Firebird SQL, Greenplum, H2, Hive, Hive 2, Hypersonic, Informix, Ingres, LucidDB, MaxDB (SAP DB), PostgreSQL, SQLite, Teradata, UniVerse database; Andere relationale Datenbanken per nativer Anbindung (Quelle und Ziel): Microsoft, Oracle und Mondrian
SAP Unterstützung IBM DB/2: iSeries 6.4, 6.1, 7.1, LUW 9.1, 9.5, 9.7, 10.1, 10.5, zOS 8.1, 9.1, 10.5 via iSeries Access/ DB2 Connect/DataDirect ODBC Unterstützung Microsoft SQL Server Data Direct ODBC: 2000 SP4, 2005 SP3/SP4, 2008 SP2/R2, 2012 Unterstützung MySQL 5.0, 5.1, 5.5 Unterstützung Oracle Database 9i, 10g, 10gR2, 11g, 11gR1, 11gR2, 12c, 12cR1 Unterstützung SAP HANA ab 1.0 SP6, SP7, SP8 via HANA ODBC Andere relationale Datenbanken per ODBC/JDBC-Anbindung (Quelle und Ziel) : SAP IQ, Teradata Andere relationale Datenbanken per nativer Anbindung (Quelle und Ziel): Netezza, Informix, SAP ASE, SAP SQL Anywhere, HADOOP
Syncsort Unterstützung IBM DB/2: 9.1; 9.7 and higher Unterstützung Microsoft SQL Server 2005 and higher Unterstützung MySQL Level 3 compliant Unterstützung Oracle Database 10g; 11g Unterstützung ODBC/JDBC Level 3 compliant Andere relationale Datenbanken per ODBC/JDBC-Anbindung (Quelle und Ziel) : JDBC level 3 compliant und ODBC Level 3 compliant Andere relationale Datenbanken per nativer Anbindung (Quelle und Ziel): Teradata; Vertica; Sybase; Netezza; Hive; Greenplum; Greenplum: 4.2 and higher; Hive: Hive Server 2; Netezza: 6.0 and higher Sybase: ASE und IQ 15.0 and higher; Teradata: TD13 und TD14; Vertica: 5.1 und 6.0 und 7.0
Talend Talend verwendet grundsätzlich JDBC für den Datenbankzugriff, wobei datenbankspezifische Komponenten Spezifika der jeweiligen Datenbank berücksichtigen. Zusätzlich werden die jeweiligen Batch/Bulk-Load Komponenten des Herstellers für das Laden großer Datenmengen unterstützt. Andere relationale Datenbanken per ODBC/JDBC-Anbindung (Quelle und Ziel): generelle JDBC/ODBC Anbindung unterschiedlichster Datenbanken möglich; Für eine vollständige Übersicht https://help.talend.com/ display/TalendPlatformforDataManagementInstallationandUpgradeGuide55EN/Home Appendix B
Theobald Software Andere relationale Datenbanken per nativer Anbindung (Quelle und Ziel): SAP ERP
Unterstützte Relationale Datenbanken II
© areto consulting gmbh 2014 Seite 9
Unterstützte Nicht-Relationale Datenbanken
Information Builders Andere unterstützte Datenbanken (Quelle): Adabas, Datacom/DB, IDMS/DB, IMS, Lotus Notes, Millennium, Model 204,
Axiom EPM, JD Edwards EnterpriseOne, JD Edwards World, Lawson, Oracle Applications, PeopleSoft, Salesforce.com, SAP,
Siebel,Adabas/NAT, Address Doctor, CICS Transaction, CICS Transaction for Natural, IMS Transaction, IWAF, Natural Batch,
Query/400, REST, Web Services, FOCUS/FDS
Microsoft Unterstützte Datenbanken benötigen 3rd Party connection data flow component;
diverse 3rd Party data flow components sind am Markt erhältlich, eigene Entwicklung ist einfach möglich,
da die Schnittstelle offen und dokumentiert ist
Pentaho Andere unterstützte Datenbanken: Impala, InfoBright, Ingres VectorWise, MonetDB, Neoview, Netezza, Vertica
Syncsort mittels HDFS bei allen Datenbanken, die diesen Standard unterstützen
Datenbanken
Ap
ache C
assand
ra
Go
ogle B
ig Table
HB
ase
Mo
ngo
DB
and
ere Nich
t-Relati
on
ale Daten
ban
ken
Ap
ache C
assand
ra
Go
ogle B
ig Table
HB
ase
Mo
ngo
DB
and
ere Nich
t-Relati
on
ale Daten
ban
ken
Anbieter als Quelle als Ziel
Cubeware ● --- --- ● --- --- --- --- --- ---
Information Builders --- --- ● ● ● --- --- ● ● ●
Microsoft ● ● ● ● ● ● ● ● ● ●
n³ data & software science --- --- --- --- --- --- --- --- --- ---
Oracle ● --- ● ● --- ● --- ● ● ---
Pentaho ● ● ● ● ● ● ● ●
SAP --- --- --- ● --- --- --- --- ● ---
Syncsort ● ● ● ● ● ● ● ● ● ●
Talend ● ● ● ● ● ● ● ● ● ●
Theobald Software --- --- --- --- --- --- --- --- --- ●
● : (native) Unterstützung -- keine/keine Angaben
© areto consulting gmbh 2014 Seite 10
Unterstützte Multidimensionale Datenbanken
Microsoft Unterstützte Datenbanken anderer Hersteller benötigen jeweils OLEDB/ODBC Treiber; SAP NetWeaver BW ergänzt durch
Theobald Software
Pentaho Unterstützte andere multidimensionale Datenbanken (Quelle): Palo MOLAP Server (Plug-In specific access method),
Mondrian (native)
SAP Unterstütze Versionen 3.5, 7.0, 7.3, 7.4, 7.4SP6
Syncsort DMX ist ein typisches ETL Tool. Als solches bereiten DMX die Daten auf lädt sie an die benötigten Stellen.
Multidimensionale Datenbanken laden dann von dort typischerweise die Daten selbst in die Cubes
Talend Unterstützte andere multidimensionale Datenbanken (Quelle und Ziel): Mondrian Palo
Theobald Software Unterstützte andere multidimensionale Datenbanken (Ziel): Goddata
Datenbanken
IBM
Co
gno
s TM1
Info
r BI O
LAP
Server
Jedo
x OLA
P Server
Micro
soft
An
alysis Services
Oracle Essb
ase
Oracle D
atabase O
LAP
Op
tio
n
SAP
Netw
eaver BW
SAS O
LAP
Server
and
ere mu
ltid
imen
sion
ale Daten
ban
ken
IBM
Co
gno
s TM1
Info
r BI O
LAP
Server
Jedo
x OLA
P Server
Micro
soft
An
alysis Services
Oracle Essb
ase
Oracle D
atabase O
LAP
Op
tio
n
SAP
Netw
eaver BW
SAS O
LAP
Server
and
ere mu
ltid
imen
sion
ale Daten
ban
ken
Anbieter als Quelle als Ziel
Cubeware ● ● --- ● ● --- ● --- --- ● ● --- ● ● --- ● --- ---
Information Builders --- --- --- ● ● --- ● --- --- --- --- --- --- --- --- --- --- ---
Microsoft ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ●
n³ data & software science --- --- --- --- --- --- --- --- --- --- --- --- --- --- --- --- --- ---
Oracle --- --- --- --- ● ● --- --- --- --- --- --- --- ● ● --- --- ---
Pentaho --- --- --- ● --- --- --- --- ● --- --- --- --- --- --- --- --- ---
SAP --- --- --- --- --- --- ● --- --- --- --- --- --- --- --- ● --- ---
Syncsort --- --- --- --- --- --- --- --- --- --- --- --- --- --- --- --- --- ---
Talend --- --- --- --- --- --- ● --- ● --- --- --- --- --- --- --- --- ●
Theobald Software --- --- --- --- --- --- ● --- --- --- --- --- ● ● --- ● --- ●
● : (native) Unterstützung -- keine/keine Angaben
© areto consulting gmbh 2014 Seite 11
Unterstützte Dateien/Datenformate
Cubeware Andere Datenformate: xls/xlsx
Information Builders Andere Datenformate: Acucobol CISAM, DB Heritage Files, Delimited Flat File, Excel (via direct retrieval), Flat File, Informix, CISAM, MicroFocus CISAM, RMS,VSAM
Microsoft Andere Datenformate: custom code oder 3rd Party Komponente notwendig (JSON); Excel, Access
n³ data & software science Anderes Datenformat: Excel
Pentaho Andere Datenformate: Email, ESRI, Google Analytics, Google Docs, GZIP, HL7, IBM Websphere MQ, JMS, LDAP, LDIF, MS Access, MS Excel, RSS, S3 CSV, Salesforce, SAS, Yaml
SAP Andere Datenformate: DTD, als Quelle: Excel Worksheet, Cobol Copybook, VCF Dateien (Genomsequenzen), ESRI Shapefiles (Geodaten), beliebige weitere via Adapter SDK
Syncsort Andere Datenformate: Informix C-ISAM; Microfocus; Unikox VSAM; ACUCOBOL GT Version; Fixed length; Mainframe; Fortran
Talend Andere Datenformate: HDFS, Apache Log, ARFF, EBCDIC, Excel, LDIF, Mail
Theobald Software Anderes Datenformat: Tableau-Datenfiles
Datenbanken
Fixed Len
gth Flat File
CSV
XM
L
JSON
and
ere Daten
form
ate
Fixed Len
gth Flat File
CSV
XM
L
JSON
and
ere Daten
form
ate
Anbieter als Quelle als Ziel
Cubeware ● ● --- --- ● --- ● --- --- ●
Information Builders ● ● ● ● ● ● ● ● ● ---
Microsoft ● ● ● ● ● ● ● ● ● ●
n³ data & software science ● ● ● ● ● ● ● ● ● ●
Oracle ● ● ● ● --- ● ● ● ● ---
Pentaho ● ● ● ● ● ● ● ● ● ●
SAP ● ● ● ● ● ● ● ● ● ●
Syncsort ● ● ● ● ● ● ● ● --- ●
Talend ● ● ● ● ● ● ● ● ● ●
Theobald Software --- --- --- --- --- ● ● ● ● ●
● : (native) Unterstützung -- keine/keine Angaben
© areto consulting gmbh 2014 Seite 12
Stärken des ETL-Tools aus Sicht des Herstellers
Cubeware Einfachheit in der Bedienung, selbst für die Definition komplexer ETL Prozesse; ETL und OLAP Modellierung über
ein Tool unter Verwendung eines Repositories; Definition von ETL Prozessen durch Drag & Drop-
Information Builders Funktional umfangreiches, leicht erlernbares ETL Tool. Der gesamte ETL Entwicklungsprozess erfolgt über eine
graphische Benutzeroberfläche und zwar schrittweise als Daten- und Prozess Flows. Die mit dem Data Migrator
erstellten Flows sind als lesbare Textfiles gespeichert, bestehend aus SQL Commandos und interner Scriptsprache.
So ist der gesamte Ablauf Line by Line nachvollziehbar (vollständiges Audit). Mehr als 250 Datenadapter stehen als
Quell- oder Zieladapter bereit. Der DataMigrator nutzt dieselben Metadaten wie das BI Reporting Werkzeug Web-
FOCUS, daraus ergeben sich Synergien für kürzere Entwicklungszeiten und Wiederverwendbarkeit von Modulen.
Microsoft Geschwindigkeit, Remote Debugging, kurze Designzeit, vollständige API zur Programmierung.
n³ data & software science leicht verständliche grafische Oberfläche; bedienbar mit grundlegenden Datenbank-Kenntnissen; einfach in beste-
hende Infrastruktur integrierbar.
Oracle 1. dynamische Codegenerierung durch Template (Knowledge Module): Der Anwender kann den genierten Code
an seine Anforderungen anpassen.
Einsatzszenarios:
- individuelle Performanceanpassungen
- neue Funktionalitäten, die Oracle nicht in das Tool eingebaut hat
- Standardisierung des Codes: wiederkehrende Schritte werden automatisch generiert und die Codestruktur ist
immer die gleiche (führt zu sehr viel kürzeren Entwicklungszeiten und geringeren Entwicklungskosten)
2. heterogene Umgebungen
3. Integration in den Oracle Product Stack von der Hardware bis zum BI Werkzeug
4. Java basierte Entwicklungsumgebung
Pentaho Intuitiv, skalierbar, offen, Baukastenprinzip (eigene Schritte können definiert und ausgeführt werden), alle markt-
gängigen Speichersysteme können integriert werden.
Big Data Adaptive Layer ‒ Änderungen in Hadoop-Distributionen sind transparent; Datenbank-Repository bietet
Möglichkeiten für Teamarbeit, zur Hinzufügung von Informationen, ist Metadaten-getrieben und kann in einer
Cloud-Umgebung eingesetzt werden.
SAP Benutzerfreundlichkeit, starke Datenqualitäts- und ETL-Transformationen in einem Tool, hohe Performance, Er-
weiterbarkeit via Adapter SDK, Real-Time und Batch-Szenarien in einem Tool.
Syncsort DMXExpress ist aus Sicht des Herstellers eines der leistungsfähigsten ETL Tools am Markt. Durch seine Mainframe-
Herkunft ist DMX gewohnt, mit wenig Ressourcen sehr effizient zu arbeiten. Typischer Weise benötigt DMX ca. 1/3
der Cores, die ein herkömmliches ETL Tool benötigt. Dazu verbraucht DMX ca. 65% weniger Memory. Durch den
Einsatz der verschiedenen DMX Features wie Compression kann der Bedarf an Plattenplatz drastisch reduziert
werden. DMX kann komplette Workflows komprimiert verarbeiten ‒ also sowohl komprimierte Files lesen, verar-
beiten und wieder wegschreiben. Ein Extrahieren ist nicht nötig.
Talend Durch native Unterstützung moderner Big-Data-Plattformen wie Hadoop und NoSQL nehmen die „Zero Footprint“
Lösungen von Talend die Komplexität und statten IT-Abteilungen so aus, dass sie schneller auf Geschäftsanforde-
rungen reagieren können.
Talends einheitliches Lösungsportfolio basiert auf Open Source und wird vom breitesten Ökosystem in der Bran-
che unterstützt. Es wird über ein vorhersehbares Subskriptionsmodell angeboten und beinhaltet Big Data, Daten-
integration, Data Quality, Master Data Management (MDM), einen Enterprise Service Bus (ESB) und Geschäftspro-
zessmanagement (BPM).
Theobald Software Instant Datawarehousing für automatisiertes Anlegen der DWH-Objekte, minimaler bis kein Eingriff in das SAP,
robustes, standardisiertes Verfahren für inkrementelle Beladungen, zentrales Security-Konzept.
© areto consulting gmbh 2014 Seite 13
Übersicht der kommerziellen Aspekte und Details I
Welche Lizensierungsmodelle gibt es (z.B. pro CPU, pro Named User)?
Cubeware Keine Angaben
Information Builders pro CPU Core und pro Datenquelle
Microsoft pro Core, min. 4 Cores
n³ data & software science Named User
Oracle Oracle bietet CPU-basierte Lizensierung (anhand der Cores des jeweiligen Prozessor-Anbieters) und eine Named
User Plus Lizensierung an. Es sind die Staging-/Transformations-Area zu lizensieren, die Quell- und Zielsysteme sind
in der Regel enthalten (Ausnahme: Host-Systeme, Standards-Applikationen wie z. B. SAP oder Siebel)
Pentaho per Core für die Pentaho Plattform; zusätzlich per Node für den adaptiven Big Data Layer / Hadoop
SAP CPU -Kerne
Syncsort Kauf- und Mietlizenzen pro CPU
Talend Named User, Concurrent User, Core-based
Theobald Software pro Server
Welche kostenpflichtigen Optionen und Zusatzmodule bieten Sie an?
Cubeware Keine Angaben
Information Builders Keine Angaben
Microsoft Keine
n³ data & software science Keine Angaben
Oracle Der Datenintegrationsbereich besteht im wesentlichen aus 3 Produkten:
1. ODI
2. Oracle Golden Gate (OGG) für Realtime Integration
3. Oracle Enterprise Data Quality (EDQ) für Data Quality and Data Profiling, optional Address Verification Server
Die drei Produkte können unabhängig voneinander betrieben werden, sie lassen sich auch integrieren und werden
dann von ODI gesteuert.
Optionen:
1. ODI Management Pack für Oracle Enterprise Manager Grid Control (z. B. für einheitliche Administration aller
Oracle Produkte oder die Optimierung des von ODI generierten Codes durch die Datenbank)
2. Adaptoren für Standard Applikationen (z. B. SAP ECC/BW, Siebel oder EBus)
3. Adaptoren für Host Systeme
Pentaho Adaptive Big Data Layer, Data Science Pack
SAP Keine
Syncsort DMX-Hadoop
Talend Mission Critical Support
Theobald Software Keine Angaben
© areto consulting gmbh 2014 Seite 14
Übersicht der Anbieter
Vorgestellte Unternehmen und Lösungen in dieser Studie
Cubeware GmbH .............................................................................................................................................................. 17
Information Builders (Deutschland) GmbH ...................................................................................................................... 23
Microsoft Deutschland GmbH .......................................................................................................................................... 31
n³ data & software science GmbH .................................................................................................................................... 38
Oracle Deutschland BV & Co. KG ...................................................................................................................................... 45
Pentaho EMEA .................................................................................................................................................................. 53
SAP SE ............................................................................................................................................................................... 62
Syncsort GmbH ................................................................................................................................................................. 69
Talend Germany GmbH .................................................................................................................................................... 76
Theobald Software GmbH ................................................................................................................................................ 84
Weitere Anbieter
Actian Germany GmbH 63303 Dreieich www.actian.com
IBM Deutschland GmbH 71139 Ehningen www.ibm.de
Informatica GmbH 60528 Frankfurt am Main www.informatica.com
SAS Institute GmbH 69118 Heidelberg www.sas.com
Vermissen Sie ein Unternehmen oder eine Lösung? Soll Ihr Unternehmen oder Ihr ETL-System im geplanten Update der Marktstudie Anfang 2015 ebenfalls
aufgeführt werden? Setzen Sie sich bitte mit uns in Verbindung, wir werden Ihre Wünsche gerne berücksichtigen.
© areto consulting gmbh 2014 Seite 15
Cubeware GmbH I
Anbieter
Anbieter Cubeware GmbH, Mangfallstr. 37, 83026 Rosenheim
Webseite und eMail-Adresse www.cubeware.com, info@cubeware.com
Anzahl Mitarbeiter weltweit und in Deutschland 200 (weltweit), 100 (deutschlandweit)
Architektur
Speicherung der entwickelten ETL-Prozesse (ETL-Repository)
Kann die Speicherung des ETL-Repository in einer relationalen Datenbank
erfolgen? Nein
Kann die Speicherung des ETL-Repository außerhalb einer relationalen
Datenbank erfolgen? Ja (die Speicherung erfolgt in einem binären XML Dateiformat)
Werden vom Client des ETL-Tools Auswertungen des ETL-Repository zur
Verfügung gestellt (z. B. in Form von vordefinierten Berichten)? Nein
Kann auf das ETL-Repository auch außerhalb des Clients lesend zugegriffen
werden (Existieren z. B. Views, auf die mit SQL zugegriffen werden kann)? Nein
Kann auf das ETL-Repository auch außerhalb des Clients schreibend zuge-
griffen werden (Existieren z. B. API-Funktionen, um Objekte im ETL-
Repository zu erzeugen oder zu verändern)?
Nein
Existiert ein Metadaten-Repository und ist es erweiterbar? Nein
Welche Sicherheitslösungen bestehen für den autorisierten Zugriff
auf Metadaten? Keine Angaben
Softwarelösung
Genaue Bezeichnung des ETL-Tools C8 Importer
Version des aktuell verfügbaren ETL-Tools, die als Grundlage für die Beant-
wortung dieser Fragen herangezogen wurde C8 Importer R8
Modul 1 C8 SAP Connect R8 (Zugriff auf SAP ERP)
Modul 2 C8 SAP OLE DB Connect R8 (Zugriff auf SAP BW)
Modul 3 C8 Infor Connect R8 (Zugriff auf ION BI)
Modul 4 C8 TM1 Connect R8 (Zugriff auf IBM Cognos TM1)
Modul 5 C8 MS AS Connect R8 (Zugriff auf Microsoft Analysis Services)
Modul 6 C8 Essbase Connect R8 (Zugriff auf Oracle Essbase)
Modul 7 C8 EXASOL Connect R8 (Zugriff auf EXASolution)
Handelt es sich um kommerzielle Software oder um eine Open Source oder
Freeware-/Shareware-Lösung? kommerzielle Software