Logo des Repositoriums
 

HMD 53(4) - August 2016 - NoSQL-Anwendungen

Autor*innen mit den meisten Dokumenten  

Auflistung nach:

Neueste Veröffentlichungen

1 - 10 von 15
  • Zeitschriftenartikel
    Implementierung von kryptographischen Sicherheitsverfahren für Apache Cassandra und Apache HBase
    (HMD Praxis der Wirtschaftsinformatik: Vol. 53, No. 4, 2016) Waage, Tim; Wiese, Lena
    Spaltenfamiliendatenbanken (engl.: „column family databases“ oder „wide column stores“) sind wegen ihres flexiblen Datenmodells beliebt, das eine weitgehend schemalose Datenverwaltung ermöglicht. Diese Datenbanken (insbesondere HBase und Cassandra als quelloffene Produkte) werden auch von einigen großen Cloud-Dienstanbietern als Database-as-a-Service bereitgestellt. Eine Verschlüsselung der Transportschicht (also eine Sicherung der Verbindung zwischen Kundenrechner und der Cloud-Datenbank) ist in der Regel vorgesehen. Jedoch wird eine darüberhinausgehende Verschlüsselung der Daten innerhalb der Datenbank entweder gar nicht oder zu spät (d. h. erst auf Datenbankseite) unterstützt. Die Daten sind daher im Klartext zugreifbar für den Dienstanbieter. Im Falle eines Einbruchs in das Datenbanksystem kann darüber hinaus auch ein externer Angreifer vollen Zugriff auf die Daten erhalten.Verschlüsselung ist daher notwendig, um Daten vor unbefugtem Zugriff zu schützen. Insbesondere sollte die gesamte Schlüsselverwaltung sowie die Ver- und Entschlüsselungsoperationen auf Kundenseite erfolgen, damit die Vertraulichkeit der Daten gewahrt bleibt. Traditionelle starke Verschlüsselungsverfahren führen jedoch dazu, dass die Daten nicht mehr effizient verwaltet werden können: eine Suche nach übereinstimmenden Werten, eine Sortierung oder eine Aggregation (zum Beispiel Summierung) der Daten ist nicht möglich. Zur Lösung dieser Probleme wurden in der Theorie zahlreiche Verschlüsselungsverfahren vorgeschlagen, die gewisse Eigenschaften des Klartextes erhalten (sogenannte durchsuchbare und ordnungserhaltende Verschlüsselung).In diesem Artikel behandeln wir zum einen die derzeit vorhandenen Angebote, HBase und Cassandra als Database-as-a-Service zu nutzen und zum Anderen stellen wir unsere Implementierungen von Verschlüsselungsverfahren vor, die es ermöglichen, Cloud-Datenbanken (und zwar speziell HBase und Cassandra) mit verschlüsselten Daten zu nutzen.AbstractColumn family databases (sometimes also called wide column stores) are popular due to their flexible data model, which allows schemaless data storage. These databases (in particular the open source platforms Apache Cassandra and Apache HBase) are offered as database-as-a-service by several cloud storage providers. While encryption of the transport layer (and thus, a secure connection between a customer’s computer and the cloud database) is usually provided, there is no further encryption within in database. The cloud storage provider can access the data in plaintext format. In case external attackers break into the database, they can get access as well.Thus encryption is necessary to protect sensitive data from illegitimate access. In particular the key management as well as encryption and decryption should be done on customer side in order to preserve data confidentiality. However traditional encryption methods like AES do not preserve the plaintexts characteristics, which make data processing very inefficient. Certain operations, for example sorting, searching and aggregations, are no longer possible at all after encryption. However, various theoretical encryption methods were proposed recently, that preserve the plaintext properties the databases are relying on, e.g. order-preserving encryption and searchable encryption.This article describes the currently available options for using Apache Cassandra and HBase in the database-as-a-service scenario and introduces our implementations of property-preserving encryption schemes, that enables cloud databases to operate on encrypted data.
  • Zeitschriftenartikel
    Editorial
    (HMD Praxis der Wirtschaftsinformatik: Vol. 53, No. 4, 2016) Knoll, Matthias
  • Zeitschriftenartikel
    Digitalisierung des Innovationsmanagements
    (HMD Praxis der Wirtschaftsinformatik: Vol. 53, No. 4, 2016) Lindermeir, Andreas
    Der unter dem Begriff der Digitalisierung zu verstehende zielgerichtete Einsatz von informationstechnischen Lösungen kann dabei helfen Innovationsprozesse effektiver, kosteneffizienter und schneller zu gestalten. Insbesondere beim Einsatz der mittlerweile weit verbreiteten Innovation Communities ergibt sich für den Innovationsprozess durch geeignete Digitalisierungsmaßnahmen ein sehr hohes Verbesserungspotential. Mit Hilfe von Innovation Communites werden Innovationen durch die Zusammenarbeit mehrerer Abteilungen, Bereiche, Organisationen oder unter Einbeziehung der potentiellen Kunden entwickelt, anstatt durch eine singuläre F&E-Abteilung. Dieser Beitrag betrachtet die sich durch die Digitalisierung ergebenden Chancen aber auch Herausforderungen, welche sich durch den Einsatz von Innovation Communities ergeben. Zunächst werden die drei wesentlichen Formen Knowledge Exchange, Open Innovation Community und Internal Innovation Community inkl. Beispiele aus der Praxis vorgestellt und hinsichtlich der Erfolgsfaktoren Fit-to-Market, New-to-Market, Time-to-Market und Cost-to-Market sowie der Herausforderungen analysiert. Anschließend werden ausgewählte Software-Produktbeispiele (SharePoint, HYVE IdeaNet App, Yammer, RapidMiner) vorgestellt und es wird aufgezeigt, wie diese die o. g. Erfolgsfaktoren verbessern können. Mit Hilfe von daraus abgeleiteten praxisnahen Handlungsempfehlungen für Unternehmen wird dargestellt, wie der Einsatz digitaler Technologien in Innovation Communities zu besseren (im Sinne von schnelleren, kosteneffizienteren, neuartigeren, markttauglicheren) Innovationen führen kann. Um konkrete Empfehlungen für die Form der Innovation Community sowie die vielversprechendsten Digitalisierungsmaßnahmen zu geben, wird dabei zwischen hochinnovativen Marktführern, durchschnittlich innovativen Marktteilnehmern und weniger innovativen Markteinsteigern unterschieden.AbstractThe under the megatrend of digitalization focused application of IT solutions can help to make the innovation processes more effective, cost-efficient and faster. In particular, when using the widespread Innovation Communities there is much room for improvement of the innovation process by digitalization initiatives. Thereby, innovations are the co-work of several departments, divisions, organizations or with the involvement of potential customers rather than the work of a singular research and development department. This article particularly examines the opportunities but also the challenges by applying digitalization initiatives in Innovation Communities. First, the three most important forms Knowledge Exchange, Open Innovation Community and Internal Innovation Community including real-world examples are introduced and analyzed regarding the success factors fit-to-market, new-to-market, time-to-market, and cost-to-market as well as the challenges. Further, selected software products (SharePoint, HYVE IdeaNet App, Yammer, RapidMiner) including their influence on the success factors are presented. Related practical recommendations for companies show how the use of digital technologies in Innovation Communities can lead to better innovations (meaning faster, more cost-effective, more revolutionary and more marketable). The recommendations for the form of the Innovation Community and the most promising digitalization initiatives thereby are differentiated between a highly innovative market leader, an average innovative market participant, and a below-average innovative market entrant.
  • Zeitschriftenartikel
    Herausforderungen bei der Anwendungsentwicklung mit schema-flexiblen NoSQL-Datenbanken
    (HMD Praxis der Wirtschaftsinformatik: Vol. 53, No. 4, 2016) Klettke, Meike; Störl, Uta; Scherzinger, Stefanie
    NoSQL-Datenbanksysteme sind in den letzten Jahren sehr populär geworden, gute Gründe sprechen für ihren Einsatz: Eine attraktive Eigenschaft vieler Systeme ist ihre Schema-Flexibilität, die insbesondere in der agilen Anwendungsentwicklung Vorteile bietet. Durch horizontale Skalierbarkeit ermöglichen NoSQL-Datenbanksysteme eine effiziente Verarbeitung großer Datenmengen. Einige Systeme, die für die Datenhaltung interaktiver Anwendungen konzipiert sind, können zudem hochfrequente Nutzeranfragen bedienen.Diesen Vorteilen stehen eine Reihe von Nachteilen gegenüber, aus denen sich neue Herausforderungen für die Anwendungsentwicklung ergeben: Fehlende Standards bei den Anfragesprachen erschweren die Entwicklung datenbanksystemunabhängiger Anwendungen. Schema-Flexibilität im Datenbankmanagementsystem führt dazu, dass die Verantwortung für das Schema-Management in die Anwendung verlagert wird.Im vorliegenden Beitrag werden wesentliche Herausforderungen identifiziert und Lösungsansätze aus Forschung und Praxis vorgestellt. Dabei liegt der Fokus auf schema-flexiblen NoSQL-Datenbanksystemen, mit einem aggregat-orientierten Datenmodell, d. h. Key-Value Datenbanksysteme, dokumentenorientierten Datenbanksystemen und Column-Family Datenbanksystemen.AbstractNoSQL data stores have become very popular over the last years, as good reasons are justifying their application: One attractive feature of many systems is their schema flexibility, which may be preferable in agile software development projects. Due to their horizontal scalability, NoSQL data stores make it possible to efficiently process large amounts of data. Some systems, designed as data backends for interactive applications, can also manage highly frequent user requests.Apart from these advantages, there are also downsides to NoSQL data stores that create new challenges for software development: Missing standards in query languages make it difficult to build data store independent applications. Schema flexibility in the data store shifts the responsibility for schema management into the application.This article identifies substantial challenges as well as solution statements from research and practice. The focus of our survey is on schema-flexible NoSQL data management systems with an aggregate-oriented data model, i. e., key-value data management systems, as well as document and column family data management systems.
  • Zeitschriftenartikel
    Deja Vu: Wieder einmal NoSQL Datenbanken
    (HMD Praxis der Wirtschaftsinformatik: Vol. 53, No. 4, 2016) Schöning, Harald
  • Zeitschriftenartikel
    SentiStorm: Echtzeit-Stimmungserkennung von Tweets
    (HMD Praxis der Wirtschaftsinformatik: Vol. 53, No. 4, 2016) Zangerle, Eva; Illecker, Martin; Specht, Günther
    Das automatisierte Erkennen der Stimmung von Texten hat in den letzten Jahren stark an Bedeutung gewonnen. Insbesondere durch die rapide Zunahme der Geschwindigkeit, mit der in sozialen Medien Informationen verbreitet werden, ist eine Echtzeit-Bestimmung der Stimmung von Texten ein herausforderndes Problem. Der Mikroblogging-Dienst Twitter verzeichnet im Durchschnitt über 8000 versendete Nachrichten pro Sekunde. In dieser Arbeit stellen wir mit dem SentiStorm-Ansatz einen Ansatz zur Stimmungserkennung von Tweets vor. Dabei erzeugen wir in einem ersten Schritt Merkmalsvektoren für die Tweets, die sowohl linguistische Informationen über den Tweet (Wichtigkeit der Wörter, Wortarten), wie auch über Sentiment-Lexika gewonnene Stimmungsinformationen beinhalten. In einem zweiten Schritt führen wir mittels der Merkmalsvektoren eine Stimmungsklassifikation durch, die eine Einteilung in positive, negative oder neutrale Tweets ermöglicht. Die durchgeführten Evaluationen zeigen, dass der präsentierte Ansatz bezüglich der Qualität der erkannten Stimmung sehr gute Erkennungsraten garantiert. Weiter zeigen wir, dass der Ansatz mittels der Apache Storm Plattform problemlos für die Echtzeit-Stimmungserkennung von Tweets skaliert werden kann.AbstractThe automatic detection of the sentiment of texts has become more and more important throughout the last years. Particularly, the rapid increase of the speed at which information is spread in social media makes real-time sentiment detection a challenging task. On the microblogging platform Twitter, more than 8,000 messages are sent every second. In this work, we present the SentiStorm approach, an approach for sentiment detection within tweets. We base the approach on feature vectors which contain linguistic information about the tweet content (weighting of words, word categories), as well as sentiment information which we gather based on sentiment lexica. Subsequently, we facilitate these feature vectors for a sentiment classification task which allows for distinguishing positive, negative and neutral tweets. Our conducted evaluations show that the proposed approach shows high classification accuracy. At the same time, we show that utilizing the Apache Storm platform we are able to easily scale the approach towards a real-time sentiment classification of tweets.
  • Zeitschriftenartikel
    Graph-Datenbanken als Grundlage des Configuration Managements – Eine Untersuchung am Beispiel von Neo4 J
    (HMD Praxis der Wirtschaftsinformatik: Vol. 53, No. 4, 2016) Stiefel, Stephan; Möstl, Christian; Bär, Florian; Schmidt, Rainer; Möhring, Michael
    Configuration-Management-Databases (CMDBs) stellen einen zentralen Speicher für die Verwaltung aller Informationen und Beziehungen in IT-Infrastrukturen dar. Sie dienen Unternehmen für die Entscheidungsunterstützung. Aufgrund ihrer Graph-orientierten Grundstruktur liegt ihre Implementierung auf Basis von modernen Graph-Datenbankensystemen nahe. Deren tatsächliche Eignung als Grundlage für CMDBs, wurde in der wissenschaftlichen Literatur bisher jedoch noch nicht geprüft. Die vorliegende Arbeit stellt einen wesentlichen Beitrag zur Schließung dieser Forschungslücke dar. Im Rahmen eines Versuchsaufbaus werden die relationale Datenbank Oracle 12c sowie die Graph-Datenbank Neo4 J in einem CMDB-Kontext miteinander vergleichen. Ziel ist es, die Eignung der Neo4 J Datenbank und folglich von Graph-Datenbanken im Allgemeinen als Grundlage von CMDBs zu prüfen. Dafür werden zunächst geeignete Anwendungsfälle und Messkriterien definiert. Diese bilden die Ausgangsbasis für durchgeführte Messungen und Vergleiche. Zwar bestätigen die Ergebnisse der vorliegenden Arbeit eine generelle Eignung von Graph-Datenbanken als Grundlage für CMDBs, jedoch wird aufgezeigt, dass relationale Datenbanken in diesem Kontext als effizienter anzusehen und folglich vorzuziehen sind.AbstractConfiguration-Management-Databases (CMDBs) store relevant information about the IT-infrastructure of an enterprise and support CIOs and IT-administrators in making IT-related decisions. As CMDBs can be considered as labeled graphs, implementing them based on graph-based databases is an obvious idea . However, the suitability of graph-based databases to serve as the basis of CMDBs, has not been explored by prior research yet. The present study is a first step towards filling this research gap. As part of a controlled experiment, both database systems, Oracle 12c and Neo4 J, are compared to each other based on defined measurement criteria and test scenarios. The main objective of our study is to examine, whether Neo4 J (and graph-based databases in general) is an appropriate basis for CMDBs. In particular, we are interested in the fact of whether Neo4 J performs more efficiently in a CMDB-context compared to Oracle 12c or not. Though, our findings reveal that Neo4 J is a suitable basis for CMDBs in general, it is found that Oracle 12c (as a relational database system) performs more efficiently and thus should be preferred over Neo4 J in CMDB-contexts.
  • Zeitschriftenartikel
    Aggregierte Kennzahlen
    (HMD Praxis der Wirtschaftsinformatik: Vol. 53, No. 4, 2016) Kütz, Martin
    Wer mit Kennzahlen steuern will, muss sich beschränken. Reale Steuerungsobjekte erzeugen große Mengen an Daten, die dann für das Einbringen in Kennzahlensysteme auf wenige Kennzahlen reduziert werden müssen. Dieser Beitrag beschreibt Vorgehensweisen zur Bildung aggregierter Kennzahlen, die dem Verantwortlichen klarer als die in der Praxis gebräuchlichen Mittelwerte anzeigen, wie hoch der Zielerreichungsgrad ist und ob in das zu steuernde System aktiv eingegriffen werden muss.AbstractManagement with KPIs means restriction. Management objects, e.g. IT systems, generate a lot of data and those data must be summarized into few indicators which are then included into scorecards. This article presents procedures to build aggregate indicators which are more appropriate than commonly used mean values to show the degree of target achievement and the need for the responsible manager to intervene into his/her management object.
  • Zeitschriftenartikel
    Zur Nutzung von SQL- und NoSQL-Technologien
    (HMD Praxis der Wirtschaftsinformatik: Vol. 53, No. 4, 2016) Meier, Andreas
    Webbasierte Anwendungen setzen für unterschiedliche Dienstleistungen adäquate Datenhaltungssysteme ein. Die Nutzung einer einzigen Datenbanktechnologie genügt nicht mehr. In diesem Überblicksbeitrag wird der Begriff Big Data erläutert, bevor die Potenziale von SQL- und NoSQL-Technologien einander gegenübergestellt werden. Nach der Vorstellung der wichtigsten NoSQL-Ansätze und entsprechender Anwendungsoptionen werden organisatorische Maßnahmen für das Unternehmen im Zeitalter des Big Data aufgezeigt.AbstractWeb-based applications need adequate database concepts for their services. Working with a single database technology doesn’t help anymore. This overview explains the term Big Data and compares the potentials of SQL- and NoSQL-technologies. It explains NoSQL principles and appliation options before organizational issues will be proposed for the era of Big Data.
  • Zeitschriftenartikel
    Das aufstrebende Berufsbild des Data Scientist
    (HMD Praxis der Wirtschaftsinformatik: Vol. 53, No. 4, 2016) Schumann, Conny; Zschech, Patrick; Hilbert, Andreas
    Um die Vielzahl an heterogenen Datenströmen im Zeitalter von Big Data in für Unternehmen entscheidungsrelevante Informationen zu transformieren, wurden in den letzten Jahren nicht nur Business-Analytics-Ansätze entwickelt. Auch ein neues Berufsbild wurde Mittelpunkt zahlreicher Diskussionen: der Data Scientist. Die Vielzahl an Kompetenzen, die diese neue Berufsgruppe mit sich bringen sollte, wurde in verschiedenen Fachbeiträgen beschrieben und wird in diesem Artikel durch ein systematisches Literature Review zusammengefasst. Dabei werden die einzelnen, durch die Inhaltsanalyse ermittelten Kompetenzen nicht nur aufgezählt, sondern erstmalig in ein Kompetenzmodell eingeordnet. Der Data Scientist sollte zahlreiche Fachkompetenzen, wie Kenntnisse in Statistik oder den KDD-Prozess betreffende Kompetenzen zur Datenselektion-, -aufbereitung, -analyse und Interpretation, aber auch Sozialkompetenzen, wie Team- und Kommunikationsfähigkeit, sowie Selbstkompetenzen, wie Neugier oder Kreativität, mit sich bringen. Hierbei wird ersichtlich, dass ein Data Scientist allein nicht alle Kompetenzen erfüllen kann. Es bedarf vielmehr an die Aufgaben und Rollen im Unternehmen angepasste Typen von Data Scientists mit unterschiedlichen Kompetenzschwerpunkten. Folglich werden ausgehend von den Erkenntnissen der Literatur- und Inhaltsanalyse Handlungsempfehlungen zur Entwicklung von spezifischeren Anforderungsprofilen ausgesprochen.AbstractTo transform the variety of heterogeneous data streams into enterprise decision-relevant information, not just modern business analytics approaches have been developed in recent years. In addition, a new job profile called for attention within the rising era of Big Data: the Data Scientist. The variety of skills that come along with this new profession has been described in various technical papers and is now summarized in this article through a systematic literature review. For this purpose, the identified competences are not only enumerated, but also classified within a competency model using a content analysis. The result of this examination is that according to the literature a Data Scientist should provide an extensive skill set – including professional skills such as statistics or KDD-relevant skills for the selection, preprocessing, analysis and interpretation of data, but also social skills such as teamwork and communication, as well as personal skills such as curiosity or creativity. Here it becomes evident that a Data Scientist alone cannot meet all these competencies. Rather, it requires individual types of Data Scientists with different major focus depending on the roles and duties within the enterprise. For this purpose the article provides recommendations for the development of specific Data Scientist profiles based on the results of the literature and content analysis.