Car-tech

Cloudera Preps Hadoop voor de Enterprise

Get Started with Hadoop Using Cloudera Enterprise | Part 2

Get Started with Hadoop Using Cloudera Enterprise | Part 2
Anonim

Cloudera heeft een nieuwe set Hadoop-beheertools onthuld, genaamd Cloudera Enterprise, die het bedrijf zal aanbieden voor een jaarlijks abonnement, kondigde het dinsdag aan. Het heeft ook het open-source distributiepakket van Hadoop bijgewerkt.

Zowel nieuwe releases als verschillende nieuwe partnerschappen met leveranciers van leveranciers van datamanagementsoftware tonen het bedrijf dat zich opmaakt om de opkomende databasetechnologie te bieden - nu grotendeels gebruikt door webreuzen zoals Google en Yahoo - naar de bedrijfsmarkt als een alternatief voor relationele databases.

"Onze gok is niet alleen de grote internetbedrijven, maar banken, ziekenhuizen en verzekeringsmaatschappijen zullen ontdekken dat ze complexe en gestructureerde data samen, en Hadoop is daarvoor gemaakt ", aldus Mike Olson, CEO van Cloudera. "Hadoop lost een nieuw probleem op, op een nieuwe manier."

Hadoop is een van een groeiend aantal niet-SQL- of NoSQL-databases. Het is gebaseerd op Google MapReduce, een raamwerk voor het parallel verwerken van gegevens over grote aantallen computers. knooppunten. Hadoop, nu ontwikkeld als open-sourceproject door de Apache Software Foundation, biedt een alternatief voor traditionele relationele databases, voor ten minste die gevallen van het analyseren van grote, snel veranderende datasets.

Het kan zowel met SQL als met niet-SQL werken -SQL-gegevens, en is beter bestand tegen serverstoringen dan relationele databases, zei Olson.

Cloudera verpakt Hadoop voor organisaties op middenniveau, beide met de Hadoop-distributie en de onlangs uitgebrachte set beheertools. Beide pakketten zouden organisaties met veel diepgaande technische ervaring in Hadoop moeten toelaten om de software te gebruiken, zei Olson. "Er is deze mythe dat Hadoop bruikbaar is als je Google-geschaalde gegevens hebt.Er zijn veel gebruikers die slechts een paar terabytes aan gegevens hebben die ze willen analyseren," zei Olson.

Cleverda's distributie voor Hadoop (CDH) is een open source pakket van vooraf geïntegreerde softwareprogramma's gebouwd rond de Hadoop Common, voorheen Hadoop Core genaamd. Het pakket omvat: Hive, dat een datawarehouse-infrastructuur biedt; HBase, de database die ten grondslag ligt aan Hadoop; Pig, een compiler voor programma's om kaarten te verkleinen; Zookeper, een planning voor het uitvoeren van applicaties op meerdere servers en MapReduce.

In de nieuw uitgebrachte versie 3 bevat het pakket drie programma's die het bedrijf heeft vrijgegeven als open-sourceprojecten, onder de open source-licentie van Apache V2. De ene is Flume, die kan helpen bij het laden van gegevens in Hadoop. Een andere nieuwe toevoeging is Oozie, een workflowbeheersoftware. De laatste is de Hadoop User Environment (HUE) -code, die een gebruikersinterface biedt voor het beheren van Hadoop.

"HUE stelt iedereen in staat een toepassing te maken die is gericht op analisten en weet hoe met de Hadoop-clusters te praten," zei Olson.

Het Cloudera Enterprise-pakket verbetert CDH-versie 3 met extra beheertools. Deze nieuwe software, die niet open source is, biedt beheerders de mogelijkheid om toegangsbeheer te regelen via het Lightweight Directory Access Protocol. Er worden ook programma's ter beschikking gesteld voor het beschikbaar stellen van middelen, voor het uitvoeren van configuratie- en prestatiebewaking.

Olson zou niet bespreken hoeveel Cloudera tot nu toe heeft gemaakt van abonnements- en advieskosten, maar merkt op dat het bedrijf in het eerste kwartaal van 2010 evenveel heeft gemaakt als wat het verdiend door de helft van 2009. Onder verschillende industrieën hebben financiële diensten, telecommunicatie, retail, overheid en web commerce bedrijven interesse getoond in de technologie, Olson zei.

"De dingen die bedrijven doen met Hadoop variëren. in het algemeen vangen deze mensen veel gegevens op uit veel plaatsen en moeten ze deze onderwerpen aan geavanceerde analyses, "zei Olson. "Financiële diensten zijn geïnteresseerd in het gebruik van Hadoop voor fraudedetectie, en in de telecommunicatie is er een reële behoefte om netwerken te optimaliseren en klantverloop te verminderen."

Naast het aanbieden van deze pakketten heeft Cloudera ondersteuning van Hadoop van leveranciers van business intelligence (BI) en gegevensbeheersoftware verzameld.

Olson is van plan om tijdens zijn keynote op de Hadoop Summit 2010, die plaatsvindt in Santa Clara, aan te kondigen, Californië op dinsdag, dat BI-leverancier MicroStrategy het gebruik van Hadoop zal ondersteunen.

Een andere nieuwe partner is Talend, een leverancier van open source data-integratiesoftware. Het bedrijf heeft zijn Talend Integration Suite uitgebreid met interface met Hadoop-databases. Met de suite kunnen beheerders meerdere gegevensbronnen beheren en samenvoegen vanaf een enkele console. Met Hadoop kan de software "native gegevens invoegen of ophalen en de gegevens verwerken binnen de Hadoop-architectuur", zegt Talend vice president marketing, Yves de Montcheuil.

Microstrategy en Talend sluiten zich aan bij een groeiend aantal bedrijven bereiden open source voor of commerciële managementtools voor Hadoop. Vorige week zijn Cloudera en Quest begonnen aan een project om software te bouwen die Hadoop kan verbinden met Oracle-databases. In mei kondigde open-source bedrijf, bedrijfsinformatiecentrum Pentaho, aan dat zijn BI-suite zou werken met Hadoop-databases.

In een afzonderlijk interview met IDG News Service wees Yahoo CTO Raymie Stata erop dat Hadoop de noodzaak voor het bouwen van supercomputers kon verminderen om grote gegevenssets te analyseren. Traditioneel zijn grote datasets verplaatst van opslag naar de supercomputer, een verzameling van te analyseren servers. Hadoop daarentegen verplaatst de analytische berekening naar waar de gegevens zich bevinden, waardoor er geen centale gigantische machine meer nodig is. Yahoo leverde een vroege bijdrage aan Hadoop.

Naast het aanbod van Cloudera wordt ook Hadoop gecommercialiseerd door IBM, dat onlangs een aantal analytische services heeft aangeboden die de technologie gebruiken.

Joab Jackson omvat enterpise-software en algemeen technologie breaking news voor The IDG News Service. Volg Joab op Twitter op @Joab_Jackson. Het e-mailadres van Joab is [email protected]