Android

Ex-Google, Yahoo Staffers geven Hadoop-distributie vrij

Ranking Relevance in Yahoo Search

Ranking Relevance in Yahoo Search
Anonim

Een startup die Cloudera op maandag heette, publiceerde publiekelijk de distributie van het open source Hadoop-gedistribueerde computerraamwerk, in de hoop enterprise-gebruikers te verkopen op het systeem van Google, Yahoo en anderen om grote gegevenssets te verwerken.

Cloudera, dat werd gelanceerd door voormalige Google-, Yahoo-, Oracle- en Facebook-medewerkers van vorig jaar, hebben de eerste klanten ondersteuning geboden voor Hadoop.

"Een van de terugkerende thema's die we hebben gehoord tijdens het werken met onze klanten en de gemeenschap is dat de configuratie en implementatie van Hadoop is een pijn, "zei Cloudera-medewerker en voormalig Googler Christophe Bisciglia in een blogpost. "Om ervoor te zorgen dat Big Data de onderneming echt verstoort, moet Hadoop net zo eenvoudig worden geconfigureerd, geïmplementeerd en beheerd als elk ander stukje software."

[Lees meer: ​​de beste tv-streamingdiensten]

Daarom heeft Cloudera besloten om zijn distributie, die beschikbaar is als een RPM-bundel voor systemen met Red Hat Linux, en een afbeelding voor Ama's Elastic Compute Cloud (EC2) vrij te geven.

De distributie is kosteloos beschikbaar, onder de Apache 2-licentie. Door het pakket vrij te geven, hoopt Cloudera ongetwijfeld dat meer bedrijven een kijkje gaan nemen bij het gebruik van Hadoop en vervolgens op de ondersteunende services van Cloudera tikken, waarvoor de prijsinformatie niet meteen beschikbaar was.

Cleverda's distributie bestaat uit drie componenten: het Hadoop-bestandssysteem, die op grondstoffenmachines kunnen lopen; een implementatie van het MapReduce-raamwerk dat oorspronkelijk door Google is ontwikkeld voor parallelle verwerking van grote gegevenssets; en Hive, een data warehousing-laag die de op SQL gebaseerde HQL-taal gebruikt voor bevraging.