Websites

Crunching-gegevens over goedkope

PRANK: JADE IN TRANEN DOOR BOZE REGISSEUR - Prankhuis #4 | Kalvijn

PRANK: JADE IN TRANEN DOOR BOZE REGISSEUR - Prankhuis #4 | Kalvijn
Anonim

Software voor warehousing van gegevens onderzoek is duur, maar veel bedrijven zijn niettemin bereid om diep te graven, met de gok dat analytics nieuwe inzichten in hun bedrijf en een concurrentievoordeel zal opleveren. In een eerder dit jaar gepubliceerd rapport voorspelde onderzoeksbureau IDC de datawarehousing platformmarkt zal groeien van ongeveer US $ 7,9 miljard in 2009 naar ongeveer $ 10,8 miljard in 2013.

Het goede nieuws voor IT-winkels die willen beginnen met analytics, maar nu niet over het budget beschikken, is de recente opkomst van gratis software opties die tamelijk serieuze data-crunching vuurkracht bevatten.

In oktober kondigde Greenplum een ​​Single Node Edition aan van zijn MPP-database (massively parallel processing). MPP-architecturen splitsen gegevensworkloads op in meerdere delen die onafhankelijk worden beheerd op een reeks servers.

De versie met één knooppunt kan in de productiemodus worden gebruikt op één x86-server met maximaal twee CPU-sockets en onbeperkte kernen. Het kan ook worden geïmplementeerd in een enkele virtuele machine met maximaal acht virtuele kernen. Er is geen opslagkap. Single Node Edition kan ook worden gekoppeld aan een bredere Greenplum-implementatie.

Ook in oktober bracht Calpont de InfiniDB Community Edition uit, een opensource kolomgeoriënteerde database. De kolommethode kan in veel gevallen de I / O-vraag van schijven aanzienlijk verlagen in vergelijking met systemen die gegevens in rijen opslaan, en ook hogere compressieniveaus bereiken, zei analist Curt Monash van Monash Research.

InfiniDB Community Edition is ook beperkt tot een enkele server, maar heeft geen limiet op het CPU-aantal, het aantal kernen, geheugen, datavolume of gelijktijdige gebruikers.

Calpont heeft ook een commerciële versie van InfiniDB, nu in de early adopter-fase, waarmee gebruikers het systeem kunnen opschalen naar meerdere servers.

InfiniDB Community Edition volgt op de release vorig jaar van een ander open source columnar datawarehousing platform van Infobright. Deze laatste kunnen voorlopig een voorsprong hebben op InfiniDB in termen van ondersteuning door de gemeenschap; Infobright zei onlangs dat de software meer dan 15.000 keer is gedownload.

Uiteindelijk hebben deze gratis data-warehousing-opties hun limieten en waarschijnlijke gebruiksscenario's volgens Monash.

"Als u één analist of klein bedrijf hebt team van analisten die vroeg verkennende zoekopdrachten uitvoeren tegen enkele terabytes aan gegevens of minder, dan zullen deze producten waarschijnlijk de klus klaren, "zei hij.

Bedrijven hebben misschien ook niet het budget om iets anders aan te schaffen, of kunnen geen financiering krijgen Zonder een eerste proof of concept uit te voeren, voegde Monash eraan toe.

"Er zijn zeker workloads waarvoor ze onvoldoende zijn, en je zult geld moeten betalen voor een product dat het werk voor je doet," zei hij. "Maar als u meer waarde uit uw gegevens wilt halen, kunnen deze gratis producten een geweldige plek zijn om te beginnen."