Components

'Analytische database' van Aster Data Updates

How to Make Inserts, Updates, and Deletes Faster: Databases for Developers: Performance #8

How to Make Inserts, Updates, and Deletes Faster: Databases for Developers: Performance #8
Anonim

Opstart Aster-gegevenssystemen heeft de 3.0-versie van zijn analytische nCluster-database op dinsdag vrijgegeven, waardoor het ideaal is voor "frontline" datawarehousing.

"Traditioneel denken we datawarehousing als een back-office-taak," schreef Aank CEO Mayank Bawa in een blog na dinsdag. "Het datawarehouse kan in afzonderlijke laadvensters worden geladen, ladingen kunnen te laat worden uitgevoerd (het netto-effect is dat zakelijke gebruikers hun rapporten te laat krijgen); loads, backups en scale-up kunnen data warehouses offline nemen - wat OK is sinds deze taken kunnen op niet-zakelijke uren (nachten / weekends) worden gedaan. "

Maar de klanten van Aster, waaronder aCerno, een netwerk voor het adverteren van internet," vertrouwen op data-analyse voor hun inkomsten ", zei Bawa.

Aster's nCluster 3.0 verspreidt workloads over een aantal servers en maakt het eenvoudig om extra machines toe te voegen voor meer kracht. De software splitst ook de verschillende componenten van de werkbelasting van de gegevensanalyse op in afzonderlijke stukken.

Een "loader" -laag houdt zich bezig met het laden en exporteren van gegevens van en naar externe bronnen; een "worker" -laag slaat gegevens op lokaal verbonden schijven op voor bevraging; en een laag "queen" -knooppunten voert intelligente queryplanning en -verwerking uit.

Intussen werken gebruikers met het cluster alsof het een enkele entiteit is.

De mogelijkheid om segmenten van het cluster selectief te schalen, betekent dat gebruikers resources kunnen toevoegen in gebieden waar ze het meest nodig zijn, zegt Aster.

Tot deze kernmogelijkheden voegt de 3.0-release een aantal functies toe voor "always-on" -gebruik, waaronder de mogelijkheid om capaciteit toe te voegen, gegevens opnieuw in balans te brengen en gegevens te herstellen terwijl de systeem is live.

Aster werkte ook om parallellisatie toe te voegen door het systeem, volgens een bedrijfsfunctionaris.

"We willen systemen bouwen die 10x, 100x meer gegevens kunnen verwerken dan welk ander systeem dan ook. veel gegevens voor elke productserver, "zei CTO Tasso Argyros in een blogpost. "We hebben dus veel R & D-inspanningen gedaan om alle functies van het systeem parallel te gebruiken - niet alleen query's, maar ook laden, gegevensexport, back-up en upgrades. Bovendien laten we onze gebruikers kiezen hoeveel ze willen parallelliseren met alle deze functies, zonder het hele systeem te hoeven opschalen. "

De release bevat ook ondersteuning voor MapReduce, een programmeertechniek die oorspronkelijk door Google is ontwikkeld en waarmee ontwikkelaars gemakkelijker programma's kunnen schrijven voor het analyseren van grote hoeveelheden gegevens. Aster's concurrent Greenplum heeft onlangs ook MapReduce-ondersteuning aangekondigd.

Extra functies omvatten de mogelijkheid om datacompressieniveaus voor afzonderlijke tabellen te selecteren, een "éénklik" -upgradatietool; en betere beveiligingsfuncties, zoals LDAP (Lightweight Directory Access Protocol) voor verificatie en de mogelijkheid om gebruikersrechten te beheren op cluster-, database- en tabelniveau.

Veel van de eerste klanten van Aster, waaronder ook MySpace, zijn webgericht, zei Curt Monash, president van Monash Research.

"Een enorm deel van de groei en de mogelijkheid in datawarehousing ligt in het omgaan met relatief nieuwe soorten data," zei hij. "Er zijn grote data warehouses die zich bezighouden met traditionele OLTP, transactiegegevens, maar Aster is niet noodzakelijkerwijs een toonaangevende concurrent in het analyseren van dit. De zoete vlek in het analyseren van grote hoeveelheden gegevens zijn momenteel webgegevens en bijbehorende netwerkgebeurtenissen."

Monash geciteerd parallelle verwerkingsadministratie en ondersteuning voor MapReduce als de belangrijkste sterke punten van Aster: "Aster is een startup met een relatief onvolwassen product, maar er is veel over nagedacht om parallelle verwerking eenvoudig te beheren."

NCluster 3.0 wordt uitgevoerd op standaard x86-servers. De prijs is gebaseerd op de hoeveelheid gegevens die wordt beheerd. Het bedrijf zei eerder dat de kosten beginnen bij US $ 100.000.