Android

Bedrijven bieden services voor het crunchen van Gov't Raw-gegevens

Gov't Mule - "I'd Rather Go Blind" @ Moulin Blues Ospel 2016

Gov't Mule - "I'd Rather Go Blind" @ Moulin Blues Ospel 2016
Anonim

Wat als een Amerikaanse president opriep tot het vrijgeven van een heleboel overheidsgegevens, maar de ruwe cijfers waren moeilijk te begrijpen?

A een handvol bedrijven en een open-sourceontwikkelingsproject proberen ervoor te zorgen dat dit niet gebeurt, aangezien de Amerikaanse president Barack Obama in de begindagen van zijn bestuur voor open overheid aandringt.

De bedrijfsmodellen verschillen, maar sommige bedrijven gebruiken de onbewerkte gegevens die op Data.gov en elders zijn vrijgegeven om de kracht van hun data-publishing- en nummer-crunching-services te demonstreren.

De release van al deze gegevens is een goede zet, maar veel ervan is in een onbewerkt formaat, waardoor het is moeilijk om het te presenteren op een manier die mensen kunnen begrijpen, zei Kevin Merritt, CEO en oprichter van Socrata, een twee jaar oud bedrijf dat zich richt op het helpen van overheidsinstellingen en andere gebruikers van de gegevens om het te reorganiseren en opnieuw te publiceren op het web.

Socrata noemt zijn ser ondeugd van het reorganiseren van de gegevens in gemakkelijk te lezen, interactieve grafieken en grafieken "sociale gegevens ontdekking."

"De gegevens zijn waardevol, maar de sociale gegevens zijn ook waardevol," zei Merritt, een voormalig Microsoft executive. "Het is één ding om de gegevens online te zetten, maar het is een ander ding om daadwerkelijk een civic feedback-loop te krijgen."

Alleen op Data.gov waren er bijna 400 onbewerkte datasets beschikbaar vanaf woensdagochtend.

Er is een database van mensen, gerapporteerd per land en regio, verleend asiel in de VS tussen 1998 en 2008; er zijn gegevens over giftige chemicaliën vrijgegeven in Guam in 2005; er is een database van tornado's, grote hagel en schadelijke wind rapporten van 1950 tot 2006; er zijn gegevens over de geochemie van watermonsters in de VS.; en er is een database van kopersmelterijen over de hele wereld.

Er zijn ook gegevens over octrooiaanvragen, dodelijke ongevallen op de werkplek, federale IT-uitgaven en trekvogels. Er zijn nog eens 109.000 geografische gegevenssets.

Vivek Kundra, federale CIO, werd op een recent forum van de Amerikaanse Federal Communications Commission gevraagd naar de filosofie van Obama over het vrijgeven van gegevens. "We weten niet echt welke datafeeds zullen leiden tot een betere analyse," zei hij. "Wat we doen is, we proberen zoveel mogelijk gegevens vrij te geven. Als gevolg daarvan vinden we heel wat innovatie gaande."

Omdat de gegevens worden vrijgegeven, hebben veel Amerikaanse inwoners spotten trends die overheidswerkers nog niet eerder hadden gezien, voegde hij eraan toe. Bijvoorbeeld, op basis van gegevens over welke vluchten van luchtvaartmaatschappijen doorgaans te laat zijn, beginnen vliegers op bepaalde tijden van de dag vluchten van bepaalde luchtvaartmaatschappijen te vermijden, zei hij.

Socrata richt zijn producten op overheidsinstellingen, evenals op journalisten, onderzoekers en andere mensen die de ruwe gegevens zinvol willen maken. Het biedt een handvol producten, waaronder een gratis instapmodel waarmee iedereen gegevens kan hosten op Socrata.com en een gehoste gegevenssite voor grote organisaties. Socrata kan overheidsinstellingen helpen de kosten voor het opslaan en leveren van gegevens te verlagen, aldus Merritt.

Socrata herformatteert gegevens van verschillende formaten en stelt gebruikers in staat om de gegevens te delen op Twitter, Digg, Facebook en andere websites. Het bedrijf werkt vanuit een filosofie dat gegevens moeten worden gedeeld, zei Merritt.

"Gegevens worden waardevoller naarmate het zich verder verspreidt vanuit de bron," zei hij. "De theorie is dat hoe verder de bron wordt verwijderd, hoe meer mensen er gebruik van hebben gemaakt en daarom moeten gegevens intrinsiek waardevoller zijn."

Andere bedrijven, waaronder iCharts en Visual i / o, gebruiken de overheidsgegevens die nog steeds worden vrijgegeven om de kracht van hun visuele analyse of producten voor het publiceren van kaarten te tonen. Daarnaast is Sunlight Labs, gestart door de Sunlight Foundation, bezig met de ontwikkeling van open-source software die gebruikmaakt van overheidsgegevens, en moedigt andere ontwikkelaars aan hetzelfde te doen. Dit jaar organiseerde Sunlight Labs twee wedstrijden om applicatieontwikkeling aan te moedigen op basis van overheidsgegevens, en het heeft meer dan 90 inzendingen gekregen.

Een deel van de reden dat de Sunlight Foundation Sunlight Labs oprichtte, was om traditionele en burgerjournalisten te helpen met onderzoeksrapporten, zei Clay Johnson, directeur van Sunlight Labs.

"Naarmate de regering-Obama meer gegevens begint vrij te geven, zijn er niet genoeg vingers op toetsenborden hier in Sunlight Labs om dit allemaal aan te kunnen, "zei Johnson. "Is de regering-Obama geslaagd in het beschikbaar maken van meer overheidsgegevens? U spreekt met de kerel met de meest onstilbare honger daarvoor, die nooit zal zeggen dat ze succesvol zijn." ICharts richt zich niet uitsluitend op de overheid gegevens, maar werkt om uitgevers van websites informatie te laten presenteren in een doorzoekbaar, gemakkelijk te verwerken formaat, zegt Seymour Duncker, de oprichter en CEO van iChart. "Er is een enorme hoeveelheid open data, bijvoorbeeld geproduceerd door de overheid en via universiteiten," zei hij. Er is een mogelijkheid om die gegevens voor iedereen toegankelijk te maken, voegde hij eraan toe. <> Obama's streven naar transparantie van de overheid geeft iCharts veel nieuwe onbewerkte gegevens om mee te werken, zei hij. "We zien dat het verstrekken van de onbewerkte gegevens niet voldoende is," voegde Duncker eraan toe. "Je moet context bieden, ik zie hier een nieuwe waardeketen ontstaan."

Bijvoorbeeld, een van de grafieken van iChart op de voorpagina volgt het Amerikaanse bruto binnenlands product van 1948 tot 2009. Dit jaar, zoals verwacht mag worden in een recessie is het bbp aanzienlijk lager.

Visual noemt zijn producten visuele analysesoftware. Gebruikers kunnen interactieve grafieken en grafieken maken en deze delen met anderen via Visual i / o's webgebaseerde tools, zegt Angela Shen-Hsieh, Visual i / o president en CEO. Gebruikers van de diagrammen kunnen met een paar klikken verschillende weergaven maken op basis van verschillende parameters.

"Wanneer u naar de Data.gov-gegevenssets kijkt, worden ze interessant wanneer u ze samen opruimt," Shen - Zei zei. De gegevens worden nuttiger naarmate gebruikers gegevenssets overlappen, zoals chronische ziekten met geografische informatie, voegde ze eraan toe.

Twee IT-analisten zeiden dat ze een groeiende trend van bedrijven als iCharts en Visual i / o zien aan de hand van overheidsgegevens om hun producten te demonstreren. Diensten. Maar zowel Shawn McCarthy, een analist van de overheidsleverancier bij IDC, als David Curle, hoofdanalist bij Outsell, vroegen zich af of een bedrijf een bedrijfsmodel volledig kon bouwen op herbestemming van overheidsgegevens. Er lijken beperkte verkoopkansen buiten verkoop te zijn de hergebruikte gegevens terug naar overheidsinstanties, en met de gegevens die beschikbaar zijn voor iedereen, zou het potentieel voor concurrentie groot zijn, zei Curle.

Veel openbare belangengroepen maken al kaarten en grafieken met overheidsgegevens, voegde McCarthy eraan toe.

"Wat ik heb gevonden is dat de meeste gegevens die ik heb gezien, verder moeten worden bewerkt om het echt waardevol te maken," zei hij. "Iedereen die de gegevens pakt en er iets mee doet, heeft er waarschijnlijk waarschijnlijk waarde aan toe."