Deel dit artikel
-

‘Met Big Data geven wij antwoord waar Google dat niet kan’

Na 2,5 jaar bouwen en testen opent het Nederlandse Dataprovider.com vandaag de deuren. Het bedrijf indexeert de eigenschappen van zoveel mogelijk sites in een land. Met die ‘big data’-sets kan het strategisch waardevolle vragen voor ondernemers, financiers en onderzoekers beantwoorden.

Ondernemer Marc Noët schetst een aantal eenvoudige scenario’s. “Bijvoorbeeld: Hoeveel webwinkels verkopen wijn vanuit Amsterdam. Dat zijn er 43. Of: Hoeveel .nl-domeinen hebben een website. Die vraag kon het SIDN niet beantwoorden, noch de hosters zelf. Ons systeem weet dat van de 4,9 miljoen .nl-domeinen 23,9 procent een site bevat.”

Complexere vragen komen bijvoorbeeld van investeerders of diensten als Experian of European Directories. De laatste categorie heeft zelf enkel vrij basale informatie over het offline functioneren van de bedrijven die het kent. Dataprovider.com kan alle vermeldingen desgewenst aanvullen met informatie en benchmarks van het web. Investeerders kunnen er op hun beurt marktanalyses mee doen. Andere bedrijven kunnen het voor verkoop en service inzetten.

Dataprovider.com liet afgelopen jaren honderden servers per land zoeken naar de eigenschappen van bedrijven en sites en kan de verbanden daartussen leggen. Directeur Noët: “Google en Bing kunnen geen zicht geven op gerichte vragen, lijsten en contexten. Ze kijken naar de inhoud van een site, niet naar de eigenschappen. Dat doen wij wel. We kennen meer dan tienduizend mogelijke variabelen.”

De lancering van de site komt niet helemaal uit de lucht vallen. Dataprovider.com is een zusterbedrijf van Lipperhey, een online specialist in statistieken die sites doormeet. “We hadden de indexeringstechnologie dus al in huis. Zo’n drie jaar geleden kwam ik voor een vraag te staan die met de huidige technologie niet was op te lossen. We zijn Lipperhey gaan uitbreiden met heel veel variabelen.”

Typische klanten moeten instanties worden met geraffineerde kennis- of verrijkingsvragen. Maar ook eigenaren van grote datasets die hun materiaal niet naar Google willen uploaden voor analyse beginnen aan te kloppen. Een gebruiker betaalt per gedownloade dataset of kan abonnementen nemen die groter worden naarmate er meer zoekopdrachten worden gedaan en weergegeven. De prijs per maand loopt op tot 2.750 dollar.

“Beursgenoteerde bedrijven hebben ons systeem al getest. Hun ogen gingen open.”

In theorie zouden Wolfram Alpha en Apple Siri de diensten van het Nederlandse bedrijf ook kunnen inzetten. “Wij zijn enkel de dataleverancier en bieden derde partijen toegang via een API.”

Dataprovider.com start met datasets van twaalf afzonderlijke landen, waaronder Nederland. De indexering van het web in Amerika, Duitsland en Engeland loopt nu. In september wil het zusterbedrijf van Lipperhey die markten commercieel kunnen bedienen. Landen met andere tekensets, Rusland en Aziatische landen, zouden daarna kunnen volgen.

“Het werken met Big Data is een prille markt die net in opmars is. Met onderzoeken, statistieken, lijstjes en praktische scenario’s gaan we de markt informeren.”

Voor zeven werkterreinen creëerde het team in Amsterdam en Groningen voorbeeldvragen: E-commerce, Locatie, Marketing, Technische specificaties, Zakelijk, Hostinginformatie en Content. “Naast een vooraf gedefinieerd zoekplan kunnen gebruikers ook hun eigen zoekopdracht samenstellen. Het resultaat van een zoekopdracht is altijd een lijst met websites die voldoen aan de zoekopdracht.“

Over de rol van social media voor e-commerce weet Dataprovider bijvoorbeeld te melden, dat van de 45.806 webwinkels in Nederland de meeste Twitter inzetten (41 procent), gevolgd door Facebook (37 procent) en Google+ (20 procent). Hyves speelt met 1,6 procent geen rol van betekenis.

Foto: Kevin Krejci (cc)

Deel dit bericht

2 Reacties

Remko

Wij zijn in ieder geval nu al benieuwd naar de uitgebreide mogelijkheden. Het klinkt veelbelovend in ieder geval.

M. Roelofs

i say. als het klopt- geniaal. en daar ga ik van uit

Plaats een reactie

Uw e-mailadres wordt niet op de site getoond