Varför stora data är råolja - medan rik data är raffinerad och det ultimata i BI
NyheterDet pratas som en epok-definierande förändring, men stora data på egen hand är värdelösa. Skapad genom att kombinera öppna, fritt tillgängliga data med data som ägs av både medborgare och företag är "rik data" en mycket mer värdefull produkt.
Vad är skillnaden mellan stor data och rik data?
"Det är som skillnaden mellan råolja och raffinerad olja", säger dr. Rado Kotorov, chef innovationsofficer hos informationsbyggare. "Kombinera data ger nya sammanhang och nya användarfall för data. Till exempel kan kombinering av sociala mediedata med transaktionsdata ge insikt i inköp och därmed leda till produktinnovation."
Rika data skapas genom att kombinera data från olika system. Rika data har sammanhang och är sålunda praktiskt användbara för både företag och privatpersoner. "Kreditkortsföretag säljer benchmarking data till handlare," säger Kotorov. "Dessa köpmän kan se allmänna marknadsutvecklingar och jämföra dem med sina egna observationer av marknaden för att fatta bättre beslut eller förstå luckor i sin egen verksamhet."
Kontext är allt - en studie nyligen i Harvard Business Review visar att platsbaserade erbjudanden till shoppare ökar oddsen för inköp med 76%. Rika data kan hjälpa vårdgivare och till och med bekämpa brott också.
Varför behöver vi rik data?
Rika data är inget annat än den senaste affärsinformationen. "Rika data kan användas för att svara på olika typer av frågor som tidigare hade varit svåra", säger Southard Jones hos Cloud Business Intelligence och analysföretaget Birst. "Att länka upp flera informationskällor kan hjälpa till att se saker på nya sätt eller över hela processen, i stället för bara ett lags ansvar."
Tänk för exempel ett säljteam som analyserar vilka produkter som ska säljas till vilka kunder. I stället för att titta på försäljningsdata i isolation för att se vem som köpt det senaste året, är en rik datametod att se bortom försäljningsdata och se effekten av marknadsföringskampanjer och finansiera (hur snabbt kunden betalar) också.
Rikta uppgifter handlar om att förutsäga beteende. Att sälja rätt produkt till rätt person till rätt pris är vad försäljningen handlar om, men ingen av detta beror för närvarande på data. "Försäljningen är ofta beroende av tarmens känsla och erfarenhet", säger Jones. "Att ersätta det med ett system där kundens benägenhet att köpa är tydligt angivet gör att försäljningen kan prioritera sina ansträngningar och förbättra produktiviteten och noggrannheten."
Vad är fel med stora data?
Det är alldeles för grunt att använda. "Molnens beräkningsstyrka har gjort det möjligt för oss att samla, lagra och bearbeta stora datamängder, men med stora data är det oundvikligt att vi också kommer att samla in mycket dubbletter, avvikelser och duds", säger Nigel Beighton, VP of Technology , Rackspace, som säger att utan stora data kan vi inte ha rik data. "Rika data är diamant i grovt."
Jon Cano-Lopez, VD för REaD Group"Vi säger ofta till våra kunder att medan deras egna kunddata är mycket noggranna eftersom de speglar deras faktiska transaktioner, kan det vara ganska begränsat när det gäller det totala djupet det ger", säger Jon Cano-Lopez, VD för REaD Group. "Ett telekomföretag kommer att veta hur folk använder sina telefoner och data, deras geografiska läge, och även vem deras vänner är via deras telefonnummer", säger Cano-Lopez. "Men de vet inte vem folket verkligen är, vilket jobb de gör, vad deras intressen är, hur mycket de tjänar, deras familjesammansättning och vad som gör dem frikänna."
Ostrukturerad data kan berätta om två till synes identiska tunga användare, men titta närmare och en person kan vara en högvolym företagsanvändare, medan den andra är en socialite med många vänner. Ett extra, "rik" lager av data kommer att lägga till djupet, vilket hjälper till att identifiera ett sant värde för en kund. "Kombinera transaktionsdata som är baserade på en kunds verksamhet, med deras livsstilsinformation, ger en mycket fylligare bild", säger Cano-Lopez.
Vilka fördelar kan medföra rik data?
Det är möjligt att skapa stor potentiell nytta genom att berika data och använda den i realtid. "Medicinska data och ostrukturerad data i form av kliniska personalenoter minskar för att stödja tidigare diagnoser av tillstånd som sepsis (blodförgiftning)", säger Matt Pfeil, Chief Customer Officer hos DataStax. "Detta innebär realtidsjämförelse av patientdata mot en centraliserad, anonym uppsättning data."
Att skapa rik data gör det möjligt att upptäcka livshotande förhållanden och behandlas tidigt, men endast om patientens samtycke föreligger. deras anonymiserade data kan användas i framtiden för behandling av andra.