Den "alternative data”Bransjen, som selger informasjon som nedlasting av apper og kjøp av kredittkort til investeringsgrupper, unnlater å slette personlige detaljer tilstrekkelig før de deler materialet, ifølge flere hedgefond.
Den raskt voksende verdenen av big data blir sett på som en stadig mer attraktiv kilde til informasjon for kapitalforvaltere som søker en viktig investeringskant, med dataleverandører som selger alt fra skravler i sosiale medier og mottatte e-postmeldinger til føderale lobbydata og til og med satellittbilder fra verdensrommet. Men flere hedgefond sier at noen leverandører selger informasjon som fremdeles inneholder sensitiv personlig informasjon som kan brukes til å identifisere enkeltpersoner.
"Leverandørene hevder å stripe ut all personlig informasjon, men vi finner noen ganger telefonnumre, postnummer og så videre," sa Matthew Granade, sjef for etterretningsansvarlig ved Steven Cohens Point72. "Det er en stor nok avtale at vi har et par teknikere på heltid som vasker dataene selv."
Lederen for et annet stort hedgefond sa at selv når personlig informasjon hadde blitt skrubbet fra et datasett, var det altfor lett å gjenopprette. "Vi ble sjokkert over hvor lett det var å av anonymisere dataene," sa han. "Det tok en av analytikerne mine 30 minutter å oppdage noen som antagelig hadde en affære."
Sofistikerte algoritmiske tilnærminger som "maskinlæring”La pengene forvaltere å sile gjennom enorme datasett for lønnsomme mønstre. Tabb Group, et konsulentfirma, anslår at alene i USA vil utgiftene til big data dobles i løpet av de neste fem årene til $ 400m, mens CB Insights, en dataleverandør, har telt minst 30 oppstarter i feltet.