Kritik gibt es an "Big Data" vor allem dahingehend, dass die Datenerhebung und -auswertung oft nach technischen Aspekten erfolgt, also dass beispielsweise der technisch einfachste Weg gewählt wird, die Daten zu erheben und die Auswertung von den Möglichkeiten, diese Daten zu verarbeiten, begrenzt wird. Statistische Grundprinzipien wie das einer repräsentativen Stichprobe werden oft vernachlässigt. Es gilt:
Viele Fragestellungen erfordern tief greifende Recherchen – eine Korrelation ist eigentlich nur der Anfang. Statistisch gesehen mögen viele Antworten stimmen. Sind die Aussagen auch noch populär, dann beglücken sie uns. Jedoch ist es in der Praxis oft ungeheuer schwierig, im Heuhaufen belangloser Korrelationen jene Stecknadel zu finden, die eine wahre Ursache darstellt. Anders als es scheinen mag, sind solche Funde nicht die Regel, sondern die Ausnahme. Doch es gibt sie. Wie etwa die „Britische Ärzte-Studie“, die ein halbes Jahrhundert währte, einen klaren und ursächlichen Zusammenhang zwischen Rauchen und Lungenkrebs offenbarte – und die meiste Zeit ganz ohne Computer und Big-Data auskam.