Des données comme matière première
Depuis une vingtaine d'années, la plupart des données produites sont dématérialisées. Des informations qui sont directement créées par l'homme (textes, données chiffrées, images fixes ou animées, sons...), par des systèmes techniques (données de connexion, télépaiements, télescopes, capteurs environnementaux, péages routiers...) ou encore par les outils interconnectés (cartes de transport, véhicules, mobilier intelligent, GPS...). Nombre de ces données font déjà l'objet d'un traitement statistique de masse, le plus souvent par les géants d'Internet comme Google, Facebook ou encore Yahoo!, par des opérateurs téléphoniques, par les banques et les assurances ou par certains organismes publics (universités, sécurité nationale...). Leur volume augmente de manière exponentielle et pourrait, selon les prévisionnistes, être multiplié par 100 d'ici à 2020.Des compétences techniques pointues
La dématérialisation des échanges est telle qu'aujourd'hui un grand nombre d'entreprises se trouvent en possession d'une masse colossale et en constante augmentation d'informations, concernant notamment leurs clients et leurs prospects. Les difficultés qu'elles rencontrent, dans la mise en place d'une démarche Big data, portent ainsi davantage sur le traitement de ces données que sur leur recueil.Le déploiement du Big data combine le plus souvent deux approches. Une augmentation des capacités de stockage de données via des solutions permettant un ajustement progressif des besoins, comme c'est le cas avec le « cloud », par exemple. Et le développement de bases de données et d'algorithmes aptes à extraire en continu des enseignements pertinents d'une masse évolutive de données multistructurées. Ce développement s'appuyant généralement sur des solutions comme NoSQL, Redis, Hadoop ou encore HBase. Sans surprise, la mise en place de ces solutions informatiques impose le recours à des spécialistes de la gestion et de l'analyse des données de masse (data scientist, data analyst, data officer...).- de cibler avec précision leurs offres commerciales (en croisant les données, il est possible de connaître l'activité professionnelle d'un client, ses loisirs, ses habitudes de consommation...) ;
- de répondre immédiatement à l'expression du besoin d'un client ou d'un prospect (l'analyse en temps réel des données permet, par exemple, d'adresser une promotion en rapport avec le sujet d'un tweet ou d'un courriel rédigé par un internaute) ;
- d'anticiper une tendance, un comportement de masse et de s'y préparer (l'analyse du comportement d'un échantillon de population représentatif doit permettre, avec plus ou moins de précision, de définir le comportement d'un plus grand nombre d'individus).Mais le Big data ne s'arrête pas là. Il permet également :
- la création de nouveaux services, comme la prévision des déplacements des populations à partir des données de géolocalisation que proposent désormais certains opérateurs téléphoniques ;
- la mise en place d'une agriculture dite « de précision » permettant, via l'analyse des données climatiques, de photos satellites, de données sur la composition des sols, de limiter les apports d'eau, d'engrais ou de pesticide aux seules zones qui, dans un champ, en ont besoin ;
- d'améliorer l'expérience client dans le tourisme et la culture (meilleure gestion des files d'attente, anticipation des besoins...) ;
- d'améliorer les services des assureurs grâce à une meilleure identification des risques (tarification plus adaptée au client, détection facilitée des comportements frauduleux...) ;
- d'optimiser les processus de recherche fondamentale dans le domaine de la santé, mais aussi la mise au point des médicaments.