Faut-il se mettre au "Big" ?
23 février 2014
C'est devenu le nouveau mot pour faire du business, raconter des histoires, vendre des rêves de croissance et de nouveaux "business models".
Cela devrait faire trembler les firmes installées, et offrir des opportunités fantastiques à des nouveaux entrants plus malins, qui cherchent la rupture.
C'est le "Big Data". On parle même de "dataification" du monde.
Le terme désigne tout simplement la collecte, l'exploration et l'analyse de grandes masses de données : des chiffres, bien sûr, mais aussi des textes, des images, des vidéos...et encore des gênes, des étoiles..;
Cela permet de rêver - ou de cauchemarder - à un paramètrage de nos existences et à une augmentation de nos capacités de prédiction dans tous les domaines : prévoir la localisation des individus, le traffic routier, les épidémies, les incendies.
Mais c'est aussi prévoir les comportements des consommateurs, les produits qui vont se vendre, et les autres, identifier les personnes les plus intéressantes pour les assureurs ( celles qui n'auront pas d'accidents, qui resteront en bonne santé, celles qu'on appelle "les bons profils").
De plus, avec l'amélioration des performances des systèmes, et la baisse des coûts de collecte et de traitement - les données sont la plupart du temps facile d'accés et gratuites - ces "Big data" ne sont pas réservées aux grosses boîtes ou aux agences d'espionnage; tout le monde, même la plus petite start-up, y a accès. D'ailleurs les consultants et experts sont tous en train de persuader de nombreux acteurs de l'économie que leurs données, en grande masse, qui dorment chez eux, sont des pépites pour améliorer leurs diagnostics, leurs ciblages, leurs actions marketing. Tout y passe : la recherche thérapeuthique pour les industries pharmaceutiques, comme les publicités sur le web, l'estimation des primes d'assurances, mais aussi la prévention de la délinquance pour la police.
Les Etats ont bien compris le potentiel : les Etats-Unis ont annoncé un programme de recherche en 2012 "Recherche et développement big data", doté de 146 M€. En France la Commission Innovation 2030, avec Anne Lauvergeon, en a fait un des sept "défis d'avenir".
Deux questions restent apparemment encore incertaines : Comment va-t-on utiliser ces données? Et qui va les utiliser?
Comment utiliser ces données?
Trois propriétés des ces systèmes de Big data viennent perturber les informaticiens et les mathématiciens : le volume, la vitesse, et la diversité.
Le volume pose le problème de la capacité à faire des calculs sur des monstres de données, et aussi celui de la capacité à gérer une base de données géante. Google a pris de l'avance pour apporter les réponses, et populariser de nouvelles méthodes de développement comme Mapreduce, et Hadoop. Ces sujets de technologies et d'infrastructures sont, selon François Bourdoncle, CEO d'Exalead et copilote du plan Big Data en France, d'ore et déjà bien lancés.
Ce qui va contituer la prochaine vague, ce sont les solutions pour bien utiliser ces données. Et c'est là que l'on parle de vitesse et de diversité : La vitesse c'est ce qui permet de faire des mises à jour fréquentes des données comme les mots clés sur les pages web, ou les consultations des produits sur les sites marchands*; là encore, de nouvelles approches mathématiques sont nécessaires.
Quant à la diversité, cela concerne ce que l'on récolte sur un utilisateur : son nom, son âge, son adresse, la liste des sites web qu'il a visités, les commentaires qu'il a laissé, ses "like" sur facebook (il y en a trois millions par minute sur le réseau facebook), des photos, des vidéos,...Là encore les traitements sont plus compliqués. D'autant que ces données sont laissées sur des des smartphones, des tablesttes, des ordinateurs, et bientôt sur des objets connectés de toutes sortes. Impossible de rappatrier toutes les données en un seul endroit, - trop coûteux. On va alors développer des systèmes pour permettre aux "capteurs" de "bavarder entre eux pour diffuser des résultats partiels de voisin à voisin jusqu'au résultat final" ( comme indiqué dans un article du Monde de david Larousserie, paru fin janvier).
Autre problème : beaucoup de données , beaucoup de variables, de "connaissances" pour chaque individu, et qui changent tout le temps : de quoi perturber toutes les méthodes des sondeurs. C'est le phénomène du "fléau de la dimension".
Sur tous ces sujets, la Recherche est en cours. On ne sait pas encore tout. D'où cette nouvelle discipline porteuse de développement, qu'on appelle la "science des données". Des opportunités pour tous les informaticiens et mathématiciens.Ces talents deviennent de plus en plus précieux, sinon les entreprises qui possèdent toutes ces "big data" se trouveront perdues et ne sauront pas comment réellement les exploiter.
Qui va utiliser ces Big Data?
C'est un deuxième enjeu.
Certains prédisent que l'accés aux données, de plus en plus facile et gratuitement, va permettre à de nouveaux acteurs de désintermédier en partie les acteurs historiques et de capter ainsi une partie de plus en plus importante de la valeur et des clients. Grâce à la connaissance de plus en plus fine de chaque client, il est possible de croiser les données personnelles des clients, Santé, habitation, habitudes,..et ainsi de proposer des produits d'assurance et d'assistance aux clients les "meilleurs", en laissant les personnes à problèmes aux compagnies classiques et historiques. De nouveaux acteurs pourront alors se glisser dans cette relation client, comme "front office". Avec comme conséquence le détournement des clients "bons profils". On peut alors imaginer le développement de ces plateformes "désintermédiées" dans de nombreux secteurs, y compris dans les services professionnels et le Consulting, comme Youmeo.
Ce phénomène ouvre des perspectives intéressantes et importantes. A chacun, grand Groupe, entreprise nouvelle, startup, de trouver les meilleures voies pour se lancer.
Mais certains sont aussi, déjà, en train de crier au loup, comme Pierre Bellanger, qui vient de publier "la souveraineté numérique". Pour lui, nous sommes en danger : nos données privées et personnelles sont mangées et exploitées gratuitement par les géants américains, qui créent de la valeur avec, et nous les revendent avec cette valeur. Pour lui, cela constitue un pillage inadmissible. Il faut créer une protection, des sortes de "droits d'auteur" sur les données privées et personnelles. Il faut, pour lui, se dépêcher de réguler de protéger la "propriété" des données; à commencer par rappatrier les serveurs en Europe, au lieu de les laisser aux Etats Unis.Pour lui, c'est simple, en laissant exporter nos données brutes, que nous réimportons sous forme de services, nous perdons le coeur de notre valeur ajoutée, le coeur de nos emplois, le coeur de nos services.
Bon alors, le Big : est-ce que ça va nous transformer, permettre aux entrepreneurs d'émerger, aux mathématiciens d'inventer, ou bien nous toucher au coeur?
Sûrement un peu de tout ça. Tout dépend de ce que nous en ferons.
Mais on ne peut pas s'en désintéresser : ouvrons un chantier "Que faire avec les Big Data?" dans toutes nos entreprises.
Ce n'est pas suffisant. l'enjeu est géopolitique.
Rédigé par : AnnePallatin | 15 mars 2014 à 23:15