Qu’est-ce que le Big Data ?
Big Data : définition simple
Avec le développement des nouvelles technologies, d’internet et des réseaux sociaux, la production de données numériques est en croissance constante. L’expression « Big Data » (traduite en français par « mégadonnées » ou « données massives ») désigne la masse hétérogène des données numériques produites par les entreprises et les particuliers dont les caractéristiques (très grand volume, diversité de forme, vitesse de traitement) requièrent des outils informatiques de stockage et d’analyse spécifiques de plus en plus sophistiqués.
D’où proviennent les données du Big Data ?
Les données numériques produites proviennent en partie de l’utilisation d’appareils connectés aux réseaux de téléphonie mobile et à internet.
Ainsi, les smartphones, tablettes et ordinateurs transmettent des données relatives à leurs utilisateurs lors des actions suivantes : émission de signaux GPS des smartphones, navigation internet, utilisation des moteurs de recherche, messages laissés sur les réseaux sociaux, téléchargement et utilisation d’applications, publication en ligne de photos et vidéos, achats sur des sites de vente en ligne, etc. De la même manière, les cartes bancaires transmettent des données lorsqu’elles sont utilisées pour des retraits ou des paiements, par exemple.
Les objets intelligents connectés transmettent des données sur l’utilisation que font les consommateurs de certains objets du quotidien (par exemple, pour une voiture, puce connectée indiquant le trajet et la distance parcourus ainsi que la vitesse moyenne).
En dehors des appareils connectés, les données du Big Data proviennent de sources très diverses : données démographiques, données climatiques, données scientifiques et médicales, données de consommation énergétique, données issues de l’utilisation des réseaux de transports, de la fréquentation des lieux publics, etc. Nouvelle source importante de données : l’open data, à savoir le partage des données de l'Etat, des établissements publics et des collectivités.
Toutes ces données fournissent des informations sur la localisation des utilisateurs des appareils, leurs déplacements, leurs centres d’intérêt, leurs habitudes de consommation, leurs loisirs, leurs projets, etc. Mais également des informations sur la façon dont sont utilisés les infrastructures, machines et appareils.
Avec l’augmentation permanente du nombre d’utilisateurs d’internet et de téléphones mobiles, le volume des données numériques croît de manière fulgurante.
Volume des données du Big Data
Chaque jour, environ 2,5 quintillions de bytes de données numériques sont produits. En 2018, 90 % des données numériques dans le monde ont été créées au cours des deux années précédentes seulement (source : IBM 2019).
L’analyse des données issues du Big Data
Qu’est-ce que l’analyse du Big Data ?
Des solutions de stockage innovantes (cloud computing, super calculateurs hybrides, etc.) couplées à des logiciels exploitant des algorithmes informatiques sophistiqués permettent l’analyse de ces gros volumes de données numériques. Ces outils sont conçus pour détecter les informations pertinentes et établir des corrélations entre elles. Si l’analyse de la donnée, également appelée « Data Mining », existait déjà dans de nombreuses entreprises, cette activité a pris une ampleur nouvelle avec l’arrivée du Big Data. On parle aujourd’hui de science de la donnée (ou « datascience »).
Un des enjeux actuels du Big Data est la mise au point d’outils complexes permettant de traiter et de mieux visualiser, analyser et cataloguer les flux énormes de données.
À quoi sert l’analyse du Big Data ?
Cette analyse permet par exemple:
- de comprendre les besoins des individus et les contraintes des usagers ;
- d’adapter les infrastructures, réseaux et services (notamment services publics) en fonction de leur utilisation ;
- d’assister la prise de décision des différents acteurs économiques (entreprises, administration) ;
- d’analyser et d’anticiper les comportements des consommateurs (analyse prédictive) ;
- de faciliter l’évaluation des services ;
- d’améliorer l’utilisation des machines et appareils (amélioration des performances, prévention des pannes, maintenance).
Les applications concrètes du Big Data
Dans le domaine de la santé, par exemple, le Big Data favorise une médecine préventive et personnalisée. Ainsi, l’analyse des recherches des internautes sur un moteur de recherche a déjà permis de détecter plus rapidement l’arrivée d’une épidémie de grippe. Dans un futur proche, les appareils connectés devraient permettre l’analyse en continu des données biométriques des patients.
Dans le domaine des transports, l’analyse des données du Big Data (données provenant des pass de transport en commun, géolocalisation des personnes et des voitures, etc.) permet de modéliser les déplacements des populations afin d’adapter les infrastructures et les services (horaires et fréquence des trains, par exemple).
Dans le domaine de la gestion énergétique, l’analyse des données issues du Big Data intervient dans la gestion de réseaux énergétiques complexes via les réseaux électriques intelligents (smartgrids) qui utilisent des technologies informatiques pour optimiser la production, la distribution et la consommation de l’électricité.
De la même manière, l’analyse des données provenant de capteurs sur les avions (données de vol) associées à des données météo permet de modifier les couloirs aériens afin de réaliser des économies de carburant et d’améliorer la conception et la maintenance des avions.
Il existe des utilisations concrètes du Big Data dans de nombreux autres domaines : recherche scientifique, marketing, développement durable, commerce, éducation, loisirs, sécurité, etc.
Faut-il avoir peur du Big Data ?
L’usage du Big Data est strictement encadré. En France, les opérateurs intervenant dans la collecte et l’analyse des données sont soumis à la surveillance de la Commission nationale de l’informatique et des libertés (CNIL). L’usage des données à caractère personnel est réglementé par la loi Informatique et Libertés. Cette loi précise que les données personnelles doivent être collectées et traitées avec un objectif précis : seules les données pertinentes pour un usage défini peuvent être collectées. La loi reconnaît aussi le droit à toute personne d’être informée de la collecte et de l’utilisation de ses données personnelles. En principe, chaque personne peut décider elle-même de l'utilisation des données la concernant.
Le Big Data est donc soumis aux exigences de la CNIL et ses usages directement concernés par le cadre législatif en vigueur.
À noter : un nouveau règlement européen sur la protection des données personnelles entrera en application le 25 mai 2018. Ce règlement prévoit une transparence accrue sur l'usage des données personnelles collectées. En particulier, de nouvelles obligations s’imposeront aux opérateurs collectant des données personnelles : ceux-ci auront l’obligation de s'assurer du consentement des individus (et d'être en capacité de le prouver) pour la collecte et le traitement de leurs données. Ils devront également mettre en place tous les dispositifs nécessaires pour sécuriser ces données contre des risques comme la perte, le vol ou encore la divulgation.
Droit à l'oubli et internet
La Cour de justice de l’Union européenne oblige les moteurs de recherche à mettre en œuvre un « droit à l’oubli », c’est-à-dire une suppression des données personnelles sur demande des utilisateurs.
Les enjeux du Big Data dans le domaine bancaire
Des données pour améliorer la relation client
La stratégie Big Data des banques vise à améliorer la connaissance de leurs clients et à instaurer un lien de plus grande proximité afin de répondre de façon plus adaptée à leurs besoins (satisfaction client).
Concrètement, cela passe par la personnalisation immédiate des services et des produits proposés grâce à l’exploitation des sources de données auxquelles le client aura autorisé l’accès. On parle de « marketing prédictif ».
Certains produits bancaires (par exemple, une offre de prêt immobilier) peuvent ainsi être mis en avant sur le site internet de la banque lors de sa consultation par le client en fonction de ses projets identifiés grâce au Big Data (par exemple, un projet d’acquisition d’un bien immobilier identifié car le client a consulté des sites Web d’annonces immobilières).
La satisfaction client est également améliorée grâce à l’adaptation des processus de communication en fonction, en particulier, de l’utilisation qui est faite par le client des réseaux sociaux. Le Big Data fait ainsi partie de la stratégie de communication omnicanale des banques pour s’adapter aux habitudes et préférences de communication de leurs clients.
La lutte contre la fraude bancaire grâce au Big Data
Dans la lutte contre la fraude à la carte bancaire, grâce au Big Data, les banques ont pour objectif de pouvoir recouper les informations liées à une demande d’autorisation de paiement par carte bancaire avec l’historique du client, son profil d’acheteur et son activité sur les réseaux sociaux (ce qui peut permettre notamment de le géolocaliser). En cas de doute, une authentification supplémentaire serait alors nécessaire.
Big Data et protection des données personnelles
Dans la continuité des exigences formulées par la CNIL, les entreprises souhaitant exploiter les technologies du Big Data doivent respecter certains principes dans l’utilisation des données personnelles :
- Transparence de la banque sur l’usage des données stockées et analysées ;
- Respect de la confidentialité et de la vie privée (les données restent internes à la banque et ne font pas l’objet d’un traitement commercial) ;
- Développement de systèmes de sécurité sophistiqués pour limiter les risques de piratage des données.
Le Big Data chez LCL
Chez LCL, des algorithmes étudient la navigation des clients sur le site internet de la banque LCL.fr.
Un des objectifs poursuivis est d’améliorer la connaissance clients afin de répondre de la façon la plus adaptée à leurs besoins.
Un autre objectif est de faire évoluer le site internet de la banque grâce à l’identification des pages les plus visitées, des fonctionnalités les plus utilisés, etc. La mise en avant des points forts du site permet une meilleure expérience client.
Par ailleurs, afin d’améliorer sa relation client, LCL propose un bilan efficacité. Il s’agit, pour les clients, d’évaluer leur satisfaction vis-à-vis de leur relation bancaire.
Le questionnaire Bilan Efficacité comporte 3 questions. À travers la première question le client note sur une échelle de 0 à 10 sa prédisposition à recommander la banque à son entourage. Les deux questions suivantes sont ouvertes et permettent au client de détailler les raisons pour lesquelles il a accordé la note d’une part, et d’autre part, de fournir des suggestions d’amélioration. Les commentaires recueillis sont ensuite analysés, grâce à des algorithmes et permettent d’identifier, à partir des verbatim, les motifs de satisfaction et d’insatisfaction en vue d’améliorer les processus et de capitaliser sur les bonnes pratiques.
LCL confirme ainsi son intérêt pour les applications innovantes liées au Big Data.
Avertissement : Les informations fournies par LCL proviennent de sources dignes de foi mais ne sauraient entraîner sa responsabilité en cas d'inexactitude.