A la une
Me contacter

 

Les trois types d’analyse des données nécessaires pour résoudre un problème d’entreprise sont les suivantes :  l’analyse descriptive (ou analyse exploratoire), l’analyse prédictive et l’analyse prescriptive.

 

  1. L’analyse descriptive (ou analyse exploratoire).

Toute analyse part d’un problème, c’est-à-dire d’un écart entre le vécu et le voulu, par exemple d’un écart entre le degré en cours de satisfaction des clients et degré de satisfaction voulu.

L’objectif de ce premier type d’analyse est de collecter des informations pour tenter de comprendre pourquoi cet écart s’est produit et de formuler des hypothèses explicatives à vérifier.

 

1.1. La collecte des informations

Cette exploration conduit à recourir aux sources d’informations internes et à des sources externes :

-Les sources internes sont les services de l’entreprise en relation avec le problème. Ils peuvent réunir toutes les statistiques descriptives disponibles, fournir une première définition du problème, réunir toutes les mesures internes et réactions externes et formuler quelques hypothèses explicatives.

-Les sources externes sont les personnes extérieures concernés par le problème, par exemple les clients.

Collecter ce que ces derniers pensent ou pourquoi ils agissent de telle manière conduit à recourir aux méthodes suivantes : le groupe de discussion, les enquêtes (par sondage ou pas), les collectes d’observations sur le terrain, l’analyse des réseaux sociaux et du web

-Le groupe de discussion.

C’est un petit groupe de personnes extérieures à l’entreprise, par exemple des clients, aussi représentatives que possible de la totalité de leur population et à qui sont posées des questions ouvertes concernant le problème étudié.

On notera qu’aujourd’hui on peut recourir à des entreprises numériques qui peuvent réunir beaucoup plus de personnes, les questionner et les faire échanger longtemps sur le problème étudié.

-Les enquêtes.

L’une et l’autre de ces deux méthodes procèdent généralement par sondage.

L’exemple typique d’enquête pourrait être le « Net Promoter Score » ou « taux de recommandation d’une offre » qui consiste à poser la question suivante : « Quelle est la probabilité que vous recommandiez X à un ami ou un collègue ? » et à demander une évaluation allant de 0 à 10. Ce n’est qu’un indicateur de connaissance ou de satisfaction.

On notera qu’ici, aussi, des entreprises numériques proposent de réaliser des enquêtes auprès des clients et des observations sur le terrain.

-Les observations sur le terrain

Par exemple, observation sur le lieu de vente.

-Les données collectées par beaucoup d’entreprises spécialisées sur des sujets divers : sur l’écoute de la radio, la vision de la TV, ce qui se dit sur les réseaux sociaux, sur les recherches qui sont conduites sur Internet, sur ce qui se dit dans les téléphones mobiles, etc.

1.2. Les précautions à prendre

définir ce qu’on veut savoir ou comprendre et dans quelle mesure cette connaissance contribuera à la résolution du problème étudié ;

-définir correctement la population à questionner et vérifier que l’échantillon est bien représentatif ;

tester le questionnaire choisi sur les plans de la pertinence des questions et de la compréhension du langage ;

obtenir autant que possible l’accord de toutes les parties prenantes.

 

1.3. Le repérage des facteurs possibles et les hypothèses à vérifier.

Ici il faut comprendre la différence entre corrélation et causalité.

La corrélation est la relation entre deux variables ; si les prix baissent, les ventes peuvent croître ou chuter.

La causalité est aussi une relation entre variables, mais certaines sont déterminantes et d’autres sont déterminées.

Y a-t-il des corrélations observables, des relations causales probables ?

Dans les deux cas, attention à l’éventuel « troisième facteur » général qui, en fait, provoque la relation (le climat, la situation économique, le niveau de revenus, etc.)

 

  1. L’analyse prédictive

L’objectif de ce deuxième type d’analyse est de tenter de trouver les facteurs déterminants du problème et de prévoir le futur proche.

  1. Prévoir le futur proche.

L’analyse exploratoire précédente a permis de repérer des facteurs possibles et de faire des hypothèses.

Il faut maintenant tester le « lien » entre ces facteurs et l’indicateur principal du problème, par exemple le lien entre variation des prix et chute indésirable des ventes ; repérer le meilleur « lien » pour décider de la correction du problème et surtout prévoir le futur, en tous cas le futur immédiat.

Ici l’outil le plus fréquemment utilisé est la méthode de la régression.

La régression vise à vérifier le lien entre variables et la « force » de ce lien ; à établir dans quelle mesure l’indicateur du problème, par exemple la chute des ventes (dans ce cas= variable dépendante) est « déterminée » par les prix (dans ce cas=variable indépendante), connaissance qui va faciliter la prévision des ventes futures.

La présence du lien peut être vue via un graphique mais on peut aussi évaluer la « force » du lien en calculant la droite des moindres carrées, celle qui minimise les écarts entre les valeurs calculées et valeurs observées.

C’est ce que montre m’exemple suivant :

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Les valeurs observées sont les points bleus et les valeurs calculées sont données par la droite (Il s‘agit ici d’un ajustement linéaire mais il pourrait aussi être curviligne)

L’équation de la droite est donnée et R2 = 0.87 est le coefficient de détermination de l’évolution des ventes par les prix. On voit que le lien est très fort, ce qui permet d’évaluer les ventes futures en fonction des prix retenus.

Mais on voit aussi sur le graphique (et par le R2 inférieur à 1) que la droite ajustée laisse des « résidus » inexpliqués.

D’autres facteurs interviennent et on peut, si nécessaire, calculer une régression ayant plusieurs variables déterminantes.

 

2.2. Prévoir le futur plus lointain.

En général, avec la régression on ne peut pas faire des prévisions à plus d’un an car, après, il n’y aura pas de données observées sur lesquelles prendre appui.

Mais que faire si on veut prévoir quels seront les bons clients, lesquels feront défection, quelle dépense maximum à faire pour acquérir un client ou pour calculer la valeur à vie d’un client.

Une des méthodes de prévision est d’appliquer le modèle RFM sur une structure particulière de données.

L’acronyme RFM est l’abréviation de récence, fréquence, montant (par exemple d’achat) critères qui sont considérés comme les meilleurs prédicteurs des futurs achats,

La récence est indiquée par la date du dernier achat du client et on a vérifié que plus cette date est récente plus un prochain achat est probable.

La fréquence est indiquée par le nombre d’achats effectués dans une période par un client. (« fidélité »)

Les montants moyen et maximum des achats d’une période donnent une indication du besoin et de la satisfaction du client.

 

Structure particulière de données.

– Les clients sont regroupés par segment ; par exemple, selon l’importance de l’achat, ou l’année du premier achat ou la fréquence de l’achat (ou selon un autre critère jugé utile par analyste ;

– On ne prend en compte que les résultats RFM moyens de chaque segment au cours d’un nombre de périodes passées, de telle sorte qu’on puisse avoir une idée de l’évolution du segment et une estimation de la probabilité de passage d’un segment à l’autre.

– On admet l’hypothèse que les clients d’un segment de l’an prochain vont agir comme les clients du même segment l’ont fait il y a un an, sauf si on a des raisons d’admettre une autre hypothèse.

Voici une illustration de ces passages d’un segment à l’autre.

-les actifs de haute valeur (Active top) ;

-les actifs de plus faible valeur (Active bottom) ;

-les actifs ouverts à l’entreprise (Warm) ;

-les actifs fermés (Cold) ;

-les inactifs.

 

On peut aussi estimer la fidélité des clients et la « courbe de vie de ses achats » (Customer lifetime value (CLV)

 

 

 

 

 

 

 

 

 

 

 

 

 

  1. L’analyse prescriptive.

 

L’analyse prescriptive vise à prescrire des recommandations d’actions à l’entreprise.

Le problème que l’entreprise rencontre (écart entre le vécu et le voulu) a conduit, en principe, à définir un objectif, à procéder à une analyse descriptive et à définir, plus ou moins précisément, un modèle explicatif du problème, c’est -à dire à repérer les facteurs déterminants.

Il s’agit maintenant du choix des moyens d’actions les plus aptes à atteindre l’objectif.

Les problèmes relevant de cette approche concernent quasi toutes les décisions que l’entreprise doit prendre.

Par exemple, comment optimiser l’investissements, la gestion des stocks, le processus de production, la campagne de marketing, la prévention fraudes financières, etc.

Ici, il nous faut prendre appui sur un problème plus simple pour présenter la méthode ; on retient le modèle qui a servi de base à l’analyse prédictive pour repérer les déterminants de la demande.

L’objectif n’est plus de maximiser les ventes mais de maximiser la rentabilité, ce qui conduit à prendre en compte les coûts.

Observons d’abord que la relation prix-CA n’est, en général, pas linéaire et passe par un maximum comme le montre le graphique ci-dessous.

Pour optimiser la rentabilité il faut prendre en compte les coûts, comme le montre le graphique (qui retient l’hypothèse de réduction linéaire des coûts, ce qui pas toujours de cas).

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

On voit que le profit maximum, c’est à dire l’écart maximum entre CA et coût global, s’obtient avec un prix d’environ 5,5.

Le calcul est plus simple si on repère le critère de la détermination de la rentabilité maximale.

Ce critère est le suivant : la rentabilité maximale est atteinte lorsque le revenu marginal est égal au coût marginal.

Le revenu marginal est le supplément de CA que génère l’augmentation du prix d’une unité de l’article vendu (ou du lot de produits, etc.)

Le coût marginal est augmentation du coût que génère la production supplémentaire d’un article (ou du lot de produits, etc.).

On peut augmenter le prix jusqu’au point ou le revenu marginal est égal au coût marginal.

Si on dit cela plus simplement, on reconnaitra un principe généralement appliqué : je tends à augmenter les moyens de me procurer de la satisfaction tant que ce supplément dépasse le coût généré.

 

Source : https://www.coursera.org/learn/wharton-customer-analytics/home/module/1

Pour aller plus loin:

https://outilspourdiriger.fr/methodes-de-lanalyse-des-donnees/

https://outilspourdiriger.fr/trois-types-danalyse-des-donnees-necessaires-aux-managers/

https://outilspourdiriger.fr/avoir-cuture-du-client-et-celle-de-lanalyse-des-donnees/

 

 

Aucune reproduction ne peut être faite de cet article sans l’autorisation expresse de l’auteur.  A. Uzan. 11/01/2025