Mémoires d'Actuariat
Création d’un score d’appétence client à l’orientation vers un garage agréé et impact sur le tarif technique Automobile
Auteur(s) UBEZZI R.
Société Generali France
Année 2023
Confidentiel jusqu'au 05/05/2025
Résumé
Dans un contexte marché Automobile très concurrentiel, avec un ratio décaissement sur encaissement structurellement supérieur à 100% et des hausses de coûts de pièces détachées supérieures à 6% par an de 2018 à 2020, il est nécessaire d’utiliser toutes les ressources à disposition afin de disposer d’un tarif technique le plus performant possible. Le but de ce mémoire est de mieux segmenter les risques, en enrichissant le modèle de coût moyen Automobiles d’une nouvelle variable discriminante : la probabilité qu'un client répare son véhicule dans un garage agréé du réseau partenaire. Un maximum d’informations sur le client, son véhicule, les garages agréés ainsi que des données externes, ont été utilisés afin de modéliser cette probabilité. Elle a été calculée en appliquant un modèle de régression logistique, optimisée avec la méthode forward. Les variables les plus discriminantes sont la zone d’habitation du client, les choix antérieurs fait vis-à-vis de l’orientation et le mode de gestion de son sinistre, trois variables qui ne sont pas prises en compte aujourd’hui dans le tarif technique. Une discrétisation a été effectuée sur cette variable, à l'aide de la méthode des Kmeans, afin de créer un score. Cela permet de différencier les clients, et de créer des groupes homogènes d’appétences à l’orientation. Ce score a été ajouté au modèle de coût de la garantie Responsabilité civile et permet d’en améliorer la performance et donc d’obtenir une segmentation client plus fine. Mots clés : Sinistre automobile, IARD, Garantie dommage, Garantie Responsabilité civile, Réseau de garages agréés, Taux d’orientation, Tarif technique, K plus proches voisins, Discrétisation, Kmeans, Modélisation, Régression logistique, Méthode forward, Modèle de coût.
Abstract
In a very competitive Automotive market context, with a combined ratio structurally higher than 100% and spare parts cost increases of over 6% per year from 2018 to 2020, it is necessary to use all available resources in order to have the most efficient technical price possible. The purpose of this thesis is to better segment risks, by enriching the Automotive average cost model with a new discriminating variable: the probability that a customer will have his vehicle repaired in an approved garage of the partner network. A maximum of information on the customer, his vehicle, the approved garages as well as external data, were used to model this probability. It was calculated by applying a logistic regression model, optimized with the forward method. The most discriminating variables are the customer's area of residence, the previous choices made with regard to the orientation and the mode of management of his claim, three variables which are not taken into account today in the technical price. A discretization was carried out on this variable, using the Kmeans method, in order to create a score. This makes it possible to differentiate customers, and to create homogeneous groups of appetites for orientation. This score has been added to the Civil Liability cover cost model and helps to improve its performance and therefore to obtain a finer-grained customer segmentation. Keywords: Motorcar loss, casualty, Damage guarantee, Civil liability guarantee, Network of approved garages, Orientation rate, Technical tariff, K nearest neighbors, Discretization, Kmeans, Modeling, Logistic regression, Forward method, Cost model.
Auteur(s) UBEZZI R.
Société Generali France
Année 2023
Confidentiel jusqu'au 05/05/2025
Résumé
Dans un contexte marché Automobile très concurrentiel, avec un ratio décaissement sur encaissement structurellement supérieur à 100% et des hausses de coûts de pièces détachées supérieures à 6% par an de 2018 à 2020, il est nécessaire d’utiliser toutes les ressources à disposition afin de disposer d’un tarif technique le plus performant possible. Le but de ce mémoire est de mieux segmenter les risques, en enrichissant le modèle de coût moyen Automobiles d’une nouvelle variable discriminante : la probabilité qu'un client répare son véhicule dans un garage agréé du réseau partenaire. Un maximum d’informations sur le client, son véhicule, les garages agréés ainsi que des données externes, ont été utilisés afin de modéliser cette probabilité. Elle a été calculée en appliquant un modèle de régression logistique, optimisée avec la méthode forward. Les variables les plus discriminantes sont la zone d’habitation du client, les choix antérieurs fait vis-à-vis de l’orientation et le mode de gestion de son sinistre, trois variables qui ne sont pas prises en compte aujourd’hui dans le tarif technique. Une discrétisation a été effectuée sur cette variable, à l'aide de la méthode des Kmeans, afin de créer un score. Cela permet de différencier les clients, et de créer des groupes homogènes d’appétences à l’orientation. Ce score a été ajouté au modèle de coût de la garantie Responsabilité civile et permet d’en améliorer la performance et donc d’obtenir une segmentation client plus fine. Mots clés : Sinistre automobile, IARD, Garantie dommage, Garantie Responsabilité civile, Réseau de garages agréés, Taux d’orientation, Tarif technique, K plus proches voisins, Discrétisation, Kmeans, Modélisation, Régression logistique, Méthode forward, Modèle de coût.
Abstract
In a very competitive Automotive market context, with a combined ratio structurally higher than 100% and spare parts cost increases of over 6% per year from 2018 to 2020, it is necessary to use all available resources in order to have the most efficient technical price possible. The purpose of this thesis is to better segment risks, by enriching the Automotive average cost model with a new discriminating variable: the probability that a customer will have his vehicle repaired in an approved garage of the partner network. A maximum of information on the customer, his vehicle, the approved garages as well as external data, were used to model this probability. It was calculated by applying a logistic regression model, optimized with the forward method. The most discriminating variables are the customer's area of residence, the previous choices made with regard to the orientation and the mode of management of his claim, three variables which are not taken into account today in the technical price. A discretization was carried out on this variable, using the Kmeans method, in order to create a score. This makes it possible to differentiate customers, and to create homogeneous groups of appetites for orientation. This score has been added to the Civil Liability cover cost model and helps to improve its performance and therefore to obtain a finer-grained customer segmentation. Keywords: Motorcar loss, casualty, Damage guarantee, Civil liability guarantee, Network of approved garages, Orientation rate, Technical tariff, K nearest neighbors, Discretization, Kmeans, Modeling, Logistic regression, Forward method, Cost model.