Exploiter les données non structurées au moyen de grands modèles de langage

Réaliser le potentiel :
Exploiter les données non structurées au moyen de grands modèles de langage

Lecture 6,5 minutes

Publié 18.10.2023

Experts
Sujets connexes
Partage

L’industrie de l’assurance connaît bien les données; elle en tire profit. Pourtant, une partie importante de ces données est non structurée et est confinée dans des documents comme les rapports du médecin traitant. Cependant, cela change rapidement. Les grands modèles de langage sont devenus une technologie accessible capable de libérer ces réserves de données et de fournir des renseignements et des perspectives auparavant difficiles d’accès.

Dans cette série d’articles, nous verrons le fonctionnement de ces modèles, nous nous pencherons sur les cas d’utilisation probables dans le cadre de la sélection des risques et des réclamations, et nous examinerons les facteurs dont les assureurs doivent tenir compte dans l’élaboration de leurs stratégies d’intelligence artificielle

Grands modèles de langage : Notions de base

Nous avons tous entendu parler de Chat GPT : c’est le grand modèle de langage le plus célèbre. Qu’est-ce que cela signifie exactement? Un grand modèle de langage est un type de modèle de traitement du langage naturel et génératif qui peut accomplir diverses tâches, notamment générer et classer du texte, répondre aux questions de façon conversationnelle et traduire du texte d’une langue à une autre.

Les grands modèles de langage convertissent de vastes quantités de données, comme des articles et des wikis, en encodages à partir desquels ils peuvent être entraînés pour comprendre le contexte. Le terme « grand » fait référence au nombre de valeurs (paramètres) pouvant faire l’objet d’un entraînement. Le modèle de langage peut aussi tirer des leçons de la rétroaction humaine dans le cadre d’un processus appelé apprentissage par renforcement à partir de rétroaction humaine. Certains des modèles les plus réussis, comme Chat GPT-3, ont des centaines de milliards de paramètres qui ont été entraînés sur l’équivalent de 600 000 livres de données et de rétroaction de plusieurs centaines de personnes.

La capacité des grands modèles de langage à générer du texte pertinent en prédisant le prochain mot viable (ou jeton pour être précis) dans une phrase les place dans une catégorie d’algorithmes d’intelligence artificielle connue sous le nom d’intelligence artificielle générative.

Graphic image explaining what a Large Language Model is

Travailler comme notre cerveau

Ils sont basés sur une architecture appelée un transformateur qui, à la base, possède un énorme réseau de neurones artificiels, essentiellement un modèle de traitement de l’information qui reproduit le fonctionnement de notre cerveau. Les réseaux de neurones artificiels ont été inspirés par les neurones biologiques. Dans celles-ci, l’information est stockée dans la force des connexions dans les synapses. Ces connexions évoluent et s’ajustent continuellement à mesure que nous traitons l’information et apprenons. Il en va de même pour les réseaux neuronaux artificiels. Leurs données sont stockées dans des coefficients synaptiques qui définissent la force des connexions entre les neurones artificiels. Pendant l’entraînement, ces coefficients, qui commencent par des nombres aléatoires, sont continuellement ajustés jusqu’à ce que l’erreur de sortie sur réseau soit très faible.

Technologies révolutionnaires

Le domaine de l’intelligence artificielle existe depuis des années, mais les récentes percées ont permis de réaliser des progrès révolutionnaires à une vitesse vertigineuse. Nous disposons maintenant de technologies informatiques plus avancées, d’unités de traitement graphique qui nous permettent de nous entraîner en utilisant beaucoup plus de données. De plus, le développement du modèle de transformateur, inventé par Google en 2017, a entraîné un changement de paradigme du grand modèle de langage.¹ Au lieu de traiter une entrée comme une phrase, un mot à la fois, les modèles de transformateur traitent toutes les entrées en même temps. Cette façon améliore la capacité du modèle à mieux reconnaître le contexte et accélère l’entraînement. Ensemble, les unités de traitement graphique et l’architecture du transformeur permettent à un grand modèle de langage d’apprendre à comprendre et à générer un langage pertinent.

Préentraînement et mise au point

Plus récemment, les grands modèles de langage, comme Chat GPT-4, ont reçu un préentraînement (à partir de zéro) sur au moins 1 pétaoctet de données. C’est l’équivalent de lire un milliard de livres. Compte tenu de la quantité de données et de matériel requis, il peut être coûteux d’entraîner de grands modèles de langage. Il existe heureusement des solutions de rechange pour réduire les coûts. Un exemple est la mise au point, qui consiste à ajuster et à adapter un modèle préentraîné pour répondre à un besoin précis. Par exemple, un assureur pourrait appliquer ses propres données à un modèle qui a déjà fait ses preuves pour faire la mise au point dans le but de produire une recommandation en matière de sélection des risques.

La méthode la moins coûteuse pour personnaliser un grand modèle consiste à ajouter un système de récupération de l’information pour améliorer les données disponibles dans le modèle sur un sujet particulier. C’est ce qu’on appelle la récupération de la génération augmentée, ou RAG. C’est ce qui nous permet, par exemple, d’extraire et de traiter des renseignements d’un rapport du médecin traitant. Les architectures RAG sont à la fois efficaces et rentables pour les cas d’utilisation de traitement de l’information précise à grande échelle.

Principales forces du grand modèle de langage

Les grands modèles de langage sont propulsés par de vastes réseaux de neurones artificiels et sont des systèmes d’intelligence artificielle sophistiqués qui offrent un éventail d’occasions intéressantes aux compagnies d’assurance vie et d’assurance invalidité, notamment :

Synthétisation des données non structurées : ces modèles excellent à extraire des informations de sources disparates et à regrouper des données pour une analyse efficace.
Personnification de l’information : ils offrent une façon novatrice d’interagir avec les données non structurées, ce qui les rend plus accessibles et exploitables.
Avantage concurrentiel : les sociétés qui disposent de données exclusives, propres à un domaine et non structurées (p. ex., données sur la sélection des risques médicaux) auront une longueur d’avance en tirant parti du potentiel inexploité de leurs réserves de données.

Rendre l’intégration des grands modèles de langage viable

Bien que le potentiel de ces modèles soit attrayant, les assureurs doivent tenir compte de certains aspects pratiques pour assurer la réussite de la mise en œuvre. Les deux éléments les plus importants sont le coût et la technologie.

La rentabilité de l’intégration des grands modèles de langage dépend en grande partie de l’approche d’entraînement choisie. Les assureurs doivent évaluer leurs cas d’utilisation précis pour déterminer la stratégie la plus efficace. L’entraînement des grands modèles de langage peut être coûteux, mais il existe des solutions de rechange pour atténuer les dépenses et des techniques comme la mise au point et la RAG peut optimiser le processus. Une gestion prudente des coûts de l’infonuagique est également essentielle, car des dépenses importantes pourraient s’accumuler si elles ne sont surveillées avec diligence. Étant donné que des ensembles de données bien organisés sont essentiels à l’exactitude et au rendement des modèles, les assureurs doivent également tenir compte des coûts des ressources associés à la création d’ensembles de données pour l’entraînement de ces modèles.

Les grands modèles de langage ont besoin de matériel informatique approprié, en particulier les unités de traitement graphique, pour l’hébergement et l’inférence (c.-à-d. pour générer des sorties de texte). Les assureurs doivent évaluer leur infrastructure informatique et investir en conséquence. Le choix entre utiliser des services infonuagiques ou investir dans du matériel spécialisé est crucial. Cette décision doit tenir compte des objectifs à long terme et des contraintes budgétaires.

Avantages énormes

Tirer parti de la puissance des grands modèles de langages n’est pas sans défis, mais les avantages pourraient être énormes. En adoptant ces modèles, les assureurs peuvent transformer des données non structurées en renseignements exploitables, ce qui peut améliorer la prise de décisions, l’évaluation des risques et le service à la clientèle.

Ils doivent évaluer attentivement les facteurs de coût et les choix technologiques pour faire de l’intégration des grands modèles de langage dans leurs processus opérationnels un objectif viable. Ceux qui adoptent cette technologie transformatrice pourraient se retrouver à l’avant-garde de l’innovation dans le secteur de l’assurance vie et de l’assurance invalidité, être mieux outillés pour répondre aux besoins changeants de leurs clients et s’y retrouver dans le contexte complexe de l’assurance moderne.

Prochain article : Utiliser de grands modèles de langage pour la sélection des risques et les réclamations fondées sur l’intelligence artificielle.

Référence

Https://blog.research.google/2017/08/transformer-novel-neural-network.html?m=1 (en anglais seulement)

Retour au sommaire

Contact the author

Lovell Hodge PhD

Vice-président, Données et intelligence

Munich Re, Amérique du Nord (vie)

Courriel LHodge@munichre.ca

D'autres articles qui pourraient vous intéresser

Male business speaker giving a talk at business conference event

Ventes et produits

Comprendre la distribution pour croître

Une meilleure compréhension de la distribution nous permet d’élaborer des stratégies de croissance plus efficaces.

Lecture 9,5 minutes

Publié 18.10.2023

man and woman looking at concepts of data floating outside of a laptop

Ventes et produits

Partenariat numérique : facteurs de réussite

Complexité associée à la détermination des partenaires numériques et des pratiques pour l’établissement de partenariats.

Lecture 9 minutes

Publié 12.09.2023

Créer une stratégie d’intégration de l’intelligence artificielle de A à Z

Numérique

Intégration de l’IA : une stratégie de A à Z

Cinq étapes principales pour établir une stratégie d’intelligence artificielle efficace.

Lecture 7 minutes

Publié 17.06.2022

Numérique

Étude de cas sur l’ingénierie des données

Création d’une solution de sélection des risques robuste reposant sur des pratiques logicielles bien fondées

Lecture 1,5 minutes

Publié 28.05.2021

Stay ahead of the curve with exclusive insights and industry updates! Subscribe to our Munich Re Insights Newsletter for a front-row seat to the latest trends in risk management, expert analyses and assessments, market insights, and innovations in the insurance industry. Join our community of forward-thinkers at Munich Re and empower your journey toward a more resilient future.

Subscribe now and stay up to date!

Subscribe to our newsletter for the latest industry research, insights on life and health-related topics, and relevant Munich Re Life US updates. Join today and stay connected with our business.

Subscribe now