Les données sont la bouée de sauvetage de la publicité numérique. À mesure que le paysage numérique continue de changer, les données changeront également. Qu’il s’agisse de faire évoluer les réglementations sur la confidentialité des données ou de désactiver les cookies tiers, l’accès à des données de haute qualité (des données propres, bien structurées et sans biais) est un défi pour les organisations marketing.
Alors que les données deviennent de plus en plus difficiles à collecter, stocker et activer, les responsables du marketing numérique ont besoin de solutions qui maintiennent l’efficacité et protègent la confidentialité de leurs clients. Entrer : données synthétiques.
Qu’est-ce qu’une donnée synthétique ?
Les données synthétiques sont une classe d’IA générative qui peut optimiser les données rares, atténuer les biais ou préserver la confidentialité des données. Les ensembles de données synthétiques sont générés artificiellement (c’est-à-dire non obtenus à partir d’observations directes du monde réel) pour préserver les aspects statistiques et comportementaux des ensembles de données réels sans compromettre la vie privée des personnes auprès desquelles les données ont été collectées. .
Bien que les spécialistes du marketing puissent être tentés de considérer les données synthétiques comme de « fausses données », elles peuvent en fait être assez puissantes. Les données synthétiques peuvent être utilisées pour générer des ensembles de données qui seraient autrement irréalisables en raison de limitations de collecte ou de restrictions réglementaires, les rendant disponibles et applicables à divers objectifs marketing.
Nous verrons probablement une adoption plus large des technologies d’IA génératives, telles que les données synthétiques dans la publicité ciblée, au cours des deux à cinq prochaines années. Les spécialistes du marketing doivent se préparer au jour où les données synthétiques deviendront la norme dans la publicité en ce moment.
Les données synthétiques répondent aux préoccupations concernant les informations personnellement identifiables
Premièrement, les données synthétiques sont une solution potentiellement viable aux défis communs de confidentialité liés au partage de données entre partenaires, y compris à des fins de campagnes publicitaires numériques ciblées.
Bien que la technologie d’anonymisation des ensembles de données via des données synthétiques soit encore relativement immature, les données synthétiques pourraient théoriquement protéger les informations personnelles identifiables (PII) des clients d’une entreprise, telles que les numéros de sécurité sociale, les numéros de téléphone, etc. , les adresses e-mail et les données sensibles telles que que la race et le sexe.
Aujourd’hui, le processus d’anonymisation et de partage de données sources réelles peut être long et coûteux. Les données synthétiques, d’autre part, peuvent être construites sur l’ensemble original de « données réelles » pour former un ensemble synthétique qui ne contient plus aucune des PII d’origine ou des informations de données sensibles.
Par exemple, une grande compagnie d’assurance américaine a utilisé des données synthétiques pour anonymiser des ensembles de données transactionnelles complexes contenant des PII en extrayant des informations statistiques et des relations complexes des ensembles de données. Le nouvel ensemble de données synthétiques ne contenait plus aucune information originale et n’était pas traçable jusqu’aux individus, garantissant la conformité réglementaire et préservant les attributs statistiques et les tendances de comportement des consommateurs. L’entreprise pourrait alors partager en toute sécurité les données avec des tiers pour une analyse comportementale des transactions du compte en trois jours au lieu de six mois. Dans la publicité, cela pourrait aider à créer des segments pour des publicités ciblées spécifiques ou à créer des parcours client uniques.
Des exemples similaires de protection de la vie privée des consommateurs ne feront que continuer à émerger : d’ici 2025, Gartner s’attend à ce que les données synthétiques réduisent la collecte de données personnelles des clients de manière à éviter 70 % des sanctions pour violation de la vie privée.
Les données synthétiques aident les spécialistes du marketing à faire progresser les créations publicitaires
L’utilisation de l’IA et de l’apprentissage automatique (ML) augmente dans le marketing, et l’une de ces technologies reposant sur des données synthétiques est le deepfake, un type de média synthétique qui remplace la vidéo ou l’audio existant par une image ou un son généré synthétiquement.
Alors que la technologie deepfake a été critiquée dans des cas d’utilisation non consensuelle, elle a déjà été mise en œuvre dans des campagnes publicitaires réussies.
Prenons l’exemple d’une grande entreprise de beauté. Leur objectif était de sensibiliser à la nature néfaste des conseils de beauté en ligne en utilisant une fausse technologie de cartographie faciale pour créer des mères porteuses numériques faisant la promotion de conseils de beauté nuisibles (ironiquement) dans le contenu des médias sociaux. Le résultat a été des réactions choquées de la part des mères de voir leur moi numérique donner des conseils aussi toxiques, ce qui les a incitées à avoir des conversations plus honnêtes et informées avec leurs enfants sur ce qu’ils voient sur leurs réseaux sociaux. L’application de la technologie deepfake a permis à la marque de beauté de diffuser un véritable message de campagne d’une manière qui a réduit les efforts de production et les coûts.
Les créations générées par Deepfake deviendront un élément plus répandu des campagnes publicitaires à mesure que les spécialistes du marketing s’efforceront de suivre le rythme des développements technologiques émergents. En fait, d’ici 2025, Gartner s’attend à ce que 30 % des messages marketing sortants des grandes organisations soient générés de manière synthétique, contre moins de 2 % en 2022.
Les données synthétiques améliorent les tests et le développement des produits
Gartner prédit que les données synthétiques liées à l’image et à la vidéo représenteront plus de 95 % des données utilisées pour les modèles d’IA d’ici 2030. L’un des cas d’utilisation les plus répandus pour les données synthétiques comprend la formation de modèles ML pour développer des produits et des fonctionnalités qui peuvent augmenter valeur commerciale. améliorer la qualité des produits, réduire les coûts et éventuellement découvrir de nouveaux produits ou services au cours du processus.
Dans un exemple, une entreprise de véhicules autonomes présente des scénarios générés synthétiquement dans ses vidéos de formation qui seraient autrement peu pratiques ou dangereux à collecter dans la vie réelle, comme un piéton marchant devant un véhicule en mouvement. Les données de ces tests informent sur la façon dont l’IA réagit et sont ensuite optimisées pour un certain nombre de fonctionnalités de sécurité sans avoir besoin d’apprendre de scénarios réels et de mettre en danger de vraies personnes. Gartner prédit que les données synthétiques réduiront le volume de données réelles nécessaires à l’apprentissage automatique de 70 % en trois ans.
le futur est ici
Considérez le scénario suivant : nous sommes en 2030 et les spécialistes du marketing de la « marque X » préparent leurs campagnes pour le Super Bowl 64. Le jeu, et ses publicités et parrainages sans précédent, seront diffusés en direct dans près de 100 millions de foyers adressables et connectés numériquement.
La marque X croit en son produit et est ravie de présenter sa nouvelle publicité, où, en utilisant des données synthétiques basées sur sa clientèle existante et l’IA générative pour la vidéo, elle a pu créer des milliers de versions en une fraction du temps. le temps d’un tournage publicitaire traditionnel. Les ménages cibles ont été segmentés en un ou plusieurs des centaines de groupes de distribution, chacun recevant son propre mélange de vidéo, de son et de graphiques conçu pour connecter chaque spectateur à un attribut clé de leurs produits. Les téléspectateurs l’adorent, mais la campagne jette une clé dans les meilleures listes typiques d’après-match du lundi.
Alors, comment les spécialistes du marketing peuvent-ils aujourd’hui tirer parti de ces implications pratiques et se préparer au rôle que les données synthétiques joueront éventuellement dans leurs stratégies ? Les responsables marketing peuvent commencer par les impératifs suivants :
- Identifiez si les données synthétiques peuvent aider à respecter les réglementations en matière de confidentialité et d’identité, ainsi que les réglementations émergentes sur les applications d’IA dans les entreprises.
- Vérifiez les revendications des fournisseurs et validez les cas d’utilisation. Choisissez des fournisseurs qui génèrent des ensembles de données synthétiques qui préservent les attributs statistiques et les tendances comportementales tout en supprimant les PII.
- Évaluez si les deepfakes peuvent aider à augmenter l’impact des campagnes publicitaires et à atteindre les objectifs marketing. Tenez compte des coûts et des délais de livraison par rapport aux campagnes publicitaires et aux budgets traditionnels.
- Évitez le « syndrome de l’objet brillant » en vous associant à des équipes informatiques, de R&D et de produits de premier plan pour évaluer la valeur client et commerciale des produits générés synthétiquement ou dotés de capacités.
L’accès aux données du monde réel nécessaires pour former des modèles ou obtenir des informations sur les consommateurs devient de plus en plus difficile, en partie en raison de problèmes de confidentialité et de sécurité. Mais avec des données synthétiques, les spécialistes du marketing peuvent contourner les limitations de collecte ou les restrictions réglementaires concernant les informations personnelles, les rendant disponibles et applicables à une variété d’applications et de produits marketing.