Les
profils, le marketing et la gestion du risque :
vers « lordinateur
indic »
Surfichés, ne vous en fichez plus... - Paris, le samedi 25 avril 1998
Depuis le début des années welfare puis de la libéralisation généralisée des échanges, le management, qu'il soit public ou privé a incité massivement à la création de traitements informatisés. En retour, le pouvoir de mémorisation, de discrimination et de connexion des ordinateurs a suscité de nouveaux projets d'automatisation des activités humaines. Les sciences de l'artificiel pénètrent désormais toutes les sphères de la décision (médecine, économie, droit, gestion) : les effets induits sont incommensurables.
Un de ces effets les plus reconnus est de rendre plus sensible ce qui l'était déjà, et même de créer de nouvelles zones de vulnérabilité, particulièrement dans les domaines où les activités humaines paraissaient les plus complexes et donc les moins justiciables d'un traitement automatique.
Le mot « sensible » n'a pas en soi de connotation positive ou négative : dire qu'un phénomène est sensible ne dit rien de plus que ses états sont instables et que les déséquilibres sont relativement imprévisibles et potentiellement incontrôlables. Cependant si l'on considère l'informatisation de la société, la notion de donnée sensible évoque plutôt des menaces supplémentaires. Certes, tous les acteurs d'un phénomène ne perçoivent pas les mêmes dangers et ne sont pas confrontés aux mêmes risques. Après avoir opposé l'informatique aux libertés, on tente de réconcilier protection des personnes et circulation des données. Est-ce vraiment un progrès ? Il n'en reste pas moins que c'est autour de cette notion de sensibilité, des degrés de l'atteinte, des protections, des exceptions, et des limites qu'elle implique, que s'est construit le domaine « informatique et libertés ».
Les outils d'intelligence artificielle comme les systèmes interactifs d'aide à la décision, les systèmes experts, les réseaux neuronaux artificiels ont pour objectif de simuler des activités cognitives proprement humaines : diagnostic, analyse de stratégie, jugement. Ils utilisent souvent des données issues de comportements individuels et de techniques identificatoires vues précédemment - notamment les techniques de profils traduites en règles de sens commun - pour constituer leur bases de connaissances. Ils utilisent des questionnaires très détaillés sur les individus à partir desquels « le raisonnement » de la machine simulera non seulement leur comportement mais l'appréciation du décideur et produira des effets à leur égard. Il sont destinés en général à améliorer la productivité d'un service administratif ou à réduire les risques d'un choix, qu'il s'agisse d'un recrutement, de l'octroi d'une subvention ou d'un crédit, du refus d'une autorisation. Ils ont besoin de données particulièrement sensibles. Mais surtout leurs effets dans le monde réel peuvent porter atteinte aux droits de la personne car les critères retenus peuvent être discriminatoires et les motifs prédéterminés.
Ces outils nouveaux sont liés au développement massif de réseaux interconnectés et à la disponibilité de vastes fonds de données (méga-bases) en ligne qui ont pour finalité ce que l'on a appelé le « data mining ». Le data mining est « le processus de découverte de corrélations, formes et tendances nouvelles et significatives en passant au crible de grandes quantités de données stockées dans des bases et utilisant des technologies de reconnaissances des formes conjointement aux techniques statistiques et mathématiques » (Groupe Gartner). Cette technologie qui regroupe l'ensemble des méthodes d'exploitation des données est particulièrement présente dans le marketing mais on peut aussi la repérer dans d'autres domaines de la gestion. Ce mode d'exploitation est né avec l'idée qu'il faut passer des recherches sur les « segments de marché » à une relation avec des individus, pour tenir compte du client individuellement, il faut avoir le maximum de connaissances le concernant : observer ses besoins, se souvenir de ses préférences et apprendre de ses contacts passés. Dans un secteur ultra-concurrentiel, où se trouvent la plupart des industries qui utilisent les plus grands volumes d'informations, il n'y a plus de limite pour exploiter le maximum de données individuelles obtenues à partir de ce qu'on appelle les enregistrements transactionnels. C'est pour cette raison par exemple, que les supermarchés sont devenus des courtiers en information. Des clients divulguent eux-mêmes leurs données personnelles pour élaborer des modèles prédictifs qui leur seront opposables. Cette recherche de généralisation prédictive s'appuie sur ce qu'on appelle désormais « la connaissance de communautés ». Cependant ces techniques peuvent s'appliquer aussi bien à la médecine qu'au droit ou à la commande de processus industriels. Les tâches de data mining sont la classification, l'estimation, la prédiction, l'analyse de similitudes et l'analyse taxinomique (clusters). Le cercle vertueux du data mining est de transformer les données en informations, les informations en décisions et les décisions ... en bénéfices.
On étendra la notion de données sensibles en informatique à trois types de phénomènes : les données initiales, liées à la vie privée que l'on collecte de plus en plus, de façon massive, et souvent à notre insu, les données dérivées, traitées pour créer de nouvelles connaissances sensibles, enfin les traitements à risque en tant qu'ils peuvent provoquer des effets inattendus voire nettement indésirables.
Les deux premiers effets renvoient au rôle croissant de l'information sur les personnes et au risque particulier que représente l'informatique en tant qu'elle peut stocker et croiser ces données.
Le troisième concerne non plus l'information mais les modèles de décision qui, élaborés à partir des données sur les personnes, peuvent leur être opposables.
Danièle
BOURCIER
Juriste, directrice
de recherche CNRS