17/11/2025

Comment « archiver » est devenu un verbe

Traduction de How “Archive” Became a Verb, par Amelia Acker, ISSUES, automne 2025

Les débats autour d’un projet de centre national de données dans les années 1960 révèlent comment les inquiétudes liées à la confidentialité et à la numérisation ont conduit à un transfert du contrôle des données personnelles vers les entreprises.

Chaque matin, comme beaucoup d’autres personnes, je commence à écrire en lançant mon traitement de texte. Récemment, le programme exécutable que j’utilise sur mon ordinateur portable est devenu une application en ligne. Il ne s’agit désormais plus que d’une application parmi toute une suite d’outils logiciels dont mon institution détient la licence. Lorsque j’éteins mon ordinateur à la fin de la journée, j’ai instinctivement tendance à enregistrer mon fichier, mais l’option « Enregistrer » n’existe plus. À la place, l’application affiche un message dans son menu qui dit : « Où est le bouton Enregistrer ? Il n’y a pas de bouton Enregistrer, car nous enregistrons automatiquement votre document. »

La banalité de cette réponse me intrigue toujours, car elle soulève des questions auxquelles le menu déroulant n’apporte manifestement aucune réponse. Pourquoi le document est-il enregistré automatiquement ? Où est-il enregistré ? Comment est-il stocké ? Qui a décidé qu’il était judicieux d’enregistrer et d’accéder automatiquement aux informations sur des plateformes gérées dans le cloud plutôt que sous forme de fichier sur le disque dur de mon ordinateur portable ?

Les réponses à ces questions résident dans l’évolution de l’archivage, qui est passé du stockage de fichiers à la gestion des informations numériques. Aujourd’hui, les archives n’appartiennent plus à la personne qui les crée. Elles sont plutôt « nées en réseau », ou créées au sein d’infrastructures d’information connectées, car la collecte de données d’entreprise est désormais intégrée de manière transparente dans les technologies en réseau que nous utilisons le plus. Alors que nos données étaient auparavant gérées et contrôlées par des institutions publiques, telles que des agences gouvernementales, des bibliothèques ou des universités, elles relèvent aujourd’hui du domaine des plateformes privées. Cette transition des institutions publiques vers les entreprises explique comment le nom « archive », qui désignait autrefois un lieu ou un ensemble de documents, est devenu un verbe désignant le traitement, la collecte et l’accumulation de données, doté du pouvoir de contrôler les informations que nous pouvons enregistrer et les moyens d’y accéder.

Les téléphones portables, les applications et les plateformes de réseaux sociaux dépendent tous de systèmes de gestion de l’information qui archivent les données et gèrent l’accès aux collections de données. Malgré leur omniprésence, ces archives de données sont de plus en plus difficiles à trouver, à connaître ou même à imaginer pour les utilisateurs. Les données nées en réseau sont éloignées des utilisateurs, et les points d’accès sont de plus en plus dispersés et invisibles. Tout comme les processus automatisés qui ont remplacé le bouton « Enregistrer » de mon logiciel de traitement de texte, les moyens d’accéder aux données que nous créons sont désormais largement inconnus des utilisateurs finaux.

Les téléphones portables, les applications et les plateformes de réseaux sociaux dépendent tous de systèmes de gestion de l’information qui archivent les données et gèrent l’accès aux collections de données.

Les prémices de ce changement de pouvoir remontent à la transition entre la transcription manuelle des données à l’aide de cartes perforées et les données lisibles par machine et les systèmes automatisés d’archivage. Une histoire en particulier met en lumière certaines des questions cruciales liées à cette transition. Dans les années 1960, des experts ont proposé la création d’un centre national d’information gouvernementale, ce qui a suscité un débat controversé au sein du public et du Congrès avant d’échouer finalement. Ce moment charnière dans la gestion des données au XXe siècle a vu l’archivagedevenir un verbe et l’accès aux données collectées devenir une préoccupation pour les scientifiques, les bureaucrates et le public américain. L’enjeu était de savoir si les informations personnelles recueillies par l’État auprès des citoyens pouvaient être traitées et transformées en ressources de données agrégées accessibles sans violer les droits à la vie privée des Américains.

« LA TECHNOLOGIE QUI VIOLERAIT LA VIE PRIVÉE PLUS QUE TOUTE AUTRE »

Au cours de l’après-guerre, les institutions ont collecté plus d’informations personnelles que jamais sur les Américains, notamment des dossiers scolaires, des dossiers militaires et des dossiers personnels. À mesure que les ordinateurs devenaient plus rapides et plus efficaces pour traiter des données à grande échelle, la conservation des dossiers a migré vers d’énormes ensembles de cartes perforées traitées par des machines. L’informatique à cartes perforées a ouvert de nouvelles possibilités pour tous les secteurs qui dépendaient de la collecte et de l’agrégation d’informations pour leurs opérations, tels que la recherche scientifique, l’administration publique et la gestion d’entreprise.

À mesure que de plus en plus de personnes se familiarisaient avec les ordinateurs dans le cadre d’applications industrielles et organisationnelles, le pouvoir des informations personnelles, une fois agrégées en données lisibles par machine, a commencé à prendre une place importante dans la conscience du public américain. Au début des années 1960, l’Internal Revenue Service, le FBI, l’armée et les universités de tout le pays utilisaient des systèmes de gestion automatisés et mécanisés des dossiers, conférant à l’agrégation des données une aura de secret gouvernemental et de contrôle administratif. Ainsi, à mesure que les systèmes d’archivage se sont informatisés, la confidentialité des informations des citoyens est devenue un enjeu politique. Pour de nombreux Américains, les nouvelles capacités des ordinateurs et leur description publique évoquaient des dossiers secrets et la crainte d’un Big Brother.

Les spécialistes en sciences sociales et autres chercheurs ont compris que le traitement informatique avait le potentiel de transformer les méthodes d’enquête de manière à aider la société à mieux se comprendre. Les avantages d’un référentiel national centralisé pour les données étaient évidents pour ces scientifiques : l’accès à davantage de données serait plus efficace et plus utile. Il serait accessible à un plus grand nombre de personnes et provenant de sources plus diverses, au lieu d’être dispersé dans un patchwork de banques de données distinctes. Mais avant de pouvoir développer un dépôt centralisé de données gouvernementales, les bureaucrates devaient convaincre les responsables administratifs et les représentants élus au Congrès de la nécessité d’une archive centralisée de données pour soutenir la gouvernance et l’administration.

Une série d’études de cas exploratoires a été menée tout au long des années 1960 afin d’étudier la centralisation de l’accès aux données gouvernementales. En réponse, des chercheurs en sciences sociales et comportementales, tant au sein du gouvernement fédéral qu’à l’extérieur, ont proposé ce qui allait devenir le Centre national de données. Cette proposition a donné lieu à plusieurs audiences au Congrès, à la Chambre des représentants et au Sénat, tout au long de l’année 1966. Dirigées respectivement par le député Cornelius Gallagher et le sénateur Edward V. Long, ces audiences ont abordé la question de l’atteinte potentielle à la vie privée qui résulterait de l’utilisation par un centre de données de technologies informatiques et de systèmes automatisés d’archivage pour gérer les données recueillies auprès du public. Selon Priscilla Regan, spécialiste de la protection de la vie privée, « les premières discussions du Congrès concernant les systèmes d’archivage informatisés ont présenté la question sous l’angle de la menace que représentait le changement technologique pour la vie privée des individus ». Mais au fur et à mesure que les audiences se poursuivaient et que les critiques commençaient à circuler dans la presse, les préoccupations se sont déplacées, passant des impacts potentiels des nouvelles technologies informatiques sur le traitement des données au volume même des informations collectées sur les individus, soit quelque trois milliards d’enregistrements, selon un rapport de la sous-commission sénatoriale.

À la fin de l’année, les enquêtes du Congrès ont donné lieu à une controverse de grande ampleur et, comme l’écrivait un observateur en 1967, le projet de Centre national de données « a pris l’apparence d’un projet visant à créer un gigantesque centre national de données centralisé, calculé pour rapprocher 1984 d’Orwell au moins autant que 1970 ». Ces craintes concernant l’agrégation de fichiers contenant des informations personnelles dans des dossiers accessibles par ordinateur allaient façonner la protection des données aux États-Unis pendant des décennies.

FAISONS-NOUS CONFIANCE AU GOUVERNEMENT ?

D’un côté du débat sur le Centre national de données se trouvaient les partisans d’une archive nationale centralisée pour les données, qui privilégiait l’accès et les processus standardisés. Pendant des années, les économistes et statisticiens du gouvernement, les chercheurs universitaires, les bibliothécaires, les professionnels des données et les bureaucrates fédéraux ont plaidé en faveur d’un accès centralisé à des données statistiques fiables, authentiques et préparées à des fins d’étude et d’analyse scientifiques. L’accès à des données fédérales à grande échelle pourrait atténuer les plus grands problèmes de la société en mesurant les besoins et en évaluant les services gouvernementaux existants. En proposant un centre national, les partisans estimaient que des garanties adéquates en matière de confidentialité existaient déjà ; les agences gouvernementales qui regroupaient les données garantissaient la confidentialité lors de la collecte d’informations auprès des individus.

Les préoccupations se sont déplacées de l’impact potentiel des nouvelles technologies informatiques sur le traitement des données vers le volume même des informations collectées sur les individus.

De l’autre côté du débat, les experts des médias, les juristes et les représentants du Congrès ont tiré la sonnette d’alarme sur les efforts d’accès coordonnés, craignant une ingérence excessive du gouvernement. Ils prédisaient l’utilisation abusive des dossiers en réseau de chaque citoyen américain, à partir des données collectées de la naissance à la mort, qui porterait atteinte au droit à la vie privée des citoyens américains. Alors que les affirmations sur les capacités de l’archivage automatisé et des ordinateurs circulaient, des critiques du projet de banque de données nationale ont commencé à apparaître dans les journaux et les magazines, mettant en garde contre les atteintes à la vie privée.

Les propositions relatives au Centre national de données ne tenaient pas compte de l’abus de la vie privée des individus dans leurs recommandations. Malgré l’importance de la planification de l’accès aux données, les promoteurs ont rarement évoqué les restrictions concernant les personnes qui auraient accès au Centre national de données et les conditions d’accès. Une fois les données acquises et agrégées dans une banque de données, les partisans du projet avaient supposé que la confidentialité ne serait pas un problème. Mais les détracteurs du centre pensaient le contraire, à savoir que la vie privée serait gravement menacée par l’agrégation d’informations personnelles dans des ensembles de données à l’échelle de la population, facilement lisibles par des machines et accessibles à des ordinateurs omniscients.

Ce que les propositions ne disaient pas sur la vie privée et les risques d’abus révèle la confiance des partisans du Centre national de données dans les processus d’archivage du gouvernement. Lorsque les scientifiques et les gestionnaires de données de recherche imaginaient ce que serait une archive de données en sciences sociales, ils passaient plus de temps à décrire les processus de préparation et de distribution des données pour analyse qu’à expliquer comment les données étaient collectées au départ et l’impact que les banques de données auraient lorsqu’elles seraient utilisées dans la recherche. À l’inverse, la controverse publique autour des propositions et les critiques du Congrès ont sensibilisé le public au pouvoir des données au niveau de la population et au risque d’abus.

Avec le recul, deux versions du problème de la protection de la vie privée des citoyens à l’aide des technologies informatiques apparaissent désormais clairement. Les scientifiques étaient convaincus que les données rassemblées par le gouvernement préserveraient la confidentialité au moment de leur collecte, tandis que le public se méfiait de la manière dont les données, une fois centralisées et stockées dans des formats lisibles par machine, pourraient être recombinées, programmées et manipulées.

Les propositions relatives au Centre national de données ne tenaient pas compte de l’abus de la vie privée des individus dans leurs recommandations.

En réalité, la vie privée et la confidentialité exigées par les législateurs lors des audiences avaient été efficacement garanties par le tabulation mécanisée des cartes perforées, qui demandait énormément de temps. Le passage au stockage des données sur des bobines de bande magnétique a potentiellement accru le risque d’abus en réduisant le temps de traitement, ce qui a facilité la recherche, la fusion et la mise en correspondance des enregistrements agrégés. La seule façon de se prémunir contre de tels abus était la surveillance. Ironiquement, cette surveillance ne pouvait être assurée sans centraliser les sources de données de l’ensemble du gouvernement dans une banque de données.

Finalement, les alarmistes l’ont emporté, garantissant une législation sur la protection de la vie privée et des lois limitant la capacité du gouvernement fédéral à agréger les enregistrements informatiques. Cependant, les craintes du public concernant l’intégration des données et la collecte d’informations personnelles allaient finalement se réaliser, non pas par le biais du gouvernement fédéral, mais par celui des universités et des entreprises qui collectaient des données numériques dans des contextes privés fermés, et qui allaient finalement créer un marché florissant pour la collecte de données personnelles par des tiers.

LES RÉALITÉS DE LA GESTION AUTOMATISÉE DES DOSSIERS

Les préoccupations du public et les témoignages d’experts lors des audiences du Congrès sur l’informatique en réseau et le risque d’abus des données étaient peut-être exagérés. Les visions orwelliennes des détracteurs qui prédisaient «1984 d’ici 1970 » étaient hautement improbables. De nombreuses études sur les opérations de données des agences gouvernementales commandées à cette époque ont révélé que la plupart d’entre elles ne disposaient pas d’informations complètes sur les sources, les emplacements de stockage ou les formats des données. La plupart de ces audiences parlementaires et rapports de sous-commissions, y compris les rapports des agences fédérales et de l’Académie nationale des sciences, ont fait valoir que l’atteinte à la vie privée et l’utilisation abusive des banques de données n’étaient pas inhérentes à la transition vers des systèmes informatisés et la gestion automatisée des archives.

Néanmoins, les prédictions de nombreux critiques juridiques, ainsi que les préoccupations du public, se sont avérées plus fondées que ne le pensaient les sociologues et les gestionnaires de données de l’époque. Pendant des décennies, les parties prenantes au sein et en dehors du gouvernement ont fait pression pour obtenir plus d’informations sur les pratiques du gouvernement en matière d’archivage et de conservation des données. À travers les rapports et les réfutations, les experts et les spécialistes des données se sont efforcés de déterminer où se situaient réellement les risques liés à l’accès aux données agrégées et où des mesures de protection devaient être mises en place dans le cycle de vie des données afin de préserver la vie privée.

Les préoccupations du public et les témoignages d’experts lors des audiences du Congrès sur l’informatique en réseau et le risque d’abus des données étaient peut-être exagérés.

De nombreux bureaucrates et fonctionnaires ont rejeté l’idée d’un excès de zèle de la part du gouvernement, car les lois existantes interdisaient déjà l’utilisation abusive des dossiers personnels et des informations individuelles. Ils ont souligné que la collecte de données auprès des citoyens était nécessaire pour le fonctionnement essentiel du gouvernement, ainsi que pour l’analyse statistique, les prévisions économiques et l’application des lois qui s’appuyaient sur des informations personnelles agrégées provenant des États et des agences fédérales. Mais la législation imposant la collecte de statistiques démographiques et de données auprès des citoyens, comme beaucoup d’autres lois régissant les technologies de l’information et de la communication, ne pouvait pas anticiper ce que les données numériques et les technologies de réseau allaient bientôt apporter.

Dans son traité de 1971 intitulé The Assault on Privacy, qui rendait compte de l’échec du Centre national de données, le juriste Arthur Miller écrivait que « la victoire apparente des défenseurs de la vie privée contre le Centre national de données est en grande partie une victoire à la Pyrrhus ». Miller était un fervent détracteur du centre et avait publié des éditoriaux pendant les audiences pour réclamer un cadre juridique plus solide afin de protéger les citoyens contre les mauvaises utilisations des données. Il s’inquiétait de la manière dont la vie privée était menacée par le passage à la gestion informatisée des dossiers, non seulement au sein du gouvernement, mais aussi dans l’industrie.

La législation imposant la collecte de statistiques démographiques et de données auprès des citoyens ne pouvait pas prévoir ce que les données numériques et les technologies de réseau allaient bientôt apporter.

L’argument de Miller était aussi pertinent à l’époque qu’il l’est aujourd’hui. Lors des audiences du Congrès de 1966, les organisations non gouvernementales qui collectaient des données démographiques, telles que les compagnies d’assurance, les agences de notation, les instituts de sondage et les agences de publicité, faisaient l’objet de très peu de contrôles. En renonçant à créer un centre national de données, le gouvernement a ouvert la voie aux entreprises pour qu’elles agrègent des données à des fins personnelles et lucratives. L’absence de centre de données nationalisé a permis à un nouveau marché de banques de données privées et de solutions d’intégration de données de s’implanter et de prospérer.

Les progrès informatiques des années 1970, notamment le traitement automatisé et le temps partagé avec des mini-ordinateurs, ainsi que l’essor des bases de données et de l’échange de données, ont catalysé les technologies de réseau et les appareils informatiques personnels qui sont devenus le fondement de l’internet sans fil actuel. À chacune de ces étapes, certains se sont inquiétés de savoir qui serait propriétaire des données une fois celles-ci accumulées, comment elles pourraient être exploitées au fil du temps et comment ces preuves pourraient être à la fois accessibles et contrôlées grâce à la gestion des données par des sociétés tierces. Peu à peu, à mesure que l’archivage est devenu un verbe, ces techniques de gestion des données ont transféré la gestion active des informations personnelles des individus vers des processus automatisés et pilotés par des machines.

Les craintes des alarmistes en matière de confidentialité des données se sont avérées fondées. Mais ce sont désormais principalement des entreprises privées, et non des institutions publiques, qui collectent et assemblent des archives de données et agissent en tant que gardiens de l’accès à celles-ci. L’archivage contemporain des données dans le contexte des entreprises s’inscrit dans la continuité des processus historiques de dépossession des données, éloignant les créateurs de leurs données et mettant en œuvre des processus automatisés de gestion de celles-ci à leur insu. Les Américains ayant cédé leur capacité à gérer leurs données en échange de l’utilisation des technologies de l’information et de la communication, les implications de ce changement deviennent de plus en plus floues, laissant aux entreprises un pouvoir sans précédent sur les données personnelles et les informations créées aujourd’hui par la société.

Amelia Acker est professeure agrégée à la School of Communication and Information de l’université Rutgers. Elle est l’auteure de Archiving Machines: From Punch Cards to Platforms (The MIT Press, 2025), dont cet essai est adapté.


Voir la LISTE ÉVOLUTIVE des articles
traduits par Gilles en vrac…