Les documents expurgés ne sont pas aussi sécurisés que vous le pensez

“Même si vous effectuez la rédaction, soi-disant correctement, même si vous supprimez le texte, il y a beaucoup d’informations latentes qui dépendent du contenu qui a été rédigé, et même cela peut divulguer des informations”, déclare Levchenko. “Si vous expurgez un nom dans un PDF, si l’attaquant a un contexte – il sait qu’il s’agit d’un Américain – il pourra, avec une forte probabilité, soit récupérer ce nom, soit le réduire à une très petite liste de candidats. ”

Edact-Ray se concentre sur la taille des glyphes (au sens large, caractères ou lettres) et leur positionnement. “Il est assez clair pour beaucoup de gens que la lettre ‘L’ est plus mince qu’une lettre ‘M’, et que si vous ne caviardez que la lettre ‘L’, vous pourrez peut-être dire qu’elle est différente d’une caviardage avec juste la lettre ‘M’ », dit Bland. L’outil est essentiellement capable de comparer automatiquement la taille de la rédaction et la position des lettres avec un “dictionnaire” prédéfini de mots pour estimer ce qui a été remplacé.

Le logiciel est construit en déduisant comment le document original a été produit – par exemple, dans Microsoft Word – puis en procédant à l’ingénierie inverse des spécificités du document. “Cela nous dit comment le texte a été présenté”, dit Levchenko. “Une fois que nous savons cela, nous avons un modèle pour la façon dont cet outil a présenté le texte et comment et quelles informations il a déposées dans le reste du document.” À partir de là, il est finalement possible de simuler ce que le texte original a pu être et de produire une série de correspondances potentielles ou probables. Lors des tests, l’équipe a pu éliminer 80 000 suppositions par seconde.

“Nous avons constaté, par exemple, que la suppression d’un nom de famille à partir d’un fichier PDF généré par Microsoft Word à l’aide de Calibri à 10 points laisse suffisamment d’informations résiduelles pour identifier le nom de manière unique dans 14 % des cas”, conclut le document de recherche de l’équipe, ajoutant que cela est susceptible d’être une “limite inférieure sur l’étendue des expurgations vulnérables”.

Daniel Lopresti, professeur d’informatique à l’Université Lehigh qui a étudié les techniques de rédaction, dit que la recherche est impressionnante. Il “présente une étude complète des outils de rédaction et des façons dont ils peuvent être cassés, y compris en exploitant des aspects presque invisibles de la typographie d’un document”, explique Lopresti, qui n’a pas participé à la recherche. « L’image qu’il peint est effrayante ; trop souvent la rédaction est mal faite.

La grande majorité des organisations touchées par les échecs de rédaction du monde réel mis en évidence dans la recherche, y compris le ministère américain de la Justice, le système judiciaire américain, le Bureau de l’inspecteur général et Adobe, n’ont pas répondu à la demande de commentaires de WIRED. Bland et le document de recherche indiquent que de nombreuses organisations se sont engagées dans les recherches de l’équipe.

Microsoft n’a pas abordé les fuites de données à partir de documents Word convertis en PDF. “Les clients peuvent enregistrer un document au format PDF, mais c’est le rôle de l’outil de rédaction de censurer ou de masquer les informations”, explique Jeff Jones, directeur principal de Microsoft. Jones ajoute que les utilisateurs doivent « réviser » les données et leurs fichiers avant de les convertir dans un format qui sera partagé.

commentaires

LAISSER UN COMMENTAIRE

S'il vous plaît entrez votre commentaire!
S'il vous plaît entrez votre nom ici

Le plus populaire