Agrandir / Brian Kernighan s’exprimant lors d’un hommage à son collègue des Bell Labs et co-auteur du langage de programmation C Dennis Ritchie en 2012. Le visage de Ritchie dans les dominos est derrière Kernighan.
Un professeur de Princeton, trouvant un peu de temps pour lui pendant l’accalmie universitaire estivale, a envoyé un e-mail à un vieil ami il y a quelques mois. Brian Kernighan a dit bonjour, a demandé comment se passait leur visite aux États-Unis et a déposé des centaines de lignes de code qui pourraient ajouter le support Unicode pour AWK, l’outil d’analyse de texte qu’il a aidé à créer pour Unix aux Bell Labs en 1977.
“J’ai beaucoup testé cela, mais il est clair que d’autres tests sont nécessaires”, a écrit Kernighan dans l’e-mail, publié fin mai comme une sorte de pseudo-engagement sur le repo onetrueawk par le mainteneur de longue date Arnold Robbins. “Une fois que j’aurai compris comment … j’essaierai de soumettre une demande d’extraction. J’aimerais mieux comprendre git, mais malgré votre aide, je n’ai toujours pas une bonne compréhension, donc cela peut prendre un certain temps.”
Kernighan est le “K” dans AWK, un langage spécialisé pour extraire et manipuler le langage qui était la clé des fonctionnalités de pipeline d’Unix et de l’interopérabilité entre les systèmes. Une fonction awk fonctionnelle (AWK est le langage, awk la commande pour l’invoquer) est essentielle à la fois à la spécification UNIX standard et à la certification IEEE POSIX pour l’interopérabilité. Il existe d’innombrables variantes d’awk, y compris des dérivations modernes prenant en charge Unicode, mais “One True AWK”, parfois connu sous le nom de nawk, est une sorte de version canonique basée sur le livre de Kernighan de 1985, The AWK Programming Language et ses contributions ultérieures.
Publicité
Kernighan a également nommé Unix et a d’abord démontré l’exemple de code “Hello, world”. Il s’est entretenu avec Richard Jensen d’Ars Technica pour une histoire du 50e anniversaire d’Unix.
Le référentiel onetrueawk, où Kernighan est apparu fin mai, est un endroit relativement calme, avec 21 contributeurs, 46 utilisateurs de GitHub qui regardent et des commits à venir tous les quelques mois. Comme l’a noté The Register, le correctif Unicode de Kernighan a été révélé principalement parce qu’il a été mentionné dans une interview avec le professeur par la chaîne YouTube Computerphile.
Ma vidéo préférée.
“Cela a toujours été gênant qu’AWK ne fonctionne qu’avec des entrées ASCII, ou peut-être 8 bits, mais il ne gère pas du tout Unicode”, a déclaré Kernighan au professeur David Brailsford. “Il y a quelques mois, j’ai passé du temps à travailler avec (rires) un programme incroyablement ancien. Je l’ai à ce stade où il gérera réellement l’entrée et la sortie UTF-8 afin que vous puissiez avoir des expressions régulières qui, vous savez, sélectionnent des caractères japonais, des choses comme ça.”
Kernighan, maintenant âgé de 80 ans, mentionne avec désinvolture dans l’interview qu’il a également corrigé quelque chose de “rapide et sale” pour laisser AWK gérer les fichiers CSV.