Pas de code, pas de problème – nous essayons de battre une IA à son propre jeu avec de nouveaux outils

Agrandir / Notre apprentissage automatique est-il encore?

Au cours de l’année écoulée, les technologies d’apprentissage automatique et d’intelligence artificielle ont fait des progrès considérables. Des algorithmes spécialisés, dont DALL-E d’OpenAI, ont démontré leur capacité à générer des images basées sur des invites textuelles avec une ruse croissante. Les systèmes de traitement du langage naturel (TAL) se sont rapprochés de l’écriture et du texte humains. Et certaines personnes pensent même qu’une IA a atteint la sensibilité. (Alerte spoiler : ce n’est pas le cas.)

Et comme Matt Ford d’Ars l’a récemment souligné ici, l’intelligence artificielle peut être artificielle, mais ce n’est pas de l'”intelligence” – et ce n’est certainement pas de la magie. Ce que nous appelons “l’IA” dépend de la construction de modèles à partir de données utilisant des approches statistiques développées par des humains de chair et de sang, et elle peut échouer de manière aussi spectaculaire qu’elle réussit. Construisez un modèle à partir de mauvaises données et vous obtenez de mauvaises prédictions et de mauvais résultats. Il suffit de demander aux développeurs de Tay Twitterbot de Microsoft à ce sujet.

Pour un échec beaucoup moins spectaculaire, il suffit de regarder nos dernières pages. Les lecteurs qui sont avec nous depuis un certain temps, ou du moins depuis l’été 2021, se souviendront de la fois où nous avons essayé d’utiliser l’apprentissage automatique pour effectuer des analyses, et nous n’avons pas vraiment réussi. (“Il s’avère que ‘data-driven’ n’est pas qu’une blague ou un mot à la mode”, a déclaré Danny Smith, chef de produit senior chez Amazon Web Services, lorsque nous lui avons demandé conseil. “‘Data-driven’ est une réalité pour les machines projets d’apprentissage ou de science des données !”) Mais nous avons beaucoup appris, et la plus grande leçon est que l’apprentissage automatique ne réussit que lorsque vous posez les bonnes questions aux bonnes données avec le bon outil.
Publicité

Ces outils ont évolué. Une classe croissante d’outils d’apprentissage automatique « sans code » et « à faible code » rend un certain nombre de tâches de ML de plus en plus accessibles, en prenant les pouvoirs de l’analyse d’apprentissage automatique qui étaient autrefois la seule provenance des scientifiques des données et des programmeurs et en les rendant accessibles aux analystes commerciaux et autres utilisateurs finaux non programmeurs.

Alors que le travail sur DALL-E est incroyable et aura un impact significatif sur la fabrication de mèmes, de contrefaçons profondes et d’autres images qui étaient autrefois le domaine des artistes humains (en utilisant des invites comme “[insert celebrity name] dans le style de The Scream d’Edvard Munch”), l’analyse d’apprentissage automatique facile à utiliser impliquant les types de données que les entreprises et les individus créent et travaillent avec tous les jours peut être tout aussi perturbatrice (au sens le plus neutre de ce terme).

Les fournisseurs de ML vantent leurs produits comme étant un “bouton facile” pour trouver des relations dans des données qui peuvent ne pas être évidentes, découvrir la corrélation entre les points de données et les résultats globaux et orienter les gens vers des solutions que l’analyse commerciale traditionnelle prendrait des jours, des mois ou des humains. années à découvrir grâce à une analyse statistique ou quantitative traditionnelle.

Nous avons décidé d’effectuer un test John Henry-esque : pour savoir si certains de ces outils sans code requis pouvaient surpasser une approche basée sur du code, ou au moins fournir des résultats suffisamment précis pour prendre des décisions à moindre coût que les heures facturables d’un data scientist. Mais avant de pouvoir le faire, nous avions besoin des bonnes données et de la bonne question.

commentaires

LAISSER UN COMMENTAIRE

S'il vous plaît entrez votre commentaire!
S'il vous plaît entrez votre nom ici

Le plus populaire