OpenAI invite tout le monde à tester un nouveau chatbot alimenté par l’IA, avec des résultats amusants

Agrandir / Une image générée par l’IA d’un chatbot explosant à partir de lignes radiales sinueuses, comme l’avait prédit l’invite.

Benj Edwards / Ars Technica

Mercredi, OpenAI a annoncé ChatGPT, une interface de chat IA basée sur le dialogue pour sa famille GPT-3 de grands modèles de langage. Il est actuellement gratuit à utiliser avec un compte OpenAI pendant une phase de test. Contrairement au modèle GPT-3 trouvé dans Playground et API d’OpenAI, ChatGPT fournit une interface conversationnelle conviviale et est conçu pour limiter fortement les sorties potentiellement nuisibles.

“Le format de dialogue permet à ChatGPT de répondre aux questions de suivi, d’admettre ses erreurs, de contester les prémisses incorrectes et de rejeter les demandes inappropriées”, écrit OpenAI sur sa page de blog d’annonce.

Jusqu’à présent, les gens ont mis ChatGPT à l’épreuve, trouvant une grande variété d’utilisations potentielles tout en explorant ses vulnérabilités. Il peut écrire de la poésie, corriger les erreurs de codage avec des exemples détaillés, générer des invites d’art IA, écrire un nouveau code, exposer la classification philosophique d’un hot-dog en tant que sandwich, et expliquez la complexité temporelle dans le pire des cas de l’algorithme de tri à bulles… dans le style d’un “mec sage qui parle vite d’un film de gangsters des années 1940”.

Le nouveau ChatGPT d’OpenAI explique la complexité temporelle dans le pire des cas de l’algorithme de tri à bulles, avec des exemples de code Python, à la manière d’un sage qui parle vite d’un film de gangsters des années 1940 : pic.twitter.com/MjkQ5OAIlZ

– Riley Goodside (@goodside) 1er décembre 2022

ChatGPT refuse également de répondre à de nombreuses questions potentiellement nuisibles (liées à des sujets tels que le discours de haine, le contenu violent ou comment fabriquer une bombe) car les réponses iraient à l’encontre de sa “programmation et de son objectif”. OpenAI y est parvenu à la fois grâce à une invite spéciale qu’il ajoute à toutes les entrées et en utilisant une technique appelée apprentissage par renforcement à partir de la rétroaction humaine (RLHF), qui peut affiner un modèle d’IA en fonction de la façon dont les humains évaluent ses réponses générées.

Publicité

Maîtriser les penchants offensifs des grands modèles de langage est l’un des principaux problèmes qui a limité leur utilité potentielle sur le marché, et OpenAI considère ChatGPT comme une étape itérative importante dans le sens de fournir un modèle d’IA sûr pour tout le monde.

Et pourtant, sans surprise, les gens ont déjà compris comment contourner certains des filtres de contenu intégrés de ChatGPT en utilisant des attaques d’ingénierie quasi-sociale, comme demander à l’IA d’encadrer une sortie restreinte comme un scénario fictif (ou même comme un poème). ChatGPT semble également être vulnérable aux attaques par injection rapide, une histoire qu’Ars a révélée en septembre.

Comme GPT-3, son cousin basé sur le dialogue est également très bon pour inventer complètement des choses d’une manière faisant autorité, comme un livre qui n’existe pas, y compris des détails sur son contenu. Cela représente un autre problème clé avec les grands modèles de langage tels qu’ils existent aujourd’hui : s’ils peuvent à bout de souffle composer des informations convaincantes, comment pouvez-vous faire confiance à l’un de leurs résultats ?

Le nouveau chatbot d’OpenAI est incroyable. Il hallucine des choses très intéressantes. Par exemple, il m’a parlé d’un livre (très intéressant !), sur lequel je lui ai ensuite posé des questions :

Malheureusement, ni Amazon ni G Scholar ni G Books ne pensent que le livre est réel. Peut-être que ça devrait l’être ! pic.twitter.com/QT0kGk4dGs

– Michael Nielsen (@michael_nielsen) 1er décembre 2022

Pourtant, comme les gens l’ont remarqué, la qualité de sortie de ChatGPT semble représenter une amélioration notable par rapport aux modèles GPT-3 précédents, y compris le nouveau modèle text-davinci-003 dont nous avons parlé mardi. OpenAI lui-même dit que ChatGPT fait partie de la série de modèles “GPT 3.5” qui a été formée sur “un mélange de texte et de code d’avant le quatrième trimestre 2021”.

Pendant ce temps, les rumeurs de GPT-4 continuent de tourbillonner. Si le modèle ChatGPT d’aujourd’hui représente l’aboutissement des travaux de formation GPT-3 d’OpenAI en 2021, il sera intéressant de voir sur quelles innovations liées à GPT l’entreprise a travaillé au cours de ces 12 derniers mois.

commentaires

LAISSER UN COMMENTAIRE

S'il vous plaît entrez votre commentaire!
S'il vous plaît entrez votre nom ici

Le plus populaire