Session B: exercices pour les enseignants-chercheurs
Nous allons voir les usages recherche, notamment bibliographique et écriture d’article puis des usages plus pédagogiques sur la rédaction de cours, la création d’exercice.
[Une autre vision des LLM pour la pédagogie, pour plus tard: lien]
B.1. Bibliographie
C’est un des usages controversé: on a beaucoup cité la bibliographie comme la chose à NE PAS faire avec un LLM… Tentons quelques expériences.
1.a Bibliographie et hallucination
Une hallucination est un résultat faux… mais obtenu en maximisant la vraisemblance du texte. Transposé dans le domaine de la bibliographie, cela se traduit par des référénces qui n’existent pas… Mais qui sont très crédibles!
- Je voudrais une bibliographie sur la technique CRISPR-CAS9 [remplacer par le terme technique de votre choix]
Tester les différentes références: si >90% sont bonnes, que faut-il en conclure?
➡️ plus les références sont classiques (=beaucoup citées), plus elles sont correctes... Mais il faudra toujours les vérifier !
➡️ Ca vaut le coup de refaire l'expérience sur un domaine plus pointu (moins général) pour avoir plus d'hallucinations... Il faut aussi différentier le mode LLM (mémoire paramétrique) et le mode RAG (sur chatGPT par exemple).
- Remplacer le CRISPR-Cas9 par ce que vous voulez
1.b Usage en bibliographie : identifier une source primaire
Retrouver une source primaire sur Scholar n’est pas simple… Sur des techniques très connues (CRISPR-Cas9 en biologie moléculaire, les SVM, VAE ou Transformer en IA, …)
- Quelle est la référence biblio primaire de CRISPR-Cas9? [remplacer par une technologie très citée dans votre domaine]
1.c Usage en bibliographie : structurer la bibliographie
- Je veux faire une bibliographie sur l'usage des données textuelles dans les systèmes de recommandation: peux-tu me proposer une structuration avec différents usages et quelques références
B.2. Création de contenus : plan de cours / brainstorming / exercices
2.a Plan de cours
L’enjeu est de trouver rapidement un plan… De vérifier qu’on n’a rien oublié d’important… Puis de pousser plus loin pour faire sortir des idées originales.
- Proposer un plan de cours en 10 parties
- Renouveler l'opération sur les items pertinents pour obtenir des détails (ou demander dès le début des sous-parties)
Aller vers des pédagogies alternatives
- Je m'intérroge sur des organisation différentes du classique TP/cours: peux-tu me proposer des pédagogies alternatives
- Demander des titres de séances, des exemples d'exercices,...
- Au lieu de demander un sommaire, on peut demander une carte mentale, éventuellement en version graphique
2.b Exercices & quizz
Et pour générer un quizz (très à la mode pour des évaluations mieux réparties et robustes à chatGPT)…
- Demander 10 ou 20 questions pour avoir plus de choix (certaines questions seront plus pertinentes que d'autres !)
- OPT: Demander une génération en latex (si vous utilisez ce format)
- Comparer avec un des exercices suivant où on fera la même chose... En donnant le poly de cours comme base
2.c Rédaction/gestion de projets
Quelques exemples:
On peut envisager différentes options:
- Ce texte a vocation a être publié sur la page web de votre équipe
- Ce texte est une réponse à appel à projet (AAP), il doit être crédible tout en mettant en avant votre équipe pour obtenir des financements
- Quels sont les enjeux de ce type de systèmes? Générer des arguments explicant l'intérêt de ces systèmes (sur le plan de la santé, des économies, de la souveraineté alimentaire, ...) [on peut décomposer en plusieurs questions]
- Structurer une bibliographie pour ce projet en distinguant les types d'applications et les modèles associés.
- Quelles sont les sources de données disponibles pour apprendre ces systèmes de recommandation?
- Ne pas hésiter à demander des outils pour certaines étapes (e.g. sélection des aarticles)
- Auprès de qui rechercher un budget? Comment procéder? Ecrire les lettres de demande
B.3. Dans la peau d’un étudiant
The good, the bad, the ugly: les LLM ont de multiples visages qui nous imposent de repenser notre pédagogie.
4.a Poser des questions sur un énoncé
Le LLM est une sorte de prof disponible 24/7 à qui on peut poser toutes les questions sans avoir peur…
- Dans le cours sur les tris de listes, peux tu m'expliquer le tri par bulle? (OPT : demander le code python, ajouter des commentaires, générer des exemples de tests pour valider ma solution...)
- Peux-tu me donner toutes les étapes pour calculer la représentation binaire 32 bits de 34.5 en virgule flottante?
➡️ En tant qu'enseignant, on voit rapidement que l'usage est assez différent de wikipedia
➡️ Note importante: le prof reste une personne importante et incontournable pour de nombreux aspects !!
4.b Générer des exercices pour les révisions
- Quelles sont les questions les plus classiques dans un cours de physique sur la refraction?
- Dans le cadre d'un cours de L2 informatiques sur l'algorithmique, nous avons une interrogation sur le tri des listes, quelles sont les questions les plus probables?
4.c Traiter directement un énoncé
L’usage classique des étudiants (peu apprécié par le corps enseignant). Soit le fichier d’examen suivant lien.
- Donner les réponses des questions de cet examen de machine learning
4.d Détecter les tricheurs
Il existe des outils de détection (statistique) des textes générés par des IA, par exemple GPTzero; zeroGPT; lien
Expliquer brièvement le fonctionnement d'un algorithme de classification (2 classes) Naive Bayes basé sur une modélisation de Bernoulli.
- Donner l'énoncé à un LLM et copier la réponse
- Aller sur GPT Zero et coller dans la boite
- Que se passe-t-il si vous demandez au LLM de reformuler sa réponse (ou que vous le faites à la main):
Reformuler la réponse sans les formules et avec des phrases plus simple tout en gardant les mots clés techniques. Ajouter quelques fautes d'orthographes. - Que se passe-t-il lorsque vous donnez un paragraphe de wikipedia? Par exemple tiré de lien
B.5. Analyse automatique de dossier (e.g. MonMaster)
La réforme TrouverMonMaster, discutable dans ses hypothèses, sa mise en oeuvre et ses conséquences, nous pousse à trouver des solutions originales pour analyser les lettres de motivation…
5.a Quelques questions sur une lettre de motivation
- Analyser la lettre suivante en répondant à la liste de questions
- Le candidat demande-t-il le master MIND?
- Le candidat a-t-il fait des projets en IA? Donner les titres.
- Le candidat a-t-il fait des stages en IA en entreprise? En laboratoire académique?
- Demander les résultats en JSON, analyser un pdf...
5.b Analyser des bulletins de notes / OCR
Les techniques d’OCR (extraction de textes) ont significativement progressé avec les LLM. On pourrait envisager de nouvelles applications sur les candidatures.
- Analyser l'image suivante pour trouver l'éditeur et l'année de publication
➡️ Sur un bulletin de notes, il faut retrouver l'année d'étude, regrouper les matières par domaines (les noms variants d'une licence à l'autre) puis remplir un formulaire...
➡️ Plus on pose des questions précises, plus on guide l'extraction qui gagne en performance.
B.6. Générations amusantes
- On peut spécifier la langue (le LLM part vers l'anglais ou le franglais par défaut)
- On peut préciser la langue ou rajouter des élements dans le prompt ou dans les questions suivantes
- Si vous voulez ensuite générer de l'audio, différents outils existent: e.g. lien