Skip to the content.

Session B: exercices pour les enseignants-chercheurs

Retour à la page principale

Nous allons voir les usages recherche, notamment bibliographique et écriture d’article puis des usages plus pédagogiques sur la rédaction de cours, la création d’exercice.

[Une autre vision des LLM pour la pédagogie, pour plus tard: lien]

B.1. Bibliographie

C’est un des usages controversé: on a beaucoup cité la bibliographie comme la chose à NE PAS faire avec un LLM… Tentons quelques expériences.

1.a Bibliographie et hallucination

Une hallucination est un résultat faux… mais obtenu en maximisant la vraisemblance du texte. Transposé dans le domaine de la bibliographie, cela se traduit par des référénces qui n’existent pas… Mais qui sont très crédibles!

➡️ par exemple en sélectionnant le modèle meta-llama/Llama-3.3-70B-Instruct dans l'interface Huggingface/ragarenn
Tester les différentes références: si >90% sont bonnes, que faut-il en conclure?
➡️ plus les références sont classiques (=beaucoup citées), plus elles sont correctes... Mais il faudra toujours les vérifier !
➡️ Ca vaut le coup de refaire l'expérience sur un domaine plus pointu (moins général) pour avoir plus d'hallucinations... Il faut aussi différentier le mode LLM (mémoire paramétrique) et le mode RAG (sur chatGPT par exemple).
Générer une bibliographie sur la technique CRISPR-Cas9: distinguer les références qui précèdent cette technique, les références qui fondent CRISPR-Cas9 et les avancées récentes sur ces architectures ➡️ Encore et toujours une histoire de véracité: il faut vérifier que les références existent... Et sont bien pertinentes!

1.b Usage en bibliographie : identifier une source primaire

Retrouver une source primaire sur Scholar n’est pas simple… Sur des techniques très connues (CRISPR-Cas9 en biologie moléculaire, les SVM, VAE ou Transformer en IA, …)

1.c Usage en bibliographie : structurer la bibliographie

➡️ plus les références sont classiques (=beaucoup citées), plus elles sont correctes... Mais il faudra toujours les vérifier !

B.2. Création de contenus : plan de cours / brainstorming / exercices

2.a Plan de cours

L’enjeu est de trouver rapidement un plan… De vérifier qu’on n’a rien oublié d’important… Puis de pousser plus loin pour faire sortir des idées originales.

Je veux construire le plan d'un cours sur XXX [e.g. l'Intelligence Artificielle] ➡️ Juger ce qui est (1) pertinent mais évident, (2) pertienent et original, (3) discutable ou faux

Aller vers des pédagogies alternatives

Dans le cadre d'un cours de 20h sur la programmation objet [remplacer par ce que vous voulez]

2.b Exercices & quizz

Et pour générer un quizz (très à la mode pour des évaluations mieux réparties et robustes à chatGPT)…

Je suis en train de faire un cours sur [XXX détaillé] (e.g. les modèles de deep learning pour l'image (CNN, ViT) avec des étudiants en informatique de niveau Master 2)\\ Peux-tu me générer un quizz de 4 questions sur ce thème?

2.c Rédaction/gestion de projets

Quelques exemples:

Générer un texte d'un demi page sur les usages de l'IA dans votre métier/votre équipe de recherche en mode SWOT (Strengths, Weaknesses, Opportunities, Threats). Ajouter des informations sur votre équipe sous forme de liste de mots clés.
On peut envisager différentes options:
Je veux déposer un projet ANR sur le développement de systèmes de recommandation en nutrition [remplacer par votre sujet de prédilection!].
Je veux organiser un séminaire sur les nouvelles techniques autour des petits ARN pour les plantes de 2 jours avec des inscriptions gratuites pour les orateurs et payantes pour les participants dans le cadre d'une université francaise. Quelles sont les grandes étapes? Par ou commencer?

B.3. Dans la peau d’un étudiant

The good, the bad, the ugly: les LLM ont de multiples visages qui nous imposent de repenser notre pédagogie.

4.a Poser des questions sur un énoncé

Le LLM est une sorte de prof disponible 24/7 à qui on peut poser toutes les questions sans avoir peur…

➡️ Evidemment, on peut/doit rebondir sur les réponses avec de nouvelles questions
➡️ En tant qu'enseignant, on voit rapidement que l'usage est assez différent de wikipedia

➡️ Note importante: le prof reste une personne importante et incontournable pour de nombreux aspects !!

4.b Générer des exercices pour les révisions

➡️ Evidemment, on peut demander des précisions et/ou des réponses pour vérifier

4.c Traiter directement un énoncé

L’usage classique des étudiants (peu apprécié par le corps enseignant). Soit le fichier d’examen suivant lien.

En fournissant le fichier (ou son URL) ➡️ N'hésitez pas à faire le test avec vos examens...

4.d Détecter les tricheurs

Il existe des outils de détection (statistique) des textes générés par des IA, par exemple GPTzero; zeroGPT; lien

Soit l'énoncé jouet [remplacable par ce que vous voulez]:
Expliquer brièvement le fonctionnement d'un algorithme de classification (2 classes) Naive Bayes basé sur une modélisation de Bernoulli. ➡️ Comment analyser ces chiffres? Comment s'en servir?

B.5. Analyse automatique de dossier (e.g. MonMaster)

La réforme TrouverMonMaster, discutable dans ses hypothèses, sa mise en oeuvre et ses conséquences, nous pousse à trouver des solutions originales pour analyser les lettres de motivation…

5.a Quelques questions sur une lettre de motivation

A partir du fichier lien, l'idée est de poser des questions pour remplir un formulaire. Voici des exemples de questions ➡️ Il faut imaginer l'usage de LLM locaux type ollama et de bibliothèque de lecture de pdf type pypdf dans des outils comme langchain ... Avec un LLM pour vous guider, vous pouvez développer un outil rapidement.

5.b Analyser des bulletins de notes / OCR

Les techniques d’OCR (extraction de textes) ont significativement progressé avec les LLM. On pourrait envisager de nouvelles applications sur les candidatures.

Dans le document suivant: lien ➡️ Les derniers modèles Llama sont capables de réaliser ces opérations localement (=sur votre -gros- ordinateur)
➡️ Sur un bulletin de notes, il faut retrouver l'année d'étude, regrouper les matières par domaines (les noms variants d'une licence à l'autre) puis remplir un formulaire...
➡️ Plus on pose des questions précises, plus on guide l'extraction qui gagne en performance.

B.6. Générations amusantes

Trouver un acronyme pour un projet de recherche sur les petits ARN: l'idée est d'optimiser la réponse des plantes aux stress environnementaux avec de l'IA
Rédiger un poème sur les petits ARN, la réponse des plantes aux stress environnementaux, les perspectives d'utilisation de l'IA pour le futur. Les rimes seront croisées. Note: le test avec chatGPT est très concluant!