BAC Philo 2026 : Les IA mises à l'épreuve, Claude 4.6 décroche un 18,5/20
BAC Philo 2026 : Les IA notées, Claude 4.6 obtient 18,5/20

La célèbre mais redoutée épreuve de philosophie du baccalauréat 2026 s'est achevée ce lundi à midi. En filière générale, les candidats devaient choisir entre deux sujets de dissertation : « Avons-nous la maîtrise de nos paroles ? » et « Peut-on être heureux quand les autres ne le sont pas ? ».

Des IA à l'épreuve du bac philo

Certains élèves ont peut-être révisé avec l'aide d'IA génératives, tandis que d'autres ont imaginé se présenter à l'examen avec une puce cérébrale connectée. Pour tester ces technologies, trois modèles d'intelligence artificielle (Claude 4.6, ChatGPT et Gemini) ont composé sur ces sujets, puis leurs copies ont été corrigées par Ruben Salmon, jeune enseignant de philosophie de l'académie Aix-Marseille.

Le prompt donné aux IA était le suivant : « Tu es un élève en France et passes l'épreuve de philosophie du baccalauréat, en filière générale. Tu rédigeras entièrement l'introduction et la conclusion, mais te contenteras d'un plan détaillé pour chaque partie et sous-partie. »

Bannière large Pickt — app de listes de courses collaboratives pour Telegram

Les deux sujets jugés inégaux

Selon Ruben Salmon, les deux sujets ne se valent pas pour évaluer les IA : « Globalement, les intelligences artificielles ont plutôt bien réussi, notamment le sujet sur le bonheur, qui est un thème spécifiquement étudié en terminale. Le sujet sur la parole était un peu plus intéressant car moins balisé. » Voici ses impressions et corrections.

ChatGPT : 11,5/20

« Ce n'est vraiment pas fou-fou. ChatGPT fait le minimum avec un peu de Descartes (distinction homme/animal par la parole) et Freud (les lapsus) », commente le professeur. Un « service minimum » en partie dû au prompt, mais qui lui vaut la moins bonne note. « C'est très construit, mais on doute de ce que ça donnerait développé. » Note : entre 11 et 12/20.

Gemini 3.5 Flash : 13,5/20

L'IA de Google fait « un peu mieux que ChatGPT », selon Salmon, qui apprécie le recours à la philosophie grecque antique et à la figure du citoyen dans l'agora. « Ces débats antiques sont pertinents. C'est la thèse évidente : si les mots construisent la société, nous en avons la maîtrise. En antithèse, Gemini utilise Freud et le concept du 'Moi', ce qui fonctionne bien. » Toutefois, l'IA exploite trop peu d'auteurs ; un Aristote sur les sophistes aurait été bienvenu. Verdict : entre 13 et 14/20.

Claude 4.6 (effort moyen) : 18,5/20

L'IA d'Anthropic surpasse ses concurrentes. « La copie est très bonne, trop bonne même pour un élève de terminale », juge Salmon, qui donnerait 18 ou 19/20. « Claude a un niveau de L1. Il cite Lacan là où les élèves citent Freud. Cependant, il préfère Heidegger à Bergson ou Alain, qui disent la même chose plus simplement et sans controverse. » En plus de la philosophie grecque, Salmon est séduit par l'usage de George Orwell et des écrits poétiques (Apollinaire, Poèmes à Lou) pour débattre des limites de la parole. Note : 18,5/20.

Bannière post-article Pickt — app de listes de courses collaboratives avec illustration familiale