We hebben een taak gevonden waar LLM's enorm mee worstelen! Geef ze een programmeerprobleem in Python en ze presteren geweldig. Geef hetzelfde probleem in brainfuck en hun performance is in zero-shot ongeveer 0% +[--------->+<]>+.++[--->++<]>+.