Encontrámos uma tarefa em que os LLMs têm grandes dificuldades! Dê-lhes um problema de codificação em Python e eles funcionam muito bem. Dê o mesmo problema em brainfuck e a sua performance em zero-shot é de ~0% +[--------->+<]>+.++[--->++<]>+.