Vi introduserer en ny metode for å lære LLM-er å resonnere, som Bayesianske. Ved å trene modeller til å etterligne optimal probabilistisk slutning, forbedret vi deres evne til å oppdatere sine prediksjoner og generalisere på tvers av nye domener. Les mer: