Trillion Labs, en koreansk AI-startup, har lansert Tri-21B-think Preview, en liten åpen vekt-resonnementsmodell som scorer 20 på Artificial Analysis Intelligence Index Viktige benchmarking-innsikter: ➤ Høy, men ikke ledende intelligens for sin lille størrelse: Tri-21B-think Preview scorer høyt for sin relativt lille parameterstørrelse på 21 milliarder. At modellen kun er 21B, gjør den relativt mer tilgjengelig å selvhoste sammenlignet med ledende åpen kildekode-modeller som GLM-5 og Kimi K2.5 ➤ Lav hallusinasjonsrate: Tri-21B-think Preview scorer -49 på AA-Omniscience Index, en proprietær benchmark for kunstig analyse som måler kunnskapspålitelighet og hallusinasjon på tvers av bransjer. Denne gode scoren skyldes hovedsakelig en relativt lav hallusinasjonsrate (62 %), som er den laveste blant sørkoreanske modeller vi benchmarker. ➤ Styrke i bruk av agentiske verktøy: Tri-21B-think Preview scorer 93 % på τ²-Bench Telecom, og viser sterk ytelse på arbeidsflyter for bruk av agentiske verktøy. Tri-21B-think Preview er blant de ledende åpne vektmodellene i denne kategorien, og scorer tilsvarende DeepSeek V3.2 og MiniMax M2.5 i denne kategorien ➤ Høy tokenbruk: Tri-21B-think Preview viser svært høy tokenbruk sammenlignet med andre modeller i samme intelligensnivå, med bruk av ~120 millioner resonnementstokler på tvers av Artificial Analysis Intelligence-pakken. Dette kan sammenlignes med K-EXAONE (100 millioner resonnementtoken), en annen koreansk modell ➤ Ingen offentlige endepunkter: Tri-21B-think Preview er en åpen vektmodell under Apache 2.0-lisensen. For øyeblikket er den eneste måten å få tilgang til modellen på gjennom selvhosting. Trillion Labs har delt at et førsteparts, dedikert endepunkt forventes å bli betjent i nær fremtid. Se nedenfor for videre analyse
Tri-21B-think Preview scorer 93 % på τ²-Bench Telecom, og viser sterk ytelse på arbeidsflyter for agentisk verktøybruk.
Tri-21B-think Preview viser svært høy tokenbruk, med bruk av ~120 millioner resonnementstokler på tvers av Artificial Analysis Intelligence-pakken.
9,05K