Populære emner
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
Trillion Labs, en koreansk AI-startup, har lansert Tri-21B-think Preview, en liten åpen vekt-resonnementsmodell som scorer 20 på Artificial Analysis Intelligence Index
Viktige benchmarking-innsikter:
➤ Høy, men ikke ledende intelligens for sin lille størrelse: Tri-21B-think Preview scorer høyt for sin relativt lille parameterstørrelse på 21 milliarder. At modellen kun er 21B, gjør den relativt mer tilgjengelig å selvhoste sammenlignet med ledende åpen kildekode-modeller som GLM-5 og Kimi K2.5
➤ Lav hallusinasjonsrate: Tri-21B-think Preview scorer -49 på AA-Omniscience Index, en proprietær benchmark for kunstig analyse som måler kunnskapspålitelighet og hallusinasjon på tvers av bransjer. Denne gode scoren skyldes hovedsakelig en relativt lav hallusinasjonsrate (62 %), som er den laveste blant sørkoreanske modeller vi benchmarker.
➤ Styrke i bruk av agentiske verktøy: Tri-21B-think Preview scorer 93 % på τ²-Bench Telecom, og viser sterk ytelse på arbeidsflyter for bruk av agentiske verktøy. Tri-21B-think Preview er blant de ledende åpne vektmodellene i denne kategorien, og scorer tilsvarende DeepSeek V3.2 og MiniMax M2.5 i denne kategorien
➤ Høy tokenbruk: Tri-21B-think Preview viser svært høy tokenbruk sammenlignet med andre modeller i samme intelligensnivå, med bruk av ~120 millioner resonnementstokler på tvers av Artificial Analysis Intelligence-pakken. Dette kan sammenlignes med K-EXAONE (100 millioner resonnementtoken), en annen koreansk modell
➤ Ingen offentlige endepunkter: Tri-21B-think Preview er en åpen vektmodell under Apache 2.0-lisensen. For øyeblikket er den eneste måten å få tilgang til modellen på gjennom selvhosting. Trillion Labs har delt at et førsteparts, dedikert endepunkt forventes å bli betjent i nær fremtid.
Se nedenfor for videre analyse

Tri-21B-think Preview scorer 93 % på τ²-Bench Telecom, og viser sterk ytelse på arbeidsflyter for agentisk verktøybruk.

Tri-21B-think Preview viser svært høy tokenbruk, med bruk av ~120 millioner resonnementstokler på tvers av Artificial Analysis Intelligence-pakken.

9,05K
Topp
Rangering
Favoritter
