Trillion Labs, корейський стартап у сфері штучного інтелекту, запустив Tri-21B-think Preview — невелику модель мислення з відкритими вагами, яка отримує 20 балів у Індексі штучного аналізу інтелекту. Основні висновки з бенчмаркінгу: ➤ Високий, але не провідний інтелект для свого малого розміру: Tri-21B-think Preview отримує високі оцінки завдяки відносно невеликому розміру параметрів у 21 мільярд. Наявність моделі 21B робить її відносно більш доступною для самостійного хосту порівняно з провідними відкритими моделями, такими як GLM-5 і Kimi K2.5 ➤ Низький рівень галюцинацій: Tri-21B-think Preview оцінює -49 за AA-Omniscience Index, власним бенчмарком штучного аналізу, який вимірює надійність знань і галюцинації в різних галузях. Цей хороший результат зумовлений переважно низьким рівнем галюцинацій (62%), що є найнижчим серед південнокорейських моделей, які ми бенчмаркуємо. ➤ Сила при використанні агентних інструментів: Tri-21B-think Preview набрав 93% на τ²-Bench Telecom, демонструючи високу продуктивність у робочих процесах використання агентних інструментів. Tri-21B-think Preview серед відкритих моделей Frontier у цій категорії, набравши подібні оцінки до DeepSeek V3.2 та MiniMax M2.5 у цій категорії ➤ Високе використання токенів: Tri-21B-think Preview демонструє дуже високе використання токенів порівняно з іншими моделями того ж рівня інтелекту, використовуючи ~120M логічних токенів у всьому наборі Artificial Analysis Intelligence. Це можна порівняти з K-EXAONE (100M tokens reasoning tokens), ще однією корейською моделлю ➤ Без публічних кінцевих точок: Tri-21B-think Preview — це модель з відкритими вагами за ліцензією Apache 2.0. Наразі єдиний спосіб отримати доступ до моделі — це самохостинг. Trillion Labs повідомила, що найближчим часом очікується, що в найближчому майбутньому буде обслуговуватися перша стороння, спеціалізована кінцева точка. Дивіться нижче для подальшого аналізу
Tri-21B-think Preview отримує 93% на τ²-Bench Telecom, демонструючи високу продуктивність у робочих процесах використання агентних інструментів.
Tri-21B-think Preview демонструє дуже високе використання токенів, використовуючи ~120M розсудливих токенів у наборі Artificial Analysis Intelligence.
9,05K