韓国のAIスタートアップ、Trillion Labsは、人工分析知能指数で20点を獲得した小規模なオープンウェイト推論モデル「Tri-21B-think Preview」を立ち上げました 主なベンチマークポイント: − 小型ながら高いがトップではない知能:Tri-21B-think Previewは、210億パラメータという比較的小さいにもかかわらず高い評価を受けています。モデルは21Bに過ぎないため、GLM-5やKimi K2.5のような主要なオープンソースモデルと比べてセルフホストが比較的アクセスしやすいです † 低い幻覚率:Tri-21B-thinkプレビューはAA-Omniscience Indexで-49点を獲得しました。AAは業界全体で知識の信頼性と幻覚を測定する独自の人工分析ベンチマークです。この良いスコアは主に比較的低い幻覚率(62%)によるもので、これは私たちがベンチマークした韓国モデルの中で最も低い数値です。 † エージェントツール利用における強み:Tri-21B-thinkプレビューはτ²-Bench Telecomで93%のスコアを獲得し、エージェントツール使用ワークフローで高いパフォーマンスを示しています。Tri-21B-think プレビューは、このカテゴリーのフロンティアオープンウェイトモデルの中でも、DeepSeek V3.2やMiniMax M2.5と同等のスコアを獲得しています † 高いトークン使用率:Tri-21B-thinkプレビューは、同じ知能層の他のモデルと比較して非常に高いトークン使用率を示しており、人工分析知能スイート全体で約1億2,000万の推論トークンを使用しています。これは、別の韓国モデルであるK-EXAONE(1億ドルの推論トークン)に相当します † No Public Endpoints: Tri-21B-think PreviewはApache 2.0ライセンスのオープンウェイトモデルです。現在、モデルにアクセスする唯一の方法はセルフホスティングです。Trillion Labsは、近い将来、ファーストパーティ専用エンドポイントのサービスが提供される見込みであると共有しています。 さらなる分析については下記を参照してください
Tri-21B-think Previewはτ²-Bench Telecomで93%の評価を得ており、エージェント型ツール使用ワークフローで優れたパフォーマンスを示しています。
Tri-21B-think Previewは、人工分析知能スイート全体で約1億2千万の推論トークンを使用し、非常に高いトークン使用率を示しています。
8.98K