俺の世界がぶつかり合う! Factorioハーネスを本気で作ることは考えていませんが、ソフトウェア会社を運営するのと同等の難しさがあり、成功した場合のインセンティブと互換性のあるリターンカーブもあまり明確にありません。
Isaac King 🔍
Isaac King 🔍3月10日 00:12
これは面白いですね。LLMがマジックをプレイするためのハーネス、録画された対局とリーダーボード付き。 予想通り、彼らは完全にひどい出来です。しかし、フロンティアモデルはリーダーボードのトップにいるので、ある程度の兆しはあります!
大まかに言えば、「問題を指し示せば顔をぶっ飛ばす」という一般的な表現よりも先に経済的影響が期待されるべきだと思いますし、実際、コーディングツールが経済的影響を明確にしているのは、SATテストのように自明なゲームが飽和状態になる前のことです。
しかし興味深いことに、バニラ版で最初にFactoioロケット発射を実現するハーネスは、ロケットを実現するためのシステムを書く人にとっては、Factorio LUAコードなどのインターフェースを書く人よりも難しい問題だと思います。
(私は、AI 2027が予測したような現実の工場でのSotA製造の大幅な改善よりも、Factorioの発売をずっと早く期待していると思います。 2030年にFactorioBenchが未解決のままになるとは思いません。)
(Claude Opus 4.6は現在、私と一緒にFactorio Seablockをプレイしています。これは「進捗を報告できる相手がいて、技術ツリーの深い部分には十分な文脈がないと学び、意味のある推奨を出せないが、私の言ったことを反響できる」という意味です)
(これは主に、私の周りの他の人たちが「赤い回路が銅の需要のせいで不安定で、硫酸生産の下流が新たな世界需要に対応できていない」といったアップデートを聞かないようにするためです。今、空気を洗っている。」)
@GregorStocks @JohnWittle また、LLMの非人間的な適応の一つは、ビターに主観的に2時間の労力を失っても、a) 基地建設に使う資源以外ほとんど失わないことです。クリックすればラウンドが解放されるはずですし、b) ほぼ無限の忍耐強さが強いということです。
@IsaacKing314「十分に高度なハーネス」であれば、#2は1,000のLOCと数ページのヒント程度だと思います。
564