Minha visão contrária é que a visão de "modelos são commodities, só troca" é uma visão terminal e ingênua quase exclusivamente por pessoas aqui que nunca enviaram produtos baseados em LLM em profundidade. Essas pessoas geralmente são apenas pontificadores. Minha opinião pessoal é que o fosso realmente existe e é o encaixe acumulado... Que são coisas como bibliotecas de prompts, tratamento de casos limite, intuição institucional sobre modos de falha e calibração de confiança embutida. E os custos de troca se acumulam de forma não linear com a profundidade de integração. O consumidor de API em nível superficial talvez seja trivial. Mas para coisas profundamente incorporadas como lógica de segmentação, pipelines de comunicação, fluxos de trabalho classificados etc., o custo de troca é basicamente um ciclo completo de reengenharia disfarçado de decisão de fornecedor. A situação dow/antrópica especificamente é interessante porque as organizações militares provavelmente têm a versão mais extrema desse problema. Eles não podem simplesmente fazer um teste Yolo na produção, e cada caso de referência comportamental precisa ser revalidado de formas lentas, caras e que exigem expertise especializada que não necessariamente se transfere entre famílias de modelos. Estou bem ciente disso porque nossa startup pode mudar para qualquer modelo, mas é um saco porque tudo ou quebra ou fica muito estranho.