Quanto mais eu me aprofundo na Goodfire Research, mais percebo como o ramo da interpretabilidade está silenciosamente se tornando uma das fronteiras mais interessantes da IA (e especialmente da IA para a Ciência) Eles publicaram essa pesquisa no ano passado com a ideia central de como um modelo de fundação de DNA organiza internamente espécies em seu espaço de incorporação de uma forma que espelha a verdadeira árvore evolutiva da vida. ou basicamente como o modelo redescobriu a filogenia puramente a partir de sequências de DNA. eles estudaram o Evo 2 (modelo de DNA desenvolvido pela EvolutionaryScale) e descobriram que: + o genoma de cada espécie é mapeado para um vetor incorporado dentro do modelo. + essas imersão formam uma estrutura geométrica curva (uma variedade). As distâncias + ao longo dessa variedade correspondem à distância evolutiva real entre espécies. Então, dentro do modelo: espécies semelhantes → embeddings próximos espécies distantes → embeddings distantes e a estrutura que emerge é essencialmente a árvore da vida. Isso pode ser algo inovador como modelos de fundação podem redescobrir estruturas científicas automaticamente.