Qwen3.5 pode ser o primeiro LLM de fronteira a enfrentar a Maldição da Profundidade. Sua semelhança camada a camada mostra redundância muito menor em camadas mais profundas em comparação com Qwen3. Meu palpite: dado o tamanho incomum de 9B deles, ou alguma reorganização inteligente das camadas (poda/troca/reutilização) ou uma mudança no esquema de normalização. @Alibaba_Qwen