Qwen3.5 podría ser el primer LLM de frontera en abordar la Maldición de la Profundidad. Su similitud por capas muestra una redundancia mucho más baja en las capas más profundas en comparación con Qwen3. Mi suposición: dado su inusual tamaño de 9B, ya sea alguna ingeniosa reorganización de capas (poda/intercambio/reutilización) o un cambio en el esquema de normalización. @Alibaba_Qwen