Qwen3.5 ar putea fi primul LLM de frontieră care abordează Blestemul Profunzimii. Similaritatea sa pe straturi arată o redundanță mult mai scăzută în straturile mai adânci comparativ cu Qwen3. Presupunerea mea: având în vedere dimensiunea lor neobișnuită de 9B, fie o reorganizare inteligentă a straturilor (tăiere/schimbare/reutilizare), fie o schimbare în schema de normalizare. @Alibaba_Qwen