Qwen3.5 saattaa olla ensimmäinen rajaseudun LLM, joka tarttuu Syvyyden Kiroukseen. Sen kerroskohtainen samankaltaisuus osoittaa paljon pienempää redundanssia syvemmillä kerroksilla verrattuna Qwen3:een. Arvaukseni: heidän epätavallisen 9B-kokonsa vuoksi joko jokin nerokas kerrosjärjestely (karsiminen/vaihto/uudelleenkäyttö) tai muutos normalisointimenetelmässä. @Alibaba_Qwen