Tópicos em alta
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
Alguém acabou de pular o Neural Engine da Apple para treinar modelos.
O Neural Engine dentro de cada Mac da série M foi projetado para inferência.
Execute modelos, não os treine. Sem API pública, sem documentação e certamente sem retropropagação.
Um pesquisador fez engenharia reversa das APIs privadas mesmo assim e construiu um loop de treinamento de transformador que roda para frente e para trás diretamente no hardware do ANE.
O método ignora completamente o CoreML.
Em vez de usar as ferramentas oficiais da Apple, o projeto constrói programas em MIL (Model Intermediate Language), compila-os em memória usando APIs '_ANEClient' não documentadas e alimenta os dados por meio de buffers de memória compartilhada do IOSurface.
Os pesos são incorporados nos programas compilados como constantes. E
A etapa de treinamento ACH despacha seis kernels personalizados: attention forward, feedforward forward, depois quatro passagens para trás que calculam gradientes em relação às entradas.
Os gradientes de peso ainda rodam na CPU usando as bibliotecas matriciais do Accelerate, mas o trabalho pesado (matrix multiplies, softmax, funções de ativação) acontece no ANE.
Isso torna três coisas possíveis que antes não existiam:
1. Treinar modelos pequenos localmente sem gastar a bateria
2. Ajuste fino no dispositivo sem enviar dados para um servidor ou ligar a GPU
3. Pesquise o que o hardware da ANE realmente pode fazer quando você ignora as barreiras da Apple
Se essa abordagem escalar, a próxima onda de IA no dispositivo deixará de ser sobre rodar o modelo congelado de outra pessoa.
Melhores
Classificação
Favoritos
