DApp Store | Hub da Web3 para eventos e jogos

Tópicos em alta

Alguém acabou de pular o Neural Engine da Apple para treinar modelos. O Neural Engine dentro de cada Mac da série M foi projetado para inferência. Execute modelos, não os treine. Sem API pública, sem documentação e certamente sem retropropagação. Um pesquisador fez engenharia reversa das APIs privadas mesmo assim e construiu um loop de treinamento de transformador que roda para frente e para trás diretamente no hardware do ANE. O método ignora completamente o CoreML. Em vez de usar as ferramentas oficiais da Apple, o projeto constrói programas em MIL (Model Intermediate Language), compila-os em memória usando APIs '_ANEClient' não documentadas e alimenta os dados por meio de buffers de memória compartilhada do IOSurface. Os pesos são incorporados nos programas compilados como constantes. E A etapa de treinamento ACH despacha seis kernels personalizados: attention forward, feedforward forward, depois quatro passagens para trás que calculam gradientes em relação às entradas. Os gradientes de peso ainda rodam na CPU usando as bibliotecas matriciais do Accelerate, mas o trabalho pesado (matrix multiplies, softmax, funções de ativação) acontece no ANE. Isso torna três coisas possíveis que antes não existiam: 1. Treinar modelos pequenos localmente sem gastar a bateria 2. Ajuste fino no dispositivo sem enviar dados para um servidor ou ligar a GPU 3. Pesquise o que o hardware da ANE realmente pode fazer quando você ignora as barreiras da Apple Se essa abordagem escalar, a próxima onda de IA no dispositivo deixará de ser sobre rodar o modelo congelado de outra pessoa.

Melhores

Classificação

Favoritos