Tópicos populares
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.

Bartosz Naskręcki
Matemático | Vice-Reitor @ Adam Mickiewicz University em Poznań|Unir matemática rigorosa com programação e ML|Apaixonado pelo que a IA realmente entende
Acho que finalmente alguém escreveu em texto simples o que venho pensando há bastante tempo. Obrigado @getjonwithit por este tópico. Esta perspectiva abre novos desafios muito interessantes. Como podemos realmente comunicar matemática e física de forma eficaz entre nós? A invenção da geometria algébrica moderna por Grothendieck é um exemplo proeminente de um processo de compressão extremamente bem-sucedido. Coincidentemente, vemos recentemente uma enorme melhoria dos LLMs na área de álgebra e teoria dos números.

Jonathan Gorard15/03, 00:18
Acho que uma das conclusões que devemos tirar do tremendo sucesso dos LLMs é quanta do conhecimento humano e da sociedade existe em níveis muito baixos de complexidade de Kolmogorov.
Estamos entrando em uma era onde a representação mínima de um artefato cultural humano... (1/12)
145
Comecei na semana passada um curso para os nossos alunos de ciência da computação sobre redes neurais. O meu plano é passar pelos clássicos iniciais (McCulloch–Pitts, Rosenblatt), através dos desenvolvimentos em torno de todos os artigos marcantes, até ao Attention Is All You Need. Estamos a construir compreensão através de uma análise matemática muito detalhada dos conceitos, muitos experimentos numéricos e experiência prática com cada noção que definimos.
Devo admitir que não esperava ter tanto prazer em brincar com os pesos das redes, internalizando os princípios fundamentais e apenas experimentando. Já construí o primeiro lote de notas e aplicações para o primeiro mês de experimentos.
Sugestões e ideias são muito bem-vindas. Vou manter as minhas notas abertas a todos, por isso estou curioso se há alguma imprecisão ou pontos óbvios que possa ter perdido.

203
Desde ontem, tenho trabalhado com o meu colaborador Piotr Pokora em um problema relacionado a superfícies logarítmicas. Estávamos tentando descobrir como pesquisar o espaço combinatório de possíveis configurações de linhas em um quartico suave, a fim de maximizar a chamada inclinação de Chern. Em termos numéricos, fizemos muitos exemplos, e o famoso quartico de Fermat x^4 + y^4 + z^4 + w^4 = 0 é atualmente o detentor do recorde para a inclinação (= 8/3) para uma configuração particular de 16 linhas (veja nosso artigo). Este era o máximo esperado, que temos tentado superar ou provar nos últimos dois anos. Hoje, executei o problema com a versão mais avançada do GPT Pro usando um prompt robusto que incluía muitos detalhes sobre o problema e o texto completo do nosso artigo.
Recebi uma visão muito interessante: usar programação linear mista. Esta abordagem supera de longe as técnicas de força bruta, incluindo o recozimento simulado. Nós mesmos não havíamos visto isso, mas o modelo encontrou essa percepção e explicou como escrever um código eficiente usando o SciPy.
Agora percebo que somos três no escritório: dois humanos e um sistema agente com habilidades e um poder computacional substancial. As habilidades estão se tornando cada vez mais importantes, e essa harness agente produz resultados incríveis. Sinto que mudei completamente minha perspectiva. Ainda gosto de colaborar com humanos, mas delego buscas profundas, ideação ousada e exploração extensa para os modelos. É simplesmente mais rápido e eficiente. E o progresso é real. Agora temos um caminho concreto a seguir.



287
Top
Classificação
Favoritos
