En nuestro último episodio de podcast de partners, @BenAtBox, CTO de Box, se sentó con @ankrgyl, CEO de @braintrust, para explorar cómo las organizaciones pueden evaluar, probar y desplegar agentes de IA de forma eficaz a gran escala. Marcas de tiempo 00:39 Ankur Goyal comparte su viaje desde el procesamiento de documentos con IA hasta Braintrust 03:01 Definiendo las evaluaciones y cómo funcionan en IA 07:03 No determinismo y complejidad en la toma de decisiones de los agentes de IA 15:12 Consejos para manejar el no determinismo al trabajar con datos financieros en IA 17:40 Uso de múltiples caminos para la validación y la importancia de cruzar los resultados 22:12 El papel crítico del contexto en la evaluación de la precisión de la salida de la IA 26:03 Las evaluaciones internas como piedra angular del desarrollo fiable de productos de IA 32:16 Promover la transparencia en la evaluación de IA con proveedores 34:45 Consejos para que las empresas eviten fallos al desplegar capacidades agenticas