En nuestro último episodio del pódcast de socios, @BenAtBox, CTO de Box, se sentó con @ankrgyl, CEO de @braintrust, para explorar cómo las organizaciones pueden evaluar, probar y desplegar agentes de IA de manera efectiva a gran escala. Tiempos 00:39 Ankur Goyal comparte su trayectoria desde el procesamiento de documentos de IA hasta Braintrust 03:01 Definiendo evaluaciones y cómo funcionan en IA 07:03 No determinismo y complejidad en la toma de decisiones de los agentes de IA 15:12 Consejos sobre cómo manejar el no determinismo al trabajar con datos financieros en IA 17:40 Usando múltiples caminos para la validación y la importancia de verificar los resultados 22:12 El papel crítico del contexto en la evaluación de la precisión de la salida de IA 26:03 Evaluaciones internas como la piedra angular del desarrollo confiable de productos de IA 32:16 Promoviendo la transparencia en la evaluación de IA con proveedores 34:45 Consejos para las empresas para evitar fracasos al desplegar capacidades agénticas