La inteligencia artificial ha irrumpido masivamente en el discurso de las herramientas de pruebas visuales: «Visual AI», «self-healing tests», «smart diff», cada editor reivindica su capa de IA. Detrás de los términos de marketing, la realidad técnica es más matizada: en la mayoría de los casos se trata de algoritmos perceptuales (SSIM, embeddings) entrenados para filtrar el ruido cosmético y solo reportar las desviaciones probablemente significativas. Es útil, a veces notable, pero no es magia: un falso negativo en una prueba visual sigue siendo un bug entregado en producción.
Esta página reúne los artículos que examinan la IA en el testing con una mirada crítica: lo que realmente cubren las promesas Visual AI de los principales actores (Applitools a la cabeza), dónde el aporte es tangible y dónde se trata más bien de comunicación, cómo evaluar la fiabilidad de un algoritmo llamado inteligente sin caer en el efecto caja negra, qué precauciones tomar cuando una herramienta arbitra sola si una diferencia es «importante» o no. También se aborda el tema emergente de los LLM aplicados al testing —generación de escenarios, clasificación automática de los diffs, asistencia a la revisión— distinguiendo los usos prometedores de los anuncios huecos. Delta-QA no utiliza IA generativa en su motor de comparación actual, y estos artículos asumen un compromiso de honestidad sobre lo que la IA aporta realmente a las pruebas visuales hoy.