Die künstliche Intelligenz ist massiv in den Diskurs visueller Testwerkzeuge eingezogen: „Visual AI", „self-healing tests", „smart diff" – jeder Anbieter beansprucht seine eigene KI-Schicht. Hinter den Marketingbegriffen ist die technische Realität nuancierter: Meist handelt es sich um perzeptuelle Algorithmen (SSIM, Embeddings), die darauf trainiert sind, kosmetisches Rauschen zu filtern und nur wahrscheinlich signifikante Abweichungen zurückzumelden. Das ist nützlich, manchmal beeindruckend, aber kein Wunder: Ein falsch-negatives Ergebnis bleibt ein in Produktion ausgelieferter Bug.
Diese Seite versammelt Artikel, die KI im Testing kritisch betrachten: Was steckt wirklich hinter den Visual-AI-Versprechen der wichtigsten Akteure (allen voran Applitools)? Wo ist der Mehrwert greifbar und wo eher Kommunikation? Wie bewertet man die Zuverlässigkeit eines sogenannten intelligenten Algorithmus, ohne in den Black-Box-Effekt zu verfallen? Welche Vorsichtsmaßnahmen sind nötig, wenn ein Werkzeug allein darüber entscheidet, ob ein Unterschied „wichtig" ist? Wir behandeln auch das aufstrebende Thema der LLMs im Testing – Szenariengenerierung, automatische Diff-Klassifizierung, Review-Unterstützung – und unterscheiden vielversprechende Anwendungen von hohlen Ankündigungen. Delta-QA verwendet derzeit keine generative KI in seiner Vergleichsengine, und diese Artikel bekennen sich zu einer ehrlichen Haltung darüber, was KI dem visuellen Testing heute wirklich bringt.