Incrementality Testing: Misst deine Werbung wirklich den Unterschied?

Q: Warum lügt ROAS bei lokalen Kampagnen?

ROAS (Return on Ad Spend) misst den Umsatz pro Werbe-Euro, berücksichtigt aber nicht ob dieser Umsatz auch ohne Werbung stattgefunden hätte. Für lokale Kampagnen ist das besonders problematisch: Viele Kunden die auf eine lokale Anzeige klicken, hätten den Laden sowieso besucht — sie haben nur den bequemsten Weg genommen. ROAS schreibt der Werbung zu, was ohnehin passiert wäre.

Q: Wie funktioniert ein Geo-Holdout Test?

Bei einem Geo-Holdout Test teilst du deine Standorte in zwei Gruppen: Die Testgruppe bekommt Werbung, die Kontrollgruppe (Holdout) nicht. Nach einer definierten Testperiode vergleichst du die Ergebnisse. Wenn die Testgruppe 15% mehr Store Visits hat als die Kontrollgruppe, dann sind diese 15% der inkrementelle Effekt deiner Werbung.

Q: Wie viele Standorte brauche ich für einen Incrementality Test?

Für statistisch aussagekräftige Ergebnisse brauchst du mindestens 30-50 Standorte, idealerweise mehr. Die Standorte sollten in vergleichbare Gruppen aufteilbar sein (ähnliche Größe, Region, Kundenstruktur). Bei weniger als 30 Standorten wird der statistische Nachweis schwierig, weil die Stichprobe zu klein ist.

Du schaltest lokale Google Ads für 80 Filialen. Budget: 40.000 Euro pro Monat. Dein ROAS (Return on Ad Spend) sagt: Für jeden investierten Euro kommen 5 Euro zurück. Klingt fantastisch. Dein Chef ist zufrieden. Du bist zufrieden.

Aber eine Frage stellt niemand: Wären diese 5 Euro auch ohne die Ads gekommen?

Das ist die unbequeme Wahrheit über ROAS im lokalen Marketing: Er lügt. Nicht absichtlich. Aber systematisch. Und die Konsequenz ist, dass Filialisten jeden Monat Zehntausende Euro in Kampagnen stecken, von denen sie nicht wissen ob sie überhaupt etwas bewirken.

Incrementality Testing ist die Lösung. Es ist nicht einfach. Es ist nicht billig. Aber es ist die einzige Methode die dir ehrlich sagt, was deine Werbung wirklich bringt.

Warum ROAS für lokale Kampagnen lügt

Stell dir vor, du bist Marketingleiter einer Optikerkette. Du schaltest Google Ads auf das Keyword "Optiker Mannheim". Jemand sucht "Optiker Mannheim", sieht deine Anzeige, klickt drauf, kommt in den Laden, kauft eine Brille für 400 Euro.

Dein ROAS rechnet: 400 Euro Umsatz geteilt durch 8 Euro Klickkosten = ROAS von 50. Weltklasse.

Aber denk kurz nach: Der Mensch hat "Optiker Mannheim" gegoogelt. Er wollte zum Optiker. Er wäre vermutlich auch ohne deine Ad in irgendeinen Optiker gegangen. Vielleicht sogar in deinen — weil er der nächste ist, weil ein Freund ihn empfohlen hat, weil er seit 10 Jahren Stammkunde ist.

Deine Ad hat möglicherweise nicht den Kauf erzeugt. Sie hat nur den Klick erzeugt. Der Kauf wäre vielleicht sowieso passiert. Und dein ROAS von 50 ist eine Illusion.

Das ist kein Randfall. Das ist das Grundproblem von Attribution im lokalen Marketing. Bei Brand-Suchanfragen ("Fielmann Mannheim") ist es offensichtlich — der Kunde sucht bereits nach dir. Aber auch bei generischen Suchanfragen ("Optiker in der Nähe") gibt es eine hohe natürliche Nachfrage die du nicht erzeugt hast, sondern nur abschöpfst.

ROAS unterscheidet nicht zwischen "Werbung hat einen Kauf erzeugt" und "Werbung hat einen Kauf begleitet der sowieso stattgefunden hätte". Für lokale Kampagnen, wo die meisten Kunden ohnehin in der Nähe leben und regelmäßig einkaufen, ist das ein massives Problem.

Was Incrementality Testing ist — einfach erklärt

Incrementality Testing beantwortet eine einzige Frage: Was passiert wenn ich die Werbung abschalte?

Das Prinzip ist simpel und kommt aus der Medizinforschung. Du brauchst zwei Gruppen:

Testgruppe: Filialen die Werbung bekommen (wie bisher)
Kontrollgruppe (Holdout): Filialen die KEINE Werbung bekommen

Nach einer definierten Testperiode (typisch: 4-8 Wochen) vergleichst du die Ergebnisse. Wenn die Testgruppe 15% mehr Store Visits hat als die Kontrollgruppe, dann sind diese 15% der inkrementelle Effekt deiner Werbung. Alles andere wäre sowieso passiert.

Das klingt einfach. Und konzeptionell ist es das auch. Die Komplexität steckt in den Details: Welche Standorte kommen in welche Gruppe? Wie lange muss der Test laufen? Wie groß muss die Stichprobe sein? Was verfälscht die Ergebnisse?

Der Geo-Holdout Test: Schritt für Schritt

Die gebräuchlichste Methode für Incrementality Testing bei Filialisten ist der Geo-Holdout Test. So funktioniert er:

Schritt 1: Standorte clustern. Teile deine Standorte in möglichst vergleichbare Gruppen auf. Vergleichbar heißt: ähnliche Umsatzgröße, ähnliche Region, ähnliches Kundenprofil. Du willst Äpfel mit Äpfeln vergleichen — nicht München-Innenstadt mit einem Dorf in Sachsen.

Schritt 2: Test- und Kontrollgruppe definieren. Typischerweise nimmt man 70-80% der Standorte als Testgruppe (mit Werbung) und 20-30% als Kontrollgruppe (ohne Werbung). Die Kontrollgruppe muss groß genug sein für statistisch valide Ergebnisse, aber klein genug um den Gesamtumsatz nicht zu gefährden.

Schritt 3: Baseline messen. Bevor du den Test startest, miss 2-4 Wochen lang die Performance beider Gruppen OHNE Änderung. Das ist deine Baseline. Wenn beide Gruppen sich schon vor dem Test unterschiedlich verhalten, sind sie nicht vergleichbar.

Schritt 4: Test starten. Schalte die Werbung für die Testgruppe ein (oder lasse sie laufen) und schalte sie für die Kontrollgruppe ab. Ändere sonst nichts. Keine neuen Aktionen. Keine Preisänderungen. Keine Sonderöffnungszeiten. Je sauberer der Test, desto besser die Ergebnisse.

Schritt 5: Messen und vergleichen. Nach 4-8 Wochen vergleichst du die KPIs beider Gruppen. Die wichtigsten:

Store Visits (wenn verfügbar)
Umsatz pro Standort
Transaktionen pro Standort
Neukunden vs. Bestandskunden (wenn messbar)

Schritt 6: Uplift berechnen. Die Formel ist einfach:

Inkrementeller Uplift = (Testgruppe - Kontrollgruppe) / Kontrollgruppe × 100

Wenn die Testgruppe 12% mehr Store Visits hat als die Kontrollgruppe, dann hat deine Werbung 12% zusätzliche Besuche erzeugt. Das ist dein echter ROI.

Wie viele Standorte brauchst du?

Die ehrliche Antwort: Es kommt drauf an. Aber hier sind Richtwerte aus der Praxis:

30-50 Standorte: Minimum für einen brauchbaren Test. Die Ergebnisse haben eine gewisse Unschärfe, aber du erkennst grobe Trends.
50-100 Standorte: Gute Basis für statistisch signifikante Ergebnisse. Du kannst nach Regionen oder Standorttypen segmentieren.
100+ Standorte: Ideal. Du kannst mehrere Tests parallel laufen lassen und granulare Segmente vergleichen.

Bei weniger als 30 Standorten wird es schwierig. Nicht unmöglich — aber die statistische Power ist gering. Ein einzelner Ausreißer (ein Standort der zufällig einen super Monat hat) kann das Ergebnis kippen.

Für kleine Filialnetze gibt es Alternativen: Zeitbasierte Tests (Werbung an, Werbung aus, Werbung an — und dann die Perioden vergleichen) oder Matched-Market Tests (zwei einzelne, möglichst ähnliche Standorte gegeneinander testen). Sie sind weniger robust, aber besser als nichts.

Ein echtes Beispiel

Eine Baumarktkette mit 90 Standorten in Deutschland schaltet seit zwei Jahren lokale Google Ads. Budget: 60.000 Euro pro Monat. Der ROAS sieht gut aus — 4,2x. Aber der CMO will wissen: Bringen die Ads wirklich mehr Kunden in die Märkte?

Der Geo-Holdout Test:

70 Standorte in der Testgruppe (Google Ads laufen weiter)
20 Standorte in der Kontrollgruppe (Google Ads werden abgeschaltet)
Testdauer: 6 Wochen
Gemessen: Store Visits via Google Ads, Umsatz via POS-Daten

Das Ergebnis nach 6 Wochen:

Store Visits Testgruppe: +8% gegenüber Baseline
Store Visits Kontrollgruppe: -2% gegenüber Baseline (saisonaler Rückgang)
Inkrementeller Uplift: ca. 10%
Umsatz-Uplift pro Standort: ca. 6%

Die Werbung wirkt — aber nicht so stark wie der ROAS suggeriert hatte. Statt 4,2x Return sind es real eher 1,8x. Immer noch profitabel. Aber ein komplett anderes Bild. Und plötzlich stellen sich neue Fragen: Können wir den Uplift steigern? Bei welchen Standorten wirkt die Werbung am besten? Welche Keywords treiben den inkrementellen Effekt?

Das sind die richtigen Fragen. Und ohne Incrementality Testing hätte sie niemand gestellt.

Die statistischen Anforderungen

Incrementality Testing ist kein Bauchgefühl. Es ist Statistik. Und Statistik hat Regeln. Drei Begriffe die du kennen solltest:

Statistische Signifikanz: Wie sicher bist du, dass der gemessene Unterschied nicht Zufall ist? Der Industriestandard ist 95% Konfidenz. Das heißt: Es gibt eine 5% Chance, dass der Unterschied zufällig ist. Für die meisten Geschäftsentscheidungen ist das ausreichend.

Statistische Power: Die Wahrscheinlichkeit, einen echten Effekt zu erkennen wenn er existiert. Standard: 80%. Wenn dein Test eine Power von 80% hat und die Werbung tatsächlich 10% Uplift erzeugt, wirst du diesen Uplift in 8 von 10 Tests erkennen.

Minimum Detectable Effect (MDE): Der kleinste Effekt den dein Test erkennen kann. Je mehr Standorte und je länger die Testdauer, desto kleinere Effekte kannst du messen. Bei 50 Standorten und 4 Wochen liegt der MDE typischerweise bei 8-12%. Einen 3% Uplift wirst du nicht zuverlässig erkennen.

Das klingt kompliziert. Ist es auch. Aber du musst die Formeln nicht selbst berechnen. Es gibt Tools dafür — und jede seriöse Performance-Agentur sollte in der Lage sein, einen sauberen Test aufzusetzen.

Was Incrementality Testing kostet — und was es kostet es NICHT zu tun

Der direkte Kostenpunkt eines Geo-Holdout Tests: Du verlierst den potenziellen Werbeumsatz der Kontrollgruppe für die Testdauer. Bei 20 Standorten ohne Ads für 6 Wochen und einem echten Uplift von 10% sind das vielleicht 5-8% deines monatlichen Umsatzes in diesen Märkten.

Das klingt nach viel. Aber vergleich es mit der Alternative: Ohne Test weißt du nicht, ob deine 60.000 Euro Monatsbudget 60.000 Euro bringen oder 6.000 Euro. Du weißt nicht welche Kampagnen funktionieren. Du weißt nicht welche Standorte Hilfe brauchen und welche auch ohne Ads laufen.

Die Kosten von Nicht-Testen sind unsichtbar. Aber sie sind da. Jeden Monat. In jedem Budget-Meeting in dem jemand sagt "Der ROAS sieht gut aus" — ohne zu wissen ob das stimmt.

Laut IAB (2024) sagen 71% der Advertiser, dass Incrementality wichtiger ist als ROAS. Die Industrie weiß es. Die Frage ist nur, wer es auch umsetzt.

Die häufigsten Fehler

Wenn du einen Incrementality Test aufsetzt, vermeide diese Fehler:

Fehler 1: Zu kurze Testdauer. 2 Wochen reichen nicht. Die meisten Kunden kaufen nicht impulsiv. Gib dem Test mindestens 4 Wochen, besser 6-8. Sonst misst du Rauschen, nicht Signal.

Fehler 2: Kontrollgruppe zu klein. 5 Standorte ohne Ads sind keine Kontrollgruppe — das ist ein Anekdoten-Sammlung. Du brauchst mindestens 15-20 Standorte in der Kontrollgruppe für halbwegs belastbare Ergebnisse.

Fehler 3: Externe Faktoren ignorieren. Wenn während des Tests ein Wettbewerber eine massive Kampagne startet, ein Feiertag dazwischenkommt oder das Wetter extrem wird, verfälscht das deine Ergebnisse. Plane Tests in ruhigen Perioden.

Fehler 4: Nur einmal testen. Ein Test ist ein Datenpunkt. Kein Beweis. Wiederhole den Test in verschiedenen Perioden, mit verschiedenen Gruppierungen. Erst wenn die Ergebnisse konsistent sind, hast du ein belastbares Bild.

Fehler 5: Das Management nicht mitnehmen. Incrementality Testing liefert oft unangenehme Wahrheiten. Dein ROAS von 5 wird plötzlich zu einem echten Uplift von 1,5. Bereite dein Management darauf vor. Erkläre vorab, warum das eine gute Nachricht ist — weil ihr jetzt endlich wisst was wirklich funktioniert.

Was du morgen tun kannst

Wenn du ein Filialnetz mit 30 oder mehr Standorten hast und digitale Werbung schaltest, hast du keinen Grund, nicht zu testen. Hier ist dein Fahrplan:

Daten sammeln. Du brauchst mindestens 3 Monate historische Daten pro Standort (Umsatz, Transaktionen, idealerweise Store Visits). Ohne Baseline kein Test.
Standorte clustern. Gruppiere deine Standorte nach Größe, Region und Performance. Wähle vergleichbare Paare für Test- und Kontrollgruppe.
Testdesign definieren. 70/30 Split, 6 Wochen Laufzeit, klare KPIs. Schreib es auf. Halte dich dran.
Test durchführen. Keine Panik wenn die Kontrollgruppe kurzfristig leidet. Das ist der Preis für Erkenntnis. Und die Erkenntnis ist mehr wert als 6 Wochen Ads in 20 Märkten.
Ergebnisse analysieren und handeln. Wenn der Uplift positiv ist: optimiere. Wenn er null ist: hinterfrage alles. Beides ist wertvolles Wissen.

Incrementality Testing ist nicht sexy. Es ist nicht schnell. Es erfordert Geduld, Disziplin und die Bereitschaft unangenehme Wahrheiten zu hören. Aber es ist das einzige Werkzeug das dir ehrlich sagt, ob dein Werbebudget arbeitet — oder nur so tut als ob.

Quellen

IAB — State of Incrementality 2024: 71% der Advertiser halten Incrementality für wichtiger als ROAS.
Google Ads Help — About Store Visits: Offizielle Dokumentation zu Store Visit Conversions als Basis für Incrementality-Messungen.
Google — Think with Google: Incrementality: Best Practices für Geo-Holdout Tests und experimentelles Design.
Nielsen — Incrementality Testing Guide: Methodische Grundlagen, MDE-Berechnungen und statistische Anforderungen.
BrightLocal — Local Consumer Review Survey 2026: Daten zu lokalem Suchverhalten und digitalem Kaufprozess.

Dieser Artikel ist Teil der Filialhelden-Serie. Lies auch: Lokales Marketing ist kaputt (Das Manifest) · Store Visit Attribution: So misst du ob deine Ads Kunden in die Filiale bringen (Tracking) · Gießkanne vs. Skalpell (Strategie)

Häufig gestellte Fragen

Was ist Incrementality Testing?

Incrementality Testing misst den echten Zusatzeffekt von Werbung. Es beantwortet die Frage: Wären die Kunden auch ohne die Werbung gekommen? Dafür werden Regionen mit Werbung (Testgruppe) mit Regionen ohne Werbung (Kontrollgruppe) verglichen. Der Unterschied ist der inkrementelle Effekt — der echte Mehrwert deiner Kampagne.

Warum lügt ROAS bei lokalen Kampagnen?

ROAS misst den Umsatz pro Werbe-Euro, berücksichtigt aber nicht ob dieser Umsatz auch ohne Werbung stattgefunden hätte. Bei lokalen Kampagnen hätten viele Kunden den Laden sowieso besucht — ROAS schreibt der Werbung zu, was ohnehin passiert wäre.

Wie funktioniert ein Geo-Holdout Test?

Du teilst deine Standorte in zwei Gruppen: Die Testgruppe bekommt Werbung, die Kontrollgruppe nicht. Nach 4-8 Wochen vergleichst du die Ergebnisse. Der Unterschied in Store Visits oder Umsatz ist der inkrementelle Effekt deiner Werbung.

Wie viele Standorte brauche ich für einen Incrementality Test?

Mindestens 30-50 Standorte für statistisch aussagekräftige Ergebnisse. Bei 100+ Standorten kannst du granulare Segmente vergleichen und mehrere Tests parallel laufen lassen. Bei weniger als 30 Standorten sind zeitbasierte Tests eine Alternative.