Home / Insights / Meta Ads

Meta Ads

Meta Ads Retargeting: ROAS oder Incrementality, was warmes Budget wirklich trägt

Ein hoher Retargeting-ROAS beweist nicht, dass deine Anzeigen die Käufe ausgelöst haben. Meta Ads Retargeting trifft Menschen, die schon ein Kaufsignal gezeigt haben, also wandert ein Teil ohnehin geplanter Käufe in deine Paid-Attribution. Über warmes Budget entscheidet deshalb nicht der gemeldete ROAS, sondern der inkrementelle Beitrag: Wie viele dieser Käufe wären ohne die Anzeige nicht entstanden? Diese Frage klärst du mit sauberen Exclusions, Frequency-Diagnose und, bei genug Volumen, einem Lift-Test.

Kurz gesagt

Plattform-ROAS ist eine Diagnose, keine Entscheidung. Retargeting sieht fast immer effizient aus, weil es vorhandene Kaufabsicht einsammelt. Bevor du warmes Budget kürzt, hochskalierst oder auf einen festen Prozentsatz fixierst, klär drei Dinge: welcher Anteil der Käufe aus reinem View statt Click stammt, wie viel davon Brand Search oder Organik ohnehin abgeholt hätte, und ob der erreichbare Pool groß genug ist, dass ein Incrementality-Test statistisch überhaupt trägt. Gewinner ist nicht die Kampagne mit dem höchsten ROAS, sondern die mit nachweisbar zusätzlichen profitablen Handlungen.

Warum Meta Ads Retargeting fast immer gut aussieht

Wer im Retargeting-Pool landet, hat schon interagiert: Websitebesuch, Produktansicht, Video View, Add to Cart, Formularstart, bestehende Kundenbeziehung. Diese Leute stehen im Schnitt näher an einer Handlung als kalter Traffic. Der Plattform-ROAS profitiert von dieser vorhandenen Absicht, ohne sie zu verursachen.

Attribution ordnet einer Anzeige eine Conversion zu, sobald die Person innerhalb des Fensters nach dem Kontakt kauft. Die eigentliche wirtschaftliche Frage beantwortet sie aber nie: Hätte diese Person auch ohne die Retargeting-Ad gekauft? Genau hier reißt die Lücke zwischen Attribution (dem CAC, der scheinbar aufgeht) und Incrementality (dem echten kausalen Zusatzbeitrag) auf. Wer mit warmem Budget arbeitet, braucht eine Meta Ads Betreuung mit echter Wirkungsmessung, die diese beiden Größen nicht verwechselt. Den Mechanismus dahinter haben wir ausführlicher beschrieben, nämlich warum der Plattform-ROAS täuscht, sobald du auf Basis attribuierter Werte skalierst.

Der 2026-Kontext, der das Bild verschiebt

Zum Stand der Prüfung (berichtet, datiert auf den 12. Januar 2026) hat Meta laut Sekundär-Berichterstattung die Attributionsfenster 7-Tage-View und 28-Tage-View aus dem Reporting entfernt; im Wesentlichen unterstützt bleiben 1-Day-View und 7-Day-Click. Die Folge: Gemeldete View-Conversions fielen je nach Konto und Branche teils deutlich, ohne dass die tatsächliche Performance eingebrochen wäre. Dieselben Sekundärquellen nennen als grobe Größenordnung rund 15 bis 40 Prozent Rückgang, das ist keine belastbare Benchmark, sondern eine Orientierung. Für Retargeting zählt das doppelt. Dein historisch hoher View-ROAS war teils ein Reporting-Artefakt, und ein heutiger Conversion-Rückgang kann genauso gut nur das verkürzte Fenster sein, nicht weniger Wirkung. Behandle beide Bewegungen erst als zu prüfende Reporting-Effekte, bevor du sie als reale Wirkungsänderung liest.

Retargeting nach Entscheidungszustand statt nach Tagen

Viele Setups segmentieren nur über Zeitfenster: 7, 14, 30, 180 Tage. Zeit ist relevant, beschreibt aber nicht, was die Person braucht. Ein „alle Websitebesucher 180 Tage"-Pool wirft einen zufälligen Blog-Leser mit einem Checkout-Abbrecher in denselben Topf. Beide bekommen dieselbe Botschaft, beide werden gleich teuer beworben, und keiner bekommt den Hebel, der seine offene Frage löst.

Sinnvoller ist eine Segmentierung nach Entscheidungszustand. Welche Botschaft, welcher Ausschluss und welche Frequency angemessen sind, hängt davon ab, wo die Person gerade steht:

Zustand Signal Offene Frage des Nutzers Wenn-dann: Aufgabe der Ad
Aufmerksamkeit, kein Produktinteresse Video View, Social Engagement, Profilbesuch „Ist das Problem relevant für mich?" Wenn nur Engagement-Signal, dann Problem oder Mechanismus vertiefen, Proof liefern, noch kein harter Kauf-CTA
Produkt oder Offer angesehen Produktseite, Advertorial, Pricing „Warum ihr und nicht die Alternative?" Wenn Produktansicht ohne Cart, dann Haupteinwand beantworten, Differenzierung und Kundenerfahrung zeigen
Hohe Kaufabsicht Add to Cart, Checkout, Formularstart „Was hält mich im letzten Schritt?" Wenn Abbruch im Funnel, dann konkrete Friktion lösen (Versand, Zahlung, Sicherheit), zurück zum offenen Schritt
Bestandskunde Kauf in Customer List „Was ist der nächste Wert für mich?" Wenn Käufer, dann Cross-Sell, Wiederkauf oder neue Anwendung, niemals die Neukunden-Ad weiterlaufen lassen
Unqualifiziert oder nicht verfügbar Storno, disqualifizierter Lead, nicht bediente Region Wenn Conversion unmöglich, dann ausschließen, kein Budget auf eine Handlung verbrennen, die nicht stattfinden kann

Eine saubere State Map ist gleichzeitig deine Exclusion-Logik. Wer einen Zustand erreicht, verlässt den darunterliegenden. Wer kauft, verlässt alle Akquise-Pools.

Exclusions: der unterschätzte Hebel

Ohne Ausschlüsse bewirbst du Käufer mit Neukundenrabatten, akquirierst Leads, die längst im Sales-Prozess stecken, attribuierst interne Nutzer und buchst organische Käufer als Paid-Erfolg. Das ist der direkteste Weg, einen Retargeting-ROAS künstlich aufzublasen. Prüfe mindestens: Käufer der letzten X Tage, aktive Subscriber, qualifizierte und disqualifizierte Leads, gebuchte Termine, Mitarbeitende, nicht verfügbare Regionen und Personen in parallelen Kampagnenstrecken.

Eine Einschränkung, die du nicht wegmoderieren solltest: Ausschlüsse sind nie perfekt. Identifier-Verlust, Browserwechsel, Cross-Device-Nutzung und fehlendes Consent begrenzen, wie viele Personen überhaupt gematcht werden. Eine Käuferliste mit niedriger Match Rate schließt real weniger Käufer aus, als die Audience-Größe vermuten lässt. Die Logik wird trotzdem besser, der Ausschluss bleibt aber eine Annäherung, kein Filter mit Garantie.

Frequency: kein universeller Grenzwert

Frequency misst, wie oft eine Person im Zeitraum durchschnittlich erreicht wurde. Einen festen Schwellenwert, ab dem sie „zu hoch" ist, gibt es nicht. Hohe Frequency wird zum Problem bei kleinem Pool, identischen Ads ohne neue Information, steigendem CPM und negativem Feedback. Vertretbar ist sie bei kurzen Sales, erklärungsbedürftigen Produkten und mehreren echt unterschiedlichen Botschaften.

Lies Frequency deshalb nie als einzelne Zahl, sondern im Kontext: je Zeitfenster, gegen Creative-Wechsel, gegen marginale Conversion, gegen negatives Feedback, gegen Audience-Wachstum. Die operative Frage bleibt immer dieselbe: Liefert die nächste Impression noch zusätzliche Entscheidungshilfe, oder zahlst du nur für Wiederholung? Frequency ist hier ein Leading Indicator, ein Diagnosesignal, nicht die Entscheidung selbst.

Budget folgt erreichbarer Nachfrage, nicht einer Quote

Ein fester Prozentsatz fürs Retargeting ist bequem und meistens falsch. Ist der warme Pool klein, treibt ein festes Budget nur die Frequency hoch und kauft dieselben Leute mehrfach. Wächst der Pool stark, lässt ein zu kleines Budget inkrementelle Nachfrage liegen. Der sinnvolle Spend hängt an Poolgröße und -wachstum, Kaufzyklus, organischem Traffic, Prospecting-Volumen, Saison und gemessenem Lift, nicht an einer dauerhaften Quote.

Kernaussage

Budget folgt der erreichbaren, inkrementellen Nachfrage. Ein steigender Retargeting-Spend bei gleichzeitig steigender Frequency und stagnierendem Pool ist kein Skalierungserfolg, sondern teurere Wiederholung.

Wie man Incrementality misst

Es gibt eine Hierarchie der Testdesigns, von robust und aufwendig bis schwach und günstig. Je höher die wirtschaftliche Bedeutung der Frage, desto teurer darf das Design sein.

  • Plattformbasierter Lift-Test. Meta hält eine randomisierte No-Ad-Kontrollgruppe in der eigenen Auktion zurück. Die Testgruppe sieht die Anzeige; der Holdout gewinnt die Impression zwar über einen Ghost Bid, bekommt aber eine andere Anzeige. Der Verhaltensunterschied zwischen beiden Gruppen ist die saubere kausale Schätzung. Die Selbstbedienungs-Verfügbarkeit (zum Stand der Prüfung unter „Experiments" im Business-Konto, alternativ über den Meta-Rep) ist konto- und regionsabhängig, und das Produkt-Namensschema kann sich ändern. Behandle kursierende Schwellen (Holdout-Anteil, Mindest-Spend, Mindest-Conversions) als grobe Größenordnung aus Drittquellen, nicht als feste Meta-Regel, und prüfe die Eligibility im aktuellen Ads Manager.
  • Holdout außerhalb der Plattform. Ein Teil einer Audience wird bewusst nicht bespielt. Schwächer, weil Überschneidungen, andere Kanäle und Cross-Device-Effekte den Vergleich verwässern. Vorsicht bei parallelen Lift-Tests: Wer gleichzeitig Control in Test A und in Test B ist, kontaminiert beide Messungen.
  • Geo-Test. Regionen werden unterschiedlich bespielt. Anfällig für regionale Unterschiede, Promotions und externe Medien.
  • Zeitbasierter Test. Retargeting wird in vergleichbaren Fenstern verändert oder pausiert. Am schwächsten, weil Saison, Wochentage und verändertes Prospecting-Volumen das Signal überlagern.

Was die aktuelle Forschung zu Meta-Experimenten zeigt

Eine 2025 veröffentlichte großskalige Analyse (Burtch, Moakler, Gordon, Zhang, Hill, arXiv:2508.21251) untersuchte 3.204 Lift-Tests und 181.890 A/B-Tests auf Meta. Der entscheidende Punkt für dich: Lift-Tests haben per Design eine echte randomisierte No-Ad-Kontrolle und sind deshalb strukturell nicht von „Divergent Delivery" betroffen. A/B-Tests dagegen liefern Varianten laut Paper an unterschiedlich zusammengesetzte Audiences aus, weil der Auslieferungsalgorithmus für jede Variante die jeweils passende Audience sucht. Das ist beabsichtigt und bleibt auf A/B-Tests beschränkt, verzerrt aber die kausale Interpretation, weil das Ergebnis Creative-Wirkung und Audience-Komposition vermischt.

Übersetzt in deine Praxis: Ein Creative-A/B-Test sagt dir, welche Variante im System besser läuft. Er beantwortet nicht die Frage, ob Retargeting überhaupt zusätzliche Conversions erzeugt. Das beantwortet nur ein Lift-Test. Beide Designs sind nützlich, sie lösen verschiedene Probleme, und das eine ersetzt das andere nicht.

Ein Rechenbeispiel

Illustratives Rechenbeispiel, keine Benchmark und kein Case. Die Zahlen dienen nur dazu, den Mechanismus sichtbar zu machen.

  • Spend: 10.000 Euro, attribuierter Umsatz: 100.000 Euro, Plattform-ROAS: 10.
  • Lift-Test: Testgruppe 1.000 Käufe, vergleichbare Kontrollgruppe 850 Käufe.
  • Zusätzlicher Effekt: 150 inkrementelle Käufe.
  • Bei 100 Euro Bestellwert: 15.000 Euro inkrementeller Umsatz, inkrementeller ROAS 1,5.

Der gemeldete ROAS von 10 und der inkrementelle ROAS von 1,5 beschreiben dieselbe Kampagne und beantworten zwei verschiedene Fragen. Das Beispiel sagt nicht, dass Retargeting schlecht ist. Es zeigt nur, dass 850 von 1.000 Käufen ohnehin passiert wären und allein 150 dem Budget zuzurechnen sind. Steuerst du nach dem ROAS von 10, schützt du Spend, der größtenteils Mitnahmeeffekte einsammelt. Genau deshalb ist die Verteidigung warmen Budgets eine Incrementality-Frage und keine Attributions-Frage.

Retargeting und Prospecting trennen?

Eine separate Retargeting-Kampagne lohnt sich, wenn du Budget bewusst kontrollieren, eine eigene Creative-Logik fahren, nach Zustand reporten, Ausschlüsse sauber steuern oder Incrementality isoliert testen willst. Ein stärker konsolidiertes oder automatisiertes Setup kann ebenso funktionieren, wenn dein Business-Signal sauber ist, Neukunden und Bestand korrekt bewertet werden und du keine eigene Budgetgarantie für den warmen Teil brauchst. Konsolidierte und Advantage+-Setups allokieren dann selbst zwischen warm und kalt. Die Wahl hängt nicht primär an der Plattform-Performance, sondern daran, welche Kontrolle und welche Aussage du brauchst.

Wann diese Regel nicht gilt

„Miss immer den Lift, bevor du entscheidest" ist die Standardlinie. Sie hat klare Ausnahmen:

  • Der Pool ist zu klein für statistische Aussagekraft. Liefert die erreichbare warme Audience nicht genug inkrementelle Conversions im Studienfenster, erkaufst du dir mit einem Lift-Test nur Wartezeit und steigende Frequency. Dann ist die ehrlichere Entscheidung, das Setup über saubere Exclusions und Zustands-Segmentierung zu steuern und auf den formalen Test zu verzichten, bis das Volumen ihn trägt.
  • Die wirtschaftliche Bedeutung ist gering. Ein Lift-Test kostet Holdout-Umsatz, Zeit und Aufmerksamkeit. Steht ein kleiner Retargeting-Spend zur Debatte, ist das stärkere Testdesign überteuert. Hier reicht oft der Blick auf View- gegen Click-Anteil und auf Brand Search.
  • View-attribuierte Conversions dominieren. Seit der berichteten Reporting-Änderung von Januar 2026 ist View-Attribution im Meta-Reporting ohnehin eingedampft. Ein hoher Anteil reiner View-Conversions in deinem alten Reporting ist ein Warnsignal, kein Wirkungsnachweis, und sollte deine Erwartung an den Lift nach unten korrigieren, bevor du überhaupt testest.
  • Dein Problem ist ein gesättigter Pool, kein Budget. „Budget folgt Nachfrage" greift nicht, wenn der warme Pool längst durchbespielt ist. Dann ist die Stellschraube nicht mehr Budget, sondern Creative-Vielfalt und frischer Pool-Nachschub aus dem Prospecting.

In allen vier Fällen bleibt der Leitsatz gleich, nur das Werkzeug ändert sich: Leading Indicators wie ROAS, Frequency, CPM und Pool-Wachstum sind Diagnose. Die Entscheidung trägt der inkrementelle Beitrag auf Business-KPI-Ebene. Der höchste Plattform-ROAS gewinnt nicht. Es gewinnt die Kampagne, die nachweislich zusätzliche profitable Handlungen erzeugt, und dort, wo der formale Test nicht trägt, die ehrlichste Schätzung dieses Beitrags.

Häufige Fragen

Ist ein hoher Retargeting-ROAS ein Beweis, dass die Kampagne funktioniert?

Nein. Retargeting erreicht Menschen, die bereits Kaufabsicht gezeigt haben, also schreibt die Attribution der Anzeige auch Käufe gut, die ohnehin passiert wären. Ein hoher Plattform-ROAS misst zugeordneten, nicht zusätzlichen Umsatz. Ob die Anzeige Käufe verursacht, zeigt nur ein Incrementality- oder Lift-Test mit echter No-Ad-Kontrollgruppe.

Wie messe ich den inkrementellen Effekt von Retargeting?

Der robusteste Weg ist ein plattformbasierter Lift-Test, bei dem Meta eine randomisierte No-Ad-Kontrollgruppe zurückhält und du den Verhaltensunterschied zur Testgruppe misst. Schwächere Alternativen sind Off-Platform-Holdouts, Geo-Tests und zeitbasierte Tests, die anfälliger für Verzerrungen sind. Je höher der Spend und die wirtschaftliche Bedeutung, desto eher lohnt das aufwendigere Design.

Welcher Prozentsatz des Budgets sollte ins Retargeting?

Es gibt keine sinnvolle feste Quote. Das tragfähige Retargeting-Budget hängt von Poolgröße und -wachstum, Kaufzyklus, organischem Traffic, Prospecting-Volumen, Saison und dem gemessenen Lift ab. Ein fester Prozentsatz treibt bei kleinem Pool nur die Frequency hoch oder lässt bei wachsendem Pool Nachfrage liegen. Budget sollte der erreichbaren, inkrementellen Nachfrage folgen.

Ab welcher Frequency ist Retargeting zu aggressiv?

Es gibt keinen universellen Grenzwert. Eine hohe Frequency ist problematisch bei kleinem Pool, identischen Ads ohne neue Information, steigendem CPM und negativem Feedback, aber vertretbar bei kurzen Sales-Zeiträumen oder mehreren echt unterschiedlichen Botschaften. Die Leitfrage ist, ob die nächste Impression noch zusätzliche Entscheidungshilfe liefert oder nur Wiederholung bezahlt.

Warum sind meine Retargeting-View-Conversions Anfang 2026 gesunken?

Laut Sekundär-Berichterstattung (Stand der Prüfung, datiert auf den 12. Januar 2026) hat Meta die Attributionsfenster 7-Tage-View und 28-Tage-View aus dem Reporting entfernt, sodass im Wesentlichen 1-Day-View und 7-Day-Click bleiben. Ein Rückgang gemeldeter View-Conversions kann deshalb ein reiner Reporting-Effekt sein und nicht weniger Wirkung. Prüfe das als Reporting-Artefakt, bevor du das Setup änderst.

Kostenloses Erstgespräch

Wo liegt euer Meta-Engpass?

Im Meta Scaling Audit prüfen wir Economics, Signalqualität, Kampagnenstruktur, Creative und Post-Click und sagen dir, welcher Hebel zuerst zählt.

Erstgespräch anfragen