Gelbe Sterne auf rosa und blauem Hintergrund

14.10.2022

Bewertungen im Internet - wahr oder unwahr?

Usermeinungen und Kundenbewertungen sind essentieller Bestandteil unseres Kaufverhaltens geworden. Schließlich interessieren uns zurecht Erfahrungen anderer mit Dienstleistungen und Dienstleistern, Onlineshops, Ferienunterkünften, Gebrauchsgegenständen oder Konsumgütern aller Art. Aber kann und sollte man immer alles für bare Münze nehmen?

Ein Kunde bat uns, seine Performance bei Google zu bewerten. Der Kunde bedient als Dienstleister andere Gewerbe und ist ausschließlich B2B unterwegs. Als wir uns unter anderem auch den MyBusiness-Eintrag angesehen haben, stellten wir etwas verwundert fest, dass unser Kunde eine relativ schwache Durchschnittsbewertung notierte (2,3 bei auch nur drei Rezensionen). Ein näherer Blick offenbarte: 1 x 5 Sterne (“Awesome”), 2 x 1 Stern (“Ganz schlechter Kundenservice. Finger weg!” (sic!), einmal keine Begründung).

Welchen Effekt haben Bewertungen?

Bewertungen steuern Umsätze, färben Unternehmen in die ein oder andere Richtung. Bewertungen erhöhen die Sichtbarkeit und beeinflussen Trust in die ein oder andere Richtung. Da nicht alles und jeder eine eigene Plattform für Nutzermeinungen bieten kann, ist eine zentrale Erfassung - wie in diesem Falle bei Google - auf den ersten Blick natürlich super. Man stelle sich eine geplante Urlaubsreise vor und weiss vorab, wie andere über Unterkunft, Umgebung, Restaurants, Unterhaltung, Sehenswürdigkeiten denken. Aber diese Methodik birgt auch echte Tücken.

Als Dienstleister ist es unsere Aufgabe, Zustände zu verbessern und zu hinterfragen. Unser Kunde ist seit über 100 Jahren am Markt, der dort geschäftsführende Ansprechpartner seit über 20 Jahren Entscheider, das Geschäft läuft - soviel kann er jetzt nicht falsch gemacht haben, wenn er in seiner Branche (Dienstleistungen und Produkte für Büros) immer noch stabil am Markt ist.

Parallel sind wir immer interessierte User, daher haben wir uns diese auf den ersten Blick frustrierenden Resultate von nur drei Bewertungen am einen und anderen Ende der Skala genauer angesehen.

Wie kommt eine Bewertung zustande?

Eine Bewertung ist natürlich immer subjektiv und reflektiert die Wirkung von etwas auf jemanden. Dabei kommen Bewertungskriterien zum tragen - aber wären das auch meine ganz persönlichen? Im besten Falle gibt die Bewertung ein nutzbares Urteil für Dritte ab und beschreibt möglichst genau, warum und wie bewertet wurde.

Im B2B-Bereich sind Bewertungen in einer Handelspartnerschaft nicht zwingend üblich, bei Google bewerten sich Geschäftspartner eher nicht. Als privater User, in einer Kunde-Dienstleister-Beziehung, ist man seine eigene Entität, die entscheidet, empfindet und urteilt. Eine Bewertung geht schnell von der Hand und ist auch gerne einmal emotional, vor allem wenn die Leistung oder das Produkt nicht so sind wie vorgestellt. Aber ist das dann zwingend valide?

Bewertungsportale sind ein entscheidender Unterschied

Das Portal trustpilot.de ist ein viel besseres Schaufenster für Bewertungen und “Nutzererfahrungen” als Google. Die selbst ernannte “Nr. 1 der Bewertungsportale” ermöglicht Nutzern, Dienstleister aller Art zu beurteilen. Die Abgabe einer Bewertung erfordert keinen Nachweis einer Transaktion, es kann also mehr oder weniger unmittelbar rezensiert werden.

Bei dieser Methode kommen die wenigsten gut weg, einige Beispiele: Der Energieversorger EWE hat einen Schnitt von 1,2 (= “Ungenügend”) aus über 1.500 Bewertungen. Anschaulich dargestellt erfährt man, dass 17 % aller User 5 Sterne vergeben, sage und schreibe 69 % nur einen. Für die Mitte zwischen den Extemen sind gerade einmal 14 % übrig.

Ein ähnliches Bild bei BMW, interessanterweise aus nur unter 200 Bewertungen: Immerhin vergeben 27 % der User 5 Sterne und 59 % einen - auch hier bleiben nur 14 % für die moderate Mitte.

Ein Muster ergibt sich: Die Deutsche Telekom AG hat eine Bewertung von 1,5 (“ungenügend”), bei 10 % 5 Stern-Bewertungen, 81 % 1 Stern, Goldene Mitte 9 %. DAZN: 1,2; 3 % super, 87 % schlecht, 10 % der Rest. Sky Deutschland, die ja immer Prügel bekommen: Immerhin 15 % geben Sky die beste aller möglichen Bewertungen, satte 72 % die schlechteste. Das bringt ein “mangelhaft” oder anders ausgedrückt, eine 2,5. (Wer sich jetzt wundert, Trustpilot hat eine ganz eigene Methode, diesen “Trustscore” zu ermitteln.). Und so weiter und so fort.

Streckendienstleistung und spontaner Ärger

Die oben beschriebenen Unternehmen haben eines gemeinsam: Sie liefern eine Streckendiensteistung wie Streaming, ein Leasingfahrzeug, eine Internet- oder Energieversorgung. Also Produkte, die auf Strecke funktionieren sollen.

Die schlechten Bewertungen haben ebenfalls eines gemein: Sie beziehen sich fast ausschließlich auf ein einzelnes Ereignis, bei dem Produkt, Dienstleistung oder Service nicht funktionierten. Es wird also nicht die gesamtheitliche Leistung bewertet, sondern ein Ausfall zu einem besonders ungünstigen Zeitpunkt, ein unangenehmes oder wenig zielführendes Gespräch mit einem Servicemitarbeiter und so weiter.

Jeder war mal in einer Hotline gefangen, in einer Web-Dauerschleife oder hatte inkompetenten Service in der Leitung. Und war dann entsprechend ohnmächtig bedient oder aufgebracht im Angesicht von Dummheit, Dreistigkeit, Ignoranz oder Fehlinformation. Geschenkt. Aber ist es zielführend, eine Dienstleistung, ein Produkt oder einen Service aufgrund eines Einzelfalles direkt und für immer zu verteufeln?

Klar gibt es Fälle, wo Firma XY das Fass zum sprichwörtlichen Überlauf bringt. Immer dann, wenn Unternehmen andere Unternehmen beauftragen, die wiederum andere Unternehmen steuern, ist kommunikatives Chaos inhärent. Beispiel: Die Deutsche Glasfaser beauftragt einen ganzen Haufen Unternehmen, um FTTH realisieren zu können: A reisst die Straße auf, B verlegt die Kabel, A macht wieder zu. C verlegt in die Vorgärten und ins Haus, D kümmert sich um den Anschluss der Endgeräte im Haus.

Was beispielsweise ein niedersächsischer Energie- und Telekommunikationsdienstleister an Schlagzeilen und Blüten aufgrund unterirdischem Service, fehlgeleiteter Anrufe (Anrufe für Firmen landen bei Privatnutzern und umgekehrt), unschlüssiger Rechnungen und vielem mehr beinahe wöchentlich in der Presse ausgebreitet produziert, ist schon starker Tobak und tatsächlich fast schon komisch.

Trotzdem kommt die Energie ja in den Haushalten an. Und es gibt sicherlich auch freundliche Stimmen am Telefon und infrastrukturelle Schwächen haben nicht immer nur einen Grund.

Und eine entscheidende Frage ist berechtigt: Hat die Bewertung denn einen Effekt? Bei derart frustrierenden Ergebnissen und Bewertungen mit wenig sachlicher Kritik fällt es jedem Dienstleister schwer, konkret Bezug zu nehmen und Missstände zu adressieren.

Zurück zu unserem Kunden: Auch dort gibt es ja, wie oben geschrieben, eine Polarisierung. 2x ganz schlecht, 1x super. Sieht man sich die gesamten bei Google abgegebenen Bewertungen der beiden negativen Bewerter/-innen an, findet man nicht nur eine erstaunliche Deckungsgleichheit der bewerteten Stellen, Orte und Dienstleistungen, sondern auch eine klar negative Grundhaltung. “Gut” oder besser kommt kaum einer bis keiner weg, im Gegenteil. Von Netto über Lidl, Polizeidirektionen oder Datenschutzbeauftragte - alle werden eher unsachlich in einem Halbsatz abgefertigt. Kontakte sind nicht erreichbar, Angestellte sind arrogant, Service ist schlecht usw. Es sei dahingestellt, ob man eine Polizeidirektion in weniger als 200 verwendeten Zeichen nachvollziehbar bewerten kann.

Ein anderer Kunde, der einen lokal eingegrenzten Wirkungskreis bearbeitete, berichtete vor einigen Jahren von einem Fall einer aus seiner Sicht “völlig überraschenden” negativen Bewertung, die den Kunden tatsächlich auch persönlich traf. Da zum damaligen Zeitpunkt nur positive bzw. sachliche Bewertungen eintrudelten, war diese eine schlechte Bewertung natürlich verstörend. Da Google bei Nachfragen eher sperrig reagiert, nahm unser Kunde Kontakt mit dem negativen Bewerter auf. Erstaunlicherweise vereinbarte man ein Treffen beim Kunden und der Bewerter sagte geradeheraus, dass er die negative Bewertung gern entfernen könne, wenn er in den Genuss einer kostenfreien Dienstleistung käme.

Das sind natürlich Einzelfälle. Aber sie zeigen, wie ätzend schlechte Bewertungen wirken können und wie hart sie treffen - und wie ungerechtfertigt sie manchmal sind. Es ist selbstredend gut, wenn es Foren gibt, wo man seinem Ärger Luft machen kann - wenn eben der Support nicht funktioniert oder reagiert oder die Plattformen der Unternehmen keine Wirkung entfalten - der Nutzer klassisch allein gelassen wird.

Im harten B2C Business sind Bewertungen wesentlicher Bestandteil des Verkaufserfolgs. Schuhe, Teller und Tassen, Filme, Musik, technische Produkte - alles wird bewertet. Amazon hat die Macht der Bewertung schon früh begriffen und diesen eine zentrale Rolle in seiner UX zugeteilt. Als die ersten Fake-Wellen schwappten, zog Amazon die Zügel an, das “verifizierter Kauf”-Badge sollte Bewertungen legitimieren, aktives Nachfragen bei Usern zur Abgabe eines Urteils bewegen. Dazu sperrte man Händler oder Hersteller, die Dritte mit der Abgabe von Bewertungen anheuerten, um ihre Produkte zu beschönigen. Trotzdem bleibt der Vorwurf haften und man sollte sich die Bewertungen schon sehr genau durchlesen, bevor man ihnen Glauben schenkt.

Aber sind Bewertungen dann sinnfrei?

Mitnichten. Ein anderes Portal, das sich aufdrängt, wenn man online unterwegs ist, ist Trusted Shops. Im Unterschied zu trustpilot sind die Bewertungen strikt transaktionsbasiert. Das bedeutet, dass nur eine von Trusted Shops validierte Transaktion zu einer Bewertung führen kann.

Das macht - sehr offensichtlich - einen himmelweiten Unterschied aus. Zum einen stellt Trusted Shops, ähnlich wie Amazon, positive und negative Bewertungen direkt gegenüber - die “relevanteste positive” und die “relevanteste kristische”.

Trusted Shops ermittelt zum Beispiel für Sky einen Score von 4,04; dabei ist die Bewertungsskala wesentlich organischer und wirkt näher am wahren Leben als bei trustpilot: 54 % finden Sky demnach “sehr gut” (5 Sterne), 22 % “gut” (4 Sterne), 11 % “befriedigend” (3 Sterne), 4 bzw. 10 % “ausreichend” bzw. “mangelhaft” (2 Sterne, 1 Stern).

Positive Bewertungen heben das Produkt oder die Dienstleistung nicht in den Himmel, kritische sind angenehm und nachvollziehbar um Objektivität bemüht.

Noch signifikanter ist der Unterschied bei der Telekom: Ein Score von 4,47 macht ein solides “gut”, nur 6 % aller bewertenden Personen befinden die Leistung als “mangelhaft”. Und selbst diese klingen fundiert und ehrlich, in Maßen empört, immer sachlich.

Wir schreiben hier wirklich keinen Werbetext für Trusted Shops. Aber wenn man sich für ein Produkt oder eine Dienstleistung interessiert, freut man sich ja über sachliche, nüchterne Beurteilungen, nicht über Geschimpfe und Häme, das ein Gerät “Mist” ist - Ein ähnliches Empfinden stellt sich auch ein, wenn man die Amazon-Bewertungen der “verified purchases” durchliest und die ohne dieses Siegel außer acht lässt.

Es gibt also definitiv Stellen, an denen man wohltuende Sachlichkeit und differenzierte Auseinandersetzung mit Dienstleistungen oder Produkten findet. Emotionalität in Bewertungen ist ein zweischneidiges Schwert. Klar, es gibt Produkte, die man tatsächlich emotional bewerten muss - weil es eben emotionale Produkte sind. Musik, Filme, Instrumente, Kunst - alle diese Dinge lassen sich ja nicht ohne eine ganz persönliche Sichtweise bewerten. Eine Internetleitung passt aber nicht in dieses Raster.

Wir haben auch Kunden, die aus Bewertungen lernen können: Ein Kunde hat entschlossen Maßnahmen ergriffen, als immer wieder die Qualität seiner Lieferungen im Rahmen von über ekomi erhobenen Bewertungen in Frage gestellt wurde. Mehr Leute in den Service, anderer Dienstleister für die Logistik - Problem nicht zwingend behoben aber adressiert und gemildert - definitiv ein gutes Verhältnis von Ursache und Wirkung.

Und unser Kunde mit dem Schnitt von 2,3? Wir haben ihm abgeraten, sich aufzuregen und stattdessen der Best Practice zu folgen: Einfach Kunden nach abgeschlossenem Auftrag ganz höflich um Ihre Meinung bitten. Ungefärbt und ehrlich.