Als eines der ältesten Online-Videospielmagazine Deutschlands mit über 20 Jahren Bestehen gehört das Testen von Games seit jeher zu den wichtigsten Aufgaben von 4P. Egal ob Triple-A oder Indie, ob PC oder Konsole, ob fünf oder 100 Stunden: Wir schauen uns neue Spiele vor der Veröffentlichung gründlich an und gießen unsere Beobachtungen und Einschätzungen anschließend in Textform. Was genau wir dabei berücksichtigen und wie wir überhaupt bewerten, könnt ihr im Folgenden nachlesen.

Die 4P-Bewertungsskala

Über mehr als zwei Jahrzehnte lang nutzten wir bei 4P eine 100-Punkte-Skala, auf der sich wirklich jeder noch so kleine Unterschied darstellen ließ. Doch aus einer großen Bandbreite folgt auch große Verantwortung und mittlerweile empfinden wir das System einfach als zu kleinteilig, um damit wirklich präzise zu arbeiten. Denn wo liegt wirklich der Unterschied zwischen einer 71 und einer 72? Damit haben wir uns oft schwer getan und uns gewünscht, klarere Grenzen ziehen zu können.

Mit dem 4P-Relaunch ist dieser Zeitpunkt nun gekommen: Ab sofort werden von uns bewertete Spiele in einer 0 – 10-Bewertungsskala mit 0,5er-Schritten ausgezeichnet. Damit herrscht noch genug Spielraum für Abstufungen, ohne sich in Details zu verlieren oder ungenau zu werden. Trotz der Umstellung hat sich an unseren Prinzipien beim Testen natürlich nichts geändert.

Unsere Testprinzipien

Kritisch: Wir fassen Spiele nicht mit Samthandschuhen an. Publisher und Entwicklerstudios stellen uns Spiele zwar für den Testprozess zur Verfügung, dies beeinflusst jedoch in keinster Weise unsere Berichterstattung. Wir werden nicht von Industrievertreter*innen bezahlt, weshalb wir unbefangen unsere Meinung schreiben und euch eine kritische Einordnung von neuen Titeln bieten können.

Fair: Wir bewerten Spiele individuell und gemessen an dem, was sie sein wollen. Das beinhaltet Vergleiche zu anderen Genre-Vertretern, bei denen jedoch auch immer das dahinterliegende Entwicklerstudio berücksichtigt wird. Außerdem versuchen wir, unvoreingenommen an neue Titel heranzugehen: Bekennende Rollenspiel-Hasser*innen werden einem Baldur’s Gate 3 wohl eher weniger gerecht.

Subjektiv: So sehr sich dies auch von manchen Leser*innen gewünscht wird, gibt es beim Testen von Spielen keine Objektivität. Wir sind keine Roboter, sondern Spieler*innen aus Leidenschaft und natürlich fließen unsere persönlichen Erfahrungen in den Testprozess mit ein. Gerade das macht unsere Texte aber auch wertvoll: Mit einem einfachen Abarbeiten, ob alles ordnungsgemäß funktioniert, ist niemandem geholfen.

Damit all diese Punkte wirklich gewährleistet werden, liest mindestens ein*e weitere*r 4P-Redakteur*in einen Test vor der Veröffentlichung Korrektur. So wird nicht nur die Fehlerquote minimiert, sondern auch verhindert, dass der Text und die vergebene Wertung zu weit auseinanderliegen. Schließlich soll eine Note auch zu den gelieferten Argumente und dessen Gewichtung passen. Der Kaufpreis spielt bei der Bewertung in der Regel eine untergeordnete Rolle, Extrembeispiele bei denen das Verhältnis überhaupt nicht stimmt, stellen natürlich eine Ausnahme dar.

10.0 bis 9.5 – “Ausgezeichnet”

God of War Ragnarök Titelbild mit Kratos und Atreus
God of War Ragnarök erhielt mit 97 Prozent im alten Wertungssystem die bislang höchste Note. Kein anderes Spiel hat je so knapp an der vollen Punktzahl gekratzt. Credit: Sony Interactive Entertainment / Sony Santa Monica

Von uns bei 4P eine bedingungslose Kaufempfehlung: Kein Spiel ist wirklich perfekt, aber diese Wertung zeichnet Titel aus, die dem so nah wir nur irgendmöglich kommen. Die Spitzenklasse ihres Genres, die in allen Belangen überzeugt und neue Maßstäbe in der Branche setzt. Ob grafische Höchstleistung oder künstlerische Einzigartigkeit, wegweisende Spielmechaniken oder ein Höchstmaß an Spielspaß: Hier wird Geschichte geschrieben.

Beispiele:


9.0 bis 8.5 – “Sehr gut”

Auf dem Siegertreppchen belegen diese Spiele den zweiten Platz: Sie reichen für uns nicht ganz an die Elite, stehen aufgrund einer ganzen Reihe an Qualitäten aber nur knapp dahinter. Grandiose Genre-Vertreter, die sich einen Platz auf eurer Einkaufsliste mehr als nur verdient hätten und für bleibende Erinnerungen sorgen.

Link aus Zelda: Tears of the Kingdom, wie er seine Hand gen Himmel streckt
Nicht so herausragend wie der Vorgänger, aber immer noch ein echtes Brett: The Legend of Zelda: Tears of the Kingdom. Vor allem die Physikspielereien sind beeindruckend. Credit: Nintendo

Beispiele:


8.0 bis 7.0 – “Gut”

Zwei Raumschiffe in Starfield kollidieren
Skyrim im Weltraum? So wegweisend wird Starfield wohl nicht sein. Ein gutes Spiel ist es trotzdem. Credit: Bethesda / Microsoft

Überdurchschnittliche Spiele: Keine Meilensteine, aber gelungene Umsetzungen, die euch trotz vorhandener Mängel stundenlangen Spielspaß bereiten können. Sie bieten unserer Meinung nach noch Raum für Verbesserungen, sind aber abhängig von euren Vorlieben definitiv Zeit und Geld wert.

Beispiele:


6.5 bis 5.0 – “Mittelmäßig”

Hier halten sich Qualitäten und Mängel in etwa die Waage: Ein cooles Gameplay-Prinzip wird von schwacher Technik zurückgehalten oder ein toller Artstyle trifft auf dröge Mechaniken. Diese Spiele empfehlen wir nur absoluten Genre-Fans, die auch mal beide Augen zudrücken können, wenn sie mehr vom Gleichen wollen.

Illustration von Koraidon und Miraidon aus Pokémon Karmesin und Purpur
Pokémon Karmesin und Purpur sind der Inbegriff von “mittelmäßig”: Eine wirklich spaßige Gameplay-Formel trifft auf hässliche Grafik und veraltete Technik. Credit: Nintendo / Game Freak / The Pokémon Company

Beispiele:


4.5 bis 3.0 – “Mangelhaft”

Gollum aus dem gleichnamigen Herr der Ringe-Spiel
Bei Daedelics Herr der Ringe: Gollum hat es an fast allen Ecken gekracht. Aber schlimmer geht immer: Unspielbar war der Ausflug nach Mordor noch nicht. Credit: Daedalic / Nacon

Grausige Technik, langweiliges Gameplay, dreiste Monetarisierung: Hier tummeln sich Spiele, bei denen nur wenige Ideen überhaupt zünden. Die Schwachstellen überschatten die Qualitäten, nur wenige Lichtblicke retten vor dem vollständigen Versagen. Aber: Sie sind noch spielbar.

Beispiele:


2.5 bis 1.5 – “Schlecht”

Diese Spiele tun richtig weh: Die positiven Punkte mussten wir wohlwollend mit der Lupe suchen, mit der Kontra-Liste ließe sich ein ganzes Buch füllen. Immerhin: Die meisten Titel in dieser Kategorie sind so schlecht, dass man darüber (nur) noch lachen kann.

Zwei Polizisten in ihrem Wagen auf der Autobahn
Der Autobahnpolizei Simulator 2 ist ein Unfall, bei dem man nicht wegschauen kann. Hat es deshalb das Gefängnis verdient? Nein. Aber die schlechte Note auf jeden Fall. Credit: Z-Software / Aerosoft GmbH

Beispiele:


1.0 bis 0.0 – “Unterirdisch”

Eine Szene aus Alone in the Dark Illumination mit Zombies
Abseits weniger Ausnahmen scheinen Zombie-Spiele prädestiniert für schlechte Wertungen zu sein. Bei Alone in the Dark: Illumination hat wirklich fast gar nichts gepasst. Credit: Pure FPS / THQ Nordic

Wenn ihr bis hierhin gescrollt habt, wollt ihr es wirklich wissen. Der absolute Bodensatz der Spielehistorie, der am besten nie entwickelt worden wäre. Hier finden sich Titel, die wir bereits verdrängt haben oder vergessen wollten, weil sie uns immer noch in unseren Albträumen verfolgen. Tiefer kann man nicht mehr sinken.

Beispiele