Data Mining ist schon was Geniales (und die Geschäftsmodelle unter anderem von Facebook und Google) und übt auch auf mich definitiv eine gewisse Faszination aus. Vor allem in Zeiten des Internets, wo alle möglichen mit einander verknüpfbaren Daten nur wenige Klicks entfernt sind und nur darauf warten von jemanden in den richtigen Zusammenhang gebracht zu werden – wenngleich nicht immer zu gutem Zweck. Besonders interessant sind dabei natürlich die Datenbanken, die ansonsten offiziell keine Informationen ausspucken. Wer in den letzten Tagen die gängigsten Magazine und Blogs aus dem Tech- und Entertainment-Sektor gelesen hat, weiß sicherlich schon auf was ich anspiele: Den Artikel von ars technica in dem sie sich Steam vorgenommen haben.
Anmerkung: Ich gebe jetzt hier nicht den ganzen Artikel wieder und kopiere schon gar nicht wie viele Magazine einfach die Tabellen. Ihr sollt ihn schon selbst lesen und der Seite eure Klicks geben . Stattdessen folgen einfach ein paar Beobachtungen/Kommentare.
Und zwar hat das Magazin sich hingesetzt und aus den 172 Millionen Userprofilen mehrmals jeweils drei Tage lang circa 250.000 zufällige herausgezogen und die darin enthaltenden Informationen analysiert. Natürlich waren da einige dabei, die auf “Privat” sitzen und entsprechend keine Informationen boten (das Magazin spricht von 6 Prozent). Gleichzeitig gab es den ein oder anderen Denkfehler (auf die sie aber mittlerweile zumindest teilweise hinweisen) wie beispielsweise die Tatsache, dass die Spielzeit erst seit März 2009 erfasst wird und selbst dann diese Spielzeit nicht unbedingt korrekt erfasst wurde. In den Kommentaren erwähnt beispielsweise ein User, dass er Einzelspielertitel meist im Offline-Modus zockt und dort scheint die Spielzeit überhaupt nicht gezählt zu werden.
Einschub
Etwas, das ich übrigens nicht ganz verstehe. Achievements werden ja auch übertragen sobald man mal wieder Online geht. Also findet auf jeden Fall ein Tracking von Seiten Steam statt. Ich glaube nämlich nicht, dass die Spiele jeweils ein eigenes System haben und quasi bei jedem Onlinegang von sich aus die Erfolge melden. Das würde meiner Meinung nach nur Unmengen an unnötigem Traffic erzeugen, denn theoretisch müsste dann JEDES installierte Spiel in eurer Liste beim Onlinegang überprüfen ob ein Informationsupdate bei ihm ansteht. Ich gehe stattdessen davon aus, dass auch hier eine Sammlung stattfindet beziehungsweise Steam ein Flag setzt von wegen “Hey, aktualisier das sobald Internetverbindung besteht” und es dann gesammelt macht.
Falls ihr jetzt als Gegenbeispiel das Thema “Updates” anbringen wollt: Bei Updates läuft es meines Wissens so, dass der Steam-Client zentralen Server anfragt “Hey, sind für diese IDs Updates da? Wenn ja, schick sie mir”. Deswegen müsst ihr oft erst den Klienten neu starten, bevor ihr ein gerade veröffentlichtes Update angeboten bekommt. Das gilt vermutlich ebenso für die Freischaltung von noch nicht veröffentlichten Titeln. Auch hier braucht es meistens erst einen Neustart, bevor Steam weiß, dass ihr es spielen dürft obwohl im Shop bereits “Play now” steht (der Button tut dann nichts).
Einschub Ende
Unter der Tatsache, dass die Spielzeit erst seit März 2009 erfasst wird, leiden logischerweise vor allem die Valve-Titel. Ich hatte ja zum 10jährigen Geburtstag bereits erwähnt, dass Drittanbieter erst ab 2007 so langsam ihren Weg auf die Plattform fanden. Somit sind die ganzen Auswertungen auf die Spielzeit am Ende des Tages nicht ganz so aussagekräftig, wie es anfangs den Anschein hatte, was natürlich schade ist. Andererseits kann man diese Diskrepanz vielleicht auch schlicht vernachlässigen angesichts der Tatsache, dass Steam sich auch erst in den letzten Jahren zu dieser immensen Größe entwickelt hat und somit die Werte von vor 2009 vermutlich gar nicht so stark ins Gewicht fallen würden trotz natürlich der starken Verkaufszahlen von Half-Life 2 oder dem Erfolg von Counter-Strike & Co.
Die Ergebnisse
Was spuckt der Artikel also für Informationen aus? Nun, die Tabelle über die meist verbreitesten Spiele überrascht mich kein bisschen. So viele Beta-Keys wie für DOTA 2 rausgeschmissen wurden verbunden mit der Tatsache, dass es kostenlos ist und dem äußerst populären MOBA-Genre angehört. Da wäre ein anderes Ergebnis verblüffender gewesen. Das gilt auch für Team Fortress 2, das zuerst dank der Orange Box eine massive Verbreitung fand und dann dank seines Free-2-Play-Wechsels eine immense Popularität gewann. Aber auch die anderen Top20 sind wie erwartet. Steam wurde für Valve-Spiele geschaffen, viele davon wurden in der Zwischenzeit kostenlos rausgeworfen, waren äußerst erfolgreiche Mods oder waren schlicht Teil eines Bundles. Glaube nämlich nicht, dass sonst Deathmatch Classic oder Richochet in der Liste vorhanden wären. Civilization V und The Elder Scrolls V: Skyrim spiegelt hingegen schlicht die Verkaufszahlen und damit die Popularität dieser altehrwürdigen Serien wieder. Deswegen gilt auch hier: Überraschender wäre es gewesen, wenn plötzlich etwas ganz anderes hier aufgetaucht wäre.
Auch die Information, dass ca. 36,9% von den 781 Millionen in den Accounts registrierten Spielen nie gespielt wurden ist keine wirkliche Neuigkeit. Die 17%, die unter eine Stunde investiert haben, sind da schon interessanter. Da hätte ich mir eine genauere Aufschlüsselung gewünscht und vor allem eine Auswertung auf die extremen Rohrkrepierer. Also ob es da einen Trend zu sehen gäbe beispielsweise Indie vs. AAA-Titel oder Shooter vs. Puzzlespiel. Das wäre sicherlich auch für die Spielentwickler selbst äußerst interessant, würde es doch zum einen zeigen, welche Genre am ehesten fesseln und zum anderen eine kleine Antwort auf die Frage liefern, ob Indie-Spiele wirklich die Gralsbringer sind oder eben doch nur 5 Minuten fasziniert reingeschaut wird, sie aber dann gleich wieder in die Ecke geworfen werden. Vielleicht kommt da ja noch was. Die Daten haben sie ja auf jeden Fall.
Zumal sie im letzten großen Abschnitt ja schon in die Richtung gegangen sind und die großen Titeln in Relation zum Rest gesetzt haben. Sprich zur Erkenntnis gelangt sind, dass die Top-Titel nicht nur sowohl in Sachen Verkaufszahlen alles andere klar dominieren, sondern auch in Sachen Spielzeit die Top 6 insgesamt fast genau so viel gezockt werden wie alle anderen gemessenen Spiele zusammengenommen. Das führt mal wieder vor Augen, wie auch ars technica selbst schreibt, dass Hype-Blockbuster aus bekannten Serien am Ende des Tages doch irgendwie alles sind und der Rest im großen Ganzen keine Rolle spielt. Ausnahmen wie Minecraft bestätigen die Regel. Von daher können wir noch so sehr über die jährlichen Aufgüsse, die vermeintliche Ideenlosigkeit und die Risikoangst der Branche bejammern: Was der Bauer nicht kennt, frisst er höchstens, wenn es vorher eine kritische Masse an Menschen außergewöhnlich fand. Mein (vergleichsweise extrem kurzer) Artikel von 2006 ist also immer noch aktuell.
Wir lesen uns in der Osternacht wieder!