🌑

Daten über Daten

Ich bin ehrlich: Ich liebe Daten.

Nicht unbedingt, weil Zahlen unbedingt “die Wahrheit” sind. Sondern weil sie einem eine zweite Ebene geben. Eine, die man gern übersieht, weil sie so banal wirkt: Wann passiert etwas? Wie oft? Von wem? Wie gleichmässig? Wie plötzlich? Wie rhythmisch?

Und genau da wird’s spannend.

Weil das sind nicht “die Daten”. Das sind Daten über die Daten selbsts, also Metadaten. Und die sind in der Praxis oft wertvoller als der eigentliche Inhalt.


Zwei Chats, zwei Persönlichkeiten (ohne den Chat zu lesen)

Vergleicht mal diese 2 Wochentags-Graphen. Zwei WhatsApp-Chats mit zwei ganz verschiedenen Mustern.

Wochentage Chat A

Wochentage Chat B

Man muss jetzt nicht gerade Sherlock-Holmes sein, um die Unterschiede zu sehen.

Chat A wirkt relativ stabil, aber Freitag und Montag stechen raus. Das sieht nach einer Gruppe aus, die am Wochenende lebt. Freitag: Planen. Montag: Nachbesprechen. Oder einfach die “jo passt nächstes Wochenende wieder” Routine.

Chat B ist dagegen “anderes Tier”. Da ist diese fette Lücke zwischen Sonntag und Samstag. Klassiker für Arbeit, oder Schule. Oder jemand, der unter der Woche weit weg ist. Oder zwei Personen, die sich am Wochenende sowieso sehen und dann plötzlich keine Nachrichten brauchen.

Und ja: Das sind alles nur Hypothesen.

Aber man merkt, wie schnell man Storys aus solchen Mustern bauen kann, ohne auch nur eine einzige Nachricht zu lesen

Jetzt mal eine Ebene tiefer.


Der Kalender lügt nicht

Tage-Heatmap Chat A

Okay. Das ist schon ziemlich eindeutig.

Zwischen Ende Januar und Mai ist viel los. Im Oktober gibt’s nochmal einen Peak, dazwischen eher weniger. Und im Sommer teilweise komplett tot.

Wenn du in Österreich lebst, weisst du wahrscheinlich schon, was das bedeutet: Ferien. Schulferien sind wie ein globales “Offline Event” für bestimmte Chatgruppen.

Das Muster schreit nach:

  • Freund*innen
  • wahrscheinlich Schüler*innen
  • vielleicht nicht in derselben Klasse (sonst wäre die Aktivität vermutlich gleichmässiger)
  • während der Schulzeit viel Koordination, in den Ferien eher real-life Kontakt

Weil: Niemand schreibt sich, wenn man eh nebeneinander sitzt. Oder?


Tage-Heatmap Chat B

Hier ist es anders. Viel gleichmässiger, keine starken saisonalen Einbrüche. Das stützt die Idee mit: “Man ist ohnehin in konstantem Kontakt” oder “das ist ein Chat, der immer relevant bleibt”.

Und diese Lücke im August? Könnte einfach Urlaub sein. Ein gemeinsamer? Oder eine Person war weg. Oder beide. Again: Hypothese.

Aber jetzt kommt der Teil, der sich leicht unangenehm anfühlt.


Metadaten sind creepy, weil sie funktionieren

Es wäre ziemlich gruselig, wenn ich dir jetzt sagen würde: “Ja, genau, Chat A sind X und Y und Chat B ist Z.” Selbst wenn ich es könnte.

Der Punkt ist nicht, dass man immer richtig liegt.

Der Punkt ist: Man kann extrem viel ableiten, ohne Inhalte zu haben.

Und jetzt stell dir kurz vor, diese Daten liegen nicht nur als hübsche Heatmap bei dir lokal rum, sondern:

  • beim Plattformbetreiber
  • bei einem Datenbroker
  • oder bei irgendwem, der Zugang bekommt, weil irgendwer irgendwo “nur kurz” eine Schnittstelle geöffnet hat

Viele Menschen beruhigen sich mit: “Ja okay, meine Chats sind Ende-zu-Ende verschlüsselt.”

Und das ist auch gut.

Aber Verschlüsselung schützt den Inhalt. Nicht die Struktur drumherum.

Wenn ein Angreifer weiss:

  • wann ich mit wem schreib
  • wie oft
  • in welchen Phasen meines Lebens
  • welche Kontakte plötzlich verschwinden oder neu auftauchen

…dann hat er oft schon genug.

Ohne ein einziges “hey wie gehts” zu lesen.


Btw, falls es wen noch weiter intressiert, Daniel Kriesels hat darüber nen mega Vortrag am 33c3 gehalten. Der macht genau dieses “Metadaten erzählen Geschichten” Thema sehr anschaulich.

Daniel Kriesel’s 33c3 Vortrag