Einerseits weil ich es
versprochen hatte und andererseits weil gestern
del.icio.us von Yahoo! gekauft wurde und damit Yahoo! mit Flickr und del.icio.us zwei der wohl momentan wichtigsten Social Software Applikationen "besitzt" deren zentrales Konzept Tagging ist. Eine grundlegende Einführung ist
hier und bei
Wikipedia zu finden.
Was bedeutet es überhaupt ein Objekt (eine URL, ein Foto, einen Weblogbeitrag, etc.) zu taggen? Aus meiner Sicht geht es dabei um die Identifikation von wichtigen Begriffen (Konzepten) im Zusammenhang mit dem Inhalt. Es geht darum dem Objekt eine Bedeutung, einen Sinn zuzuweisen. Dieser Sinn kann vielfältig sein, ist immer subjektiv auf den Erfahrungshorizont der Person zugewiesen die das Objekt tagged. Es ist eine Art Kategorisierung, ein "labelling" mit sinngebenden Begriffen.
Dabei hat ein
Paper von Golder / Huberman unlängst einige sehr interessante Faktoren im Zusammenhang mit Tagging analysiert. Die meisten Tags, in der Reihenfolge der Häufigkeit, haben laut Studie folgenden Sinn:
- Zu identifizieren welchen Inhalt (thematisch oder personell) ein Objekt hat
- festzuhalten woher ein Objekt stammt oder welcher Art es ist
- dem Objekt einen Ursprung (einen "Besitzer") zu geben
- die bereits gewählten Tags weiter zu verfeinern und verdichten
- Referenzen auf eigene Kategorien (mystuff, work, etc.)
- Aufgabenorientierte Tags, wie toread, toblog, etc.
Das zeigt deutlich, dass nicht wie manchmal angenommen, Tags ausschließlich aus Metakategorien bestehen, sondern sehr oft wesentliche Konzepte des Inhaltes in Tags abgebildet werden. Meine Hypothese ist, dass die meisten Tags als Worte im Objekt oder dessen Quelle vorkommen (wenn es textuell ist, mit Quelle ist zB im Falle einer URL die Website gemeint). Oftmals wird auch argumentiert, dass Tags auch nur eine Form von Kategorisierung wären, der Unterschied liegt jedoch im Aufwand den es bedarf um ein Objekt zu taggen und dem es in eine Kategorie einzuordnen.
Rashmi Sinha hat eine
interessante Zusammenfassung dieses Aspektes, denn es ist in der Tat einfacher sich ein Objekt anzusehen und die Konzepte die dabei im Kopf aktiviert werden zu notieren als ein Objekt zweifelsfrei und eindeutig einer Kategorie zuzuordnen. Kategorien sind meistens ausschließend (ein Element kann nicht in zwei Kategorien sein) und sind über die Zeit relativ starr. Tags sind flexibler und erlauben der/dem User/in mehr Anpassung an zeitliche Veränderungen. Wie auch das Beispiel von del.icio.us zeigt, können Tags auch für andere Dinge verwendet werden (zB die Zuweisung zu anderen Personen bei del.icio.us/for).
Doch natürlich haben auch Tags Nachteile und Probleme, die deutlich werden wenn man eine der bereits genannten Applikationen verwendet. Da wäre zum einen das Problem mehrere Bedeutungen und/oder Schreibweisen für ein Wort (auch Mehrzahl/Einzahl), auch als
Polysemie und Homonymie bezeichnet. Manchmal würde man auch gerne Spezialisierungs- und Generalisierungsbeziehungen festhalten, Tags sind ein flacher Raum. Die Anzahl der Tags wächst relativ stark und User/innen haben meist wesentlich mehr Tags zu verwalten als typischerweise Kategorien, ein Grund für das häufige Argument, dass Tags chaotisch und unübersichtlich sind. Auch die Einstiegsbarriere ist relativ hoch, da der Nutzen von Tagging (ähnlich wie Weblogs) eher durch das Erleben vermittelt werden kann als durch bloßes Erzählen. Vermutlich werden die meisten User/innen Tags auch eher inkrementell einsetzen, also ab einem gewissen Zeitpunkt beginnen Tags zu nutzen und nicht alle bereits bestehenden Inhalte (Objekte) zu taggen. Wer will schon seine gesammelten Bookmarks oder seine gesammten Digitalfotos nachträglich mit verschlagworten.
Gerne verwendete Elemente in User Interfaces (auch begünstigt durch das Aufkommen und die Verbreitung von AJAX) sind, neben anderen Vereinfachungen (wie Bulk Editing, In-Place Editing), Vorschläge aus
- dem eigenen Tagraum, oder
- den Tags anderer Personen (zB del.icio.us Recommendations).
Diese Vorschläge helfen die Anzahl an Tags überschaubar zu halten und den Prozess des tagging weiter zu vereinfachen. Die Möglichkeit mit Tags einen Raum über ein soziales Netzwerk aufzuspannen, sich also jene Objekte anzusehen die andere Personen mit selben Tags versehen haben, Cluster aus den verwendeten Tags zu erstellen und auch über die Objekte eine Verknüpfung zu erstellen ("wer hat ebenfalls dieses Objekt getagged"). Diese soziale Dimension des "Social Tagging" ist mit Sicherheit einer der spannendsten Aspekte an Tagging (Obwohl die Untersuchung von Golder / Huberman einen generellen Eigennutzen unterstellt und die Anzahl der Tags je User/in keinem Zusammenhang mit der Anzahl der Objekte hat, sondern eher mit dem generellen Verhalten des Users zu tun hat).
Wir haben vor etwa 8 Monaten mit der Entwicklung einer Technologie begonnen, deren erstes nach außen sichtbares Ergebnis
tagthe.net ist. Das Ziel dieses Webservices ist es automatische Mechanismen (Algorithmen) einzusetzen um den Inhalt von textuellen Objekten zu analysieren und die wichtigsten Konzepte zu extrahieren. Warum? Weil wie oben festgestellt, die meisten Tags den Inhalt betreffen und damit vermutlich schon mal im Text vorkommen. Das sieht auf den ersten Blick einfacher aus, als es ist, vor allem wenn man diesen Task relativ performant durchführen möchte und auch nur die wirklich relevanten Tags rausfiltern will. Dabei werden Statistiken eingesetzt um den Satzaufbau zu analysieren und wenn möglich auch Unterschiede festzustellen ob es sich bei dem Begriff um Personen, Orte oder generelle Konzepte handelt.
Das spannendste an Tags ist definitiv die Verwendung. Tags sind Filter, die beliebig kombiniert werden können, und werden als Navigationsmetapher verwendet. Die soziale Dimension (auch öfter als Folksonomies bezeichnet) macht ebenfalls einen großen Nutzenaspekt aus.
Egal wie man über das Konzept des Tagging denkt, die Anzahl der Firmen die in ihren Services Tags einsetzen wächst täglich:
Google (
Gmail [hier als Labels bezeichnet],
Google Base, Picasa [ebenfalls als Labels], im Google Reader und in der
Search History), Yahoo! in MyWeb 2.0, Flickr und del.icio.us, alle Social Bookmarking Services wie Furl, Simpy oder das höchst interessante
Dogear von IBM, RSS Reader wie Rojo oder feedlounge, seit neuestem
Amazon, natürlich
Technorati, die gerade aufkommenden Video Sharing System wie
YouTube, für Apple's mail.app gibt es ein Plugin namens
MailTags und in zahlreichen Blog Hosting Services von Typepad bis Wordpress.
Einige Services bieten ähnliche Dienste wie tagthe.net, jedoch mit anderer Ausrichtung:
Tagcloud basiert auf dem der
Term Extraction API von Yahoo! und
Tagyu, welches soziale Tags von zahlreichen Services als Ergebnis liefert und damit zwar Tags entdeckt die nicht unbedingt im Text vorkommen müssen, aber auch nur bedingt mit dem Inhalt zu tun haben.
Bleibt also spannend, was sich im Fall des Tagging noch entwickeln wird. Ich würde mich ja wie ein Kleinkind freuen wenn ich meine (ohnedies vollkommen unstrukturierten) hierarchischen Ordner auf der Festplatte endlich loswerden könnte.