Tagging revisited
Einerseits weil ich es versprochen hatte und andererseits weil gestern del.icio.us von Yahoo! gekauft wurde und damit Yahoo! mit Flickr und del.icio.us zwei der wohl momentan wichtigsten Social Software Applikationen "besitzt" deren zentrales Konzept Tagging ist. Eine grundlegende Einführung ist hier und bei Wikipedia zu finden.
Was bedeutet es überhaupt ein Objekt (eine URL, ein Foto, einen Weblogbeitrag, etc.) zu taggen? Aus meiner Sicht geht es dabei um die Identifikation von wichtigen Begriffen (Konzepten) im Zusammenhang mit dem Inhalt. Es geht darum dem Objekt eine Bedeutung, einen Sinn zuzuweisen. Dieser Sinn kann vielfältig sein, ist immer subjektiv auf den Erfahrungshorizont der Person zugewiesen die das Objekt tagged. Es ist eine Art Kategorisierung, ein "labelling" mit sinngebenden Begriffen.
Dabei hat ein Paper von Golder / Huberman unlängst einige sehr interessante Faktoren im Zusammenhang mit Tagging analysiert. Die meisten Tags, in der Reihenfolge der Häufigkeit, haben laut Studie folgenden Sinn:
Rashmi Sinha hat eine interessante Zusammenfassung dieses Aspektes, denn es ist in der Tat einfacher sich ein Objekt anzusehen und die Konzepte die dabei im Kopf aktiviert werden zu notieren als ein Objekt zweifelsfrei und eindeutig einer Kategorie zuzuordnen. Kategorien sind meistens ausschließend (ein Element kann nicht in zwei Kategorien sein) und sind über die Zeit relativ starr. Tags sind flexibler und erlauben der/dem User/in mehr Anpassung an zeitliche Veränderungen. Wie auch das Beispiel von del.icio.us zeigt, können Tags auch für andere Dinge verwendet werden (zB die Zuweisung zu anderen Personen bei del.icio.us/for).
Doch natürlich haben auch Tags Nachteile und Probleme, die deutlich werden wenn man eine der bereits genannten Applikationen verwendet. Da wäre zum einen das Problem mehrere Bedeutungen und/oder Schreibweisen für ein Wort (auch Mehrzahl/Einzahl), auch als Polysemie und Homonymie bezeichnet. Manchmal würde man auch gerne Spezialisierungs- und Generalisierungsbeziehungen festhalten, Tags sind ein flacher Raum. Die Anzahl der Tags wächst relativ stark und User/innen haben meist wesentlich mehr Tags zu verwalten als typischerweise Kategorien, ein Grund für das häufige Argument, dass Tags chaotisch und unübersichtlich sind. Auch die Einstiegsbarriere ist relativ hoch, da der Nutzen von Tagging (ähnlich wie Weblogs) eher durch das Erleben vermittelt werden kann als durch bloßes Erzählen. Vermutlich werden die meisten User/innen Tags auch eher inkrementell einsetzen, also ab einem gewissen Zeitpunkt beginnen Tags zu nutzen und nicht alle bereits bestehenden Inhalte (Objekte) zu taggen. Wer will schon seine gesammelten Bookmarks oder seine gesammten Digitalfotos nachträglich mit verschlagworten.
Gerne verwendete Elemente in User Interfaces (auch begünstigt durch das Aufkommen und die Verbreitung von AJAX) sind, neben anderen Vereinfachungen (wie Bulk Editing, In-Place Editing), Vorschläge aus
Wir haben vor etwa 8 Monaten mit der Entwicklung einer Technologie begonnen, deren erstes nach außen sichtbares Ergebnis tagthe.net ist. Das Ziel dieses Webservices ist es automatische Mechanismen (Algorithmen) einzusetzen um den Inhalt von textuellen Objekten zu analysieren und die wichtigsten Konzepte zu extrahieren. Warum? Weil wie oben festgestellt, die meisten Tags den Inhalt betreffen und damit vermutlich schon mal im Text vorkommen. Das sieht auf den ersten Blick einfacher aus, als es ist, vor allem wenn man diesen Task relativ performant durchführen möchte und auch nur die wirklich relevanten Tags rausfiltern will. Dabei werden Statistiken eingesetzt um den Satzaufbau zu analysieren und wenn möglich auch Unterschiede festzustellen ob es sich bei dem Begriff um Personen, Orte oder generelle Konzepte handelt.
Das spannendste an Tags ist definitiv die Verwendung. Tags sind Filter, die beliebig kombiniert werden können, und werden als Navigationsmetapher verwendet. Die soziale Dimension (auch öfter als Folksonomies bezeichnet) macht ebenfalls einen großen Nutzenaspekt aus.
Egal wie man über das Konzept des Tagging denkt, die Anzahl der Firmen die in ihren Services Tags einsetzen wächst täglich:
Google (Gmail [hier als Labels bezeichnet], Google Base, Picasa [ebenfalls als Labels], im Google Reader und in der Search History), Yahoo! in MyWeb 2.0, Flickr und del.icio.us, alle Social Bookmarking Services wie Furl, Simpy oder das höchst interessante Dogear von IBM, RSS Reader wie Rojo oder feedlounge, seit neuestem Amazon, natürlich Technorati, die gerade aufkommenden Video Sharing System wie YouTube, für Apple's mail.app gibt es ein Plugin namens MailTags und in zahlreichen Blog Hosting Services von Typepad bis Wordpress.
Einige Services bieten ähnliche Dienste wie tagthe.net, jedoch mit anderer Ausrichtung: Tagcloud basiert auf dem der Term Extraction API von Yahoo! und Tagyu, welches soziale Tags von zahlreichen Services als Ergebnis liefert und damit zwar Tags entdeckt die nicht unbedingt im Text vorkommen müssen, aber auch nur bedingt mit dem Inhalt zu tun haben.
Bleibt also spannend, was sich im Fall des Tagging noch entwickeln wird. Ich würde mich ja wie ein Kleinkind freuen wenn ich meine (ohnedies vollkommen unstrukturierten) hierarchischen Ordner auf der Festplatte endlich loswerden könnte.
Was bedeutet es überhaupt ein Objekt (eine URL, ein Foto, einen Weblogbeitrag, etc.) zu taggen? Aus meiner Sicht geht es dabei um die Identifikation von wichtigen Begriffen (Konzepten) im Zusammenhang mit dem Inhalt. Es geht darum dem Objekt eine Bedeutung, einen Sinn zuzuweisen. Dieser Sinn kann vielfältig sein, ist immer subjektiv auf den Erfahrungshorizont der Person zugewiesen die das Objekt tagged. Es ist eine Art Kategorisierung, ein "labelling" mit sinngebenden Begriffen.
Dabei hat ein Paper von Golder / Huberman unlängst einige sehr interessante Faktoren im Zusammenhang mit Tagging analysiert. Die meisten Tags, in der Reihenfolge der Häufigkeit, haben laut Studie folgenden Sinn:
- Zu identifizieren welchen Inhalt (thematisch oder personell) ein Objekt hat
- festzuhalten woher ein Objekt stammt oder welcher Art es ist
- dem Objekt einen Ursprung (einen "Besitzer") zu geben
- die bereits gewählten Tags weiter zu verfeinern und verdichten
- Referenzen auf eigene Kategorien (mystuff, work, etc.)
- Aufgabenorientierte Tags, wie toread, toblog, etc.
Rashmi Sinha hat eine interessante Zusammenfassung dieses Aspektes, denn es ist in der Tat einfacher sich ein Objekt anzusehen und die Konzepte die dabei im Kopf aktiviert werden zu notieren als ein Objekt zweifelsfrei und eindeutig einer Kategorie zuzuordnen. Kategorien sind meistens ausschließend (ein Element kann nicht in zwei Kategorien sein) und sind über die Zeit relativ starr. Tags sind flexibler und erlauben der/dem User/in mehr Anpassung an zeitliche Veränderungen. Wie auch das Beispiel von del.icio.us zeigt, können Tags auch für andere Dinge verwendet werden (zB die Zuweisung zu anderen Personen bei del.icio.us/for).
Doch natürlich haben auch Tags Nachteile und Probleme, die deutlich werden wenn man eine der bereits genannten Applikationen verwendet. Da wäre zum einen das Problem mehrere Bedeutungen und/oder Schreibweisen für ein Wort (auch Mehrzahl/Einzahl), auch als Polysemie und Homonymie bezeichnet. Manchmal würde man auch gerne Spezialisierungs- und Generalisierungsbeziehungen festhalten, Tags sind ein flacher Raum. Die Anzahl der Tags wächst relativ stark und User/innen haben meist wesentlich mehr Tags zu verwalten als typischerweise Kategorien, ein Grund für das häufige Argument, dass Tags chaotisch und unübersichtlich sind. Auch die Einstiegsbarriere ist relativ hoch, da der Nutzen von Tagging (ähnlich wie Weblogs) eher durch das Erleben vermittelt werden kann als durch bloßes Erzählen. Vermutlich werden die meisten User/innen Tags auch eher inkrementell einsetzen, also ab einem gewissen Zeitpunkt beginnen Tags zu nutzen und nicht alle bereits bestehenden Inhalte (Objekte) zu taggen. Wer will schon seine gesammelten Bookmarks oder seine gesammten Digitalfotos nachträglich mit verschlagworten.
Gerne verwendete Elemente in User Interfaces (auch begünstigt durch das Aufkommen und die Verbreitung von AJAX) sind, neben anderen Vereinfachungen (wie Bulk Editing, In-Place Editing), Vorschläge aus
- dem eigenen Tagraum, oder
- den Tags anderer Personen (zB del.icio.us Recommendations).
Wir haben vor etwa 8 Monaten mit der Entwicklung einer Technologie begonnen, deren erstes nach außen sichtbares Ergebnis tagthe.net ist. Das Ziel dieses Webservices ist es automatische Mechanismen (Algorithmen) einzusetzen um den Inhalt von textuellen Objekten zu analysieren und die wichtigsten Konzepte zu extrahieren. Warum? Weil wie oben festgestellt, die meisten Tags den Inhalt betreffen und damit vermutlich schon mal im Text vorkommen. Das sieht auf den ersten Blick einfacher aus, als es ist, vor allem wenn man diesen Task relativ performant durchführen möchte und auch nur die wirklich relevanten Tags rausfiltern will. Dabei werden Statistiken eingesetzt um den Satzaufbau zu analysieren und wenn möglich auch Unterschiede festzustellen ob es sich bei dem Begriff um Personen, Orte oder generelle Konzepte handelt.
Das spannendste an Tags ist definitiv die Verwendung. Tags sind Filter, die beliebig kombiniert werden können, und werden als Navigationsmetapher verwendet. Die soziale Dimension (auch öfter als Folksonomies bezeichnet) macht ebenfalls einen großen Nutzenaspekt aus.
Egal wie man über das Konzept des Tagging denkt, die Anzahl der Firmen die in ihren Services Tags einsetzen wächst täglich:
Google (Gmail [hier als Labels bezeichnet], Google Base, Picasa [ebenfalls als Labels], im Google Reader und in der Search History), Yahoo! in MyWeb 2.0, Flickr und del.icio.us, alle Social Bookmarking Services wie Furl, Simpy oder das höchst interessante Dogear von IBM, RSS Reader wie Rojo oder feedlounge, seit neuestem Amazon, natürlich Technorati, die gerade aufkommenden Video Sharing System wie YouTube, für Apple's mail.app gibt es ein Plugin namens MailTags und in zahlreichen Blog Hosting Services von Typepad bis Wordpress.
Einige Services bieten ähnliche Dienste wie tagthe.net, jedoch mit anderer Ausrichtung: Tagcloud basiert auf dem der Term Extraction API von Yahoo! und Tagyu, welches soziale Tags von zahlreichen Services als Ergebnis liefert und damit zwar Tags entdeckt die nicht unbedingt im Text vorkommen müssen, aber auch nur bedingt mit dem Inhalt zu tun haben.
Bleibt also spannend, was sich im Fall des Tagging noch entwickeln wird. Ich würde mich ja wie ein Kleinkind freuen wenn ich meine (ohnedies vollkommen unstrukturierten) hierarchischen Ordner auf der Festplatte endlich loswerden könnte.