smi: 10 Dezember 2005

Tagging revisited

Einerseits weil ich es versprochen hatte und andererseits weil gestern del.icio.us von Yahoo! gekauft wurde und damit Yahoo! mit Flickr und del.icio.us zwei der wohl momentan wichtigsten Social Software Applikationen "besitzt" deren zentrales Konzept Tagging ist. Eine grundlegende Einführung ist hier und bei Wikipedia zu finden.

Was bedeutet es überhaupt ein Objekt (eine URL, ein Foto, einen Weblogbeitrag, etc.) zu taggen? Aus meiner Sicht geht es dabei um die Identifikation von wichtigen Begriffen (Konzepten) im Zusammenhang mit dem Inhalt. Es geht darum dem Objekt eine Bedeutung, einen Sinn zuzuweisen. Dieser Sinn kann vielfältig sein, ist immer subjektiv auf den Erfahrungshorizont der Person zugewiesen die das Objekt tagged. Es ist eine Art Kategorisierung, ein "labelling" mit sinngebenden Begriffen.

Dabei hat ein Paper von Golder / Huberman unlängst einige sehr interessante Faktoren im Zusammenhang mit Tagging analysiert. Die meisten Tags, in der Reihenfolge der Häufigkeit, haben laut Studie folgenden Sinn:

Zu identifizieren welchen Inhalt (thematisch oder personell) ein Objekt hat
festzuhalten woher ein Objekt stammt oder welcher Art es ist
dem Objekt einen Ursprung (einen "Besitzer") zu geben
die bereits gewählten Tags weiter zu verfeinern und verdichten
Referenzen auf eigene Kategorien (mystuff, work, etc.)
Aufgabenorientierte Tags, wie toread, toblog, etc.

Das zeigt deutlich, dass nicht wie manchmal angenommen, Tags ausschließlich aus Metakategorien bestehen, sondern sehr oft wesentliche Konzepte des Inhaltes in Tags abgebildet werden. Meine Hypothese ist, dass die meisten Tags als Worte im Objekt oder dessen Quelle vorkommen (wenn es textuell ist, mit Quelle ist zB im Falle einer URL die Website gemeint). Oftmals wird auch argumentiert, dass Tags auch nur eine Form von Kategorisierung wären, der Unterschied liegt jedoch im Aufwand den es bedarf um ein Objekt zu taggen und dem es in eine Kategorie einzuordnen.

Rashmi Sinha hat eine interessante Zusammenfassung dieses Aspektes, denn es ist in der Tat einfacher sich ein Objekt anzusehen und die Konzepte die dabei im Kopf aktiviert werden zu notieren als ein Objekt zweifelsfrei und eindeutig einer Kategorie zuzuordnen. Kategorien sind meistens ausschließend (ein Element kann nicht in zwei Kategorien sein) und sind über die Zeit relativ starr. Tags sind flexibler und erlauben der/dem User/in mehr Anpassung an zeitliche Veränderungen. Wie auch das Beispiel von del.icio.us zeigt, können Tags auch für andere Dinge verwendet werden (zB die Zuweisung zu anderen Personen bei del.icio.us/for).

Doch natürlich haben auch Tags Nachteile und Probleme, die deutlich werden wenn man eine der bereits genannten Applikationen verwendet. Da wäre zum einen das Problem mehrere Bedeutungen und/oder Schreibweisen für ein Wort (auch Mehrzahl/Einzahl), auch als Polysemie und Homonymie bezeichnet. Manchmal würde man auch gerne Spezialisierungs- und Generalisierungsbeziehungen festhalten, Tags sind ein flacher Raum. Die Anzahl der Tags wächst relativ stark und User/innen haben meist wesentlich mehr Tags zu verwalten als typischerweise Kategorien, ein Grund für das häufige Argument, dass Tags chaotisch und unübersichtlich sind. Auch die Einstiegsbarriere ist relativ hoch, da der Nutzen von Tagging (ähnlich wie Weblogs) eher durch das Erleben vermittelt werden kann als durch bloßes Erzählen. Vermutlich werden die meisten User/innen Tags auch eher inkrementell einsetzen, also ab einem gewissen Zeitpunkt beginnen Tags zu nutzen und nicht alle bereits bestehenden Inhalte (Objekte) zu taggen. Wer will schon seine gesammelten Bookmarks oder seine gesammten Digitalfotos nachträglich mit verschlagworten.

Gerne verwendete Elemente in User Interfaces (auch begünstigt durch das Aufkommen und die Verbreitung von AJAX) sind, neben anderen Vereinfachungen (wie Bulk Editing, In-Place Editing), Vorschläge aus

dem eigenen Tagraum, oder
den Tags anderer Personen (zB del.icio.us Recommendations).

Diese Vorschläge helfen die Anzahl an Tags überschaubar zu halten und den Prozess des tagging weiter zu vereinfachen. Die Möglichkeit mit Tags einen Raum über ein soziales Netzwerk aufzuspannen, sich also jene Objekte anzusehen die andere Personen mit selben Tags versehen haben, Cluster aus den verwendeten Tags zu erstellen und auch über die Objekte eine Verknüpfung zu erstellen ("wer hat ebenfalls dieses Objekt getagged"). Diese soziale Dimension des "Social Tagging" ist mit Sicherheit einer der spannendsten Aspekte an Tagging (Obwohl die Untersuchung von Golder / Huberman einen generellen Eigennutzen unterstellt und die Anzahl der Tags je User/in keinem Zusammenhang mit der Anzahl der Objekte hat, sondern eher mit dem generellen Verhalten des Users zu tun hat).

Wir haben vor etwa 8 Monaten mit der Entwicklung einer Technologie begonnen, deren erstes nach außen sichtbares Ergebnis tagthe.net ist. Das Ziel dieses Webservices ist es automatische Mechanismen (Algorithmen) einzusetzen um den Inhalt von textuellen Objekten zu analysieren und die wichtigsten Konzepte zu extrahieren. Warum? Weil wie oben festgestellt, die meisten Tags den Inhalt betreffen und damit vermutlich schon mal im Text vorkommen. Das sieht auf den ersten Blick einfacher aus, als es ist, vor allem wenn man diesen Task relativ performant durchführen möchte und auch nur die wirklich relevanten Tags rausfiltern will. Dabei werden Statistiken eingesetzt um den Satzaufbau zu analysieren und wenn möglich auch Unterschiede festzustellen ob es sich bei dem Begriff um Personen, Orte oder generelle Konzepte handelt.

Das spannendste an Tags ist definitiv die Verwendung. Tags sind Filter, die beliebig kombiniert werden können, und werden als Navigationsmetapher verwendet. Die soziale Dimension (auch öfter als Folksonomies bezeichnet) macht ebenfalls einen großen Nutzenaspekt aus.

Egal wie man über das Konzept des Tagging denkt, die Anzahl der Firmen die in ihren Services Tags einsetzen wächst täglich:

Google (Gmail [hier als Labels bezeichnet], Google Base, Picasa [ebenfalls als Labels], im Google Reader und in der Search History), Yahoo! in MyWeb 2.0, Flickr und del.icio.us, alle Social Bookmarking Services wie Furl, Simpy oder das höchst interessante Dogear von IBM, RSS Reader wie Rojo oder feedlounge, seit neuestem Amazon, natürlich Technorati, die gerade aufkommenden Video Sharing System wie YouTube, für Apple's mail.app gibt es ein Plugin namens MailTags und in zahlreichen Blog Hosting Services von Typepad bis Wordpress.

Einige Services bieten ähnliche Dienste wie tagthe.net, jedoch mit anderer Ausrichtung: Tagcloud basiert auf dem der Term Extraction API von Yahoo! und Tagyu, welches soziale Tags von zahlreichen Services als Ergebnis liefert und damit zwar Tags entdeckt die nicht unbedingt im Text vorkommen müssen, aber auch nur bedingt mit dem Inhalt zu tun haben.

Bleibt also spannend, was sich im Fall des Tagging noch entwickeln wird. Ich würde mich ja wie ein Kleinkind freuen wenn ich meine (ohnedies vollkommen unstrukturierten) hierarchischen Ordner auf der Festplatte endlich loswerden könnte.

Dieser Beitrag wurde am Samstag, 10. Dezember 2005, 18:43 verfasst und hat 7 Kommentare. Sie können ihn kommentieren oder über Trackback sowie den Permalink darauf Bezug nehmen.

Hip Hop ist der neue Rock

Gerade in einem Masters auf MTV eine schöne Aufbereitung der Dominanz von Hip Hop in der amerikanischen Kultur. Hip Hop ist eindeutig der neue Rock, auch weil es Rapper mittlerweile deutlich besser verstehen sich zu vermarkten und aus einem Musikgenre ein Lebensgefühl, einen Lifestyle zu machen und diesen dann zu vermarkten.

Dieser Beitrag wurde am Samstag, 10. Dezember 2005, 17:12 verfasst und hat 3 Kommentare. Sie können ihn kommentieren oder über Trackback sowie den Permalink darauf Bezug nehmen.

Gemeindebau Quartett

Ich kann mich noch gut jener Zeit entsinnen an denen wir auf unendlichen Busfahrten, meist auf dem Weg in irgendwelche Sommer- oder Winterdestinationen, mit Autoquartetten PS, KW, Gewicht und Geschwindigkeiten verglichen haben. Einfaches Prinzip: einer ist dran, nennt eine Kategorie, wer den besseren Wert vorzuweisen hat, bekommt die Karte des Gegners.

Gestern habe ich eine neue Qualität des Spiels entdeckt: das Margareten Quartett, über den schönen 5. Bezirk in Wien. Komplett mit dem besten was Margareten an Gemeindebauten, Sportstätten und Lokalen zu bieten hat. Doch welche gemeinsamen Kategorien findet man wohl für so unterschiedliche Dinge? Jahreszahlen sind immer ganz gut, und (ich kann mein Staunen kaum verbergen) natürlich auch die Zähler der Seiten in Google für den Begriff. Da sag noch mal einer Google hätte nicht vieles verändert.

stadt_quartett

Der Mateotti Hof hat übrigens 684 Nennungen vorzuweisen (laut Quartett). Die Prüfung mit der Schreibweise auf der Karte zeigt ein anderes Ergebnis: nur 23 Nennungen. Erst die Rechtschreibkorrektur durch Google bringt 618 Treffer. Die Anzahl der PS konnte man seinerzeit beim Autoquartett nicht ganz so leicht überprüfen, aber ich glaube auch dort wurde geschummelt.

Dieser Beitrag wurde am Samstag, 10. Dezember 2005, 17:05 verfasst und hat 1 Kommentar. Sie können ihn kommentieren oder über Trackback sowie den Permalink darauf Bezug nehmen.

ältere Beiträge »

Tagging revisited

Hip Hop ist der neue Rock

Gemeindebau Quartett

about

suche

aktuell

archiv

credits