- Datenleckprävention
- Datenrisikobewertung
- Dateianalyse
- Dateiauditing
Daten-Tagging
Was ist Daten-Tagging?
Beim Daten-Tagging wird eine Bezeichnung an Daten angehängt, z. B. an Bilder, Websites oder Videos. Diese Tags sind häufig Metadaten, um den Namen des Autors, das Erstellungsdatum, die Abteilung, das Dateiformat oder andere definierende Details anzugeben. Anhand der Tags lässt sich ein Datensatz von anderen Daten in einer Umgebung unterscheiden und einfach suchen.
Warum ist Daten-Tagging so wichtig?
Durch Tags erhalten Daten eine Identität, indem sie mit Metadaten verknüpft werden. In einer Organisation verleiht die Mitarbeiter-ID jedem einzelnen Mitarbeiter eine eindeutige Identität. Gleichermaßen trägt jeder Sitz im Fußballstadion eine Nummer, damit jeder weiß, wo er sitzt.
In allen drei Szenarien erhält ein Objekt durch das Tag eine Bezeichnung. Diese Bezeichnung dient zur eindeutigen Identifizierung des Objekts und ermöglicht:
- Mühelose Identifizierung
Beim Fußballspiel gibt die Sitznummer einen bestimmten Standort im Stadium an, sodass man nicht lange nach seinem Platz suchen muss.
- Einfache Kategorisierung
Mit Abteilungsnamen werden die Mitarbeiter in erkennbare Gruppen eingeteilt.
- Datensicherheit
Eine Mitarbeiter-ID stellt Informationen zur Einzelperson bereit und ermöglicht es, Zugriff auf Organisationsressourcen zu gewähren oder zu verweigern, was für Datensicherheit sorgt.
Modelle für das Daten-Tagging
„Daten sind das neue Öl“ ist ein Satz, den man im letzten Jahrzehnt immer häufiger gehört hat – und er stimmt, wenn man sich ansieht, wieviel Geld Organisationen für die Datenbeschaffung ausgeben. Angesichts der gewaltigen Menge an gespeicherten Daten benötigen Organisationen eine Strategie, um diese effizient mit Tags zu versehen und zu organisieren. Hier einige Modelle für das Daten-Tagging, die in Organisationen zum Einsatz kommen:
- Hierarchisches Modell
Organisieren Sie Tags in eine Hierarchie, mit breiteren Kategorien oben und spezifischen Tags unten. Beispielsweise gibt es in einer Anwendung wie Spotify die übergeordneten Kategorien „Musik“, „Podcasts“ und „Audiobooks“, während jede davon über Subkategorien verfügt, wie Genres, Selbsthilfe und Belletristik.
- Flaches Modell
In einem flachen Modell sind alle Tags gleich wichtig und es gibt keine inhärente Beziehung zwischen den Tags.
- Segmentiertes Modell
Bei diesem Modell werden die Daten nach Segmenten mit Tags versehen. Zum Beispiel könnten in einem Autohaus die Segmente „SUV“, „Sedan“ und „Combi“ verwendet werden.
- Jargon-Modell
Auch der in einer Organisation oder Abteilung geläufige Jargon kann zum Taggen verwendet werden.
Verschiedene Arten von Daten-Tagging
Das Taggen von Daten lässt sich je nach deren Format grob in verschiedene Typen unterteilen. Das kann Text, Bild oder Video sein. Außerdem lässt sich jedes dieser Formate je nach Funktion weiter unterteilen. Hier einige dieser Unterklassifizierungen:

- Benannte Entitätserkennung (NER, von Named Entity Recognition)
NER hilft dabei, Entitäten in einem Textkörper zu erkennen, wie Namen, Orte und Objekte.
- Teil der Rede (POS, von Part Of Speech)
Beim POS-Tagging werden Wörter in einem Satz mit dem grammatischen Teil der Rede assoziiert.
- Semantische Segmentierung
Hierbei wird jeder einzelne Pixel eines Bildes mit Tags versehen.
- 2D-Begrenzungsrahmen
Indem ein Rahmen um ein Objekt gezogen wird, lässt es sich im Bild einfacher erkennen.
Best Practices für das Daten-Tagging
Das primäre Ziel des Daten-Taggings ist es, den Endnutzern das Leben zu erleichtern, da Nutzern weniger Zeit für die mühselige Suche nach Daten aufwenden müssen. Ihre Strategie für das Daten-Tagging muss also vorallem nutzerfreundlich sein. Hier einige Best Practices, die eine nahtlose Erfahrung ermöglichen können:
-
Eine wohldefinierte Terminologie
Durch organisations- oder abteilungsweite Benennungskonventionen finden sich Mitarbeiter beim Abrufen von Daten besser zurecht. Endnutzer müssen den Sinn hinter der wohldefinierten Terminologie erkennen können. Verwenden Sie also Schlüsselwörter wie Abteilung, Projekt, Manager, Team und andere relevante Kennungen. -
Konstruieren eines Modells
Ein Tagging-Modell verleiht Struktur und trägt zur Klassifizierung der Daten bei. Etwas weiter oben auf dieser Seite haben wir bereits einige solche Modelle vorgestellt. -
Bewertungen der Nutzerfreundlichkeit
Eine regelmäßige Überprüfung der Nutzerfreundlichkeit kann die Effizienz des Daten-Taggings verbessern. Dementsprechende Berichte müssen verschiedene Faktoren berücksichtigen, z. B. die Zugänglichkeit und wie lange es dauert, Dateien abzurufen. -
Automatisieren des Daten-Taggings
Das manuelle Tagging nimmt ungebührlich viele Arbeitsstunden in Anspruch und ist anfällig für menschliches Versagen. Daher kann es unschätzbar sein, das Daten-Tagging mit maschinellem Lernen zu automatisieren.
Datenklassifizierung und Tags
Klassifizierung und Tagging von Daten werden häufig synonym verwendet, es handelt sich aber um zwei Seiten der gleichen Medaille, jede mit eigener Bedeutung.
Beim Daten-Tagging erhalten Daten je nach Metadetails eine Bezeichnung, z. B. Projektname, Dateibesitzer oder Datentyp, um die Zugänglichkeit und Organisation zu fördern. Klassifiziert werden Daten hingegen abhängig von der Vertraulichkeit der Inhalte, um sensible Daten zu schützen und durch Tools zur Datenverlustprävention zu markieren. Eine gut ausbalancierte Strategie zum Taggen und Klassifizieren von Daten ermöglicht eine nahtlose Navigation und stärkt die Netzwerksicherheit.
Einzelheiten zur Datenklassifizierung lernen Sie in unserem On-Demand-Webinar mit dem Titel Datenklassifizierung: Der Grundpfeiler von DLP kennen.
Erkennen und Klassifizieren von Daten mit DataSecurity Plus
DataSecurity Plus bietet ein Tool zur Datenerkennung, dass den Prozess der Klassifizierung von Daten anhand eines hierarchischen Systems automatisiert. Das Tool zur Erkennung und Klassifizierung von Daten erkennt, klassifiziert und sichert vertrauliche Informationen, darunter personenbezogene Daten (PII), Zahlkartendaten, geschützte Gesundheitsinformationen (ePHI) und mehr, um für Compliance mit gesetzlichen Vorgaben zu sorgen.
Unter anderem bietet Ihnen DataSecurity Plus die folgenden Funktionen:
- Berichte in Echtzeit zum, Typ, Volumen und Speicherort vertraulicher Daten.
- Anpassbare Regeln zur Datenerkennung, um organisationsspezifisch zu definieren, welche Daten vertraulich sind.
- Alarmierungen, um Dateien zu verfolgen, die verschiedenen Datenschutzgesetzen entsprechen (wie DSGVO, PCI DSS und mehr).
- Inkrementelle Scans zur Datenerkennung, damit Sie ein Inventar der vertraulichsten Daten erstellen und pflegen können.
Dank unserer kostenlosen 30-Tage-Testversion mit vollem Funktionsumfang können Sie die Datenklassifizierung mit DataSecurity Plus selbst ausprobieren.
Kostenlose 30-Tage-Testversion herunterladen