Datenklassifizierung ist ein sicherheitsbezogener organisatorischer Prozess zur Herstellung von Cyber-Resilienz. Hierbei werden Daten in Kategorien eingeteilt, um die Risiken für ein Unternehmen aufzudecken und zu identifizieren. Wenn Unternehmen ihre Daten nach bestimmten Attributen, Richtlinien oder Sicherheitsstufen klassifizieren – wie z. B. vertraulich, geheim und streng geheim – vereinfachen sie sich die folgenden Aufgaben: Feststellen ihres vorhandenen Datenbestands, Organisieren dieser Daten für die Suche, Schutz der Daten vor Angreifern, Einhalten von Datenschutzrichtlinien, Bekämpfung von Ransomware und Insider-Bedrohungen, Datenverwaltung zum Gewinnen von geschäftsfördernden Einblicken und Berichterstattung über diese Daten, um Compliance- und andere Geschäftsanforderungen zu erfüllen.
Traditionell war die Klassifizierung oder Kennzeichnung von Daten ein manueller Prozess oder wurde mit begrenzten Tools wie Regex durchgeführt. Da die Datenmengen jedoch enorm angewachsen sind und Cyberangriffe immer raffinierter und häufiger werden, wenden sich Unternehmen der künstlichen Intelligenz (KI) zu, insbesondere dem maschinellen Lernen (ML) und dem auf natürlicher Sprachverarbeitung (NPL) basierenden Musterabgleich, um sensible und regulierte Daten zu identifizieren, die sie schützen müssen. Dazu gehören oft auch personenbezogene, Gesundheits- und Finanzdaten, auf die es Angreifer abgesehen haben, um Lösegeld zu erpressen.
Moderne Unternehmen produzieren riesige Mengen an digitalen Informationen in Form von strukturierten und unstrukturierten Daten. Obwohl viele davon unbedeutend sind, ist ein Teil davon für Cyberkriminelle, die aufgabenkritische Daten für finanziellen Gewinn ausnutzen wollen, ausgesprochen wertvoll. Sensible Daten in den Produktions-, Datensicherungs- und Wiederherstellungsumgebungen von Unternehmen können geistiges Eigentum (Intellectual Property, IP), personenbezogene Daten (Personal Identifiable Information, PII), Lieferantenverträge, geschützte Gesundheitsdaten (Protected Health Information, PHI), Zahlungskartendaten (Payment Card Information, PCI) und mehr enthalten. Unternehmen, die umfassende Verfahren zur Datenklassifizierung einführen, sind bestens aufgestellt, um die vollen Auswirkungen potenzieller Datenverletzungen auf ihr Unternehmen umfassend zu verstehen – in finanzieller, betrieblicher und regulatorischer Hinsicht.
Die Klassifizierung von Daten dient der Risikominderung, der Unternehmensführung ebenso wie der Kosteneffizienz – und sie verschafft Wettbewerbsvorteile. Dieses Verfahren ermöglicht einem Unternehmen insbesondere Folgendes:
Unternehmen können ihre eigenen Datenklassifizierungsstufen wählen oder von anderen Unternehmen verwendete Stufen übernehmen. Wichtig ist, dass Sie die Stufen im Verhältnis zu dem Schaden definieren, den die Daten für das Unternehmen verursachen könnten, wenn sie in die falschen Hände geraten oder von Cyberkriminellen im Dark Web oder der breiten Öffentlichkeit zugänglich gemacht werden.
Ein beliebter Ansatz zur Klassifizierung von geschäftlichen Dokumenten ist beispielsweise die Verwendung von vier Stufen:
Gleichzeitig berücksichtigen Unternehmen oft drei Variablen, um ihre Daten zu klassifizieren:
Die US-Regierung verwendet laut der National Archives and Records Administration die folgenden drei Datenklassifizierungsstufen für sensible Informationen, die der nationalen Sicherheit schaden können:
Diese Klassifizierungsstufen dürfen nicht mit den Sicherheitsstufen verwechselt werden, die erforderlich sind, um von der Regierung als sensibel eingestufte Dokumente einzusehen:
Für Unternehmen, die ihre Daten gründlich klassifizieren, ergeben sich eine Reihe bedeutender geschäftlicher und sicherheitstechnischer Vorteile. Zu diesen Vorteilen gehören:
Die manuelle Datenklassifizierung kann ein mühsamer, zeitaufwendiger und kostspieliger Prozess sein. Aus diesem Grund entscheiden sich immer mehr Unternehmen für seine Automatisierung.
Zu den wichtigsten Schritten eines modernen Datenklassifizierungsprozesses gehören:
Cyber-Bedrohungen wie Ransomware, die von Privatpersonen und Nationalstaaten ausgehen, nehmen an Häufigkeit und Schwere zu, da erfolgreiche Cyberangriffe finanzielle und politische Vorteile bringen. Datenklassifizierungsprozesse, die durch die Datensicherheits- und -managementlösungen von Cohesity bereitgestellt werden, erhöhen die Cyber-Resilienz.
Das Cohesity DataHawk Cloud-Service-Angebot umfasst eine Datenklassifizierung, die Unternehmen bei der Erkennung und Klassifizierung von Daten unterstützt. So können sie feststellen, ob und wann sensible Daten während eines Angriffs potenziell gefährdet waren. Cohesity erkennt und klassifiziert sensible und aufgabenkritische Daten mithilfe hochpräziser Scans. Diese Scans basieren auf mehr als 230 bewährten Mustern sowie auf maschinellem Lernen und natürlicher Sprachverarbeitung. Sie umfassen gängige Kombinationen von Personen-, Gesundheits- und Finanzdaten. Die Lösung nutzt benutzerdefinierte Richtlinien, um die gesetzlichen Anforderungen und Datenschutzvorgaben zu erfüllen.