- Veri Sızıntısını Önleme
- Veri Riski Değerlendirmesi
- Dosya Analizi
- Dosya Denetimi
Veri etiketleme
Veri etiketleme nedir?
Veri etiketleme; görüntü, web sitesi veya video gibi bir veri parçasına bir etiket atama işlemidir. İlişkili etiketler genellikle yazarın adını, oluşturulma tarihini, departmanı, dosya biçimini veya bazı ek tanımlayıcı ayrıntıları belirten meta verilerdir. Bu etiketler, bir veri kümesinin ortamdaki diğer verilerden ayırt edilmesini sağlayarak arama yapılmasını kolaylaştırır.
Veri etiketleme neden önemlidir?
Veri etiketleme, verilerinizi meta verilerle ilişkilendirerek verileri tanımlamanızı sağlar. Bir kuruluşta çalışan kimliği, kuruluşun çalışanlarına benzersiz bir kimlik sağlama amacını taşır. Benzer şekilde futbol maçın biletinizdeki koltuk numarası stadyumda oturacağınız yeri belirtir.
Bu senaryoların ortak noktası, bir nesnenin bir etiketle etiketlenmesidir. Bu etiket nesneye benzersiz bir kimlik verir ve şunları sağlar:
- Zahmetsiz tanımlama
Futbol maçı durumunda koltuk numarası stadyumdaki ilgili yeri gösterir ve koltuğunuzu aramak zorunda kalmazsınız.
- Kolay kategorizasyon
Departman adları çalışanları tanınabilir gruplara ayırır.
- Veri güvenliği
Çalışan kimliği, veri güvenliğini sağlamak üzere kurumsal kaynaklara erişimi sağlamak ve kısıtlamak amacıyla kullanılabilecek çalışan bilgilerini verir.
Veri etiketleme modelleri
"Veri bu çağın petrolüdür" son on yılda sıklıkla duyduğumuz bir ifadedir ve kuruluşların verilerin sağlanması amacıyla büyük meblağlar harcadığına tanık olduğumuz bu dönemde, bu ifade geçerliliğini korumaktadır. Kuruluşların sakladığı veri hacmi dikkate alındığında, verileri verimli bir şekilde etiketlemek ve düzenlemek için bir stratejiye ihtiyaçları olmaktadır. Kuruluşların izlediği veri etiketleme modellerinden bazıları aşağıdaki gibidir:
- Hiyerarşik model
Etiketleri, üstte daha geniş kategoriler ve altta belirli etiketler olacak şekilde hiyerarşik bir model oluşturacak biçimde düzenleyin. Örneğin Spotify gibi bir uygulamada müzik, podcast'ler ve sesli kitaplar en üstte yer alırken, kişisel gelişim ve kurgu gibi bunları niteleyen türler vb. alt kategoriler daha düşük seviyede konumlandırılır.
- Düz model
Düz bir modelde her etiket eşit derecede önemlidir ve etiketler arasında içsel bir ilişki yoktur.
- Segment modeli
Bu model, verilerin segmentlere göre etiketlenmesini içerir. Örneğin bir araba galerisinde SUV, sedan ve hatchback şeklinde farklı segmentler olabilir.
- Jargon modeli
Etiketleme için bir kuruluş veya departmandaki çalışanların anlayabileceği jargon kullanılabilir.
Farklı veri etiketleme türleri
Veri etiketleme, etiketlenen verilerin biçimine bağlı olarak genel olarak farklı türlerde sınıflandırılabilir. Bu metin, görüntü veya video olabilir. Ayrıca, bu biçimlerin her biri işlevselliğe dayalı olarak daha ayrıntılı bir biçimde sınıflandırılabilir. Birkaç alt sınıflandırma aşağıdakileri içerir:

- Adlandırılmış varlık tanıma (NER)
NER, bir metin gövdesindeki adlar, yerler ve nesneler gibi varlıkların tanımlanmasına yardımcı olur.
- Sözcük türü ile (POS) etiketleme
POS etiketleme, bir cümledeki sözcükleri konuşmanın dilbilgisi kısmıyla ilişkilendirmeyi içerir.
- Semantik segmentasyon
Bir görüntünün parçası olan her bir pikselin etiketlenmesi sürecidir.
- 2 boyutlu sınırlayıcı kutu
Bu, tanınabilir kılmak üzere istenen nesnenin çevresine bir sınır çizmeyi içerir.
Veri etiketleme için en iyi uygulamalar
Veri etiketlemenin birincil amacı, zahmetli bir iş olan veri arama işlemini gerçekleştirmek için gereken süreyi azaltarak son kullanıcının hayatını kolaylaştırmaktır. Dolayısıyla, veri etiketleme stratejiniz kullanıcı dostu olmak zorundadır. Sorunsuz bir deneyim sunulmasını sağlayabilecek birkaç en iyi uygulama aşağıda listelenmiştir:
-
İyi tanımlanmış bir adlandırma düzenine sahip olmak
Kuruluş veya departman genelinde adlandırma kurallarına sahip olmak, çalışanların dosyalar arasında gezinmesine ve dosyaları almasına yardımcı olabilir. İyi tanımlanmış bir adlandırma düzeninin son kullanıcı tarafından anlaşılması gerekir. Dolayısıyla departman, proje, yönetici, ekip ve diğer ilgili tanımlayıcılar gibi anahtar sözcükleri kullandığınızdan emin olun. -
Bir model oluşturmak
Veri etiketleme modeli, verilerinize bir yapı katar ve veri sınıflandırmasına katkıda bulunur. Bu sayfada daha önce bahsedilenler gibi birkaç tür mevcuttur. -
Kullanılabilirlik değerlendirmelerinin yapılması
Periyodik olarak kullanılabilirlik değerlendirmelerinin gerçekleştirilmesi, veri etiketleme konusundaki verimliliğinizi artırabilir. Kullanılabilirlik raporları, erişme kolaylığı ve dosyaları getirmek için harcanan süre gibi etmenleri hesaba katmalıdır. -
Veri etiketleme sürecinin otomatikleştirilmesi
Manuel veri etiketleme, çok uzun saatlerce çalışılmasını gerektirir ve insan hatasına açıktır. Dolayısıyla veri etiketleme sürecini makine öğrenimi yoluyla otomatikleştirmek büyük bir değer sağlayabilir.
Veri sınıflandırma ve etiketleme
Veri etiketleme ve sınıflandırma sıklıkla birbirinin yerine kullanılıyor olsa da bunlar aynı madalyonun iki yüzü gibidir ve her ikisi de ayrıca önemlidir.
Veri etiketleme, verilerin proje adı, dosya sahibi veya veri türü gibi meta ayrıntılara göre etiketlenmesini ifade eder ve erişilebilirlik ile organizasyonu iyileştirmeyi amaçlar. Bir diğer yandan veri sınıflandırması, dosya içeriğinin hassasiyet düzeyine göre gerçekleştirilir, hassas verilerin güvenliğini sağlamayı amaçlar ve hassas verileri veri kaybını önleme araçlarıyla işaretlemek için kullanılabilir. İyi dengelenmiş bir veri etiketleme ve sınıflandırma stratejisi, sorunsuz gezinme imkanı ve ağ güvenliği sağlayabilir.
Veri sınıflandırması hakkındaki isteğe bağlı web seminerimiz ile veri sınıflandırmasının en ince detayları hakkında bilgi edinin: DLP'nin temel taşı
DataSecurity Plus ile verilerinizi keşfedin ve sınıflandırın
DataSecurity Plus, hiyerarşik bir etiketleme sistemi aracılığıyla dosya sınıflandırma sürecini otomatikleştiren bir veri keşfi aracı sunar. Veri keşfi ve sınıflandırması aracı, kişisel olarak tanımlanabilecek bilgiler, ödeme kartı bilgileri, korumada olan sağlık bilgileri ve daha fazlasını içeren hassas verileri algılar, sınıflandırır ve güvence altına alır ve bu şekilde mevzuata uyumluluğu sağlar.
DataSecurity Plus aşağıdakiler gibi özelliklerle donatılmıştır:
- Hassas verilerin türü, hacmi ve konumu ile ilgili gerçek zamanlı raporlama.
- Kuruluşa özgü hassas verileri tanımlamak üzere özelleştirilebilir veri keşfi kuralları.
- GDPR, PCI DSS ve daha fazlasını içeren veri koruma yasaları ile alakalı olarak eşleşmeler içeren dosyaları izlemeye yönelik uyarılar.
- En hassas verilerinizin envanterini oluşturmak ve muhafaza etmek üzere gerçekleştirilen artımlı veri keşfi taramaları.
Ücretsiz, tam işlevli 30 günlük deneme sürümüyle DataSecurity Plus'ın veri sınıflandırması özelliklerini deneyin.
30 günlük ücretsiz denemeyi indirin