Veri Nedir? Tanımdan Veri Türlerine, Kaliteden Yönetişime Kapsamlı Rehber

Bilim ve Doğa

İÇİNDEKİLER TABLOSU

Veri Nedir? En Net Tanım

Gündelik dilde “veri”, genelde “elimizdeki sayılar” gibi düşünülür. Oysa veri; sayıdan çok daha geniş bir şeydir: ölçüm, gözlem, kayıt, işaret, metin, görüntü, konum, tıklama, sıcaklık, ses… Hepsi veri olabilir.

Standartlara dayanan kısa bir tanım: Veri; iletişim, yorumlama veya işlemeye uygun biçimde, resmileştirilmiş (formalize) şekilde sunulan, yeniden yorumlanabilir bir bilgi temsilidir. Bu tanım ISO/IEC 2382’ye dayandırılır.

Bu tanımın kritik noktası şudur:

    Veri, tek başına “anlam” olmak zorunda değildir.

  • Anlam, çoğu zaman bağlam (context) ve yorumla ortaya çıkar.

Mini örnek

  • “102” → veri olabilir

  • “İnsanın ağız içi ölçümünde 102°F ateş” → bilgiye yaklaşır

  • “Bu ateş değeri yüksek; müdahale gerekebilir” → bilgi + yorumla eyleme dönüşür

Bu dönüşümü, NIST özellikle “data–information–knowledge” ayrımını anlatırken pratik bir örnekle açıklar.

 

Veri, Bilgi ve Bilgi Birikimi: Neden Karıştırıyoruz?

En basit ayrım şu çerçevedir:

  • Veri (data): Ham kayıt / ölçüm parçaları

  • Bilgi (information): Verinin bağlam kazanmış hali (ne, nerede, ne zaman, kim?)

  • Bilgi birikimi (knowledge): Bilgiden çıkarım yapabilme, anlamlandırma ve eyleme bağlayabilme (nasıl?)

Bu yaklaşım, NIST tarafından da “bits and bytes → useful meaning → action” ekseninde anlatılır.

Pratikte şirketlerin büyük kısmı “veri biriktirme”de iyidir ama “bilgiye/karara dönüştürme” kısmında zorlanır. Çünkü problem, depolama değil; tanım, bağlam, kalite ve süreç problemidir.

 

Veri Türleri: “Her Veri Aynı Değildir”

Veriyi yönetmek için önce türlerini sınıflandırmak gerekir. Çünkü her veri tipi; farklı depolama, kalite kontrolü, güvenlik ve analiz yaklaşımı ister.

Yapısına göre: Yapılandırılmış / yarı yapılandırılmış / yapılandırılmamış

Yapılandırılmış veri (structured)

Sütun–satır mantığıyla düzenli, şeması (schema) net veridir: müşteri tablosu, sipariş tablosu, stok tablosu gibi.

  • Artıları: sorgulaması kolay, raporlama/BI için çok uygun

  • Eksileri: esnekliği sınırlı; şema değişince süreç etkilenir

Örnek:

MusteriIDSehirKayitTarihi
1281İstanbul2026-01-10

Yarı yapılandırılmış veri (semi-structured)

Şema “tam sert” değildir ama içinde anahtar–değer yapısı taşır: JSON, XML gibi.

  • Artıları: esnek; değişen alanlara uyumlu

  • Eksileri: yönetişim yoksa “alan enflasyonu” olur (her ekip farklı alan ekler)

Yapılandırılmamış veri (unstructured)

Metin dokümanları, çağrı merkezi ses kayıtları, e-posta içerikleri, resimler, videolar vb.

    Artıları: iş değeri çok yüksektir (müşteri sesi, kalite sinyalleri)

  • Eksileri: analiz için önce işleme/sınıflandırma gerekir

Ölçüm türüne göre: nicel / nitel

  • Nicel (quantitative) veri: sayısal ölçümler (gelir, sıcaklık, süre)

  • Nitel (qualitative) veri: kategorik/öznel nitelikler (müşteri memnuniyet yorumları, şikâyet sınıfları)

Bu ayrım, veri toplama yöntemini ve analiz yaklaşımını (istatistiksel testler vs içerik analizi) doğrudan etkiler.

Zaman davranışına göre: statik / akan (streaming)

  • Statik veri: belirli aralıklarla güncellenen (günlük satış raporu gibi)

  • Akan veri: gerçek zamanlıya yakın üretilen (sensör, tıklama akışı, finansal fiyat akışı)

Akan veride kritik ihtiyaçlar: gecikme (latency), sıra (ordering), tekrarlı kayıt (duplication), “en son doğru değer” (latest correct state).

Hassasiyetine göre: kişisel veri / kişisel olmayan veri

“Hassasiyet” sınıflaması, teknikten çok hukuki ve etik bir sınıflamadır.

Kişisel veri için GDPR’nin (AB Genel Veri Koruma Tüzüğü) tanımı nettir: kimliği belirli veya belirlenebilir gerçek kişiye ilişkin her türlü bilgi kişisel veridir.

Burada kritik tuzak:

  • Tek başına masum görünen bir alan (ör. “konum”, “cihaz kimliği”, “online identifier”) birleşince kişiyi belirlenebilir kılabilir.

 

Ham Veri Nedir? Veri Nasıl “İşe Yarar” Hale Gelir?

Ham veri, çoğu zaman:

  • eksik,

  • tekrarlı,

  • hatalı,

  • farklı formatlarda,

  • bağlamı eksik halde gelir.

Ham verinin “işe yarar bilgi”ye dönüşmesi için tipik olarak şu adımlar gerekir:

  1. Toplama (capture): kaynağı ve toplama yöntemini belgele

  2. Temizleme (cleaning): eksik/aykırı/tekrarlı kayıtları yönet

  3. Standardizasyon: tarih formatı, birimler (TL/USD), kod listeleri

  4. Zenginleştirme: bağlam ekleme (ürün kategorisi, kanal, kampanya)

  5. Modelleme: analiz için uygun yapıya getirme

  6. Sunum: rapor, dashboard, veri ürünü

Bu zinciri anlamanın en kolay yolu “veri yaşam döngüsü” kavramıdır.

 

Veri Yaşam Döngüsü: Veri Doğar, Yaşar, Ölür

“Data lifecycle”, verinin ilk üretiminden nihai arşiv / silme aşamasına kadar geçtiği evreleri ifade eder.

NIST sözlüğünde veri yaşam döngüsü; ham veriyi eyleme dönük bilgiye çeviren süreçler bütünü olarak tanımlanır.

Sektörel tanımlarda ise yaşam döngüsü genellikle “oluşturma/yakalama → hazırlama/işleme → saklama → kullanma/paylaşma → arşivleme/silme” çizgisinde anlatılır.

Neden önemlidir?

Çünkü her evrede farklı riskler vardır:

  • Toplama: yanlış / önyargılı örnekleme (bias)

  • Saklama: erişim kontrolü, sızıntı riski

  • İşleme: yanlış dönüşüm, veri kayması (data drift)

  • Paylaşma: yanlış yetkilendirme, kişisel veri ihlali

  • Silme: yasal saklama süresi ihlali veya “gereğinden fazla tutma” riski

 

Metadata Nedir? “Veri Hakkında Veri” Olmadan Veri Yönetilmez

Metadata, en basit haliyle “veri hakkında veri”dir. Ama bu sloganın pratik karşılığı çok nettir:
Metadata yoksa veriyi bulamaz, anlayamaz, güvenemezsiniz.

ISO/IEC 11179 (metadata kayıtları standardı ailesi) içinde, betimleyici verilerin “metadata” olarak anıldığı ve standardın “veriyi tanımlayan metadata” üzerine odaklandığı belirtilir.

Akademik bir derleme de metadata’nın; veriyi detaylı ve benzersiz tarif etmek, heterojen kaynakları birleştirmek, yeniden kullanım ve doğrulama için kritik olduğunu vurgular.

Metadata örnekleri

Bir “sipariş” veri seti düşünün:

  • “SiparisTarihi” alanı UTC mi, yerel saat mi?

  • Para birimi TL mi?

  • “NetSatis” iade dahil mi?

  • Güncellenme sıklığı: saatlik mi, günlük mü?

  • Kaynak sistem: ERP mi e-ticaret mi?

Bu soruların cevapları metadata’dır. Cevap yoksa aynı tablo iki ekipte iki farklı anlam taşır.

 

Veri Kalitesi Nedir? “Doğru Karar”ın Ön Şartı

Veri kalitesi, yalnızca “hata yok” demek değildir. Veri; hedef kullanım bağlamında yeterli doğruluk, tutarlılık, tamlık ve güncellik taşımalıdır.

International Organization for Standardization, ISO/IEC 25012 standardında veri kalite özelliklerini 15 karakteristik altında sınıflandırır ve bunların paydaşlara göre önceliğinin değişebileceğini belirtir.

BI/analitik dünyasında en sık karşılaşılan kalite sorunları

  • Doğruluk (accuracy): yanlış fiyat, yanlış ölçüm

  • Tamlık (completeness): boş şehir alanı, eksik kampanya kodu

  • Tutarlılık (consistency): aynı müşteri iki farklı sistemde iki farklı ID

  • Güncellik (timeliness): “bugün” dediğiniz metrik aslında D+2

Veri kalitesi nasıl “ölçülür”?

Pratikte üç katman ölçüm işe yarar:

  1. Kural bazlı testler: “tutar >= 0”, “tarih boş olamaz”

  2. İstatistiksel izleme: dağılım kaydı mı? (ör. ortalama sipariş tutarı aniden 3 katına çıktıysa)

  3. Süreç metrikleri: “veri gecikmesi”, “işlenen kayıt sayısı”, “hata oranı”

 

Veri Yönetişimi (Data Governance) Nedir?

“Veri kimin?”, “Tanımı kim onaylar?”, “Kim erişebilir?”, “Hangi veri seti ‘tek doğru kaynak’?” sorularının cevabı yönetişimdir.

DAMA çerçevesinde veri yönetişimi; veri varlıklarının yönetimi üzerinde otorite ve kontrolün (planlama, izleme, yaptırım) uygulanması olarak tanımlanır.

Benzer şekilde yönetişimin, organizasyonda kimin veri üzerinde yetkisi olduğunu ve verinin nasıl kullanılacağını tanımlayan bir sistem olduğu vurgulanır.

Yönetişimin somut çıktıları

  • Veri sözlüğü (glossary) ve KPI tanımları

  • Veri sahipliği (data owner) ve veri sorumluları (steward)

  • Erişim politikaları (role-based access)

  • Sertifikalı veri setleri (“bu tablo güvenilir”)

  • Değişiklik yönetimi (schema değişince ne olur?)

Yönetişim yoksa “herkesin kendi gerçeği” oluşur: aynı metrik farklı raporlarda farklı çıkar.

 

Kişisel Veri, Anonimleştirme ve Etik: “Veri Var” Demek “Kullan” Demek Değildir

Kişisel veri tanımı GDPR’de net: kimliği belirli / belirlenebilir kişiye ilişkin her bilgi. Bu nedenle veri yönetimi sadece teknoloji değil, aynı zamanda:

  • izin/amaç sınırlılığı,

  • minimizasyon,

  • saklama süresi,

  • güvenlik,

  • şeffaflık gibi ilkelere dayanır.

Özellikle şirketlerde şu hata sık görülür: “Zaten elimizde var” → “Her yerde kullanalım.”
Bu yaklaşım, regülasyon ve itibar riskini büyütür.

 

Web’de Veri: Paylaşılabilirlik ve Yeniden Kullanım Neden Zor?

Verinin web’de değer üretmesi için sadece yayınlanması yetmez; bulunabilir ve anlaşılabilir olması gerekir.

World Wide Web Consortium (W3C), “Data on the Web Best Practices” dokümanında verinin insanlar ve makineler tarafından keşfedilebilir ve anlaşılabilir olması gerektiğini vurgular.

Bu, pratikte şunlara çıkar:

  • açık şema / veri sözlüğü

  • lisans ve kullanım koşulları

  • sürümleme (versioning)

  • veri soy ağacı (lineage): “bu sayı nereden geldi?”

 

Veri Okuryazarlığı: Herkes İçin Temel Beceri

Veri okuryazarlığı, “Excel bilmek” değildir. Esas olarak:

  • veriyi okuyup yorumlayabilmek,

  • kaynağı sorgulayabilmek,

  • basit analiz/özet çıkarabilmek,

  • görselleştirmeyi doğru okuyabilmek,

  • yanıltıcı grafik/istatistiği fark edebilmek
    gibi becerileri kapsar.

UNESCO sözlüklerinde veri okuryazarlığı; veriden içgörü ve anlam çıkararak veriyle destekli karar almayı mümkün kılan beceriler ve zihniyetler bütünü olarak açıklanır.

 

Pratik Başlangıç: “Veriyle Çalışmaya” Nereden Başlanır?

Konu soyut kaldığında “veri” öğrenmesi zorlaşır. İşleyen bir başlangıç planı:

Günlük hayat örneği: kişisel bütçe verisi

  1. 30 gün harcama kaydı tut (tarih, kategori, tutar)

  2. Kategori sözlüğü oluştur (yemek, ulaşım, abonelik)

  3. Haftalık özet çıkar (toplam, ortalama, en büyük 5 harcama)

  4. “Karar sorusu” seç: “abonelikleri azaltırsam aylık ne kazanırım?”

Burada aynı anda şu kavramları öğrenirsiniz: ham veri, sınıflandırma, kalite (eksik kayıt), analiz, karar.

İş dünyası örneği: satış verisi

  • “Net satış” tanımı yap (iade, iskonto dahil mi?)

  • Tek bir “sipariş gerçeği” tablosu belirle (single source)

  • Ürün, müşteri, zaman boyutlarını standartlaştır

  • Sonra dashboard’a geç

 

Veri ile İlgili Sıkça Sorulan Sorular (SSS)

Veri nedir?

Veri; iletişim / yorumlama / işlemeye uygun şekilde biçimlendirilmiş, yeniden yorumlanabilir bilgi temsilleridir.

Ham veri nedir?

Toplandığı haliyle, bağlamı eksik olabilen; temizlenmemiş, standardize edilmemiş kayıtlar.

Veri ile bilgi arasındaki fark nedir?

Veri ham ölçüm/kayıttır; bilgi, verinin bağlam kazanmış ve yorumlanabilir halidir.

Yapılandırılmış veri nedir?

Tablo mantığında, şeması net (kolon-satır) veridir (ör. müşteri tablosu).

Metadata nedir?

Veriyi tanımlayan betimleyici bilgilerdir (birim, kaynak, güncelleme sıklığı, alan tanımı vb.).

Veri yaşam döngüsü nedir?

Verinin oluşturulmasından arşivlenmesi/silinmesine kadar geçtiği aşamalar bütünüdür.

Kişisel veri nedir?

Kimliği belirli veya belirlenebilir gerçek kişiye ilişkin her türlü bilgidir.

Veri yönetişimi nedir?

Veri varlıklarının yönetimi üzerinde otorite ve kontrol (planlama–izleme–yaptırım) mekanizmalarıdır.

Veri kalitesi neden önemlidir?

Kalitesiz veri, yanlış metrik ve yanlış karara yol açar. ISO/IEC 25012 veri kalitesini çok boyutlu ele alır.

 

Kaynakça

  • International Organization for Standardization. (n.d.). ISO/IEC 2382-1:1993 — Information technology — Vocabulary. ISO Online Browsing Platform.
  • ISEAL. (n.d.). Glossary: Data (adapted from ISO/IEC 2382). ISEAL Code Terms and Definitions.
  • National Institute of Standards and Technology. (2021, June 25). Commonly misused terms in cybersecurity. NIST Blogs.
  • National Institute of Standards and Technology. (2017). An introduction to information security (NIST SP 800-12r1). NIST Publications.
  • International Organization for Standardization. (n.d.). ISO/IEC 25012:2008 — Data quality model. ISO.
  • ISO 25000. (n.d.). ISO/IEC 25012 — Data quality model overview. ISO/IEC 25012 resource page.
  • DAMA Rocky Mountain Chapter. (2023, August 23). Data governance definition (DMBOK context diagram excerpt).
  • CIO. (2024, December 27). What is data governance? Frameworks, tools, best practices. CIO.com.
  • NIST Computer Security Resource Center. (n.d.). Glossary: Data life cycle.
  • TechTarget. (2024, July 25). Data life cycle (definition). TechTarget “WhatIs”.
  • International Organization for Standardization. (n.d.). ISO/IEC 11179-1:2015 — Metadata registries (MDR). ISO Online Browsing Platform.
  • Ulrich, H., et al. (2022). Understanding the nature of metadata: Systematic review. Journal/PMC article.
  • World Wide Web Consortium. (2017, January 31). Data on the Web Best Practices (W3C Recommendation). W3C.
  • Legislation.gov.uk. (n.d.). Regulation (EU) 2016/679 (GDPR), Article 4 — Definitions.
  • UNESCO-UNEVOC. (n.d.). TVETipedia Glossary: Data literacy.

İlave okuma önerileri

  • DAMA International. (2017). DAMA-DMBOK: Data Management Body of Knowledge (2nd ed.). Technics Publications.
  • Kitchin, R. (2014). The Data Revolution: Big Data, Open Data, Data Infrastructures and Their Consequences. SAGE Publications.
  • Kleppmann, M. (2017). Designing Data-Intensive Applications. O’Reilly Media.
  • Provost, F., & Fawcett, T. (2013). Data Science for Business. O’Reilly Media.
  • Tufte, E. R. (2001). The Visual Display of Quantitative Information (2nd ed.). Graphics Press.
  • Wickham, H., & Grolemund, G. (2017). R for Data Science. O’Reilly Media.

 

🗓️ Yayınlanma Tarihi: 22 Şubat 2026
🔄 Son Güncelleme Tarihi: 22 Şubat 2026
🎯 Kimler için: Bu yazı;

  • “Veri nedir?” sorusunu temelden öğrenmek isteyen öğrenciler ve yeni başlayanlar,

  • Analitik/BI/veri bilimi dünyasına girmek isteyen kariyer değiştiriciler,

  • Şirketinde raporlama ve KPI tartışmalarında “aynı dili” kurmak isteyen ekipler,

  • Veri toplama, saklama ve paylaşım süreçlerinde kalite ve güven problemleri yaşayan ürün/BT ekipleri,

  • Kişisel veri (privacy) tarafında kavramları netleştirmek isteyen herkes içindir.

İçerik Bilgisi
Bu içerik yaklaşık 684 kelimeden ve 4263 karakterden oluşmaktadır. Ortalama okuma süresi: 2 dakikadır. Invictus Wiki editoryal ilkelerine uygun olarak hazırlanmış; güvenilir ve doğrulanabilir kaynaklar temel alınarak yayımlanmıştır. Bilgi güncelliği düzenli olarak gözden geçirilir.
Bu Yazıyı Paylaşmak İster Misin?
ŞU YAZI DA İLGİNİ ÇEKEBİLİR:  En İyi Açık Erişim Akademik Veri Tabanları

İÇİNDEKİLER TABLOSU

İçindekiler Tablosu