Kapat
Anasayfa 38 0

Veri Madenciliği (Data Mining) Nedir?

Teknolojinin gelişmesi ve yaygınlaşması alışkanlıklarımızı da değiştirdi. Daha önce fiziksel olarak yaptığımız birçok işi ve işlemi artık elektronik ortamdan yapar olduk. Banka ödemeleri, alışveriş… Gerçekleşen her işlem sonucunda, karşı tarafta bazı verilerin birikmesini sağlıyoruz. Kurumlarda biriken bu  milyonlarca veriye sahip büyük ölçekli olarak tanımlanan yazılım sistemlerinden, ihtiyacı karşılayacak değerli verilerin elde edilmesi işlemine Veri Madenciliği denilmektedir. Bu sayede veriler arasındaki ilişkileri ortaya koymak ve gerektiğinde ileriye yönelik doğru tahminlerde bulunmak mümkün hale gelmektedir. Veri Madenciliği’nde milyarca veri üzerinde çalışılabilir. Sonuç olarak madenciliğin temel amacının, kurumlardaki karar destek mekanizmaları olarak adlandırılan sistemler için değerli olan veriyi belirli yöntemler ve işlem süreçleri sonrası ortaya çıkarmak olduğunu söyleyebiliriz.

Veriler Nasıl Toplanır?

Sonuç olarak, veri toplamanın 2 temel yolu vardır. Bu yollardan ilki, izninizle girmiş olduğunuz bilgiler, site içerisindeki davranışlarınıza dayalı “Açık veri toplama” yöntemidir. Diğer yöntem; “Kapalı veri toplama” olarak adlandırılır. Genellikle sosyal ağlar, arama motorları gibi sitelerde toplanan verilerdir. Bu tür veri toplama yönteminin amacı, o site içerisindeki tüm davranışları takip etmektir. Bu sayede, kullanıcının ilgi alanlarını belirlemek ve bunlara uygun pazarlama faaliyetleri yürütmektir.

Nasıl Bir Süreç İzlenmektedir?

Elde edilmek istenen verinin büyüklüğü, buna bağlı olarak gerçekleşen işlemin uzunluğuna göre farklı süreçler izlenir. Genel olarak Veri Madenciliği’nin ilerleme sistemini şu şekilde ifade edebiliriz:

  • Veri Filtreleme: Madencilikte kullanacakları verilerin belirlenme aşamasıdır.
  • Veriyi Temizleme (Smoothing) : Topladıkları verinin içerisinden gereksiz, tutarsız ya da gürültülü olanların ayıklanması adımıdır.
  • Veri Bütünleştirme (Damy-Optimization) : Farklı kaynaklardan elde edilen ve benzer niteliklere sahip verileri bu adımda birleştirir.
  • Veriyi İndirgeme: Temiz ve birleşmiş verilerden, analize uygun olanları seçme işlemi bu adımda gerçekleşir.
  • Veri Dönüştürme (Normalization) : Eldeki verilerin madencilik için uygun biçime dönüştürülmesi aşamasıdır.
  • Veri Madenciliği Algoritmaları Uygulama (Kümeleme, Sınıflandırma… ) : Bu aşamada, önceden hazır veriler üzerinde, uygun algoritmalar uygular.
  • Sonuçları ilgili yazılım dillerinde test ve eğitim aşamasına sokma (R, Python, Java – Makine öğrenmesine giriş)
  • Sonuçların değerlendirilmesi ve sunulması: Veri madenciliği uygulaması gerçekleştirildikten sonra, elde edilen sonuçları yorumlar. Bu sonuçların doğrulukları ile ilgili araştırma yapar. Doğrulama işlemi, farklı uygulamalardan elde edilen sonuçların karşılaştırılması ile gerçekleşmektedir.

Farklı Alanlarda Veri Madenciliği

  • Bankacılık:
    • Kredi kartı kullanım alışkanlıklarına göre müşterilerin belirlenmesi.
    • Kredi taleplerine ilişkin değerlendirmelerin yapılması.
  • Pazarlama:
    • Bireylerin satın alma alışkanlıklarının belirlenmesi.
    • Satış tahmini.
    • Pazar sepeti analizi
  • CRM:
    • Müşteri sadakatinin artırılması.
    • Pazarlama kampanyalarından en yüksek seviyede yarar sağlama çalışmalarının yapılması.
  • E-Ticaret:
    • Sunuculara yapılan saldırıların tespit edilmesi.
    • Web sitesinde gezinen kullanıcıların davranışlarının belirlenmesi.
  • Sigortacılık
    • Sigorta risk gruplarının belirlenmesi.

Veri Madenciliği İçin Hangi Becerilere Sahip Olmak Gerekir?

Milyonlarca hatta bazen milyarlarca farklı özelliğe sahip veri üzerinde çalışma yapmak, sabır ve dayanıklılık gerektirmektedir. Bilgisayar sistemlerinde sıklıkla karşılaşılan birbirinden bağımsız hatalara ve verilerde meydana gelen ani değişimlere karşı veriyi korumak çok fazla dikkat gerektirmektedir. Yani, ileri seviyede matematik, istatistik, lineer cebir, optimizasyon bilgisi, gelişmiş yazılım becerisine sahip olmak gerekir. Yazılım dillerinden Veri Madenciliği için en uygun olanlar R ve Python dilleridir. Bunun yanında, bazı test aşamaları ve deneme işlemleri yapmak için ise kullanılan ise Java dilidir.

Daha fazlası için Genç Programcı ziyaret edebilirsiniz.

[Toplam: 2   Ortalama: 5/5]
Avatar

Merve Kibir {Merve Kibir}