R ile Veri Bilimi
R, veri analizi ve istatistiksel hesaplama için yaygın olarak kullanılan güçlü bir dildir. 90'lı yılların başında geliştirilmiştir. Güçlü paketlerin R'ye dahil edilmesi onu zamanla daha güçlü hale getirmiştir. Dplyr, tidyr, readr, ggplot2 gibi paketler veri işleme, görselleştirme ve hesaplama işlemlerini çok daha hızlı hale getirdi.
Eğitimin Hedef Kitlesi
- Yazılımcı olarak çalışanlar
- İstatistik, veri analizi ve istatistiksel öğrenme konularında çalışmak isteyenler
- İstatistik ve veri bilimi alanında akademik hedefleri bulunan ilgili bölümlerin, lisans son sınıf, yüksek lisans ve doktora öğrencileri
Eğitim İçeriği
- R programlama Diline Giriş*
- dplyr paketi ile dataframe (Tabular Veri Kümesi) manipülasyonu işlemleri (Data wrangling)
- R ile temel istatistik
- ggplot ile veri görselleştirme
- Bar Grafik
- Histogram
- Dağılım
- Pairplot
- Veri ön işleme
- mice ile eksik değer giderme (Missing value handling)
- Kategorik değer dönüşümleri
- Aykırılık tespiti (outlier detection)
- Öznitelik normalizasyonu
- Korelasyon Matrisi
- Öznitelik seçimi
- Near Zero Variance
- Boruta (Rassal Orman tabanlı Öznitelik Seçim yöntemi)
- Gözetimli Öğrenme
- Regresyon
- Sınıflandırma
- caret ve e1071 paketleri ile makine öğrenmesi modellerinin oluşturulması
- K parçalı çapraz doğrulama (k-fold crossvalidation)
- Eksik öğrenme (underfitting) ve ezberleme (overfitting)
- Gözetimsiz Öğrenme
- Kümelenme
- Temel bileşen analizi (Principle Component Analysis ) ile boyut indirgeme
*Katılımcıların en az bir programlama dili biliyor olması gerekmektedir.