Texnologiyanın inkişaf etdiyi və məlumatların sürətlə artdığı bir dövrdə “Data Science”-ə tələbat getdikcə artır. Edilən son araşdırmalara görə dünyadakı məlumatların 90%-i son 2 ildə yaranıb. Məlumatlara artan tələbə misal olaraq Facebook-u deyə bilərik. Hər saatda Facebook-a 10 milyon şəkil yüklənir. Onlayn alış-veriş və ya bank əməliyyatları gündən-günə artdığından tranzaksiyalardan böyük həcmli məlumatlar əldə edilir. Günü gündən artan bu məlumatları bizə faydalı olacaq şəkildə necə istifadə edə bilərik?
Data-lardan istifadə edib keçmiş, bu gün və gələcək haqqında məlumat əldə edə bilərik. Məlumatın vaxtı vacib olduğu kimi onun faydalı olub olmamasıda bir o qədər vacibdir. “Data Science” məlumatların toplanması, analiz olunaraq nəticələr əldə edilməsi və bu nəticələr əsasında yeni qərarların verilməsi ilə məşğul olan tədqiqat sahəsidir. Təşkilatlarda suallara cavab vermək və strategiyanı idarə etmək üçün istifadə olunan böyük həcmli məlumatları təşkil etmək və analiz etmək üçün kompleks alqoritmləri qurmağı bacaran, yüksək səviyyəli texniki bacarıqlara sahib insanlar “Data Scientist” -lərdir.
“Data Science” - in üç əsas komponenti var:
1.Statistika - “Data Science”-in əsasını təşkil edir. Onun köməyi ilə məlumatlardan daha dəqiq və faydalı nəticə almaq olur.
2.Kompüter bilikləri - Hər hansısa “Data Science” layihəsini başa vurmaq üçün proqramlaşdırma bilikləri mütləqdir. Ən çox yayılmış Python və R proqlamlaşdırma dilləridir. R statistik analiz aparmaq üçün ən zəngin sistemlərdən biridir. Təxmini 12000-ə qədər kitabxanası mövcuddur. Python ümümi təyinatlı bir dil olduğu üçün “Machine Learning”, ”Artificial Intelligence”, ”Deep Learning”, ”Web Development” və s kimi bir çox sahələrdə istifadə olunur. “Data Science” üçün istifadə olunan beş əsas Python kitabxanası bunlardır: Numpy, Pandas, Scipy, Scikit-learn and Seaborn.
3.Sahə biliyi - İşin biznes tərəfini başa düşmək “Data Science” layihələrində ən önəmli məsələlərdəndir. Çalışdığınız sahə ilə bağlı kifayət qədər biliyiniz yoxdursa,məlumatlara aldanıb səhv qərarlar vermək riskiniz var.
“Data Science” layihəsini düzgün həll etmək və təqdim etmək üçün atılan addımlar “Data Science Life Cycle” adlanır və 5 əsas mərhələdən ibarətdir.