მონაცემთა სტატისტიკური ანალიზი R-ის გამოყენებით

კურსის აღწერა 

კურსი ორიენტირებულია მონაცემთა სტატისტიკური დამუშავებისა და ინტერპრეტაციის უნარების განვითარებაზე პროგრამული ენის – R-ის გამოყენებით. ის ფოკუსირებულია რაოდენობრივი მონაცემების პრაქტიკულ ანალიზზე და მოიცავს მონაცემთა დამუშავებისა და ანალიზის სრულ პროცესს:

  • მონაცემთა ბაზის მომზადება და მოდიფიცირება: მონაცემების ტრანსფორმაცია, რეკოდირება და ორგანიზება R-ის საბაზისო ბრძანებებისა და dplyr ბიბლიოთეკის გამოყენებით
  • აღწერითი და დასკვნითი სტატისტიკური ანალიზი: ცენტრალური ტენდენციის საზომების გამოთვლა, ჰიპოთეზების ტესტირება (პარამეტრული და არაპარამეტრული ტესტები), კორელაციური და რეგრესიული ანალიზი
  • შედეგების მკაფიო ინტერპრეტაცია და ვიზუალიზაცია: ggplot2 ბიბლიოთეკის გამოყენებით მონაცემთა ვიზუალიზაცია და ანალიზის შედეგების ახსნა

თითოეული სესია აერთიანებს თეორიულ ახსნას, საკურსო დავალებებსა და რეალურ მონაცემთა ბაზებზე ინტენსიურ პრაქტიკულ მუშაობას R Studio-ს გარემოში.

R პროგრამის უპირატესობები: 

  • არის ღია (open-source) პროგრამა
  • მუშაობს ყველა სისტემაზე – Windows, Linux, MAC IOS
  • არის მულტიფუნქციური – გარდა მონაცემებზე მუშაობისა, შესაძლებელია, მაგალითად, საიტის აწყობა, პრეზენტაციების შემუშავება, pdf დოკუმენტების შექმნა, ინტერაქტიული ვიზუალიზაციების შექმნა და ა.შ.
  • ინტეგრირდება სხვა წამყვან მონაცემთა მეცნიერების ხელსაწყოებთან/ენებთან

კურსი განკუთვნილია

  • მკვლევრებისთვის და სტუდენტებისთვის ეკონომიკის, სოციალური მეცნიერებების და ფსიქოლოგიის სფეროდან
  • ბაზრის კვლევის სპეციალისტებისა და ანალიტიკოსებისთვის
  • მარკეტინგის, გაყიდვებისა და მომხმარებელთა კვლევის სპეციალისტებისთვის
  • ბიზნეს ანალიტიკოსებისა და კონსულტანტებისთვის
  • მცირე და საშუალო ბიზნესის მფლობელებისა და მენეჯერებისთვის
  • ყველა იმ პროფესიონალისთვის, ვისაც მონაცემებზე დაფუძნებული გადაწყვეტილებების მიღება ესაჭიროება

სასწავლო პროგრამა 14 აპრილს იწყება და მოიცავს 12 ორსაათიან სესიას, რომელიც კვირაში ორჯერ, პირისპირ ფორმატში ჩატარდება.

🗓️ ლექციების დღეები და დრო: სამშაბათი – 19:30 – 21:30  და პარასკევი 18:00 – 20:00 (ფიზიკური დასწრება)

👥 ჯგუფში მონაწილეთა მაქსიმალური რაოდენობა: 12

📅 აპლიკაციების მიღების ბოლო ვადა: 6 აპრილი

💰 კურსის ღირებულება: 400 ლარი

კურსის მონაწილეებს გადაეცემათ სერთიფიკატები.

_

_

დამატებითი კითხვების შემთხვევაში, გთხოვთ, დაგვიკავშირდეთ:

ელ-ფოსტა: s.dolidze@crrccenters.org

_

ტრენერი

მახარე აჭაიძე  | მონაცემთა მკვლევარი

მახარე 2018 წლიდან CRRC-საქართველოს გუნდის წევრია. მისი პასუხისმგებლობაა მონაცემთა შეგროვება, მონაცემთა ბაზის ორგანიზება, ცვლადების ტრანსფორმაცია, სტატისტიკური ანალიზი და მონაცემთა ვიზუალიზაცია. მას აქვს  საერთაშორისო და ადგილობრივ ორგანიზაციებთან (UN, USAID, EPF, Integrity, CoE, World Bank და სხვ.) მრავალწლიანი მუშაობის გამოცდილება. ის CRRC-ომნიბუსის სერვისის ხელმძღვანელია და პროგრამის ფარგლებში ახორციელებს სხვადასხვა ბიზნეს და აკადემიურ საკითხზე კვლევებს.

მახარე რაოდენობრივი კვლევის მეთოდებსა და მონაცემთა ანალიზს ასწავლის თბილისის სახელმწიფო უნივერსიტეტში, საზოგადოებრივ საქმეთა ინსტიტუტში (GIPA) და სულხან-საბა ორბელიანის უნივერსიტეტში. 

ის პროფესიონალურად ფლობს ანალიზის შემდეგ პროგრამებს:  R, STATA, SPSS, EXCEL და  PowerBI.

_

კურსის სილაბუსი
 სესიის თემაშეისწავლით:
სესია_1ცვლადები მონაცემთა მეცნიერებაში და R-ის / Rstudios გაცნობა• გაზომვის დონეები
• ცვლადის ტიპები
• ტექსტური და რაოდენობრივი მონაცემები

R-სა და Rstudio-ს გაცნობა:
• R-ის გაცნობა
• R studio-ს ძირითადი ელემენტების გაცნობა
• ახალი დოკუმენტის შექმნა / შენახვა
• R script და R notebook გამოყენების თავისებურებები, მარკირება
• Rstudio-ს დახმარება: ინფორმაცია ფუნქციაზე/ბიბლიოთეკაზე, მაგალითი, ვინიეტი
• სამუშაო დირექტორია
• პროექტის ორგანიზების კარგი პრაქტიკა
• ბიბლიოთეკები (packages)
• ძირითადი მათემატიკური და ლოგიკური მოქმედებების შესრულება
სესია_2მონაცემებისა და ბაზების სახეები• მონაცემთა ბაზების ფორმატები (csv, txt, tsv და სხვ.)
• მონაცემების წაკითხვა R-ის საბაზისო ფუნქციებით
• მონაცემების წაკითხვა R-ის ბიბლიოთეკების გამოყენებით
• მონაცემთა სახეები: ლოგიკური, რიცხვითი და თვისებრივი (string/charachter)
• ვექტორული ობიექტები
• სიები და ფუნქციები
• ატრიბუტები
• ფაქტორული ცვლადი
• მონაცემთა მასივი და მატრიცა
სესია_3მონაცემთა ტრანსფორმაცია• მონაცემთა ორგანიზება / ოპტიმიზაცია
• მონაცემების გამოტოვება ანალიზიდან – R-ის ჩაშენებული ბრძანებით
• მონაცემთა რეკოდირება – R-ის ჩაშენებული ბრძანებით
• ინდექსი -R-ის ჩაშენებული ბრძანებით, (კრონბახის ალფა)
• მონაცემთა ტრანსფორმაცია dplyr ბიბლიოთეკის გამოყენებით
• შედარების სიმბოლოები (მეტობა, ნაკლებობა, ტოლობა და ა.შ.)
• ცვლადების არჩევა 
• დაკვირვებების არჩევა 
• ცვლადის გამოთვლა / დამატება 
• დაჯგუფება 
• ცვლადების სორტირება 
• დაკვირვებების სორტირება 
სესია_4აღწერითი სტატისტიკა• სიხშირე და ფარდობითი სიხშირე
• სიხშირის დიაგრამის აგება
• ცენტრალური ტენდენციის საზომები
• ვარიაციის საზომები
• ნორმალური და ასიმეტრიული განაწილებები
• დროითი მწკრივები
პირველი შუალედური დავალება
სესია_5ორგანზომილებიანი ანალიზი• ორგანზომილებიანი ანალიზის თავისებურებები კატეგორიული და რიცხვითი ცვლადებისთვის
• კროსტაბულაცია
• შედეგების დასპლიტვა ამხსნელი ცვლადის კატეგორიების მიხედვით
• ცხრილისა და დიაგრამის ექსპორტი
პირველი შუალედური პროექტის პრეზენტაცია
სესია_6ჰიპოთეზა, ჰიპოთეზის ტესტირება – პარამეტრული ტესტებიპარამეტრული ტესტები:
• T ტესტი – ერთი შერჩევისთვის
• T ტესტი დამოუკიდებელი ჯგუფებისთვის
• T ტესტი შეწყვილებული მნიშვნელობებისთვის (T Test for Paired Groups)
• ლევენის ტესტი (Levene’s Test for Equality of Variances)
• დისპერსიული ანალიზი ANOVA
სესია_7ჰიპოთეზა, ჰიპოთეზის ტესტირება – არაპარამეტრული ტესტებიარაპარამეტრული ტესტები:
• ხი-კვადრატის ტესტი
• მან-უიტნის ტესტი (Mann-Whitney U test)
• ვილკოქსონის ტესტი (Wilcoxon signed-rank test)
• კრუსკალ-ვოლისის ტესტი (Kruskal-Wallis test)
ფრიდმენის ტესტი (Friedman test)
სესია_8მონაცემთა ვიზუალიზაცია• R-ის საბაზისო ბრძანებები
• ggplot2 ბიბლიოთეკა
• მონაცემები
• ესთეტიკა
• გრამატიკა
მეორე შუალედური დავალება
სესია_9კორელაცია• წრფივი ურთიერთმიმართება
• წერტილოვანი დიაგრამა (scatterplot) 
• პირსონის კორელაცია
• სპირმენის კორელაცია
• კენდალის ტაუ-ბი
მეორე შუალედური პროექტის პრეზენტაცია
სესია_10რეგრესია• მარტივი და მრავლობითი რეგრესია
• წრფივი რეგრესია
• ჰომოსკედასტურობა-ჰეტეროსკედასტურობა
• პროგნოზირება
ფინალური დავალება
სესია_11ლოგისტიკური რეგრესია• ბინარული და ორდინალური ლოგისტიკური რეგრესია
• პროგნოზირება
• ინტერპრეტაცია
სესია_12ფინალური ანალიტიკური პროექტის წარდგენა და სერთიფიკატების გადაცემა
გაზიარება