რეგრესია Excel-ში არის გზა ავტომატიზირებული სტატისტიკური პროცესის შედარების რამდენიმე კომპლექტი ინფორმაცია, რათა ნახოთ, თუ როგორ ცვლილებები დამოუკიდებელ ცვლადებში გავლენას ახდენს ცვლილებები დამოკიდებული ცვლადები. თუ ოდესმე გინდოდათ ორ რამეს შორის კორელაციის პოვნა, Excel-ში რეგრესიული ანალიზის გამოყენება ამის ერთ-ერთი საუკეთესო საშუალებაა.
ამ სტატიაში მოცემული ინსტრუქციები ვრცელდება Excel 2019, Excel 2016, Excel 2013, Excel 2010.
რას ნიშნავს რეგრესია?
რეგრესია არის სტატისტიკური მოდელირების მიდგომა, რომელსაც ანალიტიკოსები იყენებენ მრავალ ცვლადს შორის ურთიერთობის დასადგენად.
რეგრესიის ანალიზი იწყება ერთი ცვლადით, რომლის ანალიზსაც ცდილობთ და დამოუკიდებელი ცვლადებით, რომლებსაც ამოწმებთ, რომ ნახოთ, გავლენას ახდენენ თუ არა ისინი ამ ერთ ცვლადზე.ანალიზი განიხილავს ცვლილებებს დამოუკიდებელ ცვლადებში და ცდილობს დააკავშიროს ეს ცვლილებები ერთ (დამოკიდებულ) ცვლადში მიღებულ ცვლილებებთან.
ეს შეიძლება მოწინავე სტატისტიკად ჟღერდეს, მაგრამ Excel ამ კომპლექსურ ანალიზს ყველასთვის ხელმისაწვდომს ხდის.
წრფივი რეგრესიის შესრულება Excel-ში
რეგრესიული ანალიზის უმარტივესი ფორმა არის წრფივი რეგრესია. მარტივი წრფივი რეგრესია ათვალიერებს მხოლოდ ორ ცვლადს შორის ურთიერთობას.
მაგალითად, შემდეგი ელცხრილი აჩვენებს მონაცემებს, რომლებიც შეიცავს კალორიების რაოდენობას, რომელიც ადამიანმა მიირთვა დღეში და მათ წონას იმ დღეს.
რადგან ეს ელცხრილი შეიცავს მონაცემების ორ სვეტს და ერთ ცვლადს შეუძლია გავლენა მოახდინოს მეორეზე, შეგიძლიათ ამ მონაცემებზე რეგრესიის ანალიზი გაუშვათ Excel-ის გამოყენებით.
Analysis ToolPak დანამატის ჩართვა
სანამ Excel-ის რეგრესიის ანალიზის ფუნქციას გამოიყენებთ, თქვენ უნდა ჩართოთ Analysis ToolPak დანამატი Excel-ის პარამეტრების ეკრანზე.
-
Excel-ში აირჩიეთ File მენიუ და აირჩიეთ Options.
-
აირჩიეთ დამატებები მარცხენა ნავიგაციის მენიუში. შემდეგ, დარწმუნდით, რომ Excel დანამატები არჩეულია Manage ველში.
-
დაბოლოს, აირჩიეთ გადადით ღილაკი.
-
დამატებების ამომხტარ ფანჯარაში. ჩართეთ Analysis ToolPack დაწკაპუნებით მის წინ მდებარე ველზე, რათა დაამატოთ გამშვები ნიშანი და აირჩიეთ OK.
ახლა, როდესაც Analysis ToolPak ჩართულია, თქვენ მზად ხართ დაიწყოთ რეგრესიის ანალიზის გაკეთება Excel-ში.
როგორ შეასრულოთ მარტივი ხაზოვანი რეგრესია Excel-ში
წონისა და კალორიების ცხრილის მაგალითის გამოყენებით, შეგიძლიათ შეასრულოთ წრფივი რეგრესიის ანალიზი Excel-ში შემდეგნაირად.
-
აირჩიეთ Data მენიუ. შემდეგ, Analysis ჯგუფში აირჩიეთ მონაცემთა ანალიზი.
-
მონაცემთა ანალიზი ფანჯარაში აირჩიეთ რეგრესია სიიდან და დააწკაპუნეთ OK.
-
შეყვანის Y დიაპაზონი არის უჯრედების დიაპაზონი, რომელიც შეიცავს დამოკიდებულ ცვლადს. ამ მაგალითში ეს არის წონა. შეყვანის X დიაპაზონი არის უჯრედების დიაპაზონი, რომელიც შეიცავს დამოუკიდებელ ცვლადს. ამ მაგალითში ეს არის კალორიების სვეტი.
-
აირჩიეთ Labels სათაურის უჯრედებისთვის და შემდეგ აირჩიეთ ახალი სამუშაო ფურცელი შედეგების ახალ სამუშაო ფურცელზე გასაგზავნად. აირჩიეთ OK, რათა Excel-მა გაუშვას ანალიზი და გამოაგზავნოთ შედეგები ახალ ფურცელში.
-
გასინჯეთ ახალი სამუშაო ფურცელი. ანალიზის გამომავალს აქვს რამდენიმე მნიშვნელობა, რომელიც უნდა გესმოდეთ შედეგების ინტერპრეტაციისთვის.
თითოეულ ამ რიცხვს აქვს შემდეგი მნიშვნელობა:
- მრავალჯერადი R: კორელაციის კოეფიციენტი. 1 მიუთითებს ძლიერ კორელაციაზე ორ ცვლადს შორის, ხოლო -1 ნიშნავს ძლიერ უარყოფით ურთიერთობას. 0 ნიშნავს, რომ არ არსებობს კორელაცია.
- R კვადრატი: განსაზღვრის კოეფიციენტი, რომელიც გვიჩვენებს, რამდენი წერტილია ორ ცვლადს შორის რეგრესიის ხაზზე. სტატისტიკურად, ეს არის საშუალოდან გადახრების კვადრატების ჯამი.
- მორგებული R კვადრატი: სტატისტიკური მნიშვნელობა სახელად R კვადრატი, რომელიც მორგებულია თქვენ მიერ არჩეული დამოუკიდებელი ცვლადების რაოდენობის მიხედვით.
- სტანდარტული შეცდომა: რამდენად ზუსტია რეგრესიის ანალიზის შედეგები. თუ ეს შეცდომა მცირეა, მაშინ თქვენი რეგრესიის შედეგები უფრო ზუსტია.
- დაკვირვებები: დაკვირვებების რაოდენობა თქვენს რეგრესიულ მოდელში.
რეგრესიის გამომავალში დარჩენილი მნიშვნელობები გაწვდით დეტალებს რეგრესიის ანალიზში უფრო მცირე კომპონენტების შესახებ.
- df: სტატისტიკური მნიშვნელობა ცნობილია როგორც თავისუფლების ხარისხი, რომელიც დაკავშირებულია დისპერსიის წყაროებთან.
- SS: კვადრატების ჯამი. კვადრატების ნარჩენი ჯამის შეფარდება ჯამურ SS-თან შედარებით უფრო მცირე უნდა იყოს, თუ თქვენი მონაცემების უმეტესობა შეესაბამება რეგრესიის ხაზს.
- MS: რეგრესიის მონაცემების საშუალო კვადრატი.
- F: F სტატისტიკა (F-ტესტი) ნულოვანი ჰიპოთეზისთვის. ეს უზრუნველყოფს რეგრესიის მოდელის მნიშვნელობას.
- მნიშვნელოვნება F: სტატისტიკური მნიშვნელობა ცნობილია, როგორც P-მნიშვნელობა F.
თუ არ გესმით სტატისტიკა და რეგრესიის მოდელების გამოთვლა, შეჯამების ბოლოში მოცემულ მნიშვნელობებს დიდი მნიშვნელობა არ ექნება. თუმცა მრავალი R და R კვადრატი არის ორი ყველაზე მნიშვნელოვანი.
როგორც ხედავთ, ამ მაგალითში კალორიებს ძლიერი კორელაცია აქვს მთლიან წონასთან.
მრავალჯერადი ხაზოვანი რეგრესიის ანალიზი Excel-ში
იგივე წრფივი რეგრესიის შესასრულებლად, მაგრამ მრავალი დამოუკიდებელი ცვლადით, აირჩიეთ მთელი დიაპაზონი (მრავალი სვეტი და მწკრივი) შეყვანის X დიაპაზონისთვის.
რამდენიმე დამოუკიდებელი ცვლადის არჩევისას, ნაკლებად სავარაუდოა, რომ იპოვოთ ძლიერი კორელაცია, რადგან ამდენი ცვლადია.
თუმცა რეგრესიის ანალიზი Excel-ში დაგეხმარებათ იპოვოთ კორელაციები ერთ ან რამდენიმე იმ ცვლადთან, რომელთა არსებობასაც შესაძლოა ვერ აცნობიერებდეთ მხოლოდ მონაცემების ხელით გადახედვით.