T-ტესტი არის მეთოდი, რომ გადაწყვიტოთ არის თუ არა სტატისტიკურად მნიშვნელოვანი განსხვავებები მონაცემთა ნაკრებებს შორის, სტუდენტის t-განაწილების გამოყენებით. T-ტესტი Excel-ში არის ორი ნიმუშიანი T-ტესტი, რომელიც ადარებს ორი ნიმუშის საშუალებებს. ეს სტატია განმარტავს რას ნიშნავს სტატისტიკური მნიშვნელობა და გვიჩვენებს, თუ როგორ უნდა გავაკეთოთ T-ტესტი Excel-ში.
ამ სტატიაში მოცემული ინსტრუქციები ვრცელდება Excel 2019, 2016, 2013, 2010, 2007 წლებში; Excel Microsoft 365-ისთვის და Excel Online.
რა არის სტატისტიკური მნიშვნელობა?
წარმოიდგინეთ, გსურთ იცოდეთ, რომელი ორი კამათელი მოგცემთ უკეთეს ქულას. თქვენ გააფართოვებთ პირველ კვერს და მიიღებთ 2-ს; გადააგორებ მეორე კვერს და მიიღებ 6-ს.ეს გეუბნებათ, რომ მეორე კვერი ჩვეულებრივ უფრო მაღალ ქულებს იძლევა? თუ თქვენ უპასუხეთ, "რა თქმა უნდა, არა", მაშინ თქვენ უკვე გაქვთ გარკვეული გაგება სტატისტიკური მნიშვნელობის შესახებ. თქვენ გესმით, რომ განსხვავება გამოწვეული იყო ქულის შემთხვევითი ცვლილების გამო, ყოველ ჯერზე, როდესაც ატრიალებენ. იმის გამო, რომ ნიმუში იყო ძალიან მცირე (მხოლოდ ერთი რულონი), ის არ აჩვენებდა რაიმე მნიშვნელოვანს.
ახლა წარმოიდგინეთ, რომ თითოეულ სამაჯურს 6-ჯერ გადააგორებთ:
- პირველი ტილო 3, 6, 6, 4, 3, 3; საშუალო=4.17
- მეორე ტილო რულონები 5, 6, 2, 5, 2, 4; საშუალო=4.00
ეს ახლა ამტკიცებს, რომ პირველი კვარცხლბეკი მეორეზე მეტ ქულებს იძლევა? Ალბათ არა. მცირე ნიმუში საშუალებებს შორის შედარებით მცირე სხვაობით ხდის სავარაუდოს, რომ განსხვავება მაინც შემთხვევითი ვარიაციებით არის განპირობებული. როდესაც ჩვენ ვზრდით კამათლების გაშვების რაოდენობას, ძნელი ხდება საღი აზრის პასუხის გაცემა კითხვაზე - ქულებს შორის განსხვავება შემთხვევითი ვარიაციის შედეგია თუ ერთი რეალურად უფრო მაღალი ქულების მინიჭების ალბათობაა, ვიდრე მეორე?
მნიშვნელობა არის ალბათობა იმისა, რომ დაკვირვებული განსხვავება ნიმუშებს შორის გამოწვეულია შემთხვევითი ვარიაციებით. მნიშვნელობას ხშირად უწოდებენ ალფა დონეს ან უბრალოდ "α". ნდობის დონე, ან უბრალოდ 'c' არის ალბათობა იმისა, რომ ნიმუშებს შორის განსხვავება შემთხვევითი ცვალებადობით არ არის განპირობებული; სხვა სიტყვებით რომ ვთქვათ, რომ არსებობს განსხვავება ძირეულ პოპულაციებს შორის. ამიტომ: c=1 – α
ჩვენ შეგვიძლია დავაყენოთ 'α' რა დონეზე გვინდა, რომ ვიგრძნოთ დარწმუნებული, რომ დადასტურებული მნიშვნელობა გვაქვს. ძალიან ხშირად გამოიყენება α=5% (95% ნდობა), მაგრამ თუ გვინდა ვიყოთ ნამდვილად დარწმუნებული, რომ რაიმე განსხვავება არ არის გამოწვეული შემთხვევითი ცვალებადობით, შეიძლება გამოვიყენოთ უფრო მაღალი ნდობის დონე, გამოვიყენოთ α=1% ან თუნდაც α=0.1. %.
სხვადასხვა სიტუაციებში მნიშვნელობის გამოსათვლელად გამოიყენება სხვადასხვა სტატისტიკური ტესტები. T-ტესტები გამოიყენება იმის დასადგენად, განსხვავდება თუ არა ორი პოპულაციის საშუალებები და F-ტესტები გამოიყენება იმის დასადგენად, განსხვავდება თუ არა დისპერსიები.
რატომ ტესტირება სტატისტიკური მნიშვნელობისთვის?
სხვადასხვა ნივთების შედარებისას, ჩვენ უნდა გამოვიყენოთ მნიშვნელოვნების ტესტირება იმის დასადგენად, არის თუ არა ერთი მეორეზე უკეთესი. ეს ეხება ბევრ ველს, მაგალითად:
- ბიზნესში ადამიანებს სჭირდებათ სხვადასხვა პროდუქტებისა და მარკეტინგული მეთოდების შედარება.
- სპორტში ადამიანებმა უნდა შეადარონ სხვადასხვა აღჭურვილობა, ტექნიკა და კონკურენტები.
- ინჟინერიაში ადამიანებს სჭირდებათ სხვადასხვა დიზაინის და პარამეტრის პარამეტრების შედარება.
თუ გსურთ შეამოწმოთ, მუშაობს თუ არა რაიმე სხვაზე უკეთესად, ნებისმიერ სფეროში, თქვენ უნდა შეამოწმოთ სტატისტიკური მნიშვნელოვნება.
რა არის სტუდენტური T-დისტრიბუცია?
სტუდენტის t-განაწილება ნორმალური (ან გაუსიანი) განაწილების მსგავსია. ეს ორივე არის ზარის ფორმის განაწილება, რომელთა უმეტესობა შედეგები ახლოსაა საშუალოსთან, მაგრამ ზოგიერთი იშვიათი მოვლენა საკმაოდ შორს არის საშუალოდან ორივე მიმართულებით, რომელსაც უწოდებენ განაწილების კუდებს.
Student-ის t-განაწილების ზუსტი ფორმა დამოკიდებულია ნიმუშის ზომაზე. 30-ზე მეტი ნიმუშებისთვის ეს ძალიან ჰგავს ნორმალურ განაწილებას. როდესაც ნიმუშის ზომა მცირდება, კუდები უფრო დიდი ხდება, რაც წარმოადგენს გაზრდილ გაურკვევლობას, რომელიც მოდის მცირე ნიმუშის საფუძველზე დასკვნების გაკეთების შედეგად.
როგორ გავაკეთოთ T-ტესტი Excel-ში
სანამ გამოიყენებთ T-ტესტს იმის დასადგენად, არის თუ არა სტატისტიკურად მნიშვნელოვანი განსხვავება ორი ნიმუშის საშუალებებს შორის, ჯერ უნდა შეასრულოთ F-ტესტი. ეს იმის გამო ხდება, რომ T-ტესტისთვის ტარდება სხვადასხვა გამოთვლები იმისდა მიხედვით, არის თუ არა მნიშვნელოვანი განსხვავება დისპერსიებს შორის.
ამ ანალიზის შესასრულებლად დაგჭირდებათ Analysis Toolpak დანამატი ჩართულია.
შემოწმება და ჩატვირთვა ანალიზის ხელსაწყოების დანამატის
ანალიზის ხელსაწყოების შესამოწმებლად და გასააქტიურებლად მიჰყევით ამ ნაბიჯებს:
- აირჩიეთ FILE ჩანართი >აირჩიეთ ოფციები.
- ოფციების დიალოგურ ფანჯარაში აირჩიეთ Add-Ins მარცხენა მხარეს ჩანართებიდან.
-
ფანჯრის ბოლოში აირჩიეთ ჩამოსაშლელი მენიუ Manage, შემდეგ აირჩიეთ Excel Add-ins. აირჩიეთ გადასვლა.
- დარწმუნდით, რომ მონიშნულია მოსანიშნი ველი Analysis Toolpak, შემდეგ აირჩიეთ OK.
- Analysis Toolpak ახლა აქტიურია და თქვენ მზად ხართ გამოიყენოთ F-ტესტები და T-ტესტები.
F-ტესტისა და T-ტესტის შესრულება Excel-ში
-
შეიყვანეთ ორი მონაცემთა ნაკრები ელცხრილში. ამ შემთხვევაში, ჩვენ განვიხილავთ ორი პროდუქტის გაყიდვას ერთი კვირის განმავლობაში. ასევე გამოითვლება თითოეული პროდუქტის გაყიდვების საშუალო დღიური ღირებულება მის სტანდარტულ გადახრასთან ერთად.
-
აირჩიეთ Data ჩანართი > მონაცემთა ანალიზი
-
აირჩიეთ F-Test Two-Sample for variances სიიდან, შემდეგ აირჩიეთ OK.
F-ტესტი ძალიან მგრძნობიარეა არანორმალურობის მიმართ. ამიტომ შეიძლება უფრო უსაფრთხო იყოს Welch ტესტის გამოყენება, მაგრამ ეს უფრო რთულია Excel-ში.
-
აირჩიეთ ცვლადი 1 დიაპაზონი და ცვლადი 2 დიაპაზონი; დააყენეთ ალფა (0.05 იძლევა 95% ნდობას); აირჩიეთ უჯრედი გამომავალი ზედა მარცხენა კუთხისთვის, იმის გათვალისწინებით, რომ ეს შეავსებს 3 სვეტს და 10 მწკრივს. აირჩიეთ OK.
ცვლადი 1 დიაპაზონისთვის, უნდა შეირჩეს ნიმუში ყველაზე დიდი სტანდარტული გადახრით (ან დისპერსიით).
-
იხილეთ F-ტესტის შედეგები იმის დასადგენად, არის თუ არა მნიშვნელოვანი განსხვავება ვარიაციებს შორის. შედეგები იძლევა სამ მნიშვნელოვან მნიშვნელობას:
- F: თანაფარდობა განსხვავებებს შორის.
- P(F<=f) ერთი კუდი: ალბათობა იმისა, რომ ცვლადს 1 რეალურად არ აქვს 2 ცვლადზე დიდი ვარიაცია. თუ ეს უფრო დიდია ვიდრე ალფა, რომელიც ზოგადად არის 0.05, მაშინ არ არის მნიშვნელოვანი განსხვავება ვარიაციებს შორის.
- F კრიტიკული ერთი კუდი: F-ის მნიშვნელობა, რომელიც საჭირო იქნება P(F<=f)=α მისაცემად. თუ ეს მნიშვნელობა მეტია F-ზე, ეს ასევე მიუთითებს, რომ არ არის მნიშვნელოვანი განსხვავება ვარიაციებს შორის.
P(F<=f) ასევე შეიძლება გამოითვალოს FDIST ფუნქციის გამოყენებით F და თავისუფლების გრადუსი თითოეული ნიმუშისთვის, როგორც მისი შეყვანა. თავისუფლების ხარისხი უბრალოდ არის დაკვირვებების რაოდენობა ნიმუშში მინუს ერთი.
-
ახლა, როცა იცით, არის თუ არა განსხვავება ვარიაციების შორის, შეგიძლიათ აირჩიოთ შესაბამისი T-ტესტი. აირჩიეთ მონაცემთა ჩანართი > მონაცემთა ანალიზი, შემდეგ აირჩიეთ t-ტესტი: ორი ნიმუში ტოლი ვარიაციების გათვალისწინებით ან t-ტესტი: ორი ნიმუში არათანაბარი ვარიაციების გათვალისწინებით
-
მიუხედავად იმისა, თუ რომელი ვარიანტი აირჩიე წინა ეტაპზე, თქვენ გექნებათ იგივე დიალოგური ფანჯარა, რათა შეიყვანოთ ანალიზის დეტალები. დასაწყებად აირჩიეთ დიაპაზონები, რომლებიც შეიცავს ნიმუშებს ცვლადი 1 დიაპაზონი და ცვლადი 2 დიაპაზონი..
- დაუშვით, რომ გსურთ შეამოწმოთ განსხვავება საშუალებებს შორის, დააყენეთ ჰიპოთეზირებული საშუალო სხვაობა ნულამდე.
- დააყენეთ მნიშვნელობის დონე Alpha (0.05 იძლევა 95% ნდობას) და აირჩიეთ უჯრედი გამომავალი ზედა მარცხენა კუთხისთვის, იმის გათვალისწინებით, რომ ეს შეავსებს 3 სვეტს და 14 რიგს. აირჩიეთ OK.
-
გადახედეთ შედეგებს, რათა გადაწყვიტოთ არის თუ არა მნიშვნელოვანი განსხვავება საშუალებებს შორის.
ისევე როგორც F-ტესტში, თუ p-მნიშვნელობა, ამ შემთხვევაში P(T<=t), მეტია ალფაზე, მაშინ მნიშვნელოვანი განსხვავება არ არის. თუმცა, ამ შემთხვევაში მოცემულია ორი p-მნიშვნელობა, ერთი ერთი კუდის ტესტისთვის და მეორე ორკუდიანი ტესტისთვის. ამ შემთხვევაში, გამოიყენეთ ორკუდიანი მნიშვნელობა, რადგან რომელიმე ცვლადის უფრო დიდი საშუალო იქნება მნიშვნელოვანი განსხვავება.