როგორ შეიძლება ჰალუცინაციები დაეხმარონ AI-ს თქვენი უკეთ გაგებაში

Სარჩევი:

როგორ შეიძლება ჰალუცინაციები დაეხმარონ AI-ს თქვენი უკეთ გაგებაში
როგორ შეიძლება ჰალუცინაციები დაეხმარონ AI-ს თქვენი უკეთ გაგებაში
Anonim

მთავარი წაღებები

  • ახალი მანქანათმცოდნეობის მოდელი ჰალუცინირებს წინადადების გამოსახულებას ენაზე, რათა დაეხმაროს თარგმნას.
  • AI სისტემა, სახელად VALHALLA, შექმნილია იმისთვის, რომ მიბაძოს ადამიანების ენას.
  • ახალი სისტემა არის მზარდი მოძრაობის ნაწილი, რომელიც გამოიყენება AI ენის გასაგებად.
Image
Image

სიტყვების თარგმნისას სურათების ვიზუალიზაციის ადამიანის მეთოდი დაგეხმარებათ ხელოვნურ ინტელექტს (AI) უკეთ გაგებაში.

ახალი მანქანათმცოდნეობის მოდელი ჰალუცინირებს სურათს, თუ როგორ გამოიყურება წინადადება ენაზე. ბოლო კვლევითი ნაშრომის თანახმად, ტექნიკა შემდეგ იყენებს ვიზუალიზაციას და სხვა მინიშნებებს თარგმანის დასახმარებლად. ენის გასაგებად ხელოვნური ინტელექტის გამოყენება მზარდი მოძრაობის ნაწილია.

"როგორ ლაპარაკობენ და წერენ ადამიანები უნიკალურია, რადგან ჩვენ ყველას გვაქვს ოდნავ განსხვავებული ტონები და სტილი", - განუცხადა ბეთ კუდნიმ, მერივილის უნივერსიტეტის მონაცემთა ანალიტიკის პროფესორმა, რომელიც არ იყო ჩართული კვლევაში, Lifewire-ს ელ-ფოსტის ინტერვიუში.. "კონტექსტის გაგება რთულია, რადგან ეს ჰგავს არასტრუქტურირებულ მონაცემებთან ურთიერთობას. აქ არის ბუნებრივი ენის დამუშავება (NLP) სასარგებლო. NLP არის ხელოვნური ინტელექტის ფილიალი, რომელიც განიხილავს განსხვავებებს ჩვენს კომუნიკაციაში მანქანური წაკითხვის გააზრების გამოყენებით. მთავარი განსხვავება NLP-ში., როგორც ხელოვნური ინტელექტის ფილიალი, არ ამახვილებს ყურადღებას მხოლოდ იმ სიტყვების ლიტერატურულ მნიშვნელობებზე, რომლებსაც ჩვენ ვამბობთ ან ვწერთ. ის ათვალიერებს მნიშვნელობას."

წადი ჰკითხე ალისას

ახალი ხელოვნური ინტელექტის სისტემა, სახელწოდებით VALHALLA, შექმნილი MIT-ის, IBM-ის და სან დიეგოს კალიფორნიის უნივერსიტეტის მკვლევარების მიერ, შექმნილია იმისთვის, რომ მიბაძოს ადამიანების ენას აღიქვამს. მეცნიერთა აზრით, სენსორული ინფორმაციის გამოყენება, როგორიცაა მულტიმედია, დაწყვილებული ახალ და უცნობ სიტყვებთან, როგორიცაა ფლეშ ბარათები სურათებით, აუმჯობესებს ენის ათვისებას და შენარჩუნებას.

ეს სისტემები ზრდის ჩეთბოტების ძალას, რომლებიც ამჟამად მხოლოდ გაწვრთნილნი არიან და შეუძლიათ კონკრეტული საუბრების განხორციელება…

გუნდი აცხადებს, რომ მათი მეთოდი აუმჯობესებს მანქანური თარგმანის სიზუსტეს მხოლოდ ტექსტურ თარგმანზე. მეცნიერებმა გამოიყენეს ენკოდერ-დეკოდერის არქიტექტურა ორი ტრანსფორმატორით, ნერვული ქსელის მოდელის ტიპი, რომელიც შესაფერისია თანმიმდევრობაზე დამოკიდებული მონაცემებისთვის, როგორიცაა ენა, რომელსაც შეუძლია ყურადღება მიაქციოს საკვანძო სიტყვებს და წინადადების სემანტიკას. ერთი ტრანსფორმატორი წარმოქმნის ვიზუალურ ჰალუცინაციას, ხოლო მეორე ახორციელებს მულტიმოდალურ თარგმანს პირველი ტრანსფორმატორის შედეგების გამოყენებით.

"რეალური სამყაროს სცენარებში, თქვენ შეიძლება არ გქონდეთ სურათი საწყის წინადადებასთან მიმართებაში", - თქვა რამესვარ პანდამ, კვლევის ჯგუფის ერთ-ერთმა წევრმა საინფორმაციო გამოშვებაში. "ასე რომ, ჩვენი მოტივაცია ძირითადად იყო: იმის ნაცვლად, რომ გამოვიყენოთ გარე სურათი დასკვნის დროს, როგორც შეყვანა, შეგვიძლია გამოვიყენოთ ვიზუალური ჰალუცინაცია - ვიზუალური სცენების წარმოდგენის უნარი - მანქანური თარგმანის სისტემების გასაუმჯობესებლად?"

AI გაგება

მნიშვნელოვანი კვლევა ორიენტირებულია NLP-ის განვითარებაზე, აღნიშნა კუდნიმ. მაგალითად, ილონ მასკმა დააარსა Open AI, რომელიც მუშაობს GPT-3-ზე, მოდელზე, რომელსაც შეუძლია ადამიანთან საუბარი და საკმარისად საზრიანია პროგრამული კოდის გენერირებაზე Python-სა და Java-ში.

Google და Meta ასევე მუშაობენ სასაუბრო ხელოვნური ინტელექტის განვითარებაზე თავიანთი სისტემით, სახელწოდებით LAMDA. „ეს სისტემები ზრდის ჩეთბოტების ძალას, რომლებიც ამჟამად მხოლოდ გაწვრთნილნი არიან და კონკრეტული საუბრების უნარი აქვთ, რაც, სავარაუდოდ, შეცვლის მომხმარებელთა მხარდაჭერისა და დახმარების მერხების სახეს“, - თქვა კუდნიმ.

აარონ სლომანმა, CLIPr-ის თანადამფუძნებელმა, ხელოვნური ინტელექტის ტექნოლოგიების კომპანიამ, ელფოსტაში თქვა, რომ დიდ ენობრივ მოდელებს, როგორიცაა GPT-3, შეუძლიათ ისწავლონ ძალიან ცოტა ტრენინგის მაგალითებიდან, რათა გააუმჯობესონ ტექსტის შეჯამება ადამიანის გამოხმაურებაზე. მაგალითად, მან თქვა, შეგიძლიათ დიდი ენის მოდელს მისცეთ მათემატიკური პრობლემა და სთხოვოთ ხელოვნურ ინტელექტს, იფიქროს ნაბიჯ-ნაბიჯ.

"ჩვენ შეგვიძლია ველოდოთ უფრო დიდ შეხედულებებს და მსჯელობას დიდი ენობრივი მოდელებიდან, როდესაც უფრო მეტს ვიგებთ მათი შესაძლებლობებისა და შეზღუდვების შესახებ", - დასძინა სლომანმა. „მე ასევე ველოდები, რომ ეს ენობრივი მოდელები შექმნიან უფრო მეტ ადამიანურ პროცესებს, რადგან მოდელიერები შეიმუშავებენ უკეთეს გზებს მოდელების დაზუსტებისთვის კონკრეტული დავალებების შესასრულებლად.“

Georgia Tech გამოთვლების პროფესორმა დიი იანგმა ელფოსტით მიცემულ ინტერვიუში იწინასწარმეტყველა, რომ ჩვენ დავინახავთ ბუნებრივი ენის დამუშავების სისტემების უფრო მეტ გამოყენებას ჩვენს ყოველდღიურ ცხოვრებაში, დაწყებული NLP-ზე დაფუძნებული პერსონალიზებული ასისტენტებიდან, ელფოსტისა და სატელეფონო ზარების დასახმარებლად. მცოდნე დიალოგის სისტემებს ინფორმაციის მოსაძიებლად მოგზაურობაში ან ჯანდაცვაში.„ასევე სამართლიანი ხელოვნური ინტელექტის სისტემები, რომლებსაც შეუძლიათ დავალებების შესრულება და ადამიანების დახმარება პასუხისმგებლობით და მიკერძოების გარეშე“, დასძინა იანგმა.

უზარმაზარი ხელოვნური ინტელექტის მოდელები, რომლებიც იყენებენ ტრილიონ პარამეტრს, როგორიცაა GPT-3 და DeepText, გააგრძელებენ მუშაობას ერთი მოდელისკენ ყველა ენობრივი აპლიკაციისთვის, იწინასწარმეტყველა სტივენ ჰეიგი, მანქანათმცოდნეობის ინჟინერი Dialexa-ში, ელექტრონული ფოსტის ინტერვიუში. მისი თქმით, ასევე შეიქმნება ახალი ტიპის მოდელები, რომლებიც შექმნილია კონკრეტული გამოყენებისთვის, როგორიცაა ხმოვანი ბრძანებით ონლაინ შოპინგი.

"შეიძლება იყოს მყიდველი, რომელიც ამბობს: "მაჩვენე ეს თვალის ჩრდილი შუაღამის ლურჯში მეტი ჰალოებით", რათა აჩვენო ეს ჩრდილი ადამიანის თვალებზე, გარკვეული კონტროლით, თუ როგორ გამოიყენება", დასძინა ჰეიჯმა..

გირჩევთ: