ახალი ტექნოლოგია გაჯეტებს თქვენი საუბრების გაგების საშუალებას აძლევს

Სარჩევი:

ახალი ტექნოლოგია გაჯეტებს თქვენი საუბრების გაგების საშუალებას აძლევს
ახალი ტექნოლოგია გაჯეტებს თქვენი საუბრების გაგების საშუალებას აძლევს
Anonim

მთავარი წაღებები

  • ახალმა ტექნოლოგიებმა შეიძლება გამოიწვიოს კომპიუტერები, რომლებიც უკეთ ესმით ადამიანის მეტყველებას.
  • Microsoft-მა და NVIDIA-მ ახლახან გამოაცხადეს ენის ინტერპრეტაციის ახალი AI-ზე ორიენტირებული მეთოდი.
  • კვანტური გამოთვლა შეიძლება იყოს კიდევ ერთი გზა ენის დამუშავების სფეროს წინსვლისთვის.
Image
Image

დღესდღეობით უამრავი ჭკვიანი გაჯეტია ბრძანებების მისაცემად, მაგრამ ჩვენ ჯერ კიდევ შორს ვართ კომპიუტერებისგან, რომლებსაც ესმით სასაუბრო მეტყველება.

Microsoft-მა და NVIDIA-მ ცოტა ხნის წინ გამოაცხადეს AI-ზე ორიენტირებული ახალი მეთოდი მეტყველების ინტერპრეტაციისთვის, რომელსაც შეუძლია გარდაქმნას, თუ როგორ ვსაუბრობთ ჩვენს ელექტრონიკასთან. ეს არის მზარდი მოძრაობის ნაწილი, რომელიც შეცვლის კომპიუტერების მეტყველების გაგებას, რომელსაც ასევე უწოდებენ ბუნებრივი ენის დამუშავებას (NLP).

"მოდელები, რომლებიც აძლიერებენ NLP-ს, უფრო დიდი და უფრო მოწინავე ხდება და უახლოვდება ადამიანის გაგებას", - განუცხადა ხელოვნური ინტელექტის ექსპერტმა ჰემიშ ოგილვიმ Lifewire-ს ელექტრონული ფოსტის ინტერვიუში.

"ერთ-ერთი დიდი წინსვლა არის ის, რომ NLP სცილდება მარტივ საკვანძო სიტყვებს. დღეს შესაძლოა მიჩვეული იყოთ ერთი ან ორი საკვანძო სიტყვის აკრეფა ან ლაპარაკი ძიების შედეგების მისაღებად, მაგრამ ბუნებრივი ენის დამუშავების ახალი მოდელები იყენებენ კონტექსტს უფრო მდიდარი შედეგების მისაღებად."

ჩეთის ბოტები

NVIDIA და Microsoft გაერთიანდნენ, რათა შექმნან Megatron-Turing Natural Language Generation მოდელი (MTNLG), რომელიც დუეტი ამტკიცებს, რომ არის "ყველაზე ძლიერი მონოლითური ტრანსფორმატორის ენის მოდელი, რომელიც მომზადებულია დღემდე". ხელოვნური ინტელექტის მოდელი მუშაობს სუპერკომპიუტერებზე.

მაგრამ მკვლევარებმა აღმოაჩინეს, რომ MTNLG მოდელმა აირჩია ადამიანის მიკერძოება ადამიანის მეტყველების ნიმუშების მთებში.

"მიუხედავად იმისა, რომ გიგანტური ენობრივი მოდელები აწინაურებენ ენების გენერირებას, მათ ასევე განიცდიან ისეთი საკითხები, როგორიცაა მიკერძოება და ტოქსიკურობა", - წერენ მკვლევარები ბლოგ პოსტში.”ჩვენი დაკვირვებები MT-NLG-თან არის ის, რომ მოდელი ირჩევს სტერეოტიპებს და მიკერძოებებს იმ მონაცემებიდან, რომლებზეც მას სწავლობენ.”

კომპიუტერები, რომლებსაც უკეთ ესმით მეტყველება, არ გააუმჯობესებენ მხოლოდ ჭკვიან დინამიკებს, როგორიცაა Alexa, ამტკიცებს Ogilvy. ტექსტზე დაფუძნებული საძიებო ვებსაიტები, როგორიცაა Amazon, ასევე უკეთ გაიგებენ შეკითხვებს, რომლებიც აკრეფილია.

"Google-ს ჰქონდა აშკარა ლიდერობა აქ, მაგრამ NLP ტექნოლოგია ყველგან იქნება", - თქვა ოგილვიმ. „ტექსტზე და ხმაზე დაფუძნებული ძიებისთვის, მომხმარებლები შეიძლება უფრო აღწერითი იყვნენ, რადგან NLP-ს ესმის მეტი, ვიდრე უბრალოდ ტექსტი; მას ესმის კონტექსტი, რასაც თქვენ ეძებთ უკეთესი შედეგების დასაბრუნებლად."

კვანტური ჩეთები?

კვანტური გამოთვლა შეიძლება იყოს NLP სფეროს წინსვლის ერთ-ერთი გზა. ოთხშაბათს, კომპანია Cambridge Quantum-მა გამოაცხადა lambeq, რომელიც, მისი თქმით, არის პირველი კვანტური ინსტრუმენტი NLP-ისთვის.

…NLP ესმის უფრო მეტს, ვიდრე უბრალოდ ტექსტს; მას ესმის იმის კონტექსტი, რასაც ეძებთ უკეთესი შედეგების დასაბრუნებლად.

კომპანია ამბობს, რომ ინსტრუმენტი საშუალებას იძლევა წინადადებების თარგმნა ბუნებრივ ენებზე კვანტურ კომპიუტერებზე გაშვებული კვანტური სქემების გამოყენებით. კვანტური გამოთვლა არის გამოთვლების ტიპი, რომელიც იყენებს კვანტური მდგომარეობების უჩვეულო თვისებებს, როგორიცაა სუპერპოზიცია, ჩარევა და ჩახლართულობა, გამოთვლების შესასრულებლად.

"კვანტური კომპიუტერების დამუშავება NLP-ს ძალიან განსხვავდება კლასიკური მანქანებისგან. სინამდვილეში, NLP არის "კვანტური მშობლიური", - განუცხადა კემბრიჯ Quantum-ის მთავარმა მეცნიერმა ბობ კოკემ Lifewire-ს ელექტრონული ფოსტის ინტერვიუში. „ეს განპირობებულია იმ აღმოჩენით, რომელიც ჩვენ გავაკეთეთ რამდენიმე წლის წინ, რომ გრამატიკა, რომელიც მართავს წინადადებებსა და მნიშვნელობას, ძალიან ჰგავს მათემატიკას, რომელიც გამოიყენება კვანტური კომპიუტერების დასაპროგრამებლად."

Coecke-მ თქვა, რომ კვანტურმა NLP-მ შეიძლება გამოიწვიოს უკეთესი ხმის ასისტენტები და მთარგმნელობითი ხელსაწყოები.

კიდევ ერთი პერსპექტიული მიდგომა მეტყველების ამოცნობის გასაუმჯობესებლად, სახელწოდებით Zac Liu, მონაცემთა მეცნიერმა კომპანია Hypergiant-ში, განუცხადა Lifewire-ს ელ.ფოსტის ინტერვიუში.”მოკლედ, როდესაც მონაცემთა მეცნიერები აუმჯობესებენ NLP მონაცემებს, ეს თითქმის გარანტიას იძლევა, რომ მათ ექნებათ უკეთესი NLP მოდელი და უკეთესი NLP შესაძლებლობები.”

Image
Image

შემდეგი ნაბიჯი არის კომპიუტერული ხედვის მოდელების ინტეგრირება NLP-თან, როგორიცაა ხელოვნური ინტელექტის მოდელის სწავლება ვიდეოების ყურებისა და ამ ვიდეოს ტექსტური შეჯამების შესაქმნელად, თქვა ლიუმ.

"ამ წინსვლის გამოყენება შეიძლება იყოს უსაზღვრო, დაწყებული ჯანდაცვისგან, რენტგენოლოგიური ფილმების წაკითხვით და წინასწარი დიაგნოზის მიწოდებით, სახლის, ტანსაცმლის, სამკაულების ან მსგავსი ნივთების დიზაინამდე," დასძინა მან. „მომხმარებელს შეეძლო სიტყვიერად ან წერილობით აეხსნა მოთხოვნები და ეს აღწერა შეიძლება ავტომატურად გადაკეთდეს სურათებად ან ვიდეოდ უკეთესი ვიზუალიზაციისთვის."

გირჩევთ: