AI-ს შეუძლია შეაჩეროს თვალთვალი, წინასწარმეტყველებით რას იტყვით

Სარჩევი:

AI-ს შეუძლია შეაჩეროს თვალთვალი, წინასწარმეტყველებით რას იტყვით
AI-ს შეუძლია შეაჩეროს თვალთვალი, წინასწარმეტყველებით რას იტყვით
Anonim

მთავარი წაღებები

  • მკვლევარებმა შეიმუშავეს მეთოდი საუბრების გადასაჭრელად, რათა დაამარცხონ ბოროტი მიკროფონები ჩვენი საუბრების აღწერისგან.
  • მეთოდი მნიშვნელოვანია, რადგან ის მუშაობს რეალურ დროში აუდიოს სტრიმინგზე და მინიმალური ვარჯიშით.
  • ექსპერტები მიესალმებიან კვლევას, მაგრამ ფიქრობენ, რომ ის დიდად არ გამოდგება სმარტფონის საშუალო მომხმარებლისთვის.
Image
Image

ჩვენ გარშემორტყმული ვართ გონიერი მოწყობილობებით მიკროფონებით, მაგრამ რა მოხდება, თუ ისინი კომპრომეტირებულნი არიან ჩვენს მოსმენაზე?

ჩვენი საუბრების დასაცავად, კოლუმბიის უნივერსიტეტის მკვლევარებმა შეიმუშავეს ნერვული ხმის შენიღბვის მეთოდი, რომელიც არღვევს მეტყველების ავტომატური ამოცნობის სისტემებს რეალურ დროში ხალხის უხერხულობის გარეშე.

"ჩვენს ცხოვრებაში [ჭკვიანი ხმით გააქტიურებული მოწყობილობების] შეჭრით, კონფიდენციალურობის იდეა აორთქლდება, რადგან ეს მოსასმენი მოწყობილობები ყოველთვის ჩართულია და აკვირდება ნათქვამის, " ჩარლზ ევერეტი, კიბერ ადვოკატირების დირექტორი, Deep Instinct-მა განუცხადა Lifewire-ს ელექტრონული ფოსტით.”ეს კვლევა არის პირდაპირი პასუხი იმ საჭიროებაზე, რომ დაიმალოს ან შენიღბოს ინდივიდუალური ხმა და საუბრები ამ სფეროში ცნობილი ან უცნობი ელექტრონული მომსმენებისგან.”

საუბარი

მკვლევარებმა შეიმუშავეს სისტემა, რომელიც წარმოქმნის ჩურჩულით წყნარ ხმებს, რომელთა დაკვრა შეგიძლიათ ნებისმიერ ოთახში, რათა დაბლოკოთ ბოროტი მიკროფონები თქვენი საუბრების თვალთვალის თავიდან ასაცილებლად.

როგორც ამ ტიპის ტექნოლოგია ეწინააღმდეგება მოსმენას, ევერეტს ახსენებს ხმაურის დამშლელი ყურსასმენებს.იმის ნაცვლად, რომ ჩუმად ჩუმი ხმები გამოიმუშავონ, რათა გააუქმონ ფონის ხმაური, მკვლევარები ავრცელებენ ფონურ ხმებს, რომლებიც არღვევს ხელოვნური ინტელექტის (AI) ალგორითმებს, რომლებიც ხმის ტალღების ინტერპრეტაციას უკეთებენ აუდიოს.

ადამიანის ხმის შენიღბვის ასეთი მექანიზმები უნიკალური არ არის, მაგრამ ის, რაც ნერვულ ხმოვან შენიღბვას სხვა მეთოდებისგან გამოარჩევს, არის ის, რომ ის რეალურ დროში მუშაობს აუდიო სტრიმინგზე.

"ცოცხალ მეტყველებაზე მუშაობისთვის, ჩვენმა მიდგომამ უნდა იწინასწარმეტყველოს [სწორი სკრამბლინგი აუდიო] მომავალში, რათა მათი დაკვრა რეალურ დროში მოხდეს", აღნიშნავენ მკვლევარები თავიანთ ნაშრომში. ამჟამად, მეთოდი მუშაობს ინგლისური ენის უმრავლესობისთვის.

ჰანს ჰანსენმა, Brand3D-ის აღმასრულებელმა დირექტორმა, განუცხადა Lifewire-ს, რომ კვლევა ძალიან მნიშვნელოვანია, რადგან ის უტევს დღევანდელი AI სისტემების მთავარ სისუსტეს.

ელ.ფოსტის საუბარში ჰანსენმა განმარტა, რომ ღრმა სწავლის AI სისტემები ზოგადად და მეტყველების ბუნებრივი ამოცნობა კონკრეტულად მუშაობს ათასობით სპიკერისგან შეგროვებული მეტყველების მონაცემების მილიონობით ჩანაწერის დამუშავების შემდეგ.ამის საპირისპიროდ, ნერვული ხმის შენიღბვა მუშაობს მხოლოდ ორი წამის შეყვანის მეტყველების კონდიცირების შემდეგ.

პირადად მე, თუ მე მაწუხებს მოწყობილობების მოსმენა, ჩემი გამოსავალი არ იქნება სხვა მოსასმენი მოწყობილობის დამატება, რომელიც ცდილობს ფონური ხმაურის გამომუშავებას.

არასწორი ხე?

ბრაიან ჩაპელი, BeyondTrust-ის უსაფრთხოების მთავარი სტრატეგი, თვლის, რომ კვლევა უფრო მომგებიანია ბიზნეს მომხმარებლებისთვის, რომლებიც შიშობენ, რომ ისინი შეიძლება იმყოფებოდნენ კომპრომეტირებული მოწყობილობების შუაგულში, რომლებიც უსმენენ საკვანძო სიტყვებს, რომლებიც მიუთითებს ღირებული ინფორმაციის გახმოვანებაზე.

"სადაც ეს ტექნოლოგია პოტენციურად უფრო საინტერესო იქნება, არის უფრო ავტორიტარული სათვალთვალო სახელმწიფო, სადაც ხელოვნური ინტელექტის ვიდეო და ხმოვანი ბეჭდვის ანალიზი გამოიყენება მოქალაქეების წინააღმდეგ", განუცხადა ჯეიმს მაუდმა, BeyondTrust-ის კიბერუსაფრთხოების წამყვანმა მკვლევარმა Lifewire-ს ელექტრონული ფოსტით.

მაუდმა შესთავაზა, რომ უკეთესი ალტერნატივა იქნება კონფიდენციალურობის კონტროლის დანერგვა, თუ როგორ ხდება მონაცემების აღება, შენახვა და გამოყენება ამ მოწყობილობების მიერ. უფრო მეტიც, ჩაპელი თვლის, რომ მკვლევარის მეთოდის სარგებლიანობა შეზღუდულია, რადგან ის არ არის გამიზნული ადამიანის მოსმენის შესაჩერებლად.

სახლისთვის, გაითვალისწინეთ, რომ თეორიულად მაინც, ასეთი ხელსაწყოს გამოყენება გამოიწვევს Siri-ს, Alexa-ს, Google Home-ს და ნებისმიერ სხვა სისტემას, რომელიც გააქტიურებულია სალაპარაკო გამომწვევი სიტყვით, თქვენი იგნორირებას გამოიწვევს. ჩაპელი.

Image
Image

მაგრამ ექსპერტები თვლიან, რომ ჩვენს სმარტ მოწყობილობებში AI/ML სპეციფიკური ტექნოლოგიის მზარდი ჩართვით, სავსებით შესაძლებელია, რომ ეს ტექნოლოგია ჩვენს ტელეფონებში, უახლოეს მომავალში აღმოჩნდეს.

მაუდი შეშფოთებულია, რადგან AI ტექნოლოგიებს შეუძლიათ სწრაფად ისწავლონ განსხვავება ხმაურსა და რეალურ აუდიოს შორის. ის ფიქრობს, რომ მიუხედავად იმისა, რომ სისტემა შესაძლოა თავდაპირველად წარმატებული იყოს, ის სწრაფად გადაიქცევა კატისა და თაგვის თამაშად, რადგან მოსასმენი მოწყობილობა სწავლობს ჩამკეტის ხმების გაფილტვრას.

უფრო შემაშფოთებელია, მაუდმა აღნიშნა, რომ ნებისმიერს, ვინც მას იყენებს, შეუძლია, ფაქტობრივად, მიიპყროს ყურადღება საკუთარ თავზე, რადგან ხმის ამოცნობის დარღვევა უჩვეულოდ გამოიყურება და შეიძლება მიუთითებდეს, რომ რაღაცის დამალვას ცდილობ.

"პირადად მე, თუ მე მაინტერესებს მოწყობილობების მოსმენა, ჩემი გამოსავალი არ იქნება სხვა მოსასმენი მოწყობილობის დამატება, რომელიც ცდილობს ფონური ხმაურის გამომუშავებას," გააზიარა მაუდმა. "განსაკუთრებით, რადგან ეს უბრალოდ ზრდის მოწყობილობის ან აპის გატეხვის და ჩემი მოსმენის რისკს."

გირჩევთ: