რა არის ოპტიკური სიმბოლოების ამოცნობა (OCR)?

Სარჩევი:

რა არის ოპტიკური სიმბოლოების ამოცნობა (OCR)?
რა არის ოპტიკური სიმბოლოების ამოცნობა (OCR)?
Anonim

ოპტიკური სიმბოლოების ამოცნობა (OCR) ეხება პროგრამულ უზრუნველყოფას, რომელიც ქმნის დაბეჭდილი, აკრეფილი ან ხელნაწერი დოკუმენტის ციფრულ ვერსიას, რომლის წაკითხვაც კომპიუტერებს შეუძლიათ ტექსტის ხელით აკრეფის ან შეყვანის საჭიროების გარეშე. OCR ჩვეულებრივ გამოიყენება სკანირებულ დოკუმენტებზე PDF ფორმატში, მაგრამ ასევე შეუძლია შექმნას ტექსტის კომპიუტერით წასაკითხი ვერსია გამოსახულების ფაილში.

რა არის OCR

OCR, ასევე მოხსენიებული, როგორც ტექსტის ამოცნობა, არის პროგრამული ტექნოლოგია, რომელიც გარდაქმნის სიმბოლოებს, როგორიცაა რიცხვები, ასოები და პუნქტუაცია (ასევე უწოდებენ გლიფებს) ბეჭდური ან წერილობითი დოკუმენტებიდან ელექტრონულ ფორმაში, რომელიც უფრო ადვილად ამოიცნობს და იკითხება კომპიუტერებით და სხვა პროგრამული პროგრამები.ზოგიერთი OCR პროგრამა ამას აკეთებს, რადგან დოკუმენტი სკანირებულია ან გადაღებულია ციფრული კამერით, ხოლო სხვებს შეუძლიათ გამოიყენონ ეს პროცესი დოკუმენტებზე, რომლებიც ადრე იყო დასკანირებული ან გადაღებული OCR-ის გარეშე. OCR მომხმარებლებს საშუალებას აძლევს მოძებნონ PDF დოკუმენტები, დაარედაქტირონ ტექსტი და ხელახლა დააფორმატონ დოკუმენტები.

Image
Image
ისტორიული გაზეთის სკანირება OCR პროგრამული უზრუნველყოფით.

Getty Images

რისთვის გამოიყენება OCR?

სწრაფი, ყოველდღიური სკანირების საჭიროებისთვის, OCR შეიძლება არ იყოს დიდი საქმე. თუ თქვენ აკეთებთ დიდი რაოდენობით სკანირებას, PDF ფაილებში მოძიება, რათა იპოვოთ ზუსტად ის, რაც გჭირდებათ, შეგიძლიათ დაზოგოთ საკმაოდ ცოტა დრო და გახადოთ OCR ფუნქციონირება თქვენს სკანერ პროგრამაში. აქ არის რამოდენიმე სხვა რამ, რაც OCR ეხმარება:

  • მონაცემთა ავტომატური დამუშავება და მონაცემთა შეყვანა (მაგალითი: სამუშაოს განმცხადებლის თვალთვალის სისტემები რეზიუმეებისთვის).
  • სკანირებული წიგნების მოძიება.
  • ხელნაწერი სკანირების გარდაქმნა კომპიუტერით წასაკითხად ტექსტად.
  • გახდის დოკუმენტებს უფრო გამოსადეგი მკითხველის პროგრამებისთვის, რომლებიც ეხმარება მხედველობის დაქვეითებულ მომხმარებლებს.
  • შენახვა ისტორიული დოკუმენტებისა და გაზეთების, ასევე მათი მოძიება.
  • მონაცემების მოპოვება და გადარიცხვა სააღრიცხვო პროგრამებში (მაგალითი: ქვითრები და ინვოისები).
  • დოკუმენტების ინდექსირება საძიებო სისტემებისთვის გამოსაყენებლად.
  • მძღოლის სანომრე ნიშნების ამოცნობა სიჩქარის კამერით და წითელი შუქის კამერის პროგრამული უზრუნველყოფით.
  • მეტყველების სინთეზატორები ადამიანებისთვის, რომლებსაც არ შეუძლიათ საუბარი - თეორიული ფიზიკოსი სტივენ ჰოკინგი, ალბათ, მეტყველების სინთეზატორის პროგრამის ყველაზე ცნობილი მომხმარებელია.

ბოლო ხაზი

რატომ არ გადაიღოთ უბრალოდ სურათი, არა? იმის გამო, რომ თქვენ ვერ შეძლებთ არაფრის რედაქტირებას ან ტექსტის ძიებას, რადგან ეს მხოლოდ სურათი იქნებოდა. დოკუმენტის სკანირებამ და OCR პროგრამული უზრუნველყოფის გაშვებამ შეიძლება გადააქციოს ეს ფაილი ისეთად, რისი რედაქტირებაც შეგიძლიათ და შეგიძლიათ მოძებნოთ.

OCR ისტორია

მიუხედავად იმისა, რომ ტექსტის ამოცნობის ყველაზე ადრეული გამოყენება თარიღდება 1914 წლით, OCR-თან დაკავშირებული ტექნოლოგიების ფართო განვითარება და გამოყენება სერიოზულად დაიწყო 1950-იან წლებში, განსაკუთრებით ძალიან გამარტივებული შრიფტების შექმნით, რომლებიც ადვილად გადაიყვანდნენ ციფრულ ფორმატში. წასაკითხი ტექსტი. ამ გამარტივებული შრიფტებიდან პირველი შეიქმნა დევიდ შეპარდის მიერ და ცნობილია როგორც OCR-7B. OCR-7B დღესაც გამოიყენება ფინანსურ ინდუსტრიაში საკრედიტო და სადებეტო ბარათებზე გამოყენებული სტანდარტული შრიფტისთვის. 1960-იან წლებში საფოსტო სერვისებმა რამდენიმე ქვეყანაში დაიწყეს OCR ტექნოლოგიის გამოყენება ფოსტის დახარისხების საგრძნობლად დასაჩქარებლად, მათ შორის შეერთებულ შტატებში, დიდ ბრიტანეთში, კანადასა და გერმანიაში. OCR კვლავ არის ძირითადი ტექნოლოგია, რომელიც გამოიყენება საფოსტო სერვისების ფოსტის დასალაგებლად მთელ მსოფლიოში. 2000 წელს OCR ტექნოლოგიის საზღვრებისა და შესაძლებლობების ძირითადი ცოდნა გამოყენებული იქნა CAPTCHA პროგრამების შესამუშავებლად, რომლებიც გამოიყენება ბოტებისა და სპამერების შესაჩერებლად.

ათწლეულების განმავლობაში OCR უფრო ზუსტი და დახვეწილი ხდებოდა დაკავშირებულ ტექნოლოგიურ სფეროებში მიღწევების გამო, როგორიცაა ხელოვნური ინტელექტი, მანქანათმცოდნეობა და კომპიუტერული ხედვა.დღეს, OCR პროგრამული უზრუნველყოფა იყენებს შაბლონის ამოცნობას, ფუნქციების ამოცნობას და ტექსტის მოპოვებას, რათა გარდაქმნას დოკუმენტები უფრო სწრაფად და ზუსტად, ვიდრე ოდესმე.

FAQ

    როგორ შემიძლია დოკუმენტების სკანირება ჩემი ტელეფონით ან ტაბლეტით?

    iOS-ზე გახსენით Notes აპი და შექმენით ახალი შენიშვნა. გახსენით კამერა და შემდეგ შეეხეთ დოკუმენტების სკანირება. Android-ზე გახსენით Google Drive და აირჩიეთ Plus (+), შემდეგ შეეხეთ სკანირება სკანირებისთვის დოკუმენტი თქვენი ტელეფონით.

    როგორ გამოვიყენო OCR Adobe Acrobat-ში?

    გახსენით PDF ფაილი, რომელიც შეიცავს დასკანერებულ სურათს, შემდეგ აირჩიეთ Tools > რედაქტირება PDF. Acrobat ავტომატურად გამოიყენებს OCR-ს, რათა ტექსტის რედაქტირება შეძლოთ. უბრალოდ აირჩიეთ ადგილი, სადაც გსურთ რედაქტირების გაკეთება და დაიწყეთ აკრეფა.

    რა განსხვავებაა OCR-სა და OMR-ს შორის?

    ოპტიკური ნიშნის ამოცნობა (OMR) არის პროგრამული უზრუნველყოფა, რომელიც აღმოაჩენს ნიშანს ქაღალდზე, როგორც წესი, ბუშტების ფურცელზე. OMR გამოიყენება გამოცდების, გამოკითხვების, კითხვარების და არჩევნების შედეგების დასამუშავებლად. OCR-ისგან განსხვავებით, OMR-ს არ შეუძლია გვერდზე ნიშნების გაშიფვრა, მაგრამ მხოლოდ ამოწმებს, რომ ნიშნები არსებობს.

გირჩევთ: