NedirYapay ZekaYazılım

Optik Karakter Tanıma | OCR Nedir ?

OCR Nedir ?, Optik Karakter Tanıma teknolojisi olarak adlandırılmaktadır. Belgeler ve fotoğraflar gibi görüntülerin içindeki metinleri tanımlamak için kullanılan yaygın bir teknolojidir. OCR teknolojisi, yazılı metin içeren her tür görüntüyü makine tarafından okunabilir metin verilerine dönüştürmek için kullanılır. OCR kelimesi ilk olarak 1990’ların başında gazetelerin dijital ortama geçmeye başlaması ile karşımıza çıkmaya başladı. Günümüzde OCR teknolojisi  makina öğrenmesi tekniklerini de kullanarak çok yüksek oranda doğruluk sağlamaya başlamıştır.

OCR  Tarihi

Optophone 
Optophone
  •  1914’te Emanuel Goldberg , karakterleri okuyan ve bunları standart telgraf koduna dönüştüren bir makine geliştirdi. Eşzamanlı olarak, Edmund Fournier d’Albe , basılı bir sayfada hareket ettirildiğinde belirli harflere veya karakterlere karşılık gelen tonlar üreten el tipi bir tarayıcı olan Optophone’u geliştirdi .
  • 1920’lerin sonlarında ve 1930’larda Emanuel Goldberg , bir optik kod tanıma sistemi kullanarak mikrofilm arşivlerini aramak için “İstatistiksel Makine” adını verdiği makineyi geliştirdi .
  • Günümüzde ise birçok programlama dilleri ile kullanılabilecek OCR kütüphaneleri  makina öğrenmesi yardımı ile çok yüksek doğruluklarda geliştirmiş bulunmakta.

OCR Türleri

  • Optik karakter tanıma (OCR) –  Daktilo ile yazılmış metni, her seferinde bir  karakteri hedefleyerek okuma .
  • Optik kelime tanıma –  Her seferinde bir kelime olmak üzere  yazılmış metni okumayı hedefler.
  • Akıllı karakter tanıma (ICR) –  El yazısıyla yazılmış baskıları veya el yazısı metnini her seferinde karakter olarak okumayı hedefler ve genellikle makine öğrenimini içerir .
  • Akıllı kelime tanıma (IWR) – El yazısıyla yazılmış metinleri her seferinde bir kelime olmak üzere okumayı hedefleyen tür.
[geo-post id=”2607″ label=”Önerilen Yazı”]

OCR Kullanım Alanları

  • Belgeler dijital ortama aktarılması , örneğin Çek , pasaport, fatura, banka ekstresi ve makbuz
  • Güvenlik denetimleri için plaka tanıma sistemleri
  • Pasaport, Kimlik gibi evrakların dijital olarak doğrulanması.
  • Sürücüsüz araçlar için trafik işareti tanıma sistemleri.
  • Basılı metinlerin dijital olarak bilgisayar sistemlerine aktarılması ve düzenleme kolaylığı.
  • Online kitap sistemlerinin oluşturulması.
  • El yazısı ile bilgisayara bilgi girişi.
  • Görme engelli kullanıcılar için okuma yardımcısı üretimi.
  • Taranan belgeleri aranabilir PDF‘lere dönüştürerek aranabilir hale getirme

OCR Nasıl Çalışır?

OCR teknolojisi çalışma mantığını 4 başlıkta özetleyebiliriz.

  1. Ön İşleme 
  2. Karakter Tanıma
  3. Tanıma Sonrası Düzenleme
  4. Uygulama Alanına Göre Şekillendirme

1 – Ön İşleme 

Ön işleme aşaması genel olarak kelime ve karakter tanıma işlemlerine başlamadan görüntü dosyalarındaki bulanıklık yamukluk kayma gibi durumların düzeltilmesi aşamasıdır bu aşamada yapılan işlemleri özetleyecek olursak;

  • Taranan doküman boşluklarından hizalama işlemi.
  • Bulanık noktaları düzeltme.
  • Görüntüyü siyah ve beyaz olarak iki renk tonuna dönüştürme.
  • Boş satırları ortadan kaldırma.
  • Paragrafları bloklar halinde ayırma ve sıralama.
  • Çizgi ve kelime algılama – Kelime ve karakter şekilleri için temel oluşturur, gerekirse kelimeleri ayırır.

2- Karakter Tanıma

Düzenlenmiş olan dosyayı karakter analiz algoritmaları yardımı ile inceleyerek görsel veri içerisindeki metinsel ifadelerin makina dilindeki karşılıkları bulunarak eşleştirme yapılır bu aşamada makina öğrenmesi ve Yapay zeka kavramları çokça karşımıza çıkmaktadır.

3 – Tanıma Sonrası Düzenleme

Bu aşamada Karakter tanıma aşamasında makina diline çevrilmiş veriden özel isim doğru algılama gibi durumları örnek bir şablon veya sözlük yardımı ile kontrol edip maksimum doğruluk oluşturmak için elde edilen veriler üzerinde düzeltmeler yapılır.

4- Uygulama Alanına Göre Şekillendirme

Bu aşamada OCR teknolojisinin kullanıldığı alana göre düzenlenip maksimum doğruluğun oluşturulması amaçlanmaktadır. Örneğin, Sürücüsüz araç teknolojilerinde yol üzerindeki tabelaların algılanması uyarı levhalarının algılanması gibi durumlar için özel olarak şekillendirilmesi sağlanmalıdır.

Yazı ile ilgili düşüncelerinizi yorum olarak bizlerle paylaşırsanız çok seviniriz. Benzer içeriğimiz olan latince alıntılara buradan ulaşabilir, mobil uygulamalarımızı indirmediyseniz de aşağıdaki görsele tıklayarak mobil uygulamamıza ulaşabilirsiniz.infreza mobil

Berkay Babataş

Bilgisayar ve yazılım alanında kariyerimi yürütmekte olup InFreza.com’un Kurucusu ve geliştiricisiyim. Bununla birlikte teknoloji, sanat, bilim üzerine projeler üretmekte ve günümüz dünyasına katkıda bulunmak adına çalışmaktayım. Disiplinler arası sentezler üretip özgün tasarım ve fikirler oluşturmak, girişimcilik ve takım çalışmasında beceri; sahip olduğum spesifik özelliklerdir.

İlgili Makaleler

Bir yanıt yazın

E-posta adresiniz yayınlanmayacak. Gerekli alanlar * ile işaretlenmişlerdir

Başa dön tuşu