Bu içerik kimler için?

Belge yoğun operasyon, arşiv ve otomasyon ekipleri için hazırlanmıştır. İçerik, teknoloji seçimini tek başına ele almak yerine veri, güvenlik, işletim ve ölçüm gereksinimlerini birlikte değerlendirmeye yardımcı olur.

OCR neden tek başına yeterli değildir?

OCR görüntüdeki karakterleri metne dönüştürür. Kurumsal süreç ise belgenin tipini, sayfa düzenini, alan ilişkilerini, güven seviyesini ve sonraki iş adımını da anlamayı gerektirir. Belge zekâsı bu katmanları birlikte ele alır.

Uçtan uca işleme akışı

  • Görüntü veya PDF alma
  • Döndürme, temizleme ve görüntü ön işleme
  • OCR
  • Düzen ve tablo analizi
  • Alan çıkarımı
  • Güven skoru
  • Gerekli durumda insan incelemesi
  • API veya dosya çıktısı

Kalite nasıl ölçülür?

CER ve WER metin tanıma kalitesini; alan düzeyi doğruluk iş süreci çıktısını; güven skoru otomatik karar eşiklerini; inceleme oranı operasyonel yükü; işlem süresi ise kapasite ihtiyacını görünür kılar. Tek bir doğruluk yüzdesi gerçek sistem kalitesini açıklamaz.

Gerçek dünya belgeleri

Tarama kalitesi, el yazısı, damga, imza, eğik sayfa, karmaşık tablo ve Türkçe karakterler sonuçları etkiler. Bu nedenle temsili belge seti ve insan kontrolü gerektiren sınır durumları PoC aşamasında görülmelidir.

Belge sınıfına göre tasarım

Fatura, başvuru formu, sözleşme ve serbest metin notu aynı işleme hattıyla ele alınmamalıdır. Sabit alanlı formlarda koordinat ve şablon bilgisi değerliyken, değişken belgelerde düzen analizi ve bağlamsal alan eşleştirme daha önemlidir.

Belge sınıflandırma adımı, yanlış çıkarım şemasının uygulanmasını önler. Sistem belge tipinden emin değilse otomatik işleme devam etmek yerine inceleme kuyruğuna yönlendirebilmelidir.

İnsan incelemesi nasıl tasarlanır?

İnsan incelemesi tüm belgeleri yeniden okumak anlamına gelmemelidir. Düşük güven skorlu alanlar, iş kuralı ihlalleri veya kritik veri tipleri hedefli olarak gösterilebilir. Böylece otomasyon ile kontrol arasında ölçülebilir bir denge kurulur.

İnceleme ekranında kaynak görüntü, OCR metni, çıkarılan alan ve değişiklik geçmişi birlikte bulunmalıdır. Düzeltmelerin kayıt altına alınması hem denetim hem de gelecekteki model ve kural iyileştirmeleri için veri sağlar.

Uygulama kontrol listesi

  • Temsili ve izinli belge seti hazırlayın
  • Belge tiplerini ve zorunlu alanları tanımlayın
  • Görüntü kalitesi sorunlarını sınıflandırın
  • Alan düzeyi kabul eşikleri belirleyin
  • İnsan inceleme ve hata düzeltme akışını tasarlayın
  • API, dosya çıktısı ve hedef sistem entegrasyonunu test edin

Üretim işletimi ve izleme

Üretimde belge hacmi, sayfa sayısı, dosya boyutu ve yoğun saatler kapasite planını etkiler. İşlem kuyruğu, yeniden deneme, bozuk dosya yönetimi ve kaynak belgenin değişmez kaydı operasyon tasarımının parçası olmalıdır.

Kalite zaman içinde değişebilir. Yeni belge şablonları, farklı tarayıcılar veya kullanıcı alışkanlıkları ölçümleri etkiler. CER/WER, alan doğruluğu, inceleme oranı ve işlem süresi düzenli izlenmeli; eşikler iş riskine göre güncellenmelidir.

Teknik keşif toplantısına nasıl hazırlanılır?

İlk görüşmeden önce çözülmek istenen iş problemini, etkilenen kullanıcı gruplarını, kullanılabilecek veri kaynaklarını ve mevcut güvenlik kısıtlarını kısa bir dokümanda toplamak yararlıdır. Örnek doküman veya veri hazırlanırken gerçek üretim çeşitliliğini temsil eden, paylaşımı izinli ve kişisel veri açısından değerlendirilmiş bir alt küme seçilmelidir.

Toplantının çıktısı doğrudan teknoloji seçimi olmak zorunda değildir. Öncelikle kapsam dışı alanlar, başarı ölçütleri, veri sahipleri, yetki varsayımları ve pilot kararını etkileyen riskler netleştirilmelidir. Ayrıca kararların, açık soruların ve sorumluların kısa bir toplantı kaydında tutulması sonraki teknik değerlendirmeyi hızlandırır. Bu hazırlık, gösterişli ancak ölçülemeyen bir demo yerine doğrulanabilir bir PoC planı oluşturulmasını sağlar.

  • Birincil iş problemi ve beklenen kullanıcı sonucu
  • Temsili, izinli veri veya doküman örnekleri
  • Mevcut kimlik, yetki ve entegrasyon sınırları
  • PoC sonunda ölçülecek teknik ve operasyonel göstergeler

PoC kararından sonra

Olumlu bir PoC sonucu doğrudan geniş ölçekli yayına geçmek için yeterli değildir. Pilot aşamasında gerçek kullanıcı davranışı, veri güncelleme sıklığı, destek ihtiyacı, kapasite ve hata senaryoları izlenmelidir. Üretim kararı; teknik kalite kadar operasyon sahipliği, güvenlik onayı, maliyet görünürlüğü ve geri dönüş planına dayanmalıdır.

Mansel nasıl yardımcı olabilir?

Mansel, keşif ve teknik değerlendirmeden sınırlı PoC, pilot ve üretim planına kadar güvenlik ve veri koşullarını görünür kılan bir çalışma yaklaşımı sunar.