Najnowsza wersja naszego rozwiązania, DocsQuality, została wzbogacona o funkcję obliczania wartości OCRIndex. Umożliwia ona użytkownikom weryfikację, czy plik PDF przekazany do modelu LLM lub systemu obiegu dokumentów będzie poprawnie przetwarzany przez silnik rozpoznawania tekstu metodą OCR (Optical Character Recognition).
OCRIndex to miara numeryczna wskazująca, jak dobrze oprogramowanie OCR (Optical Character Recognition) może odczytać tekst z dokumentów elektronicznych, w tym obrazów lub skanowanych pism. Uwzględnia jakość obrazu, szczególnie cechy czcionki, i wykrywa wady dokumentu, takie jak kompresja, rozmycie, kontrast itp. Wyższa wartość OCRIndex sugeruje większe prawdopodobieństwo dokładnego rozpoznania znaków.
Aby uzyskać więcej informacji, proszę odwiedzić stronę DocsQuality.