Vylepšení skenování - prázdné stránky, otáčení, vylepšení UI
- Oct 31, 2022
-
-
Jiří Setnička authored
-
Jiří Setnička authored
Autodetekujeme podle QR kódu při skenování a uložíme detekované otočení do databáze. Úpravy ve frontendu také jen zapisují otočení do databáze a teprve finální vyzobání stránek z PDF provede přes konstrukcí finálních PDF transformaci stránek. Issue #279
-
Jiří Setnička authored
Preloadovat všechno může být u větších zpracování docela brutální operace, ale preload nejvýše 3 předchozích a následujících skenů zní rozumně. Issue #279
-
Jiří Setnička authored
Odhadnuté skeny lze zpracovat, ale zobrazují varování. Frontend umí odhad označit za potvrzeny (a tím změnit stav z probably_XXX na XXX). Issue #279
-
Jiří Setnička authored
Automaticky odhadujeme prázdné stránky a při oboustranném skenování také pokračující stránky (sudé navazující stránky bez kódu, co nejsou prázdné). Příprava pro #279
-
Jiří Setnička authored
-
Jiří Setnička authored
Zatím nevyužito, bude použito v dalších commitech.
-
Jiří Setnička authored
Navazujeme na vyprahovaný černobílý obrázek, který používá detekce QR kódů. Pokud žádný QR kód nenajdeme, tak provádíme: * ořez 10 pixelů z každé strany pro odstranění divných hran ze skeneru * jeden krok eroze maticí 3x3 pro odstranění šumu a smetí na skeneru (pro každý pixel vezmeme maximum z jeho 3x3 okolí = eroze černých oblastí) * spočítáme entropii obrázku (skrze metodu PIL.Image.entropy()) Pokud spočítaná entropie překročí threshold 0.005, tak stránku odhadneme za plnou, jinak ji odhadneme za prázdnou. Testování thresholdu na Xerox scanneru, seřazené podle entropie: * prázdná úplně bílá stránka (uměle vyrobená): 0.0 * prázdná nezmačkaná stránka: 0.0000054647 * prázdná zmačkaná a natržená stránka: 0.0000314348 * vygenerované PDF s hlavičkou protokolu (neprošlo skenem, čisté PDF): 0.0166886208 * sken ručních zápisků na kostičkovaný papír (popsaná 1/4 stránky): 0.0764304045 * vybledlá pomačkaná faktura vytisklá s docházejícím tonerem: 0.0833685388 * sken ručních zápisků na kostičkovaný papír (popsána 1/2 stránky): 0.1503896076 * nějaký vyplněný formulář (tisk + propiska, nezmačkaný): 0.2290705466 * sken ručních zápisků na kostičkovaný papír (popsána celá stránka, hodně škrtání): 0.2393648031 Zatím není informace využitá, použije se v dalších commitech.
-
Jiří Setnička authored
Použit práh 180 (value > 180 = bílý pixel). Detekuje QR kódy lépe, než detekce na šedém obrázku. Obrázek pro zobrazení při třídění ukládáme barevný, předtím byl šedý.
-
- Oct 29, 2022
-
-
Jiří Setnička authored
Issue #285
-