fb
IT Systems 7-8/2020 AI a Business Intelligence 7. 10. 2020 10:06

Robotizace a kognitivní automatizace dokumentů

Díl 3: „Nákupní seznam“ při volbě technologie pro kognitivní automatizaci zpracování dokumentů

INFOMATICVítejte u třetího dílu z naší šestidílné série, která představuje technologie robotizace a kognitivní automatizace dokumentů a novinky v multikanálovém snímání dokumentů s využitím inteligentního OCR.

prvním díle jsme popsali, jakým způsobem robotizace umožňuje firmám řešit problémy s automatizací manuálních úkonů. Zároveň jsme vysvětlili důvod, proč kombinovat roboty se zpracováním dokumentů a proč je RPA technologie samotná pro tuto činnost neefektivní. V druhém díle jsme popsali technologii kognitivní automatizace dokumentů (CDA), která, jak jsme popisovali, takzvanou „prací hlavou“ dokáže porozumět obsahu dokumentu nebo emailu, v něm obsaženým informacím a dále rozhodnout, co s takovým dokumentem nebo emailem udělat. Vysvětlili jsme zároveň, proč je robotizace ve spojení s automatizací zpracování dokumentů natolik účinná pro zefektivnění obchodních procesů.

Ve třetím díle se zaměříme na funkcionality, které by vašemu řešení pro automatizaci zpracování dokumentů neměly chybět. Malý tip hned na začátek: „Potřebujete v dnešní době mnohem více, než je pouhé řešení otázky nakolik je OCR ve vytěžování dat úspěšné“!

Abychom vám technologii více přiblížili a zároveň pomohli při hodnocení nabízených řešení nebo samotných technologií, připravili jsme pro vás „Nákupní seznam“, dle kterého si tyto nutné funkce automatizace dokumentů můžete odškrtávat.

Nákupní seznam:

Distribuované snímání dokumentů

Stejně jako lze skenovat dokumenty na centrální podatelně s využitím vysokokapacitních produkčních skenerů, lze i v terénu a na pobočkách využít zařízení pro snímání dokumentů a optimalizovat náklady potřebné na svoz dokumentů, stejně jako zkrátit čas potřebný pro převedení dokumentu nebo v něm obsažených informací „do systému“. Pro účely pořizování dokumentů v bodě jejich vzniku, lze využít menší dokumentové skenery, multifunkční zařízení nebo mobilní telefony a tablety. Samozřejmostí má být centrální správa a administrace všech zařízení, která má zásadní vliv k minimalizaci celkových nákladů na vlastnictví řešení.

Multikanálové snímání

Komplexní multikanálové snímání má vyhovět potřebě konkrétního procesu nebo preferenci vašeho zákazníka a umožnit zpracování informací z různých vstupních kanálů jako dokumentové skenery, emaily, skenování prostřednictvím webových portálů, využití mobilních zařízení, chytré využití panelů multifunkčních zařízení a řízení skenovacích úloh prostřednictvím integrace do jejich ovládacích panelů nebo upload již existujících dokumentů ze složek a web portálů. Cílem multikanálového snímání je neomezovat se pouze na jeden vstupní zdroj a urychlit tak celkové obchodní procesy závislé na zpracování. V případě skenování prostřednictvím mobilních telefonů je potřeba řešit problémy s velikostí snímaného obrazu, světlem, náklonem. Proto by technologie pro integraci snímání do mobilních aplikací měla umožňovat vývojářům využít pokročilé funkce pro vedení uživatele při snímání dokumentu, kompresi, vylepšení kvality obrazu, určení typu dokumentu, vytěžování a validace dat na zařízeních.

Skenování došlé pošty

Cílem skenování došlé pošty je neomezovat software pouze pro určitý typ dokumentu nebo naopak složitě nastavovat každý typ dokumentu pro jeho zpracování do navazujícího procesu. Každé oddělení ve vaší firmě má jiné typy dokumentů a chceme-li dosáhnout jednotného skenování na recepci nebo podatelně, nebo mít jednotný tok z distribuované sítě poboček a lidí v terénu, pak musí váš software pro zpracování dokumentů a dat porozumět jakémukoliv typu dokumentu jako jsou formuláře, faktury, přepravní doklady, žádosti, objednávky, výpisy, došlé dopisy, emaily, smlouvy atd.

Klasifikace dokumentů

Dnešní software pro automatizované zpracování dokumentů musí jednoznačně podporovat pokročilé možnosti určení typu dokumentu - jeho klasifikaci. Při velkokapacitním zpracování dokumentů ve větších dávkách, stejně jako v transakčním skenování dokumentu spojeným s konkrétním případem zákazníka, lze použít učící funkce softwaru s využitím strojového učení a nebýt tak odkázáni pouze na olepování dokumentu čárovým kódem určujícím jeho typ, nebo vkládáním listu před každý dokument obsahující informaci o jeho typu. Učení klasifikace dokumentů pomocí machine learning technologie funguje na principu učení dle vzorů. Software dostane na začátku příklady různých typů dokumentů, při učení si vytvoří jednotlivé virtuální přihrádky, kam si odlišné typy dokumentu uloží a následné zpracování probíhá porovnáním dle vytvořeného vzorníku strojovým učením. Stejně jako u lidí, tak i u softwaru má následně probíhat učení za pochodu, kdy software nadále vylepšuje svoje vzorové sady nebo se učí nové typy dokumentů. Strojové učení využívá k automatizaci klasifikace typů dokumentů funkce porozumění vzhledu dokumentu, posouzení obsahu dokumentu pro určení jeho typu nebo pravidel s využitím regulárních výrazů.

Separace dokumentů

Software pro automatizované zpracování dokumentů má mít inteligenci, i v tak zdánlivě jednoduché věci jako je oddělování/separace jednotlivých dokumentů při zpracování. Nicméně představte si, že ne vše prochází přes podatelnu s fyzickou přípravou před skenováním, ale mnohé dokumenty jsou přijímané například emailem od dodavatelů ve formě PDF souborů, jež tvoří přílohy zpráv. Pak i samotná separace dokumentů může fungovat s využitím strojového učení a neustálým porovnáváním prvních stran dle své databáze pro strojové učení a v ní vytvořených příkladů a automatizovat příjem dokumentů a jejich správnou separaci na jednotlivé dokumenty pro další zpracování.

Vytěžování dat

Dospělý software pro kognitivní zpracování dokumentů nesmí být omezený pouze na určitý typ dokumentu nebo dat, ze kterého je schopen vytěžovat obsah – vaše data. V podstatě existují tři typy dokumentů. Strukturovaný a vzhledem pevně daný formulář, kde víme, jaká data hledáme a kde se nalézají. Například faktura nebo objednávka, patří do polostrukturovaného typu dokumentu, neboť víme, které data na faktuře hledáme, ale neznáme jejich umístění. Třetí typ dokumentů tvoří dopisy, žádosti, stížnosti, tedy všechny typy dokumentů, kde neznáte ani obsah, ani jejich strukturu a tím se řadí do kategorie nestrukturovaných. Kognitivní automatizace zpracování dokumentu musí vytěžovat data, ať už se jedná o tištěný text, ručně psaný text, čárové kódy, případně různé typy zaškrtávacích políček a boxů. Samotná interpretace výsledků z OCR nástroje není dostatečná. Inteligence přichází až ve chvíli, kdy je řešení připravené tato data pochopit, správně naformátovat a následně interpretovat ve formátu požadovaném navazujícím procesem.

Validace dat / Automatická pravidla / Párování databáze

Intuitivní prostředí pro validaci dat je pro řešení zpracování dokumentů a dat zásadní. Vždy se stane, že některá data nejsou spolehlivě vytěžena, a je nutný zásah člověkem. V takovém případě software musí poskytovat jednoduché rozhraní umožňující provést rychle opravu a pustit data dále do navazujících procesů. Další zásadní funkcí řešení pro zpracování jsou automatické validace. Lze automatizovat výpočtové funkce nad vytěženými daty, uplatnit pravidla správnosti očekávaných dat nebo ověřovat data oproti číselníkům a databázím. Zde pak lze s využitím fuzzy logiky určující míru pravděpodobnosti, určit správné výsledky oproti existující databázi (například určení správného dodavatele – název, adresa, číslo atd.) i s obsahem velkého množství záznamů.

Strojové učení dokumentů a dat (Machine-learning)

Strojové učení je pro spolehlivý systém pro digitalizaci a automatizaci obzvláště důležité. Využití umělé inteligence v automatizovaném učení systému v přípravě i průběhu jeho používání neustále zvyšuje úspěšnost klasifikace a vytěžování dat a snižuje náklady na provoz řešení i jeho údržbu.

Zpracování přirozeného jazyka (Natural Language Processing) a nestrukturovaného obsahu

Zpracování přirozeného jazyka je další klíčový algoritmus umělé inteligence, který pomáhá lépe porozumět obsahu a sentimentu nestrukturovaných dokumentů (jako jsou emaily, dopisy a smlouvy), aniž by je lidé museli dopředu číst. Lze tak automaticky nejen rozpoznat, zda se obdržená stížnost týká konkrétní služby, ale zároveň i sentiment a povahu s jakým důrazem zasílatel konkrétní stížnost napsal. Následně lze prioritizovat, zasílat okamžité notifikace nebo se jinak věnovat různým povahám vyhodnoceného obsahu dokumentů. Kognitivní automatizace dokumentů musí tyto funkce přímo obsahovat, případně využívat cloudové služby třetích stran jako je Microsoft nebo Google prostřednictvím REST služeb.

Export dokumentů a dat a integrace

Podpora exportu dokumentů a dat do navazujících systémů je dnes další z funkcí, která na seznamu nesmí chybět. V ideálním případě již existuje předem připravený propojovací můstek mezi systémem automatizace zpracování dokumentů a navazujícím systémem (např. SAP, Oracle, Web Portal, Sharepoint nebo jiné ERP, ECM systémy). Případně pro systémy, které jsou složité pro přístup přes API rozhraní nebo je investice do jejich úpravy nákladná, lze využít právě robotizaci, kde lze prostřednictvím robota zapisovat data do aplikací, aniž bychom na jejich straně učinili jakoukoliv změnu.

Analytika zpracování

Dnešní software obsahuje kromě samotných funkcí pro zpracování i inteligentní nástroje pro analyzování příchozích a zpracovávaných dat, stejně jako sledování produktivity systémů, uživatelů a plnění stanovených SLA cílů celkových procesů. Pomocí analytiky, která nabízí dynamické dashboardy, lze účinně sledovat a vyhodnocovat stav celkového řešení a tím se účinně vracet k jeho případným úpravám nastavení nebo rozvoji znalostí uživatelů.

Specifické úpravy projektů zpracování

Žádné dva projekty nejsou obvykle stejné. Software pro zpracování dokumentů by měl jednoduše umožnit určité vlastní úpravy pomocí skriptování a umožnit zpracovat data dle konkrétních požadavků navazujících aplikací. Schopnost přidávat skripty do projektů zpracování a jejich snadné ladění je důležité proto, aby systém udělal přesně to, co je požadováno celkovým obchodním procesem.

Integrace s RPA a BPM

Propojení robotů s automatizací zpracování dokumentů a dat je po odhalení výše uvedeného nákupního seznamu zase o krok zřejmější. Pokud roboti dokážou v rámci své konfigurace zavolat OCR řešení, vytěžit obsah například z emailu a dle povahy obsahu rozhodnout o dalším kroku v jejich činnosti, lze považovat celé spojení robotizace a kognitivního zpracování dokumentů za více automatizované. Stejně tak integrace do komplexní platformy pro řízení procesů (BPM) je zásadní pro digitalizaci celkových firemních procesů. Lze následně lehce odchytit a okamžitě řešit výjimky ve zpracování, konkrétní obchodní pravidla atd.

Jakékoli řešení kognitivní automatizace zpracování dokumentů by mělo být součástí širší platformy, která poskytuje tyto robotické a procesní schopnosti, pro zajištění konzistentní strategie ve vývoji a postupné digitalizaci veškerých firemních procesů. Jednoduše řečeno procesní řízení vám umožňuje řídit, sledovat a vyhodnocovat kompletní firemní procesy, kdy roboti ve spojení z automatizací zpracování dokumentů a dat zase přinášejí automatizaci do těch částí procesů, kde lze uspořit na čase a nákladech na jinak běžnou a manuální lidskou činnost uživatelů.

Příště

příštím díle se podrobněji podíváme na dva faktory, kterými měříme úspěšnost kognitivní automatizace dokumentů – přesnost OCR a produktivity uživatelů.

Tomáš Dolejš Tomáš Dolejš
Autor článku je ředitelem společnosti INFOMATIC.
INFOMATIC s.r.o.
solutions@infomatic.cz
https://www.infomatic.cz

Kalendář akcí
Konference - Semináře - Školení
Časopis IT Systems/Speciál
Aktuální číslo časopisu IT Systems Aktuální číslo časopisu příloha #1
Archív časopisu IT Systems
IT Systems 10 IT Systems 9 IT Systems 7-8 IT Systems 6
Archív časopisu IT Systems Special
Aktuální číslo časopisu příloha #1 Aktuální číslo časopisu příloha #1 Aktuální číslo časopisu příloha #1 Aktuální číslo časopisu příloha #1