Detekce anomálního chování stroje z měření hladiny hluku
Zkušený mechanik často rozpozná podezřelý stav zařízení na základě poslechu. Mikrofony a umělá inteligence mohou tuto lidskou zkušenost do značné míry nahradit. Často stačí vhodný náhled na graf časového průběhu naměřené hladiny hluku a případně pár popisných statistik časových řad, abychom snadno identifikovali neobvyklé chování stroje. Při hodnocení chování je ovšem třeba přihlédnout i k dalším atributům, jako je vyráběný produkt, obsluha, režim výroby apod. Jak se dá konkrétně postupovat, vám ukážeme na příkladu stroje na výrobu kabelů.
Analýza hladiny hluku při tažení drátu
V továrně na výrobu kabelů instalovali na stroj hrubotah několik mikrofonů. Hrubotah slouží k prvotní redukci průřezu drátu. Pokud by se hrubotah porouchal, nemohla by pokračovat navazující výroba kabelů na dalších strojích. Nainstalované mikrofony monitorují různé součásti hrobotahu, jako jsou ložiska, převodovka nebo motor.
Pro analýzu máme k dispozici záznamy hladiny hluku po minutách. Hladina hluku je standardizována na škálu 0 až 100 %. Dále víme, kdy stroj běží a jaký drát se právě táhne. Výrobní spektrum tažených drátů je poměrně široké, kabely se liší materiálem, tloušťkou a tvarem průřezu. Dá se očekávat, že pro různé výrobky naměříme na různých částech hrubotahu různé hladiny hluku. Mezi tažením jednotlivých výrobků se stroj vypíná, nastavuje se na další výrobek a vkládá se do něj nový materiál.
Cílem analýzy je nalézt standardní časový vývoj úrovně hlasitosti pro jednotlivé výrobky a mikrofony a identifikovat případné nestandardní časové řady měření. Nestandardní časové řady nemusí nutně indikovat poruchu, ale měly by být prověřeny expertem, aby bylo zřejmé, zda se jedná o poruchu stroje, chybu obsluhy, poruchu měřidel či jinou výjimku.
Abychom mohli stanovit standardní i případné nestandardní průběhy hlasitosti, je třeba naměřené hodnoty a výrobní data upravit a vyčistit. Úpravy a čištění dat ve většině projektů trvají dlouho, bez nich by však následné analýzy byly nespolehlivé, nebo dokonce chybné. V případě dat z hrubotahu se jedná především o následující úpravy:
- Standardizace času. Během období, kdy probíhalo měření, došlo k posunu letního času zpět na zimní. Časové řady úrovně hlasitosti jsme převedli na Greenwichský střední čas (GMT), aby se v řadách nevyskytovaly duplicity. Výrobní data bohužel nebylo možné na GMT převést, proto jsme výrobní sekvence zasahující do kritické hodiny, kdy se čas vrací, nakonec úplně vyřadili.
- Stanovení časových intervalů, kdy byl hrubotah v provozu ze signálů START a STOP generovaných operátorem stroje manuálním naskenováním příslušného čárového kódu. Operátor někdy zapomene signál naskenovat nebo ho naskenuje pozdě.
- Spojení výrobních dat o taženém kabelu s intervaly, kdy byl stroj spuštěn, a s naměřenými úrovněmi hlasitosti.
- Extrakce časových řad. Každá časová řada odpovídá období, kdy stroj běžel a vyrábělo se na něm.
- Odstranění pozorování, kdy mikrofony nezaznamenávaly. To se pozná podle nulové hladiny hluku. Zapnutý mikrofon vždy naměří nenulový hluk, i když hrubotah nepracuje. Některé původně ekvidistantní minutové časové řady se tak stanou neekvidistantními.
Pro identifikaci standardního a případného nestandardního průběhu časových řad je vhodné řady graficky vizualizovat. Vzhledem k očekávanému odlišnému chování pro různé výrobky je třeba komparovat řady pro každý výrobek a mikrofon odděleně. Kdybychom zobrazili všechny časové řady pro určitý výrobek a mikrofon za sebe do spojnicového grafu s ekvidistantní časovou osou, vizualizace by byla nepřehledná. Graf by byl velmi široký a přerušovaný přestávkami ve výrobě, kdy stroj neběžel nebo táhl jiný typ drátu. Časové řady je vhodné zobrazit jako paralelní křivky tak, že časová osa nebude znázorňovat aktuální čas, ale minuty uplynulé od startu hrubotahu.
Příklad komparace časových řad pro vybraný drát a mikrofon je vidět na obrázku 1. Pomocí tohoto obrázku jsme mimochodem identifikovali, že operátoři hrubotahu někdy vydávají signál STOP se zpožděním a některé řady jsme podle toho příslušně zkrátili. Na obrázku vidíme řady už zkrácené.
Obr. 1 Příklad časových řad hladiny hluku se snadno identifikovatelnými anomáliemi
Všechny časové řady mají podobný průběh nevykazující rostoucí nebo klesající trend. Variabilita řad se také téměř nemění. U delších řad můžeme na konci pozorovat nepatrný nárůst a mírné zvýšení variability. Na první pohled je však zřejmé, že většina časových řad kolísá okolo hladiny 61 % a několik málo řad kolísá okolo hladiny 73 %. Právě tyto řady jsou zřejmě anomální a bude třeba prověřit, proč byl naměřen abnormálně silný hluk.
Detekce anomálií
Rozpoznávání anomálních časových řad lze provádět manuálně i automaticky. Při manuální identifikaci prohlédne grafický záznam řad pověřený pracovník, vybere ty anomální a může rovnou přejít k vyhodnocování důvodů nestandardního chování. Automatické rozpoznávání anomálních časových řad můžeme založit na expertních pravidlech nebo použít umělou inteligenci.
Pro automatické rozpoznání anomálních časových řad je v obou variantách nutné z řad extrahovat atributy popisující jejich chování. Tyto atributy se pak vyskytnou v podmínkách expertních pravidel nebo poslouží jako vstupy do klasifikačního modelu. Atributy rozumíme zpravidla popisné statistiky charakterizující úroveň řady, její variabilitu, trend, změny trendu, náhlé výkyvy apod. Jako příklad uveďme průměry a směrodatné odchylky naměřených hodnot, prvních a případně i druhých diferencí. Pokud se v řadách objeví i náhlé skoky nebo odlehlá měření, postačí příznaky jejich výskytu, případně četnosti.
Zvolíme-li přístup k automatické identifikaci anomálií založený na expertních pravidlech, musíme nejprve taková pravidla od expertů získat. Pro časové řady z mikrofonů osazených na hrubotahu se nám osvědčila mimo jiné následující pravidla:
- Chybějící variabilita. Časová řada je konstantní, nebo téměř konstantní. Detekce takové anomálie je snadná, směrodatná odchylka řady je neobvykle nízká, nebo dokonce nulová.
- Neobvyklá úroveň. Hlasitost stroje je nižší nebo vyšší, než bývá obvyklé. I taková anomálie se snadno rozpozná. Stačí spočítat průměr nebo medián řady, a ten bude signifikantně jiný, než průměry či mediány časových řad pro stejný výrobek a mikrofon.
- Prudký pokles úrovně. Časová řada obsahuje náhlý výrazný pokles hladiny hluku, nízká hladina se zpravidla udrží až do konce řady. Takový pokles se dobře pozná z minima první diference časové řady, neboť se jedná o neobvyklou hodnotu v diferencované řadě.
Ve výčtu bychom mohli pokračovat, ale pro nalezení většiny anomálií postačí poměrně malý počet pravidel. Na pravidla lze nahlížet jako na jednoduché indikátory anomálií, ale můžeme je využít i ke kvantifikaci míry anomality. Při kvantifikaci každému pravidlu přiřadíme (většinou expertně) nějakou číselnou váhu. Posuzovanou časovou řadu necháme otestovat všemi pravidly a sečteme váhy těch pravidel, která byla splněna. Tento součet vah nazveme skóre. Skóre určuje míru anomálie dané časové řady, a pokud překročí stanovenou kritickou úroveň, řada se označí jako podezřelá a měla by být prověřena expertem.
Jestliže při označování anomálních časových řad dáme přednost přístupu založeném na strojovém učení a umělé inteligenci, musíme vytvořit model, jenž anomálii rozpozná bez předem daných pravidel. Při strojovém rozpoznávání anomálií se osvědčily seskupovací modely. Princip seskupování spočívá v tom, že se snažíme do stejné skupiny zařadit podobně se chovající časové řady. Odlišné časové řady by se naopak měly umístit do různých skupin. Každá identifikovaná skupina představuje jeden běžný profil časové řady. Pokud se nějaká řada nepodobá žádnému běžnému profilu, nepodaří se nám ji spolehlivě přiřadit do žádné skupiny a je identifikovaná jako anomální.
Během hledání vhodného seskupovacího modelu musíme stanovit počet skupin odpovídající počtu standardních profilů časových řad. V mnoha případech půjde o jediný profil tak, jak tomu bylo i u našeho příkladu na obr. 1. Přiřazení časových řad do skupin probíhá na základě vstupních atributů seskupovacího modelu, jimiž jsou popisné statistiky časových řad a popisné statistiky diferencovaných časových řad. Každá skupina je reprezentována vektorem průměrných popisných statistik, a tak je možné pro každou řadu stanovit její vzdálenosti od všech skupin. Řadu model přiřadí do skupiny, ke které má nejblíže. Pokud však je i tato nejmenší vzdálenost příliš vysoká, model označí řadu za anomální a měl by ji opět prozkoumat expert.
Obr. 2: Vzdálenost časové řady od nejbližší skupiny v seskupovacím modelu. Řady vzdálené více jak 0,7 se považují za anomální.
Vylepšování detektorů poruchy
Prezentované přístupy detekce anomálií vycházejí z dat měření hlasitosti. Umožní rozpoznat situace, kdy se případná porucha projevuje zvýšenou nebo sníženou hladinou hluku, případě kolísáním nebo náhlou změnou hluku. Nejsme však schopni detekovat poruchy, které se projeví změnou charakteru zvuku vycházejícího ze stroje. Máme na mysli různé podezřelé šelesty, chrčení, skřípání, pískání, přeskakování apod. Takové situace by zkušený mechanik také poznal poslechem, ačkoli se nemusí jednat o změnu hlasitosti.
Pro detekci podezřelých šelestů jsou ale potřeba daleko podrobnější měření než minutové hladiny hluku. Stroj si můžeme představit jako hudební nástroj, který začne při poruše vydávat neobvyklé tóny. To zjistíme tak, že analyzujeme frekvenci vycházejícího tónu. Samozřejmě, že se nejedná o čistý zvuk, jejž můžeme charakterizovat jedinou frekvencí. Zvuk ale umíme dekomponovat na směs různých frekvencí. Těmto směsím říkáme frekvenční spektra a získáváme je pomocí Fourierovy transformace.
Abychom mohli frekvenční spektra ze snímaného zvuku získat, je potřeba provádět měření hladiny hluku ve velmi krátkých intervalech v řádech desetin milisekund. Proto je nutné stroje osadit vhodnými detektory a dostatečně rychlým záznamovým zařízením. Za účelem detekce anomálních zvuků není však nutné uchovávat všechna měření. Stačí během měření transformovat naměřené hodnoty na spektra a uchovávat například minutové časové řady frekvenčních spekter.
Odvozené časové řady frekvenčních spekter se podrobí podobné analýze, jakou jsme prezentovali pro časové řady hladin hluku. Rozdíl spočívá v tom, že v případě spekter máme v každém okamžiku k dispozici hlasitosti na všech frekvencích, které se rozhodneme sledovat. Jedná se o analýzu vícerozměrných časových řad. Vícerozměrná časová řada nám poskytne mnohem více atributů než řada jednorozměrná, a tak můžeme sestavit větší počet přesnějších expertních pravidel pro detekci anomálních zvuků. Vhodnější se zde však jeví přístup založený na strojovém učení, neboť manuální sestavení pravidel nebude vzhledem k velkému počtu atributů popisujících měření zvuků pro člověka jednoduché.
Ilustrační foto: AI
Mgr. Ondřej Háva, Ph.D. Autor je senior analytik a lektor data miningu v ACREA CR. |