Mnoho firem bojuje při nasazování AI s kvalitou dat a pouze třetina ji využívá efektivně
Spolenost Ataccama zveřejnila zprávu Data Trust Report 2025, ve které objasňuje klíčovou roli kvalitních dat pro budování firemních systémů připravených na AI. Řada firem totiž investovala do platforem s umělou inteligencí v domnění, že jejich data jsou na inovace připravena. Realita je však jiná – až 41 % organizací přiznává, že má problém s udržením konzistentní kvality dat. Často za to mohou zastaralé systémy, které nezvládají zpracovávat rostoucí objemy dat v reálném čase. Výrazný pokrok v adopci AI tak hlásí jen 33 % organizací.
Mezi klíčová zjištění z Ataccama Data Trust Report 2025 patří:
- 33 % organizací učinilo významný posun v implementaci umělé inteligence (AI).
- 68 % datových ředitelů vnímá kvalitu dat jako největší výzvu.
- Pro 41 % respondentů je náročné udržet konzistentní kvalitu dat napříč celou organizací.
- 34 % organizací čelí zpožděním při zpracování dat kvůli nedostatečné integraci datových systémů.
„K plnému využití potenciálu AI nestačí pouze obrovské objemy dat, ale také jejich důvěryhodnost. Firmy se sice snaží naplno využít datové zdroje, nicméně často narážejí na problémy spojené s nekonzistentní a nedostatečnou kvalitou dat,“ říká CEO společnosti Ataccama Mike McKee.
Efektivita AI modelů se podle něj přímo odvíjí od kvality dat, na která se spoléhají, a tak bez důvěryhodných dat organizace čelí riziku zpomaleného růstu a nízké návratnosti investic. Nedostatečná data vedou k nepřesným analýzám, zpomalují firemní provoz, způsobují plýtvání cennými zdroji a zvyšují regulační rizika. Přitom až 41 % organizací přiznává potíže s udržováním konzistentní kvality dat napříč celou firmou. To podle studie vede k rozhodování pouze na základě intuice a nepodložených odhadů.
Proč je obtížné uvést data do lepšího stavu?
Jednou z příčin špatné kvality dat je podle studie absence jednotných standardů. Bez jasně definovaných pravidel pro formáty, definice a validaci dat je pro datové ředitele obtížné nastavit centralizovaný systém řízení. Výsledkem jsou pak roztříštěné datové systémy, které mezi sebou špatně komunikují (nebo vůbec). To vede k nekonzistenci dat, omezenému přístupu k informacím, rozdílné kvalitě mezi odděleními i k technologickým neslučitelnostem, které komplikují integraci a správné využití dat v AI modelech. Až 34 % organizací čelí zpožděním při zpracování dat právě kvůli těmto překážkám.
Řešením je sjednocení datových ekosystémů a průběžná kontrola kvality dat, a to jak během přenosu, tak v uloženém stavu. Organizace by se přitom měly na stav dat zaměřit už na samém počátku datového procesu, tedy v okamžiku, kdy se data poprvé generují, shromažďují a ukládají. Firmy musejí koordinovat své úsilí při identifikaci správných dat, ať už jsou strukturovaná, či nestrukturovaná, uložená lokálně, nebo v cloudu. Tzv. datové linie pak umožňují mapovat pohyb dat mezi systémy, zvyšovat jejich transparentnost a rychle identifikovat problémy.
Investice, do které se nechce, přesto se vyplatí
Ačkoli 51 % organizací považuje kvalitu dat za prioritu pro rok 2025, často narážejí na složitost správy dat a vysoké náklady. Investice do kvalitních dat se však dlouhodobě vyplácí. Podle průzkumu Hanover Research umožňují kvalitní data 77 % organizací zvýšit provozní efektivitu, 58 % zlepšit zákaznickou zkušenost a 56 % získat konkurenční výhodu. Studie Data Trust Report 2025 proto přichází se strategiemi, které umožní organizacím provést revizi dat.