Hlídání vašich útrat

Každou sekundou vznikne na jednu osobu na Zemi přibližně 1,5 GB dat. Kdo se ale v takovém množství má vyznat? Dříve jsme data dolovali, před několika lety jsme postoupili dál a přišla doba velkých dat, tzv. Big Data. S jejich velkými objemy se stále učíme pracovat a aplikujeme na ně postupy tzv. Data Science. A ty se vám mohou hodit i v běžném životě.

Výraz Data Science se těžko překládá, a ještě hůř vysvětluje, ale na začátek bychom mohli konstatovat, že s Data Science dokážeme v Big Data hledat určité souvislosti. Na toto téma jsme měli možnost hovořit s Bohumírem Zoubkem ze společnosti Profinit, která se problematikou Data Science zabývá na špičkové úrovni. Důkazem toho jsou jak klienti z řad finančních institucí, telekomunikačních operátorů a dalších společností, tak i fakt, že odborníci Profinitu tuto problematiku vyučují na ČVUT FEL.

Příklad první: Hlídání finančních toků

Dobře organizované rodinné finance jsou základem spokojenosti celé rodiny. To proto, že jakmile tady něco nefunguje, dochází k hádkám, nesrovnalostem, napětí a snížení úrovně rodinné pohody. Je tedy třeba pokud možno přesně znát finanční toky v domácnostech. Ale ruku na srdce - tohle není ale v mnoha našich domácnostech to, čím bychom se mohli chlubit. Utrácíme bez předchozího rozmyslu a když nám dojdou peníze, problém doprovázený nervozitou je na světě.

Představte si situaci, kdy stojíte před bankomatem ATM a zadáte si žádost o vydání nějaké částky, typicky tisícikoruny. A i když na účtu máte dostatek peněz, bankomat vám na displeji oznámí, že vám v tento okamžik vydá jen dvě stovky, protože - ač je třeba sobota - v pondělí odcházejí platby záloh na plyn a na elektřinu. A tím byste se mohli dostat do problémů, protože by vám chybělo - v případě výběru tisícikoruny - osm set na zaplacení obou pravidelných plateb.

Vyšší moc? Ne. To jen dobře nastavené procesy posoudily vaše současné možnosti a sdělují vám, že byste se mohli dostat do problémů, pokud byste vybrali víc, než si přejete. Samozřejmě, máte vše ve své hlavě a víte co děláte, ale existuje zde „něco" co vás dokáže zastavit včas. To „něco" totiž ví, že ve čtvrtek, který právě proběhl, vám většinou pravidelně přichází vaše výplata. Ta ale dodnes není připsána na vašem účtu.

Zdržení? Pozdní platba od vašeho zaměstnavatele? Není to předčasné varování, že se firma, až do minulého měsíce platící jako hodinový stroj, dostala do problémů s cash flow? Na to všechno už dnes může „vyšší moc" zareagovat, a včas vás upozornit na to, že něco není v pořádku a že byste se v pondělí nebo během velmi krátké doby mohli dostat do nějakých problémů.

A „vyšší moc" vám může na displeji nabídnout i nějaké řešení v podobě nějakého úvěru, který by vám dovolil vybrat kýženou částku, kterou zřejmě potřebujete. Protože třeba ví, že každý týden tankujete - většinou první den v týdnu - kolem 40 litrů paliva.

Tohle jsou služby, které vám například vaše banka může nabídnout díky Data Science. Jde tedy o typické řešení B2C.

Příklad druhý: Přesně cílené nabídky na základě podobnosti

Ve druhém případě se dostáváme do oblasti B2B, protože se zde pracuje s velkými daty, získanými z pohledu na větší skupinu lidí. Představte si, že jste zaměstnanec s pravidelným příjmem. Každý měsíc vám na váš účet v bance přijde podobná částka výplaty. Nakupovat chodíte jednou v týdnu většinou do podobných obchodů nebo si necháváte jednou týdně přivézt nákup, objednaný přes internet. Za měsíc načerpáte kolem 120 až 150 litrů pohonných hmot, a proto lze usuzovat, že jste často na kolech a hodně jezdíte. A takových lidí, jako jste vy, existuje spousta.

Co vás ale s nimi spojuje, je to, že na základě rozboru velkých dat máte podobný příjem, chodíte do stejných obchodů, utrácíte za podobné věci a vyčerpáte podobnou částku za pohonné hmoty. Ideální stav pro Data Science, které mohou upozornit provozovatele vašeho běžného účtu na to, že vám podobných deset lidí se chová stejně nebo hodně podobně jako vy. A tři z nich si právě pořídilo nějakou věc. Takže existuje nějaká vysoká pravděpodobnost, hodně hraničící s jistotou, že i vy se budete chovat podobně a zcela jistě si tu věc brzy pořídíte i vy. Jenže o ní nevíte.

Bohumír Zoubek, Services & Products Director společnosti Profinit, konstatuje: „Prodejce této služby samozřejmě může spustit celoplošnou kampaň na nabídku určitého zboží, její dopad ale může být zcela nulový. Může ale také doporučit tuto službu lidem, kteří jsou ‚podobní' těm, kteří si tu věc právě pořídili. A tak cíleně můžete oslovit třeba těch sedm zbývajících z výše uvedeného případu - a z nich si tu věc pořídí třeba další tři, což znamená výrazně větší úspěšnost kampaně takto oslovených zákazníků, než dodá dobře míněná a připravená reklamní plošná kampaň," dodal Zoubek.

Je tedy jasné, že Data Science je velmi dobrou metodou pro analýzy velkých dat a mohou provozovateli přinést úspěch primární, kdy může podobným lidem nabídnout nějakou in-house službu, nebo může tato data prodat dalšímu subjektu a vydělat na upozornění na adresní skupinu lidí, kteří se chovají podobně jako ti, kteří si již tu věc pořídili. Pak lze takový nástroj považovat za velmi účinný marketingový nástroj.

Nevidíme vám do talíře

Při čtení těchto řádků možná některým z vás naskakuje husí kůže, protože to všechno zní jako kapitola z Orwellovy knihy o Velkém Bratrovi. „Pokud pracujeme s daty velkých společností, dostáváme je ke zpracování depersonalizovaná, pracujeme s kódy, takže se nikdo nemusí obávat, že bychom konkrétním lidem viděli do talíře," prozradil nám Bohumír Zoubek. „Mnoho bank nebo telekomunikačních společností zaměstnává lidi, kteří se na data dívají jako na celek. Jde o to, definovat skupiny podobných lidí a vyčíst z jejich chování určité vlastnosti. To ostatně děláme i u nás. Na začátku spolupráce s bankovním, nebo telekomunikačním klientem získáme nepersonalizovaná data, která zkoumá náš odborník a dokáže definovat vztahy a vazby mezi určitými skupinami lidí - pro nás spíše objektů. A klientovi dokáže nastínit i předpokládané chování objektů."

Další možnosti Data Science - ochrana vašeho internetového bankovnictví

Autorizace a autentizace je to, na co se banky hodně soustředí. Nicméně se stává, že hacker např. do internetového bankovnictví prolomí. „Jak používáte určitý systém - a je jedno, zda je přístup přes web nebo klikáte do nějaké aplikace ve Windows - máte nějaký styl práce. Pracujete nějakou rychlostí, používáte záložky, klikáte různě rychle, skrolujete, zadáváte různé příkazy. A my dokážeme poznat, že se to najednou děje zcela jinak a upozornit vás na to, že někdo kdo právě používá vaše bankovnictví, je s největší pravděpodobností někdo zcela jiný než ten, komu to bankovnictví patří. Funguje to spolehlivě na roboty, které to zkoušejí, ale funguje to i na lidi. Náš systém odchytí zhruba 50 % případů při zároveň velmi nízké hodnotě falešných indikací, což považuji za velmi dobré číslo," přiblížil výhody řešení Zoubek.

V některých případech je dobré k chování skupin lidí znát i jejich polohu pro přesné zacílení. Pro telekomunikační operátory z hlediska geolokačních služeb je to snazší, protože ta data mají dispozici ve velkých množstvích. Pokud se spojí další, např. finanční, informace s geolokačními daty, k dispozici jsou mnohem silnější informace.

Z hlediska rozboru finanční situace existuje model, který dokáže velmi přesně stanovit výplatu nebo příjem jedince. Což je poměrně snadný úkol pro někoho, kdo je zaměstnán na hlavní poměr a dostává jednou měsíčně stále stejnou platbu, dokonce většinou chodí i ze stejného účtu. Složitější to je v případě, že u hlavního poměru existuje nějaká variabilní složka třeba podle výkonnosti nebo výkonové složky, vyplácené v různých měsících. Přesto se dá pro účely bank odhadnou příjem, který by měl tomu člověk přijít jednou v měsíci na jeho účtu. A připsání nebo naopak nepřipsání takové platby na účet může následně vyvolat další akci.

Data Science s Big Daty mají velké ambice

Z popsaných řešení plyne, že Big Data a Data Science se zároveň doplňují a jejich využití bude do budoucna hrát velkou roli. Vzniknou tak další systémy a zajímavější scénáře. Data Science je obrovským pokrokem v možnostech zpracovávání Big Data a jiný, obecně komplexněji definovatelný způsob pohledu na data přinese mnoha firmám i jednotlivcům chutné ovoce.

Zveřejněno: 10. 03. 2017