Tmavé data (tzv. dark data) sú podobné ako tmavá hmota, tvoria minimálne 85% z celkového objemu, vieme o nich že existujú avšak ich pozorovanie a práca s nimi je náročná.

V súčasnosti stroje spracovávajú prevažne štruktúrované dáta, avšak svet ľudí je založený práve na neštruktúrovaných dátach, ktoré obsahujú mnoho cenných informácií. Príkladom neštruktúrovaných dát sú napr. voľne písané texty, obrázky, zvukové alebo video záznamy. Spracovanie takýchto dát nie je aktuálne veľmi rozšírené nakoľko tento proces je veľmi zložitý, či už po stránke technickej alebo algoritmickej.
Aktuálnym trendom v ukladaných dátach je fakt, že ich objem bude neustále narastať avšak popritom sa bude výrazne prehlbovať rozdiel v objeme štruktúrovaných a neštruktúrovaných dát, ktoré by sa mali stať stredobodom záujmu každej väčšej spoločnosti.


Vďaka naším expertom a ich skúsenostiam Vám vie spoločnosť met labs pomôcť práve v oblasti spracovania neštruktúrovaných textov využitím sofistikovaných nástrojov na spracovanie prirodzeného jazyka.