Rozwiązania z zakresu text mining, wykorzystujące sztuczną inteligencję, pozwalają z obszernych zbiorów treści uzyskać dokładny obraz wizerunku firmy, produktu, zachowań i potrzeb. Przykładem takiego narzędzia jest SAS® Visual Text Analytics. System wykorzystuje inteligentne algorytmy oraz techniki przetwarzania języka naturalnego (NLP) w celu automatycznego wyodrębnienia relacji i wzorów wśród danych niestrukturalnych, eliminując w ten sposób potrzebę ich manualnego przeglądania.
Analiza tekstu w trzech krokach
Proces analizy danych tekstowych składa się z trzech głównych faz:
Faza 1 – Identyfikacja źródeł danych oraz uzyskanie dostępu do nich. Potencjalne źródła to: zasoby serwerów pocztowych, przebiegi rozmów na chacie, notatki i transkrypcje rozmów Call Center, media społecznościowe, wewnątrzfirmowe repozytoria np. umów, ofert czy dokumentacji.
Faza 2 – Właściwy proces przetwarzania i analizowania danych tekstowych. W celu podniesienia jakości działania algorytmów celowe jest wykonanie automatycznej korekty pisowni.
Faza 3 – Konsumpcja wyników z użyciem wizualizacji lub wykorzystanie wyników jako danych wejściowych w modelowaniu wraz z danymi ilościowymi np. przy wykrywaniu nadużyć.
Przykładem wykorzystania narzędzi text mining jest zwalczanie procederu prania brudnych pieniędzy. System dokonuje analizy, skanując dokumenty handlowe pod kątem nielegalnej działalności. Dzięki temu specjaliści ds. przestępstw finansowych mogą nadawać odpowiednie priorytety poszczególnym sprawom. Ekstrakcja umożliwia wydobywanie z dokumentów tekstowych interesujących fragmentów, takich jak imiona i nazwiska, adresy czy określenia czasu. Inny przykład to analiza sentymentu, która pomaga monitorować postrzeganie marki, produktu czy reklamy, co jest niezwykle przydatne w planowaniu działań marketingowych.
Forrester wskazuje liderów text mining
W raporcie Forrester Wave™: AI-based Text Analytics Platform, Q2 2018 firma SAS zajęła pozycję lidera. Oferowane przez nią rozwiązania dają organizacjom możliwość przetwarzania języka naturalnego, uczenia maszynowego oraz reguł lingwistycznych przy pomocy wizualnego pulpitu nawigacyjnego. W raporcie zwrócono uwagę na kompleksowy wizualny interfejs użytkownika, łatwość obsługi, a także wykorzystanie potencjału machine learning.