Att avancerad analys och Machine Learning är ett hett ämne inom IT har knappast undgått någon. Ju större hype desto fler buzzwords brukar det heta och området fullkomligen kryllar av dessa. Fler och fler är de företag som tittar mot området och de stora leverantörerna styr om sina skutor för att hävda att just de har det bästa och senaste inom området.
Något som verkligen har tagit fart de senaste åren är analys av icke-strukturerad data, det vill säga text, bilder, ljud, loggdata eller filmer. Eftersom dessa kategorier av data snabbt växer i mängd samtidigt som konkurrensen hårdnar, så ökar också värdet av att kunna dra kvalitativ information ur dem. Stora bolag som t.ex. Facebook, Linkedin och Google lägger enorma resurser på detta för att kunna ge en så relevant och personlig kundupplevelse som möjligt, de vill kunna analysera den data de samlat på sig för att bland annat kunna skicka riktad marknadsföring. Om vi säger så här, det finns en anledning till att t.ex. IBM riktar hela sin strategi mot ”Cognitive Computing” och ”Den Kognitiva Eran” med analys av icke-strukturerad data som huvudfokus.
Den lägst hängande frukten för många företag när de har börjat analysera strukturerad data är att börja analysera text. Det kan vara för att de vill få bättre förståelse för sina kunder, anställda eller kanske hur företaget ses på internet. Många företag inom konsumentmarknader bli mer och mer varse om den enorma kraft positiva eller negativa vindar på sociala media kan ha för försäljningen och varumärket.
Problemet för oss i lilla Sverige är att förmågan att analysera svensk text har varit väldigt begränsad. Metoderna som funnits har varit relativt rudimentära, även om behovet har ökat har inte metoderna förbättrats nämnvärt. År 2016 är det ingen kioskvältare att söka efter nyckelord (som kan vara felstavade), räkna ord eller definiera regler för vad som ska anses som positivt eller negativt betingat i text. Mycket mer avancerad textanalys är tekniskt möjligt, dock har det varit reserverat för engelsk text.
Men detta är på väg att ändras, och väldigt snart dessutom! Tillsammans med en partner har Advectas nu gått ut med ett paketerat erbjudande inom textanalys på svenska. Ett första steg i detta är att tillgängliggöra svensk textanalys i IBM SPSS Modeler, något som minst sagt varit efterlängtat. Med riktigt avancerade algoritmer inom det som kallas Deep Learning kan man med hjälp av neurala nätverk ta textanalys till en helt ny nivå. I fortsättningen kommer användare kunna göra sentimentanalys, concept tagging, entity extraction, ämnesmodellering, dokumentklustring med mera för att ta SPSS Modeler till nya höjder. Tekniker som tidigare enbart kunnat appliceras på engelsk text och som helt har förändrat marknader i länder med engelska som modersmål.
Användningsområden är många och i alla lägen där informationen ligger som text kan man dra nytta av det. Kanske kan ni få en bättre bild av era kunder genom att analysera mailhistorik, kundtjänstdata, textfält i enkäter eller följare på sociala medier? Kanske kan ni få en bättre bild av era produkter genom att skapa en raffinerad omvärldsanalys som går igenom recensioner, artiklar med mera? Kanske kan ni få en bättre uppfattning av produktionen genom att analysera serviceloggar och reklamationer?
En grundregel inom avancerad analys och Data Science är att ju mer data desto bättre. Även de områden där strukturerad data analyseras kan göras bättre genom att berikas med textanalys. Att ta fler bra beslut kan vara väldigt värdefullt oavsett om det är ett stort beslut som ska tas eller att det är många beslut som måste tas snabbt.
Är du intresserad av vad för typ av analys som kan göras eller vilka teknologier som ligger bakom? Kontakta mig genom att skicka ett email till gustav.eklund@advectas.se!



