Søkemotorer har vært blant tenkologiene som har endre våre hverdager mest de siste årene. For mange bedrifter, spesielt innen bank og finans, har også automatiserte analyseverktøy vært med å endre hvordan man jobber.

Men søk og analyse slik vi kjenner det fra Google, Bing og Kvasir har en vesentlig begrensning. De kan kun lete opp informasjon med numerisk sammenheng, altså se etter de konkrete søkeordene i søkeindeksen til søkemotoren.

Med tekstutvinning (textmining, datamining) kan man ta analyser ett steg videre og også se etter mønster i store tekstmengder.

- Datautvinning er ikke trivielt verken teknisk eller analytisk på noen måte. Men det gir effekt langt utover det søk kan gjøre, sier direktør for rådgivningsavdelingen i SAS Institute, Jørn Fredriksen til Dagensit.no.

SAS Institute er ett av selskapene som har tilbudt tekstutvinning en stund, men ser at bransjen nå begynner å bli klar for å omfavne begrepet.

- Etterspørselen etter mer treffsikker informasjon øker. Det har nok blant annet mye med interessen rundt sosiale medier å gjøre, sier Fredriksen.

Han viser blant annet til at tekstutvinning kan hjelpe selskaper med å forutsi forbrukeradferd frem i tid.

- Tekstutvinning inkluderer ukjente faktorer og blir derfor mer presist. Det blir som en slags utformell brukerundersøkelse som kan forutsi kommende adferd, sier Fredriksen.

Ser sammenhengen
Med tekstutvinning kan man overvåke store deler av nettet med vanlig søk. Men i tillegg lagrer man teksten fra sidene der for eksempel selskapsnavnet opptrer. Så går systemet gjennom all teksten og begynner å se på hvilke ordsammensetninger som gjentas ofte sammen med selskapsnavnet. Dermed kan man se hva som blir sagt og skrevet om et selskap på nettet uten å måtte gjette seg til det på forhånd.

- Våre modeller vekter informasjonen ut fra kilde. En Twitter-melding får ikke samme vekt som en avisartikkel. Tekstutvinning gjør markedsovervåkning mer effektivt fordi systemet kan vurdere viktigheten av det som blir skrevet, sier Fredriksen.

Fra smugling til omdømme
Tekstutvinning kan brukes på mange områder. De aller fleste selskaper ønsker å bruke det i sin merkevarebygging og omdømmeanalyse. Men det har også vært gjort en del forsøk på å bruke slike modeller til å forutse svingninger i aksjemarkedet.

Et litt spesielt eksempel kommer fra Sverige hvor det svenske politiet brukte tekstutvinning til å se på hvordan smuglere fikk varene sine inn i Sverige. Helt overraskende viste analysen at det er veldig effektivt å legge hasj i Tupperware-bokser. De er lufttette slik at narkohundene ikke lukter narkotikaen.

- Hadde Tupperware også brukt tekstutvinning i sine analyser ville de også visst dette og kunne lagt en plan for hvordan de skulle håndtere det den dagen det kommer på nyhetene. På samme måte er systemet velegnet til å avsløre svindel fra det offentlige, sier Fredriksen.

Har du tanker om hvordan tekstutvinning kan brukes? Diskutér saken under.

Les også: - Selvangivelsen er bare en forsmak

Dumper prisene på lesebrett (Vilkår)Copyright Dagens Næringsliv AS og/eller våre leverandører. Vi vil gjerne at du deler våre saker ved bruk av lenke, som leder direkte til våre sider. Kopiering eller annen form for bruk av hele eller deler av innholdet, kan kun skje etter skriftlig tillatelse eller som tillatt ved lov. For ytterligere vilkår se her.