Want create site? Find Free WordPress Themes and plugins.

Kunstig kommunikation – Fra strukturerede data til naturligt sprog

Har du talt med din radiator i dag? Nå, ikke? Faktum er, at digitaliseringen og intelligente teknologier nu kan sætte sproget som grænseflade mellem mennesker, maskiner og ting. Vi kan tale med radiatoren om temperaturen i stuen. Digitaliseringen og intelligente teknologier ændrer simpelthen vilkår og spændvidde for professionel kommunikation. Vi kigger lidt nærmere på, hvordan vi tackler den udfordring.

Har du talt med din radiator i dag? Nå, så vidt er I måske ikke kommet derhjemme? Det er ellers ikke, fordi det ikke er teknisk muligt. Allerede nu taler millioner af mennesker med Siri, Cortana, Watson og Alexa. Det sker på smartphones, på online chatservices og med digitale assistenter derhjemme. Sproget, både det talte og det skrevne, vil i langt højere grad end før blive grænseflade mellem menneske og maskine. Sproget vil ikke længere kun forbinde os med information, men også med de fysiske ting, der omgiver os. Sproget bliver grænseflade mellem os, maskiner og ting. Vi kan tale med radiatoren om temperaturen i stuen. Det betyder, at digitaliseringen og de tilhørende intelligente teknologier simpelthen ændrer vilkår og spændvidde for professionel kommunikation. Tidligere tog kommunikation som oftest udgangspunkt i sprogets kreative og spontane, generative kraft. Nu banker strukturerede data på døren – også til kommunikationsafdelingen. Vi kigger lidt nærmere på, hvordan vi tackler den udfordring.

Afsted til Dubai

Lad os begynde med at flyve en tur til Dubai. Vi lander i lufthavnen og går så fra flyet og ned til ankomsthallen og afventer vores bagage. Hvad vi ikke ved er, at der bag os og under os kører et kæmpe bagagehåndteringssystem, som kan klare 15.000 stykker bagage i timen, og hvor 800 radiobaserede RFID-sensorer fordelt overalt i systemet hele tiden kan lokalisere hver enkelt stykke bagage – også vores! – idet bagagen passerer igennem systemet.

Et sted derhjemme

Hjemme igen fra Dubai bestiller vi en vare i en webshop. Idet vi køber varen, tildeles den et unikt nummer, og vi kan fra vores smartphone til enhver tid og fra ethvert sted logge ind på webshoppen og se, hvor langt vores pakke nu er nået i forsendelsen hjem til os. Track-and-trace, som det hedder.

Strukturerede data er fremtiden

Endnu fylder menneskesprog ikke særligt meget i de to eksempler om Dubai og webshoppen. Bagagehåndteringen i Dubai kører i et system for sig, og vi har som rejsende i ankomsthallen kun én interesse: At vores bagage er nået med frem.

Pakken fra webshoppen vil vi gerne følge lidt nøjere med i, for vi vil gerne vide, om pakken vil nå at være fremme til næste uge, hvor vi skal give pakken i gave til et familiemedlem. Her oplever vi da også, at webshoppen i samarbejde med kurérfirmaet gør oplysninger om pakkens øjeblikkelige placering og forventede ankomst tilgængelig. Her er der altså lagt stednavne og tidsestimater på som ekstra kommunikation, også for vores skyld.

Det handler altsammen om strukturerede data – som nu også gøres tilgængelige i naturligt sprog for os. Data er der jo nok af i vore dage. Big data er et faktum, som alle taler om. Men data får for alvor først anvendelighed, når de er strukturerede. Og strukturerede data får for alvor først betydning for os, når de udtrykkes i naturligt sprog som dansk, engelsk eller tysk eller et hvilket som helst andet sprog, vi kan forstå.

Hvad er strukturerede data?

Vi bliver nødt til at se lidt nærmere på, hvad strukturerede data er, for at forstå den kommunikative udfordring, som venter os som kommunikatører om ikke så længe.

Forskellen på ustrukturerede og strukturerede data er tydelig. Hvis vi tager tilfældet med vores kuffert fra rejsen til Dubai, kunne ustrukturerede data være: ”Vores kuffert, som er blå og ret tung.” Samme kuffert beskrevet med strukturerede data kunne i princippet nøjes med identifikationsnummeret på den bakke, som kufferten ligger i hele vejen fra flyets fragtrum, videre ind igennem lufthavnen og ud til bagagebåndet i ankomsthallen. Men hvis man nu af en eller anden grund supplerede med andre sensorer, som kunne scanne vægt og farve, og som via stregkoden på kuffertstrimlen på håndtaget kunne identificere kufferten som tilhørende os, kunne data i struktureret form formuleres som: ”Element 1: kuffert; Ejer: MarketCommunity; Farve: Blå; Vægt: 20 kilo”.

Det handler om den samme ting, nemlig kufferten, men i struktureret form opstiller man sine data om kufferten som et element, der tildeles et sæt attributter (egenskaber), som er objektivt og entydigt definerende og afgørbare. De strukturerede data kan Dubai lufthavn så opstille i et stort regneark. Hvert element, d.v.s. hver kuffert, har sin egen række i regnearket, og så har man defineret et antal egenskaber, hvor hver egenskab har sin egen kolonne. Med eksempelvis 15.000 kufferter, ville regnearket have 15.000 rækker dernedad, mens antallet af kolonner med attributter ville være fast defineret, for eksempel til 5 eller 10, og indholdet i cellerne i disse kolonner ville variere inden for bestemte, vedtagne værdier, og hver kuffert ville så have et sæt af attributter.

Og hvad så?

Alt det her kan forekomme uendelig omstændeligt og uendelig fjernt fra, hvad digitalisering og kunstig intelligens vil betyde for kommunikation i fremtiden. Men det, der i virkeligheden er sket i afsnittet ovenfor, er, at vi med vores kolonner med attributter koblet på rækker af elementer har lavet et skema for ’virtuel kuffert’, og ved at fylde rækker og kolonner ud kan vi modellere flere virtuelle kufferter. Det får afgørende betydning for vores kommunikative arbejde fremover.

Når vi har foretaget vores virtualisering, kan vi koble tilsvarende sensorer på det miljø, som vores virtualiserede objekter skal befinde sig i – f.eks. rejsen igennem bagagehåndteringen fra fly til bagagebånd eller rejsen fra webshop til min hjemadresse. I sidstnævnte proces skanner kurermedarbejderne med jævne mellemrum pakken fra afsender ud til kunden. Dermed har vi en solid struktur for at tilrette det pågældende miljø, så kufferthåndtering eller pakkelevering kommer til at foregå i realtid og så gnidningsløst som det er muligt.

(Hvis nogen tænker, at dette minder om noget, jeg før har skrevet i forbindelse med Industri 4.0, så husker man rigtigt).

Nu begynder kommunikationen

Og meget vigtigt – hvilket er pointen! – vi kan med strukturerede data begynde at arbejde sprogligt og kommunikativt med vores virtuelle virkelighed. Sagen er nemlig den, at succesfuld digitalisering tager udgangspunkt i strukturerede data, og hvis vi som kommunikatører ikke følger med og gør det samme, vil vi blive hægtet af.

Bindeleddet mellem den virtuelle virkelighed og den kommunikative virkelighed vælger de fleste at lægge i et opmærkningssprog, som også kan være udvekslingsformat mellem systemer, typisk formatet XML (eXtensible Markup Language).

Hvis vi nu for eksempel ikke skulle holde ferie i Dubai, men blot var mellemlandet og skulle videre med et andet fly til Shanghai, så ville de strukturerede data om vores kuffert være yderst relevante. Dubai lufthavn kunne så synkronisere data om vores kuffert videre til det flyselskab, som skulle flyve os til Shanghai, så de kunne kontrollere, at kufferten tilhørte os, og at vi stod på deres passagerlister, og at vægten var 20 kilo, så de kunne tilrettelægge lasten korrekt. Disse data kunne de sende i XML-format til flyselskabet, som skulle tage os videre til Shanghai, og om ønsket også til Shanghai lufthavn.

Natural Language Generation

Nu har vi så altså strukturerede data – eksempelvis ”Element 1: kuffert; Ejer: MarketCommunity; Farve: Blå; Vægt: 20 kilo”. Og vi vil gerne sprogliggøre disse data. Naturligt sprog, som vi taler og skriver det til dagligt, giver overblik og er vedkommende og engagerende. Det er regneark ikke – for andre end specialister.

Siden 1960’erne har man forsøgt at få computere til at ”forstå” og ”håndtere” naturligt sprog. De bestræbelser har man kaldt Natural Language Processing (NLP). Arbejdet skrider fremad, men der er langt endnu. Særligt inden for den finansielle sektor og nyhedsformidling vil man gerne gå skridtet videre og have adgang til automatisk sprogdannelse: Natural Language Generation (NLG). Målet er, at det computergenererede sprog skal være så godt, at det ikke kan skelnes fra sprog, som ”genereres” af os mennesker. Jeg vil ikke komme ind på de forskellige strategier, som de forskellige NLG-virksomheder anlægger for at nå det mål. Jeg kan blot nævne et par firmaer, hvor man kan læse mere: tyske Retresco og amerikanske Automated Insights. Men fælles er, at strukturerede data i rækker og kolonner er udgangspunktet.

Elementary, my dear Watson

At computere har det afsindigt svært med naturligt sprog – stadigvæk – står klart, hvis man forsøger at føre en fornuftig samtale med IBM’s milliondyre og prestigefyldte Watson-computer – ikke opkaldt efter Sherlock Holmes’ hjælper, men efter IBM’s første CEO, Thomas J. Watson.

Læs bare her, hvad jeg oplevede! Kontekst for samtalen er, at jeg sidder i min bil, og Watson er min assistent:

WATSON: Hi. It looks like a nice drive today. What would you like me to do?

THOMAS: Please drive me home.

WATSON: Sorry I cannot drive you there.

THOMAS: Where can you take me?

WATSON: I understand you want me to locate an amenity. I can find restaurants, gas stations and restrooms nearby.

THOMAS: Do you understand me?

WATSON: I’m not sure about that. You can say things like “Turn on my lights” or “Play some music.”

THOMAS: Please go to a restaurant.

WATSON: Of course. Do you have a specific cuisine in mind?

THOMAS: Take me to a Burger King.

WATSON: Super! I’ve found some options for you. Which one do you like?

THOMAS: Take me to the nearest one.

WATSON: Sure thing. Navigating to the first restaurant. That place gets great reviews. You’ll be there soon.

THOMAS: How great reviews?

WATSON: Unfortunately I don’t know much about the weather… I’m still learning.

Jeg er ked af at måtte sige det, men sådan en samtale er bare helt i skoven. Prøv selv her.

Meget bedre går det med den platform for ”robotjournalistik”, som Retresco tilbyder (på tysk). Washington Post var et af de mange medier, der under OL i 2016 bragte automatisk skrevne nyheder, dog på et system, der hedder Heliograf.

Hvad så nu?

Og hvad så nu? Strukturerede data er kommet for at blive, og selv om vi kommunikatører kan levere tekst, der er bedre end det meste, som kommer fra tekstrobotter, kan vi umuligt skrive tekst i realtid i de mængder, som tekstrobotterne kan. Men det, vi kan, er, at vi kan være med til at opsætte tekstrobotterne, og vi kan gå i samarbejde med lingvister og andre sprogeksperter, så vi kan være med til at udvikle robotterne. Vi kan være med til at tænke automatiseret tekst ind i nye sammenhænge, hvor det kan gøre en afgørende forskel for god usability eller kundeoplevelse. Begge dele er kæmpe udfordringer, som ikke vil blive løst endegyldigt i nærmeste fremtid.

Og ikke mindst: Vi kan fortsætte med at skrive manuelt og fortælle de budskaber og historier, som der ikke findes strukturerede data for – for strukturer er netop strukturer, og det er ofte i bruddet med strukturer og stive domænemodeller, at ny og afgørende viden og nye forretningsmuligheder opstår. Det er digitaliseringen selv det bedste bevis på!

Did you find apk for android? You can find new Free Android Games and apps.