Hop til indhold

Tekst til video (T2V) med avatars

Projekttitel Tekst til video (T2V) med avatars
Projekttype Anvendt forskning og udvikling
Frascati Ja
Tema Business | IT | Teknologi
Teaser Inspirerende og fagligt korrekte tekster præsenteres i videoer ved hjælp af menneskelige avatars, der gør dine videoer engagerende og personlige.
Status Igangværende
Ejer  
- Akademi Erhvervsakademi Dania
- Kontaktperson Henrik Find Fladkjær
Adjunkt
hefl@eadania.dk
61952203
Nat./Int. Nationalt
Projektperiode 01. juni 2024 - 31. marts 2025
Projektbeskrivelse  
- Projektresumé

Udviklingen af tekst til video med præsentation af en menneskelig avatar er under stor udvikling. Der er nogle store fordele ved at anvende tekst til video. Hvis vigtigt indhold i en video ændrer sig, kan det løses ved at redigere teksten og generere videoen igen. Hvis der er tale om en normal video, vil den skulle filmes og redigeres igen. Af andre fordele kan nævnes, at videoindhold har en positiv indvirkning på søgemaskineoptimering (SEO). Ved at konvertere tekst til videoer, kan man forbedre synligheden og nå ud til en bredere målgruppe.  

Der er dog også udfordringer, såsom automatiseringens kvalitet, sprogbarrierer og etiske overvejelser. Dette gør emnet interessant for forskning og udvikling. 

Med udgangspunkt i ovenstående tager mit overordnede forskningsspørgsmål udgangspunkt i en undren over, hvorfor virksomheder fortsat anvender klassisk optage- og redigeringsteknik til at udvikle forskellige instruktionsvideoer, når det er muligt at generere videoer fra tekst med præsentation af menneskelige avatars? 

Jeg er endvidere nysgerrig på at undersøge: Er der forskel på at udvikle præcise instruktionsvideoer og mere debatterende videoer?

Jeg forventer, at jeg primært vil arbejde inden for talegenren ”Den informative tale”.

- Baggrund og formål

Med den stigende popularitet af online videoindhold er der et øget behov for effektive metoder til at konvertere tekstbaseret information til videoer. Det er allerede i dag dokumenteret, at det at kombinere visuelle elementer, lyd og bevægelse i videoer giver en mere dynamisk og engagerende oplevelse end ren tekst. 

Udvikling af kvalitetsvideoer, hvor der er krav til, at budskabet formuleres meget præcist, er typisk meget omkostningskrævende. Virksomheder, undervisningsinstitutioner og medieproducenter søger derfor løsninger, der kan automatisere denne proces. 

Udvikling af T2V kan potentielt skabe stor værdi for virksomheder. Omkostningerne ved både at udvikle og vedligeholde videoer er meget lavere end, hvis videoer skal udvikles og ændres som normale videoer med medarbejdere, der skal betjene optage-, lyd- og redigeringsudstyr. Der er også tidsmæssige fordele ved at anvende T2V. Det er ens ved begge typer af videoproduktion, at der skal udvikles det indhold, der skal præsenteres i videoen. Indholdet kan anvendes på flere forskellige måder, når det drejer sig om en ”normal” video. Det kan være en tekst, der skal fortælles 100 %, som den er skrevet, hvilket med fordel kan anvendes i forbindelse med instruktioner, der skal gennemføres 100 % korrekt. Der kan også være et stikordsbaseret indhold, som en instruktør kan elaborere over, uden det følger et manuskript 100 %. I begge ”normale” videoer vil der være et behov for redigering. Der kan være pauser, der skal redigeres væk eller andre hændelser, der forstyrrer videoens indhold og budskab. I modsætning til de ”normale” videoer følger T2V 100 % det manuskript, der er indlæst. Det er her op til udvikleren af videoen af tilføje forskellig gestik, toneleje, pauser o.a. i videoen for visuelt at gøre den attraktiv for modtageren. 

For det første er der en stor besparelse ved ikke at skulle anvende et team til at optage og redigere en ”normal” video. Derudover er der en meget stor besparelse ved, at en virksomhed har mulighed for at gennemføre hurtige ændringer i forbindelse med efterfølgende opdateringer af en video. I den ”normale” video skal der skydes en ny video med samme setup som ved den oprindelige video. I forhold til T2V skal der blot foretages en redigering af teksten og videoen kan genereres på ny i løbet af relativt få minutter. 

- Aktiviteter og handling

Projektet er inddelt i fem arbejdspakker (WP), der hver er inddelt i arbejdsopgaver (T) og leverancer (D)

 

WP1: Projektledelse 

T1.1: Deltagelse i styregruppemøder 

T1.2: Deltagelse i frascatinetværk 

 

WP2: Litteratur- og teknologistudie 

T2.1: Litteraturstudie. Skal afdække den seneste forskning inden for T2V både i forhold til de teknologiske udviklinger, men også inden for den impact det har på brugerne, at videoer er med avatars 

T2.2: Forståelse af teknologien. Det er en vigtig del af projektet, at der skal udvikles T2V med avatars, så modtagerne kan vurdere kvaliteten og ikke mindst udviklingen inden for det nyeste T2V software, der anvender AI 

 

WP3: Dataindsamling 

T3.1: udfærdigelse af spørgeramme til interview 

T3.2: gennemførelse af interview 

T3.3: Udfærdigelse af spørgeskema 

T3.4: Pilottest af spørgeskema 

T3.5: Udsendelse af spørgeskema (og evt. rykkere) 

 

WP4: Databehandling og analyse 

T4.1: Analyser (meningskondensering) af interview 

T4.2: Rensning og analyser af data fra spørgeskema 

 

WP5: Kommunikation 

T5.1: Udfærdigelse af working paper 

T5.2: Udfærdigelse af ”populær”-artikel til branchetidsskrift eller -nyhedsbrev 

 

D5.1: Working paper 

D5.2: ”Populær”-artikel 

- Projektets Metode

Projektet vil have en socialkonstruktivistisk tilgang. Det enkelte menneske vil blive påvirket forskelligt på baggrund af den sociale oplevelse, det er, at der er tale om en præsentation, der er foretaget af en computergeneret avatar i forhold til et rigtigt menneske. Det skal ses i lyset af, at anvendelsen af menneskelige avatars udvikler sig hurtigt og min forventning er, at inden for en meget kort årrække kan det blive vanskeligt at se, om der er tale om et rigtigt menneske eller en avatar.  

Der vil blive udviklet et litteratur review, der viser hvilke muligheder og impact, der er i forbindelse med udvikling af T2V. 

Der vil blive gennemført kvalitative interview med relevante personer i den eller de virksomheder, der samarbejdes med.  

Der vil blive udviklet et mere generelt spørgeskema i relation til, hvordan T2V opleves. Det forventes, at det bliver sendt ud i relevante grupper på LinkedIn.  

Der vil blive foretaget analyser af, hvilken impact T2V har.   

Interviews skal primært anvendes til at opkvalificere spørgeskemaet, men det skal også anvendes indirekte til at sandsynliggøre over for den interviewede, af der ligger et forretningsmæssigt potentiale i at udvikle T2V. 

Der vil blive udviklet en spørgeramme i forbindelse med afholdelse af et eller flere semistrukturerede interviews. Dataene skal være med til efterfølgende at udvikle et spørgeskema 

Der vil blive udviklet et spørgeskema både på dansk og engelsk til anvendelse på LinkedIn. Data fra spørgeskemaet vil i et stort omfang relatere sig til den enkelte persons oplevelse af brugen af avatars i forhold til rigtige mennesker. 

Spørgeskemaets data skal anvendes 1.) i forhold til hvilke præsentationer egner sig til at anvende T2V. 2.) i forhold til hvilke krav stiller en forbruger til den anvendte avatars visuelle udtryk. 3.) i forhold til lyden; kan der arbejdes med, hvilke krav brugerne stiller til eller forventer af intonation i præsentationen.  

 

- Projektets Forventede Resultater

Min forventning er, at visse mere instruksbaserede videoer med fordel kan være T2V, og at de kan anvendes uden problemer. Min forventning er også, at for nuværende med det aktuelle software- og AI-niveau vil diskuterende personlige empatiske emner klare sig bedst med de eksisterende videoer. 

Der vil blive udviklet konkrete eksempler på instruksbaserede T2V. Det skal baseres på et samarbejde med en bank og/eller revisionsvirksomhed. 

Der skal udvikles et akademisk working paper. Derudover er ambitionen at udvikle en artikel til enten Finansforbundets årlige magasin eller FSR’s magasin ”Indblik”. 

- Projektets Forventede Effekt

Projektets impact bliver på kort sigt et output af eksempler på T2V inden for de videotyper, der har relation til de instruktionsbaserede områder. Der vil være eksempler på T2V videoer, der kan ses på en Youtube-kanal eller tilgås med QR-kode. 

I et mere langsigtet perspektiv har jeg en klar forventning om, at særligt de videoer, der har relation til præcise instruktioner, vil blive benyttet i lang højere grad end almindelige videoer. Årsagen hertil vil være, at det i instruktionsvideoer ikke er så nødvendigt med fokus på de mere empatiske elementer i videoernes indhold og præsentationerne. Som en indskudt bemærkning tror jeg, at de videoer med et mere empatisk indhold også på længere sigt vil blive en større og større del af T2V produktionen fremover. Udviklingen af software og ikke mindst IA går hurtigt. 

Udviklingen af T2V vil helt sikkert have en positiv økonomiske effekt, ikke bare i den/de brancher jeg undersøger, men vil også have effekt i alle andre brancher, der anvender video i et eller andet omfang. Undervisningssektoren og online kurser er oplagte områder. Det er min forventning, at branchen udover det økonomiske aspekt også ser T2V som en mulighed for en professionalisering af den information, der skal gives, da T2V hurtigt kan opdateres og dermed altid være korrekt.  

Tags
Deltagere
Partnere
Finansiering
Resultat
Evaluering
Formidlingsform  
- Resultatets formidling
- Resultaternes værdi
- Målgruppen
- Publikationer