Hop til indhold

RAG – Talk to your data

Projekttitel RAG – Talk to your data
Projekttype Anvendt forskning og udvikling
Frascati Ja
Tema IT | Teknik
Teaser Talk To Your Data undersøger relevansen af RAG-teknologiens anvendelse koblet på virksomhedsdata i udvalgte SMV'er
Status Igangværende
Ejer  
- Akademi Erhvervsakademi Dania
- Kontaktperson Finn Vilsbæk
Adjunkt
fvil@eadania.dk
26200661
Nat./Int. Nationalt
Projektperiode 01. august 2023 - 30. juni 2025
Projektbeskrivelse  
- Projektresumé

RAG (Retrieval Augmented Generation) er et forholdsvist nyt, men meget omtalt anvendelsesområde for kunstig intelligens koblet på virksomhedsdata. Projektet Talk To Your Data undersøger relevansen af teknologien for et udvalg af små og mellemstore virksomheder i midt- og nordjylland. Udvælgelseskriteriet for de deltagende virksomheder er at de har en mængde af data, eksempelvis supportsager fra kunder i tekstformat, som de ønsker at udnytte bedre. 

Machine Learning og RAG systemer er nu mere udbredte og er efterhånden aktivt i brug hos små og mellemstore virksomheder. Nogen virksomheder bruger måske ML eller RAG i forvejen i form af automatiserede produktanbefalinger til kunder på firmaets webside, eller i form af data fra Business Intelligence løsninger osv. uden nødvendigvis at have taget stilling til, om der er flere fordele at hente, eller om de data virksomheden allerede har bliver brugt optimalt. Igennem en workshop hos virksomheden og et efterfølgende interview vil jeg se på konkrete anvendelsesmuligheder af RAG systemer i små og mellemstore virksomheder i Midt– og Nordjylland. 

- Baggrund og formål

Machine Learning er grundpillen bag AI systemer, herunder også ’Generative AI’ modeller som eksempelvis ChatGPT, Gemini og andre LLM løsninger. Med RAG kan man foretage NLP (Natural Language Processing) forespørgsler imod vektordatabaser med information om billed- eller tekstdata, og få mere akkurate og meningsfulde resultater tilbage. Det primære vidensprodukt fra dette projekt er et working paper, der redegør for resultaterne af afholdelse af workshops i virksomhederne og resultaterne af interviewundersøgelsen.

Den kvalitative interviewundersøgelse vil belyse hvilke overvejelser virksomhederne aktuelt gør sig omkring anvendelsen af egne data i et eventuelt RAG setup, og hvordan de enkelte virksomheder har oplevet workshop forløbet. 

Projektets impact er målbart igennem de resultater fra og indsigter i egne data, som virksomhederne i undersøgelsen opnår igennem workshopforløbet. Det producerede working paper diskuterer impact i de enkelte virksomheder. 

- Aktiviteter og handling

Projektet er inddelt i arbejdspakker (WP), som er underinddelt i arbejdsopgaver (T) samt leverancer (D)

 

WP1: Administration

       T1.1: Deltagelse i forskernetværk

       T1.2: Deltagelse i styregruppemøder

WP1: Administration 

T1.1: Deltagelse i forskernetværk 

T1.2: Deltagelse i styregruppemøder 

 

WP2: ML og RAG løsninger hos SMV’er i nord- og midtjylland – afdækning  

T2.1: Research ML / RAG  

T2.2: Tag kontakt til virksomheder 

T2.3: Fremstille spørgeguide 

T2.4: Kvalitativ interviewundersøgelse i tre udvalgte virksomheder ud fra spørgeguide 

 

D2.1: Working paper, der præsenterer resultaterne af interviewundersøgelsen og de praktiske resultater, der kommer ud af litteraturstudierne.
 

WP3: Udbredelse og kommunikation 

T3.1: Workshop RAG hos de deltagende virksomheder 

T3.3: Working paper publiceres på EA Viden 

- Projektets Metode

Der etableres et antal workshops hos SMV’er, der enten ikke på forhånd har kendskab til området eller kun har lidt kendskab til området i forvejen. Workshoppen (2 til 3 timer) afsluttes med et kvalitativt interview (45 minutter til en time) med virksomhedens product owner på området. 

Interviewene kodes for at identificere temaer og analyseres for at kunne vurdere paratheden i forhold til eventuelle fællesløsninger med andre virksomheder, samt at pege på problematikker og løsningsforslag, som virksomhederne allerede er opmærksomme på.

Projektets empiri udgøres af optagelser og transskriberinger af interviews foretaget under og efter workshop forløb. Data består desuden af indsamlede erfaringer fra workshops hos hvert enkelt firma, samt fra research omkring emnet og kontakter i branchen, hvor materialet til sidst kondenseres i et working paper. 

 

Foreløbigt forskningsspørgsmål:
 

  • Hvilke fælles træk i forhold til praktisk anvendelse af proprietære data i Retrieval Augmented Generation sammenhæng kan identificeres hos de deltagende virksomheder?  
  • Hvilke behov har virksomhederne tilfælles i fht. at implementere en strategi for anvendelse af RAG i deres unikke brugsscenarie?  
  • Hvordan kan en praktisk workshop designes, så den hjælper virksomhederne bedst muligt med at afdække deres behov i forhold til brugen af Retrieval Augmented Generation? 

Redegørelse for udvælgelse af virksomheder og respondenter 

Der udvælges et mindre antal virksomheder ud fra dels egen research, dels ud fra de kontakter jeg har fået stillet til rådighed fra Business Skive / Business Viborg. Virksomhederne skal være interesserede i emnet, men ikke nødvendigvis have en eksisterende erfaring på området i forvejen. Respondenterne til kvalitative interviews i de enkelte virksomheder udvælges ud fra deres roller som ’product owner’ i fht. implementeringen af en egentlig AI drevet vidensindsamling i den enkelte virksomhed. 

Kriterier for udvælgelse 

Virksomhederne skal være interesserede i at indgå i en forudgående dialog omkring emnet, og være villige til at afsætte tre til fire timer på en enkelt dag til en onsite implementeringsøvelse / workshop med praktisk anvendelse af RAG imod deres egne data. Virksomhederne skal have adgang til og have indsamlet egne data i et omfang, der retfærdiggør brugen af AI til at håndtere og analysere på disse data. 

 Afgrænsning

Projektet afgrænses til at omfatte udvalgte SMV’er i Midt- og Nordjylland.  

 

 

- Projektets Forventede Resultater

Projektet forventes at levere følgende resultater:

D2.1: Working paper, der præsenterer resultaterne af interviewundersøgelsen.

 

WP 3: Plan for samarbejde imellem SMV’er og EA Dania omkring anvendt ML

T3.1: Udfærdige bruttoliste over opgaver ifm. etablering af samarbejde imellem SMV’er og EA Dania

 

D3.1: Guide til SMV’er ift. etablering af praktiske ML løsninger.

- Projektets Forventede Effekt

Projektets potentielle impact er primært, at virksomhederne kan få et kvalificeret bud på, hvordan de bedst kan etablere anvendt Machine Learning i deres konkrete brugssituation. Et sekundært impact er, at de måske kan opnå en bedre forståelse for på hvilke andre områder, teknologien kan hjælpe dem fremadrettet.

Et tredje potentielt impact er, at vi med dette projekt ønsker at bidrage til at udvikle og udbyde et til flere fjerde semester valgfag på Datalogi, Skive.

Tags
Deltagere
Partnere
Finansiering
Resultat
Evaluering
Formidlingsform  
- Resultatets formidling
- Resultaternes værdi
- Målgruppen
- Publikationer