For å oppnå en effektiv samhandling mellom mennesker og AI, må brukergrensesnittet (UI) være designet på en måte som gjør det enkelt for brukeren å engasjere seg med AI-en. Et viktig element i dette er å ha knapper som “Godkjenn” eller “Endre”, slik at mennesket kan justere AI-ens forslag. Hvis endringer er nødvendige – for eksempel å justere AI-ens prisforslag fra 49,99 dollar til 51,99 dollar – bør grensesnittet tillate denne justeringen, samtidig som det er viktig å registrere hvorfor endringen ble gjort. For eksempel kan en rask merknad som “runding av pris for psykologisk prisfastsettelse” gi innsikt i hvorfor en pris ble justert, og dette kan brukes både for fremtidige AI-forbedringer og revisjoner.

Det er viktig å ha mekanismer for at mennesker kan gi tilbakemelding utover en enkel godkjenning eller avvisning. En merchandiser som er uenig med AI-ens anbefaling, kan for eksempel merke at “AI-en vurderte ikke lokal kunnskap om butikkens etterspørsel (som et lokalt arrangement som driver etterspørselen)”. Slike tilbakemeldinger kan loggføres og senere brukes av utviklerne til å finjustere modellen eller til å legge til nye input-funksjoner. I en kundeorientert situasjon, som en AI-basert stylist som gir antrekkforslag, bør brukeren kunne gi en tommel opp/ned eller forklare hvorfor de ikke er enige, for eksempel “Ikke min stil” eller “For dyrt”. Dette trener AI-en over tid, slik at den kan bli mer presis og bedre tilpasset individuelle preferanser.

Brukeren bør også ha tilgang til mer kontekst for å kunne ta velinformerte beslutninger. Hvis en AI foreslår en handling, kan mennesket ønske å se dataene som førte til dette forslaget – for eksempel et diagram som viser salgstallene som fikk AI-en til å anbefale en økning i lagerbeholdningen. Det bør også være mulig å simulere hva som skjer hvis et forslag ikke godkjennes, slik at man kan se potensielle konsekvenser av å ikke følge AI-ens anbefaling. Minst mulig bør relevant kontekstinformasjon vises ved siden av forslaget, som dagens lagerbeholdning eller salgsdata fra forrige uke, slik at beslutningstakeren slipper å hente informasjon fra andre kilder.

I tillegg er det avgjørende at grensesnittet er responsivt og brukervennlig. Hvis mennesker er for langsomme til å interagere med systemet, eller hvis grensesnittet er vanskelig å bruke, går mye av effekten tapt. Grensesnittet bør være designet med moderne brukeropplevelsesmetoder i tankene – tenk på rammeverk som SvelteKit eller React for smidig og reaktivt design som oppdateres når nye AI-resultater kommer inn. For eksempel kan en panel med “Ventende AI-beslutninger” oppdateres i sanntid, og nye saker AI-en trenger at mennesket vurderer vises umiddelbart. Når dette er riktig implementert, kan menneskene håndtere flere beslutninger fordi AI-en forbereder og filtrerer dem, og kun de mest nødvendige eller utfordrende beslutningene blir presentert for den menneskelige operatøren.

Selv om mennesker er i loop eller på loop, kan det oppstå situasjoner som er for komplekse eller har høy risiko for at frontlinjeoperatørene kan håndtere alene. I slike tilfeller kommer eskaleringprotokoller inn i bildet – veldefinerte prosedyrer for å eskalere beslutninger til høyere nivåer i organisasjonen eller spesialiserte team når visse kriterier er oppfylt. For eksempel, hvis en AI oppdager en plutselig etterspørselsøkning på et produkt på grunn av en viral trend som ikke er i modellen dens, kan AI-ens forslag til lagerbestillinger være upresise eller utilsiktede. I et slikt tilfelle kan en butikkleder, som kanskje også er usikker på hvordan de skal reagere på den uventede etterspørselen, ha en eskaleringprotokoll som sier at beslutningen skal gå videre til en sentral merchandise-direktør eller et krisehåndteringsteam for videre vurdering.

En viktig del av eskaleringprotokoller er tydelig definering av triggere, altså situasjoner som utløser eskalering. Dette kan være regelbaserte triggere (for eksempel: “hvis prissenkningen er større enn 30% og produktet er et flaggskip, eskaler til VP for merchandise”) eller basert på anomalier (“hvis salgsprognosefeilen er større enn X eller modellens pålitelighet er under Y, eskaler”). Triggere kan også være manuelle – en operatør kan aktivere en “Eskalere”-knapp hvis de føler at de ikke kan ta ansvar for beslutningen. Dette kan være tilfelle hvis en operatør ser at AI-ens anbefaling er potensielt problematisk eller upassende, som for eksempel en usensitiv annonse. I slike tilfeller kan eskalering være nødvendig til en høyere autoritet eller et etikkvurderingsteam.

Når eskalering skjer, bør det være en klart definert vei for hva som skjer videre. Tidsfølsomhet er kritisk i detaljhandel, for eksempel når det gjelder prisbeslutninger som må tas raskt. Protokollen kan for eksempel spesifisere at de relevante parter – som en data science-leder og en kategoriansvarlig – blir varslet umiddelbart via e-post eller Slack, og at AI-en må vente på godkjenning før videre tiltak tas. Det er også viktig at eskaleringen loggføres slik at det kan analyseres senere. Hvis det for eksempel er hyppige eskaleringer knyttet til AI-ens beslutninger i en bestemt produktkategori, kan det tyde på at AI-en trenger forbedring på dette området.

I noen tilfeller kan eskaleringprotokollen inneholde fail-safe-tiltak som kan anvendes midlertidig. Hvis for eksempel en prisbeslutning blir eskalert til en høyere leder, kan systemet midlertidig velge å ikke endre prisen, eller bruke en minimumssikker rabatt, inntil en beslutning er tatt. Dette bidrar til at virksomheten kan fortsette å operere i en forsiktig modus i påvente av videre beslutning, uten å måtte vente på en langvarig prosess.

Endelig er det nødvendig å investere i opplæring for de menneskene som skal jobbe sammen med AI-en. Det er viktig at operatørene og beslutningstakerne forstår hvordan AI-en fungerer på et konseptuelt nivå, hvilke begrensninger den har, og hvordan de skal håndtere den. Opplæringen bør inkludere forståelse av AI-ens resultater, hvordan man tolker konfidenspoeng, og hvordan man håndterer vanlige feilmodi. Dette er viktig for at menneskene som opererer AI-en, som planleggere, innkjøpere og markedsførere, skal kunne ta velinformerte beslutninger basert på de forslagene som AI-en gir.

Hvordan bruke Bayesianske prinsipper i utviklingen av produktanbefalinger

Bayesianske metoder gir en effektiv tilnærming for å lage anbefalingssystemer som både er forståelige og handlingsorienterte. Gjennom transparent og forståelig resonnering kan detaljhandelens beslutningstakere få klare innsikter i de underliggende årsakene bak produktanbefalinger. Dette gir dem mulighet til å handle på informasjonen med større tillit, ettersom innsiktene er forankret i probabilistisk logikk. For å gjøre disse prinsippene praktiske, kan vi se på et konkret eksempel: utviklingen av en bayesiansk produktanbefalingsagent.

I utviklingen av en bayesiansk produktanbefaler agent er det avgjørende å bruke Beta-distribusjoner for å modellere kundepreferanser. Beta-distribusjoner (Beta(α, β)) er ideelle for å beskrive usikkerhet og sannsynlighet når vi prøver å forutsi hvorvidt en kunde vil like eller kjøpe et produkt. Ved å bruke en slik tilnærming kan agenten begynne med en prior basert på en forhåndsforståelse (for eksempel at kunden er litt optimistisk eller skeptisk til visse produktkategorier) og gradvis justere denne forståelsen basert på de faktiske interaksjonene kunden har med produktene.

Initialisering og Oppdatering av Agenten

Når vi setter opp en bayesiansk anbefalingsagent, begynner vi med å definere en katalog over produkter som agenten kan velge fra, samt en vekt for utforskning (exploration_weight). Dette kan forstås som hvor mye agenten skal prioritere å utforske nye, usikre produkter i forhold til å anbefale produkter som kunden er mest tilbøyelig til å kjøpe.

Etter initialiseringen er en av de viktigste komponentene agentens evne til å tilpasse seg og lære av kundens interaksjoner. Hver gang en kunde engasjerer seg med et produkt – for eksempel ved å kjøpe eller vise interesse for det – justeres agentens preferanser. Dette skjer ved å oppdatere Beta-parameterne (α, β) for det aktuelle produktet, avhengig av om kunden hadde en positiv eller negativ interaksjon. Hvis en kunde gir en positiv tilbakemelding (for eksempel et kjøp), økes verdien for α. Hvis tilbakemeldingen er negativ, økes β.

Bruk av Beta-distribusjoner for Prioriteter

En viktig del av prosessen er å bestemme de innledende parameterne for Beta-distribusjonene. Dette skjer ved hjelp av data om kundens tidligere preferanser, eller i mangel på denne informasjonen, en uniform prior (Beta(1,1)), som representerer en "neutral" oppfatning om kundens smak. Hvis agenten har tilgang til informasjon om kundens affinitet til visse kategorier (for eksempel om de generelt liker teknologi eller klær), kan disse dataene brukes til å justere priorene. For eksempel, hvis en kunde har høy affinitet for teknologi, kan prioren settes til Beta(4,1), som representerer en sterk tro på at kunden vil like produkter i denne kategorien.

Oppdatering av Kundepreferanser

Når agenten får tilbakemelding fra kundens interaksjon, oppdateres Beta-distribusjonen. Dette skjer ved å endre verdiene for α og β i henhold til om tilbakemeldingen var positiv eller negativ. En positiv tilbakemelding øker α, mens en negativ tilbakemelding øker β. Etter hvert som flere interaksjoner skjer, vil agenten utvikle en mer nøyaktig forståelse av kundens preferanser. Denne prosessen er basert på Bayes’ teorem, der prioren (de innledende troene) oppdateres til en posterior (den reviderte troen) etter at ny informasjon er mottatt. Dette gir agenten en stadig mer presis modell av kundens ønsker.

Anbefalingslogikk med Thompson Sampling

Når agenten har tilstrekkelig informasjon, kan den begynne å generere produktanbefalinger. Her benyttes Thompson Sampling, en metode som balanserer utforsking og utnyttelse. Utforsking innebærer at agenten anbefaler produkter med høy usikkerhet, mens utnyttelse betyr å anbefale produkter som agenten allerede vet kunden har en høy sannsynlighet for å kjøpe. Denne metoden er svært effektiv, ettersom den kontinuerlig forbedrer seg basert på nye data, og sørger for at agenten ikke kun anbefaler det som er mest kjent, men også åpner for nye muligheter.

En sentral fordel med å bruke Beta-distribusjoner i denne konteksten er at de tillater agenten å oppdatere sin tro på en enkel og effektiv måte. I motsetning til mer komplekse metoder, krever ikke oppdateringene komplekse beregninger. Agenten kan helt enkelt justere α og β verdiene basert på tilbakemeldinger, og dermed sikre en matematisk rigorøs tilnærming uten unødvendig kompleksitet.

Videre Betraktninger

Når man utvikler en bayesiansk anbefalingssystem, er det viktig å forstå at selv om Beta-distribusjoner er en effektiv metode for å håndtere usikkerhet, kan de også ha noen begrensninger. For eksempel, hvis agenten ikke har nok interaksjoner med kunden, kan priorene være for svake til å gi presise anbefalinger. I slike tilfeller kan det være nyttig å kombinere bayesianske metoder med andre teknikker, som kollaborativ filtrering eller dyp læring, for å forbedre nøyaktigheten.

En annen viktig faktor er å kontinuerlig overvåke og evaluere anbefalingene. Selv om Beta-distribusjonene gir en god metode for å oppdatere troene, er det viktig å vurdere om agenten faktisk anbefaler de produktene som har størst verdi for kunden. For å gjøre dette kan det være nyttig å innføre mekanismer for å evaluere anbefalingene over tid og justere agentens parametere for å optimalisere resultatene.