Bygge AI-produkter med en helhetlig mental modell

Bygge AI-produkter med en helhetlig mental modell

bygge AI-produkter

Merk: Denne artikkelen er den første i en serie kalt "Dissecting AI applications", som introduserer en mental modell for AI-systemer. Modellen fungerer som et verktøy for diskusjon, planlegging og definisjon av AI-produkter av tverrfaglige AI- og produktteam, samt for justering med forretningsavdelingen. Den har som mål å samle perspektivene til produktledere, UX-designere, datavitere, ingeniører og andre teammedlemmer. I denne artikkelen introduserer jeg den mentale modellen, mens fremtidige artikler vil demonstrere hvordan du bruker den på spesifikke AI-produkter og funksjoner.

Ofte antar selskaper at alt de trenger for å inkludere AI i tilbudet er å ansette AI-eksperter og la dem spille den tekniske magien. Denne tilnærmingen fører dem rett inn i integrasjonsfeilen: selv om disse ekspertene og ingeniørene produserer eksepsjonelle modeller og algoritmer, blir utdataene deres ofte sittende fast på nivå med lekeplasser, sandkasser og demoer, og blir aldri virkelige deler av et produkt. Gjennom årene har jeg sett mye frustrasjon fra dataforskere og ingeniører hvis teknisk fremragende AI-implementeringer ikke fant veien inn i brukervennlige produkter. Snarere hadde de den ærefulle statusen som blødende eksperimenter som ga interne interessenter inntrykk av å ri på AI-bølgen. Nå, med den allestedsnærværende utbredelsen av kunstig intelligens siden utgivelsen av ChatGPT i 2022, har ikke bedrifter lenger råd til å bruke kunstig intelligens som en «fyrtårn»-funksjon for å vise frem deres teknologiske skarpsindighet.

Hvorfor er det så vanskelig å integrere AI? Det er et par grunner:

  • Ofte fokuserer team på ett enkelt aspekt av et AI-system. Dette har til og med ført til fremveksten av separate leire, for eksempel datasentrisk, modellsentrisk og menneskesentrisk AI. Mens hver av dem tilbyr spennende perspektiver for forskning, må et virkelighetsprodukt kombinere dataene, modellen og menneske-maskin-interaksjonen til et sammenhengende system.
  • AI-utvikling er en svært samarbeidende virksomhet. I tradisjonell programvareutvikling jobber man med en relativt klar dikotomi bestående av backend- og frontend-komponentene. I AI trenger du ikke bare å legge til flere forskjellige roller og ferdigheter til teamet ditt, men også sikre et tettere samarbeid mellom de forskjellige partene. De forskjellige komponentene i AI-systemet ditt vil samhandle med hverandre på intime måter. Hvis du for eksempel jobber med en virtuell assistent, må UX-designerne dine forstå prompt engineering for å skape en naturlig brukerflyt. Dataannotatorene dine må være oppmerksomme på merkevaren din og "karaktertrekkene" til den virtuelle assistenten din for å lage treningsdata som er konsistente og på linje med posisjoneringen din, og produktsjefen din må forstå og granske arkitekturen til datapipelinen for å sikre den imøtekommer styringsbekymringene til brukerne dine.
  • Når bedrifter bygger AI, undervurderer bedrifter ofte viktigheten av design. Mens AI starter i backend, er god design uunnværlig for å få den til å skinne i produksjon. AI-design flytter grensene for tradisjonell UX. Mye av funksjonaliteten du tilbyr er ikke per se synlig i grensesnittet, men "gjemt" i modellen, og du må utdanne og veilede brukerne dine for å maksimere disse fordelene. Dessuten er moderne grunnmodeller ville ting som kan produsere giftige, feil og skadelige utganger, så du vil sette opp ekstra rekkverk for å redusere disse risikoene. Alt dette kan kreve nye ferdigheter i teamet ditt, for eksempel rask konstruksjon og konversasjonsdesign. Noen ganger betyr det også å gjøre kontraintuitive ting, som å undervurdere verdien for å administrere brukernes forventninger og legge til friksjon for å gi dem mer kontroll og åpenhet.
  • AI-hypen skaper press. Mange bedrifter setter vognen foran hesten ved å hoppe inn i implementeringer som ikke er validert av kundens og markedets behov. Av og til å kaste inn AI buzzword kan hjelpe deg med å markedsføre og posisjonere deg selv som en progressiv og innovativ virksomhet, men på lang sikt må du støtte buzz og eksperimentering med reelle muligheter. Dette kan oppnås med tett koordinering mellom virksomhet og teknologi, som er basert på en eksplisitt kartlegging av markedsmuligheter til teknologiske potensialer.

I denne artikkelen skal vi konstruere en mental modell for AI-systemer som integrerer disse ulike aspektene (jf. figur 1). Det oppmuntrer byggherrer til å tenke helhetlig, skape en klar forståelse av målproduktet og oppdatere det med ny innsikt og innspill underveis. Modellen kan brukes som et verktøy for å lette samarbeid, samkjøre de forskjellige perspektivene i og utenfor AI-teamet, og bygge vellykkede produkter basert på en felles visjon. Det kan brukes ikke bare på nye, AI-drevne produkter, men også på AI-funksjoner som er integrert i eksisterende produkter.

bygge AI-produkter
Figur 1: Den mentale modellen til et AI-system

De følgende delene vil kort beskrive hver av komponentene, med fokus på deler som er spesifikke for AI-produkter. Vi vil starte med forretningsperspektivet – mulighetene på markedssiden og verdien – og deretter dykke ned i UX og teknologi. For å illustrere modellen vil vi bruke det løpende eksemplet med en copilot for generering av markedsføringsinnhold.

Hvis dette inngående pedagogiske innholdet er nyttig for deg, kan du abonner på vår adresseliste for AI-forskning å bli varslet når vi slipper nytt materiale. 

1. Opportunity

Med alle de kule tingene du nå kan gjøre med AI, kan du være utålmodig etter å bli skitne til hendene og begynne å bygge. Men for å bygge noe brukerne dine trenger og elsker, bør du støtte utviklingen din med en markedsmulighet. I den ideelle verden når muligheter oss fra kunder som forteller oss hva de trenger eller ønsker.[1] Dette kan være udekkede behov, smertepunkter eller ønsker. Du kan se etter denne informasjonen i eksisterende tilbakemeldinger fra kunder, for eksempel i produktanmeldelser og notater fra salgs- og suksessteamene dine. Ikke glem deg selv som potensiell bruker av produktet ditt – hvis du retter deg mot et problem du har opplevd selv, er denne informasjonsfordelen en ekstra fordel. Utover dette kan du også utføre proaktiv kundeundersøkelse ved å bruke verktøy som undersøkelser og intervjuer.

Jeg trenger for eksempel ikke se for langt for å se smertene ved innholdsmarkedsføring for startups, men også større selskaper. Jeg har erfart det selv — ettersom konkurransen vokser, blir utvikling av tankeledelse med individuelt, regelmessig og (!) innhold av høy kvalitet mer og mer viktig for differensiering. I mellomtiden, med et lite og travelt team, vil det alltid være ting på bordet som virker viktigere enn å skrive ukens blogginnlegg. Jeg møter også ofte folk i nettverket mitt som sliter med å sette opp en konsekvent innholdsmarkedsføringsrutine. Disse "lokale", potensielt partiske observasjonene kan valideres av undersøkelser som går utover ens nettverk og bekrefter et bredere marked for en løsning.

Den virkelige verden er litt mer uklar, og kunder vil ikke alltid komme til deg for å presentere nye, velformulerte muligheter. Snarere, hvis du strekker ut antennene dine, vil muligheter nå deg fra mange retninger, for eksempel:

  • Markedsposisjonering: AI er trendy — for etablerte virksomheter kan det brukes til å forsterke bildet av en bedrift som innovativ, høyteknologisk, fremtidssikker osv. Den kan for eksempel heve et eksisterende markedsføringsbyrå til en AI-drevet tjeneste og skille den fra konkurrentene. Men ikke gjør AI for AIs skyld. Posisjoneringstrikset skal brukes med forsiktighet og i kombinasjon med andre muligheter - ellers risikerer du å miste troverdighet.
  • Konkurrenter: Når konkurrentene dine gjør et trekk, er det sannsynlig at de allerede har gjort den underliggende forskningen og valideringen. Se på dem etter en tid - var utviklingen deres vellykket? Bruk denne informasjonen til å optimalisere din egen løsning, ta i bruk de vellykkede delene og rette opp feilene. La oss for eksempel si at du observerer en konkurrent som tilbyr en tjeneste for helautomatisert generering av markedsføringsinnhold. Brukere klikker på en "stor rød knapp", og AI går videre for å skrive og publisere innholdet. Etter litt research finner du ut at brukere nøler med å bruke dette produktet fordi de ønsker å beholde mer kontroll over prosessen og bidra med sin egen ekspertise og personlighet til skrivingen. Å skrive handler tross alt også om selvutfoldelse og individuell kreativitet. Dette er tiden for deg å gå videre med et allsidig verktøy som tilbyr rik funksjonalitet og konfigurasjon for å forme innholdet ditt. Det øker effektiviteten til brukerne samtidig som de lar dem "injisere" seg selv i prosessen når de måtte ønske det.
  • Forskrift: megatrender som teknologisk forstyrrelse og globalisering tvinger regulatorer til å skjerpe kravene sine. Regelverk skaper press og er en skuddsikker kilde til muligheter. Tenk deg for eksempel at en forskrift kommer på plass som strengt tatt krever at alle annonserer AI-generert innhold som sådan. De selskapene som allerede bruker verktøy for AI-innholdsgenerering vil forsvinne for interne diskusjoner om de ønsker dette. Mange av dem vil avstå fordi de ønsker å opprettholde et bilde av ekte tankelederskap, i motsetning til å produsere synlig AI-generert kjeleplate. La oss si at du var smart og valgte en utvidet løsning som gir brukerne nok kontroll slik at de kan forbli de offisielle "forfatterne" av tekstene. Etter hvert som den nye begrensningen introduseres, er du immun og kan løpe fremover for å dra nytte av reguleringen, mens konkurrentene dine med helautomatiserte løsninger vil trenge tid på å komme deg etter tilbakeslaget.
  • Aktiverende teknologier: Fremvoksende teknologier og betydelige sprang i eksisterende teknologier, som bølgen av generativ AI i 2022–23, kan åpne opp for nye måter å gjøre ting på, eller katapultere eksisterende applikasjoner til et nytt nivå. La oss si at du har drevet et tradisjonelt markedsføringsbyrå det siste tiåret. Nå kan du begynne å introdusere AI-hack og løsninger i virksomheten din for å øke effektiviteten til de ansatte, betjene flere kunder med de eksisterende ressursene og øke fortjenesten. Du bygger på din eksisterende ekspertise, omdømme og (forhåpentligvis velvillige) kundebase, så å introdusere AI-forbedringer kan være mye smidigere og mindre risikabelt enn det ville vært for en nykommer.

Til slutt, i den moderne produktverdenen, er muligheter ofte mindre eksplisitte og formelle og kan valideres direkte i eksperimenter, noe som øker hastigheten på utviklingen din. Således, i produktledet vekst, kan teammedlemmer komme med sine egne hypoteser uten et strengt datadrevet argument. Disse hypotesene kan formuleres på en stykkevis måte, som å endre en ledetekst eller endre den lokale utformingen av noen UX-elementer, noe som gjør dem enkle å implementere, distribuere og teste. Ved å fjerne presset for å gi a priori data for hvert nytt forslag, denne tilnærmingen utnytter intuisjonen og fantasien til alle teammedlemmer samtidig som den fremtvinger en direkte validering av forslagene. La oss si at innholdsgenereringen din går knirkefritt, men du hører flere og flere klager på en generell mangel på AI-gjennomsiktighet og forklarbarhet. Du bestemmer deg for å implementere et ekstra åpenhetsnivå og vise brukerne dine de spesifikke dokumentene som ble brukt til å generere et innhold. Teamet ditt setter funksjonen på prøve med en gruppe brukere og finner ut at de gjerne bruker den for å spore tilbake til de opprinnelige informasjonskildene. Dermed bestemmer du deg for å etablere det i kjerneproduktet for å øke bruken og tilfredsheten.

2. Verdi

For å forstå og kommunisere verdien av AI-produktet eller funksjonen din, må du først kartlegge den til en brukssituasjon – et spesifikt forretningsproblem det vil løse – og finne ut avkastningen (avkastning på investeringen). Dette tvinger deg til å flytte tankene bort fra teknologien og fokusere på brukersidefordelene ved løsningen. ROI kan måles langs forskjellige dimensjoner. For AI er noen av dem:

  • Økt effektivitet: AI kan være en booster for produktiviteten til enkeltpersoner, team og hele selskaper. For innholdsgenerering kan du for eksempel finne ut at i stedet for de 4–5 timene som normalt trengs for å skrive et blogginnlegg [2], kan du nå gjøre det på 1–2 timer, og bruke tiden du sparte på andre oppgaver. Effektivitetsgevinster går ofte hånd i hånd med kostnadsbesparelser, siden det kreves mindre menneskelig innsats for å utføre samme mengde arbeid. Dermed er denne fordelen i forretningssammenheng attraktiv både for brukere og for ledelse.
  • En mer personlig opplevelse: For eksempel kan innholdsgenereringsverktøyet ditt be brukere om å angi parametere for bedriften deres som merkevareattributter, terminologi, produktfordeler osv. I tillegg kan det spore redigeringene som er gjort av en spesifikk forfatter, og tilpasse generasjonene til den unike skriften. stilen til denne brukeren over tid.
  • Moro og nytelse: Her kommer vi inn på den emosjonelle siden av produktbruk, også kalt det "viscerale" nivået av Don Norman [3]. Hele kategorier av produkter for moro og underholdning finnes i B2C-leiren, som spill og Augmented Reality. Hva med B2B — vil du ikke anta at B2B-produkter eksisterer i et sterilt profesjonelt vakuum? I virkeligheten kan denne kategorien generere enda sterkere emosjonelle reaksjoner enn B2C.[4] For eksempel kan skriving oppfattes som en tilfredsstillende handling av selvutfoldelse, eller som en indre kamp med writer's block og andre problemer. Tenk på hvordan produktet ditt kan forsterke de positive følelsene ved en oppgave samtidig som det lindre eller til og med forvandler dens smertefulle aspekter.
  • Convenience: Hva må brukeren din gjøre for å utnytte de magiske kreftene til AI? Tenk deg å integrere innholdsgenereringscopiloten din i populære samarbeidsverktøy som MS Office, Google Docs og Notion. Brukere vil kunne få tilgang til intelligensen og effektiviteten til produktet ditt uten å forlate komforten til deres digitale "hjem". Dermed minimerer du innsatsen brukere trenger å gjøre for å oppleve verdien av produktet og fortsette å bruke det, noe som igjen øker din brukeranskaffelse og -adopsjon.

Noen av AI-fordelene – for eksempel effektivitet – kan kvantifiseres direkte for avkastning. For mindre konkrete gevinster som bekvemmelighet og nytelse, må du tenke på proxy-beregninger som brukertilfredshet. Husk at å tenke i form av sluttbrukerverdi ikke bare vil lukke gapet mellom brukerne og produktet ditt. Som en velkommen bieffekt kan det redusere tekniske detaljer i offentlig kommunikasjon. Dette vil forhindre at du ved et uhell inviterer uønsket konkurranse til festen.

Til slutt, et grunnleggende aspekt ved verdi som du bør vurdere tidlig, er bærekraft. Hvordan påvirker løsningen din samfunnet og miljøet? I vårt eksempel kan automatisert eller utvidet innholdsgenerering fortrenge og eliminere store menneskelige arbeidsbelastninger. Du vil sannsynligvis ikke bli kjent som morderen for en hel jobbkategori - dette vil tross alt ikke bare reise etiske spørsmål, men også kalle motstand fra brukere hvis jobber du truer. Tenk på hvordan du kan håndtere denne frykten. Du kan for eksempel lære brukere om hvordan de effektivt kan bruke sin nye fritid til å designe enda mer sofistikerte markedsføringsstrategier. Disse kan gi en forsvarlig vollgrav selv når andre konkurrenter tar igjen automatisert innholdsgenerering.

3. Data

For enhver form for AI og maskinlæring må du samle inn og forberede dataene dine slik at de gjenspeiler de virkelige inngangene og gir tilstrekkelige læringssignaler for modellen din. I dag ser vi en trend mot datasentrisk AI – en AI-filosofi som beveger seg bort fra endeløs justering og optimalisering av modeller, og fokuserer på å fikse de mange problemene i dataene som mates inn i disse modellene. Når du starter, er det forskjellige måter å få tak i et anstendig datasett:

  • Du kan bruke et eksisterende datasett. Dette kan enten være et standard maskinlæringsdatasett eller et datasett med et annet startformål som du tilpasser for oppgaven din. Det er noen datasettklassikere, for eksempel Datasett for IMDB-filmanmeldelser for sentimentanalyse og MNIST datasett for håndskrevet karaktergjenkjenning. Det finnes mer eksotiske og spennende alternativer, som Å fange ulovlig fiske og Hunderaseidentifikasjon, og utallige brukerkuraterte datasett på datahuber som Kaggle. Sjansene for at du finner et datasett som er laget for din spesifikke oppgave og som tilfredsstiller kravene dine er ganske små, og i de fleste tilfeller må du også bruke andre metoder for å berike dataene dine.
  • Du kan kommentere eller opprette dataene manuelt å skape de riktige læringssignalene. Manuell datakommentar – for eksempel merking av tekster med sentimentpoeng – var metoden som ble brukt i de første dagene av maskinlæring. Nylig har den gjenvunnet oppmerksomhet som hovedingrediensen i ChatGPTs hemmelige saus. En stor manuell innsats ble brukt på å lage og rangere modellens svar for å reflektere menneskelige preferanser. Denne teknikken kalles også Reinforcement Learning from Human Feedback (RLHF). Hvis du har de nødvendige ressursene, kan du bruke dem til å lage data av høy kvalitet for mer spesifikke oppgaver, som generering av markedsføringsinnhold. Annotering kan gjøres enten internt eller ved å bruke en ekstern leverandør eller en crowdsourcing-tjeneste som Amazon Mechanical Turk. Uansett, de fleste bedrifter vil ikke bruke de enorme ressursene som kreves for manuell opprettelse av RLHF-data og vil vurdere noen triks for å automatisere opprettelsen av dataene deres.
  • Så du kan legge til flere eksempler til et eksisterende datasett ved å bruke datautvidelse. For enklere oppgaver som sentimentanalyse, kan du introdusere litt ekstra støy i tekstene, bytte opp et par ord osv. For mer åpne generasjonsoppgaver er det for tiden mye entusiasme for å bruke store modeller (f.eks. grunnleggende modeller) for automatiserte generering av treningsdata. Når du har identifisert den beste metoden for å utvide dataene dine, kan du enkelt skalere dem for å nå ønsket datasettstørrelse.

Når du lager dataene dine, står du overfor en avveining mellom kvalitet og kvantitet. Du kan manuelt kommentere mindre data med høy kvalitet, eller bruke budsjettet ditt på å utvikle hacks og triks for automatisert dataforsterkning som vil introdusere ekstra støy. Hvis du går for manuell merknad, kan du gjøre det internt og forme en kultur med detaljer og kvalitet, eller crowdsource arbeidet til anonyme folk. Crowdsourcing har vanligvis lavere kvalitet, så du må kanskje kommentere mer for å kompensere for støyen. Hvordan finner du den ideelle balansen? Det er ingen ferdige oppskrifter her – til syvende og sist vil du finne din ideelle datasammensetning gjennom en konstant frem og tilbake mellom trening og forbedring av dataene dine. Generelt, når du forhåndstrener en modell, må den tilegne seg kunnskap fra bunnen av, noe som bare kan skje med en større mengde data. På den annen side, hvis du ønsker å finjustere og gi siste snev av spesialisering til en eksisterende stor modell, kan du verdsette kvalitet fremfor kvantitet. Den kontrollerte manuelle merknaden av et lite datasett ved hjelp av detaljerte retningslinjer kan være den optimale løsningen i dette tilfellet.

4. algoritme

Data er råmaterialet modellen din vil lære av, og forhåpentligvis kan du kompilere et representativt datasett av høy kvalitet. Nå ligger den faktiske superkraften til AI-systemet ditt – dets evne til å lære av eksisterende data og generalisere til nye data – i algoritmen. Når det gjelder kjerne-AI-modellene, er det tre hovedalternativer du kan bruke:

  • Spør en eksisterende modell. Avanserte LLM-er (Large Language Models) fra GPT-familien, som ChatGPT og GPT-4, samt fra andre leverandører som Anthropic og AI21 Labs er tilgjengelige for slutning via API. Med spørsmål kan du snakke direkte med disse modellene, inkludert i ledeteksten all domene- og oppgavespesifikk informasjon som kreves for en oppgave. Dette kan inkludere spesifikt innhold som skal brukes, eksempler på analoge oppgaver (få skuddspørring) samt instruksjoner for modellen å følge. For eksempel, hvis brukeren din ønsker å generere et blogginnlegg om en ny produktfunksjon, kan du be dem om å gi noen kjerneinformasjon om funksjonen, for eksempel dens fordeler og brukstilfeller, hvordan den skal brukes, lanseringsdatoen osv. Produktet ditt fyller deretter denne informasjonen inn i en nøye utformet forespørselsmal og ber LLM generere teksten. Spørring er flott for å få et forsprang på forhåndstrente modeller. Imidlertid vil vollgraven du kan konstruere med promping raskt tynnes ut over tid - på mellomlang sikt trenger du en mer forsvarlig modellstrategi for å opprettholde konkurransefortrinnet ditt.
  • Finjuster en forhåndstrent modell. Denne tilnærmingen har gjort AI så populær de siste årene. Etter hvert som flere og flere forhåndstrente modeller blir tilgjengelige og portaler som Huggingface tilbyr modelllager samt standardkode for å jobbe med modellene, er finjustering i ferd med å bli den beste metoden for å prøve og implementere. Når du jobber med en forhåndstrent modell, kan du dra nytte av investeringen som noen allerede har gjort i data, opplæring og evaluering av modellen, som allerede "vet" mye om språk og verden. Alt du trenger å gjøre er å finjustere modellen ved å bruke et oppgavespesifikt datasett, som kan være mye mindre enn datasettet som opprinnelig ble brukt til forhåndstrening. For eksempel, for generering av markedsføringsinnhold, kan du samle et sett med blogginnlegg som fungerte bra når det gjelder engasjement, og reversere instruksjonene for disse. Fra disse dataene vil modellen din lære om strukturen, flyten og stilen til vellykkede artikler. Finjustering er veien å gå når du bruker åpen kildekode-modeller, men LLM API-leverandører som OpenAI og Cohere tilbyr også i økende grad finjusteringsfunksjonalitet. Spesielt for åpen kildekode-sporet, må du fortsatt vurdere spørsmålene om modellvalg, kostnadsoverhead ved opplæring og distribusjon av større modeller, og vedlikeholds- og oppdateringsplanene for modellen din.
  • Tren din ML-modell fra bunnen av. Generelt fungerer denne tilnærmingen godt for enklere, men svært spesifikke problemer som du har spesifikk kunnskap eller anstendige datasett for. Generering av innhold faller ikke akkurat inn i denne kategorien – det krever avanserte språklige evner for å få deg i gang, og disse kan kun tilegnes etter trening på latterlig store datamengder. Enklere problemer som sentimentanalyse for en bestemt type tekst kan ofte løses med etablerte maskinlæringsmetoder som logistisk regresjon, som er beregningsmessig rimeligere enn fancy dyplæringsmetoder. Selvfølgelig er det også mellomveien for rimelig komplekse problemer som konseptutvinning for spesifikke domener, som du kan vurdere å trene et dypt nevralt nettverk for fra bunnen av.

Utover opplæringen er evaluering av primær betydning for vellykket bruk av maskinlæring. Egnede evalueringsmålinger og metoder er ikke bare viktige for en trygg lansering av AI-funksjonene dine, men vil også tjene som et klart mål for ytterligere optimalisering og som et felles grunnlag for interne diskusjoner og beslutninger. Mens tekniske beregninger som presisjon, gjenkalling og nøyaktighet kan gi et godt utgangspunkt, vil du til syvende og sist se etter beregninger som gjenspeiler den virkelige verdien som AI-en din leverer til brukerne.

5. Brukeropplevelse

Brukeropplevelsen av AI-produkter er et fengslende tema - brukere har tross alt store forhåpninger, men også frykt for å "samarbeide" med en AI som kan overlade og potensielt overliste intelligensen deres. Utformingen av dette menneske-AI-partnerskapet krever en gjennomtenkt og fornuftig oppdagelses- og designprosess. En av hovedhensynene er graden av automatisering du ønsker å gi med produktet ditt – og vel å merke, total automatisering er langt fra alltid den ideelle løsningen. Følgende figur illustrerer automatiseringskontinuumet:

bygge AI-produkter
Figur 2: Automatiseringskontinuumet til AI-systemer

La oss se på hvert av disse nivåene:

  • I det første trinnet gjør mennesker alt arbeidet, og ingen automatisering utføres. Til tross for hypen rundt AI, utføres de fleste kunnskapsintensive oppgavene i moderne selskaper fortsatt på dette nivået, noe som gir enorme muligheter for automatisering. For eksempel fungerer innholdsforfatteren som motstår AI-drevne verktøy og er overbevist om at skriving er et svært manuelt og særegent håndverk.
  • I den andre fasen av assistert AI har brukere full kontroll over oppgaveutførelsen og gjør en stor del av arbeidet manuelt, men AI-verktøy hjelper dem med å spare tid og kompensere for sine svake punkter. For eksempel, når du skriver et blogginnlegg med en stram tidsfrist, kan en siste språksjekk med Grammarly eller et lignende verktøy bli en velkommen tidsbesparelse. Det kan eliminere manuell revisjon, som krever mye av din knappe tid og oppmerksomhet, og som fortsatt kan etterlate deg med feil og oversettelser - tross alt er det menneskelig å feile.
  • Med utvidet intelligens er AI en partner som forsterker menneskets intelligens, og dermed utnytter styrken til begge verdener. Sammenlignet med assistert AI, har maskinen mye mer å si i prosessen din og dekker et større sett med ansvar, som ideer, generering og redigering av utkast, og den siste språklige kontrollen. Brukerne må fortsatt delta i arbeidet, ta beslutninger og utføre deler av oppgaven. Brukergrensesnittet skal tydelig indikere arbeidsfordelingen mellom menneske og kunstig intelligens, fremheve feilpotensialer og gi åpenhet om trinnene den utfører. Kort sagt, den "utvidede" opplevelsen guider brukere til ønsket resultat via iterasjon og foredling.
  • Og til slutt, vi har full automatisering - en spennende idé for AI-nerder, filosofer og forståsegpåere, men ofte ikke det optimale valget for virkelige produkter. Full automatisering betyr at du tilbyr én "stor rød knapp" som starter prosessen. Når AI er ferdig, står brukerne dine overfor den endelige utgangen og enten ta den eller forlate den. Alt som skjedde i mellom kan de ikke kontrollere. Som du kan forestille deg, er UX-alternativene her ganske begrenset siden det praktisk talt ikke er noen interaktivitet. Hovedtyngden av ansvaret for suksess hviler på skuldrene til dine tekniske kolleger, som må sikre en eksepsjonelt høy kvalitet på resultatene.

AI-produkter trenger spesiell behandling når det kommer til design. Standard grafiske grensesnitt er deterministiske og lar deg forutse alle mulige veier brukeren kan ta. Derimot er store AI-modeller sannsynlige og usikre - de avslører en rekke fantastiske evner, men også risikoer som giftige, feil og skadelige utdata. Fra utsiden kan AI-grensesnittet ditt se enkelt ut fordi mange av egenskapene til produktet ditt ligger direkte i modellen. En LLM kan for eksempel tolke spørsmål, produsere tekst, søke etter informasjon, oppsummere den, ta i bruk en bestemt stil og terminologi, utføre instruksjoner osv. Selv om brukergrensesnittet ditt er et enkelt chat- eller spørringsgrensesnitt, ikke la dette potensialet være usett. – For å lede brukere til suksess, må du være eksplisitt og realistisk. Gjør brukerne oppmerksomme på mulighetene og begrensningene til AI-modellene dine, la dem enkelt oppdage og fikse feil som er gjort av AI, og lær dem hvordan de kan iterere seg selv til optimale resultater. Ved å legge vekt på tillit, åpenhet og brukerutdanning kan du få brukerne til å samarbeide med AI. Mens et dypdykk i den nye disiplinen AI-design er utenfor rammen av denne artikkelen, oppfordrer jeg deg sterkt til å se etter inspirasjon ikke bare fra andre AI-selskaper, men også fra andre designområder som menneske-maskin-interaksjon. Du vil snart identifisere en rekke tilbakevendende designmønstre, for eksempel autofullføringer, ledetekstforslag og AI-meldinger, som du kan integrere i ditt eget grensesnitt for å få mest mulig ut av dataene og modellene dine.

Videre, for å levere et virkelig flott design, må du kanskje legge til nye designferdigheter til teamet ditt. Hvis du for eksempel bygger en chat-applikasjon for foredling av markedsføringsinnhold, vil du jobbe med en samtaledesigner som tar seg av samtaleflytene og "personligheten" til chatboten din. Hvis du bygger et rikt utvidet produkt som trenger å utdanne og veilede brukerne dine gjennom de tilgjengelige alternativene, kan en innholdsdesigner hjelpe deg med å bygge den riktige typen informasjonsarkitektur og legge til riktig mengde nudging og spørsmål for brukerne dine.

Og til slutt, vær åpen for overraskelser. AI-design kan få deg til å revurdere dine opprinnelige oppfatninger om brukeropplevelse. For eksempel ble mange UX-designere og produktansvarlige drillet for å minimere latens og friksjon for å jevne ut opplevelsen til brukeren. Vel, i AI-produkter kan du pause denne kampen og bruke begge til din fordel. Latens og ventetider er gode for å utdanne brukerne dine, for eksempel ved å forklare hva AI gjør for øyeblikket og indikere mulige neste trinn på deres side. Pauser, som dialog- og varslingsvinduer, kan introdusere friksjon for å forsterke menneske-AI-partnerskapet og øke åpenheten og kontrollen for brukerne dine.

6. Ikke-funksjonelle krav

Utover dataene, algoritmen og brukeropplevelsen som gjør deg i stand til å implementere en spesifikk funksjonalitet, sikrer såkalte ikke-funksjonelle krav (NFR) som nøyaktighet, latens, skalerbarhet, pålitelighet og datastyring at brukeren faktisk får den forutsatte verdien. Konseptet med NFR-er kommer fra programvareutvikling, men er ennå ikke systematisk gjort rede for i domenet til AI. Ofte blir disse kravene plukket opp på en ad hoc-måte etter hvert som de dukker opp under brukerforskning, ideer, utvikling og drift av AI-evner.

Du bør prøve å forstå og definere NFR-ene dine så tidlig som mulig siden forskjellige NFR-er vil komme til live på forskjellige punkter i reisen din. For eksempel må personvern vurderes fra det aller første trinnet i datavalg. Nøyaktigheten er mest sensitiv i produksjonsfasen når brukere begynner å bruke systemet ditt på nettet, og potensielt overvelder det med uventede input. Skalerbarhet er en strategisk vurdering som spiller inn når virksomheten din skalerer antall brukere og/eller forespørsler eller spekteret av tilbudt funksjonalitet.

Når det gjelder NFR-er, kan du ikke ha dem alle. Her er noen av de typiske avveiningene du må balansere:

  • En av de første metodene for å øke nøyaktigheten er å bruke en større modell, noe som vil påvirke ventetiden.
  • Å bruke produksjonsdata «som de er» for ytterligere optimalisering kan være best for læring, men kan bryte personvern- og anonymiseringsreglene dine.
  • Mer skalerbare modeller er generalister, noe som påvirker nøyaktigheten deres på bedrifts- eller brukerspesifikke oppgaver.

Hvordan du prioriterer de forskjellige kravene vil avhenge av de tilgjengelige beregningsressursene, UX-konseptet ditt, inkludert graden av automatisering, og virkningen av beslutningene som støttes av AI.

Nøkkelferier

  1. Start med slutten i tankene: Ikke anta at teknologi alene vil gjøre jobben; du trenger et klart veikart for å integrere AI-en din i det brukervendte produktet og utdanne brukerne dine om fordeler, risikoer og begrensninger.
  2. Markedsjustering: Prioriter markedsmuligheter og kundebehov for å veilede AI-utvikling. Ikke forhast deg med AI-implementeringer drevet av hype og uten validering på markedssiden.
  3. Brukerverdi: Definer, kvantifiser og kommuniser verdien av AI-produkter når det gjelder effektivitet, personalisering, bekvemmelighet og andre verdidimensjoner.
  4. Datakvalitet: Fokuser på datakvalitet og relevans for å trene AI-modeller effektivt. Prøv å bruke små data av høy kvalitet for finjustering, og større datasett for trening fra bunnen av.
  5. Valg av algoritme/modell: Velg det riktige nivået av kompleksitet og forsvarlighet (spørring, finjustering, trening fra bunnen av) for bruksområdet ditt, og vurder nøye ytelsen. Over tid, ettersom du tilegner deg nødvendig ekspertise og tillit til produktet ditt, vil du kanskje bytte til mer avanserte modellstrategier.
  6. Brukersentrisk design: Design AI-produkter med brukerbehov og følelser i tankene, balanser automatisering og brukerkontroll. Vær oppmerksom på "uforutsigbarheten" til sannsynlige AI-modeller, og veiled brukerne dine til å jobbe med det og dra nytte av det.
  7. Samarbeidende design: Ved å legge vekt på tillit, åpenhet og brukerutdanning kan du få brukerne til å samarbeide med AI.
  8. Ikke-funksjonelle krav: Vurder faktorer som nøyaktighet, latens, skalerbarhet og pålitelighet gjennom utviklingen, og prøv å evaluere avveiningene mellom disse tidlig.
  9. Collaboration: Fremme et tett samarbeid mellom AI-eksperter, designere, produktledere og andre teammedlemmer for å dra nytte av tverrfaglig intelligens og vellykket integrering av AI-en din.

Referanser

[1] Teresa Torres (2021). Kontinuerlige oppdagelsesvaner: Oppdag produkter som skaper kundeverdi og forretningsverdi.

[2] Orbit Media (2022). Ny bloggstatistikk: Hvilke innholdsstrategier fungerer i 2022? Vi spurte 1016 bloggere.

[3] Don Norman (2013). Utformingen av hverdagslige ting.

[4] Google, Gartner og Motista (2013). Fra markedsføring til følelser: Koble B2B-kunder til merkevarer.

Merk: Alle bildene er av forfatteren.

Denne artikkelen ble opprinnelig publisert på Mot datavitenskap og publisert på nytt til TOPBOTS med tillatelse fra forfatteren.

Liker du denne artikkelen? Registrer deg for flere AI-forskningsoppdateringer.

Vi gir beskjed når vi gir ut flere sammendragsartikler som denne.

Tidstempel:

Mer fra TOPPBOTS