Fujitsu Launches New Technologies To Protect Conversational AI From Hallucinations And Adversarial Attacks

Genudgivet af Platon

Abonnenter: 0

TOKYO, 26. september 2023 – (JCN Newswire) – Fujitsu annoncerede i dag lanceringen af to nye AI-tillidsteknologier for at forbedre pålideligheden af svarene fra konversations-AI-modeller. De nyudviklede teknologier omfatter en teknik til at detektere hallucinationer i konversations-AI-modeller - et fænomen, hvor generativ AI skaber forkert eller ikke-relateret output - og en teknik udviklet i fællesskab på dets lille forskningslaboratorium (1) ved Ben Gurion University for at opdage phishing-webadresser, der er implanteret i svarene fra AI gennem forgiftningsangreb, der injicerer falsk information.

Med de nye teknologier sigter Fujitsu mod at give virksomheder og individuelle brugere et værktøj til at evaluere pålideligheden af svar fra konversations-AI, hvilket i sidste ende bidrager til en mere sikker brug af AI på tværs af en række brugssager, herunder for virksomheder, der sigter på at implementere teknologien i faktiske operationer.

Professor Yuval Elovici, Ben Gurion University, kommenterer: "Generativ AI står som et kritisk domæne, og inden for det fremstår hallucinationsdetektionsteknologien, som Fujitsu har udviklet, som afgørende for etablering af pålidelige samtale-AI-systemer. Forskere fra Ben-Gurion University (BGU) og Fujitsu har været banebrydende for en innovativ teknik til at forbedre sikkerheden ved AI-baseret URL-filtrering mod modstridende trusler. Vores gennembrud fokuserer på tabeldata, hvilket resulterer i en mere modstandsdygtig forsvarsmekanisme mod modstridende angreb inden for AI-drevet URL-filtrering. Fremover er Fujitsu og Ben-Gurion University klar til at samarbejde om at skabe nye sikkerhedscentrerede fremskridt inden for generativ AI."

Fujitsu vil inkludere disse nye teknologier i sin samtale-AI-kernemotor, der leveres gennem "Fujitsu Kozuchi (kodenavn) - Fujitsu AI Platform", som giver brugerne adgang til en bred vifte af kraftfulde AI- og ML-teknologier. Teknologien til at detektere hallucinationer i konversations-AI vil være tilgængelig for brugere i Japan fra den 28. september 2023, og teknologien til at detektere phishing-websteders webadresser som svar på samtale-AI fra oktober 2023. De nye teknologier vil både være tilgængelige for virksomhedsbrugere som en demomiljø via Kozuchi og til individuelle brugere via et dedikeret portalwebsted (2). Fujitsu planlægger en udrulning af begge teknologier til det globale marked i fremtiden.

Fujitsu launches new technologies to protect conversational AI from hallucinations and adversarial attacks PlatoBlockchain Data Intelligence. Vertical Search. Ai. — Figur 1. Oversigt over pålidelige samtale AINyudviklede teknologier1. Teknologi til meget nøjagtig detektion af hallucinationer i svar af samtale-AI

Når de anvender konversations-AI i forretningsdrift, bruger virksomheder ofte teknologien til at udtrække information relateret til spørgsmål fra præregistrerede forretningsdata og tilføje dataene som referenceoplysninger, når de stiller spørgsmål til en ekstern samtale-AI. Selvom denne metode giver nøjagtige svar og reducerer hallucinationer, repræsenterer fuldstændig forebyggelse af hallucinationer et løbende problem, da samtale-AI i nogle tilfælde ikke er i stand til korrekt at udtrække information relateret til spørgsmål og derfor skaber urelaterede, forkerte svar. Selvom metoder til at estimere, i hvilken grad svaret fra en AI kan være en hallucination (hallucinationsscore), forbliver nøjagtig estimering af denne score en vanskelig opgave, da samtale-AI bruger forskellige forskellige sætninger til at udtrykke det samme faktum.

Baseret på observationen af, at konversations-AI ofte genererer forkert information for egennavne og tal, og indholdet af svar har en tendens til at variere med gentagne spørgsmål, har Fujitsu udviklet en teknologi til at identificere og fokusere på dele af sætninger, hvor hallucinationer sandsynligvis vil forekomme.

For at beregne en meget nøjagtig hallucinationsscore opdeler den nye teknologi først AI's svar i tre dele (emne, prædikat, objekt osv.) og identificerer derefter automatisk navngivne enheder i svaret. Som et næste trin efterlader teknologien disse navngivne enheder tomme og beder gentagne gange den eksterne AI om at definere disse specifikke udtryk mere præcist. (Figur 2)

Fujitsu benchmarked denne teknologi ved hjælp af åbne data, herunder WikiBio GPT-3 Hallucination Dataset (3) og fandt ud af, at det kunne forbedre detektionsnøjagtigheden (AUC-ROC) (4) med cirka 22 % sammenlignet med andre avancerede metoder til påvisning af AI-hallucinationer, såsom SelfCheckGPT (5).

Da konversations-AI skaber svar baseret på dets træningsdata, kan fjendtlige enheder narre AI til at skabe svar, der inkluderer manipuleret information såsom phishing-URL'er, der fører til falske websteder ved at implantere ondsindet information i AI-træningsdataene.

For at løse dette problem har Fujitsu udviklet en teknologi til at detektere manipulerede URL'er i svarene fra konversations-AI. Når teknologien identificerer en phishing-URL, sender den en advarselsmeddelelse til brugerne.

Fujitsus nye teknologi registrerer ikke kun phishing-URL'er, men øger også AI'ens modstand mod eksisterende angreb, der narrer AI-modeller til at lave en bevidst fejlvurdering for at sikre yderst pålidelige svar fra AI. Den nyudviklede teknologi udnytter en teknik, der er udviklet i fællesskab af Fujitsu og Ben-Gurion University of the Negev ved Fujitsu Small Research Lab etableret ved Ben-Gurion University. Teknologien udnytter tendensen til, at fjendtlige enheder ofte angriber en enkelt type AI-model, og detekterer ondsindede data ved at behandle information med forskellige forskellige AI-modeller og evaluere forskellen i begrundelsen for bedømmelsesresultatet.

Teknologien kan ikke kun bruges til detektering af phishing-URL'er, men også til at forhindre generelle angreb for at snyde AI-modeller, der bruger tabeldata, og kan dermed også bruges til at undgå angreb på andre tjenester.

[1] Fujitsu Small Research Lab:Initiativ, hvor Fujitsu-forskere er indlejret i teknologiinkubatorer på universiteter i Japan og internationalt for at udføre fælles forskning med nogle af de førende hjerner inden for deres områder, herunder professorer såvel som den næste generation af forskere.
[2] Individuelle brugere kan også prøve Fujitsus avancerede API'er og webapplikationer ved at oprette en konto på Fujitsu Research Portal. (Fujitsu Research Portal: portalside, der har været åben for offentligheden siden juni 2023 for at give registrerede brugere adgang til prøveversioner af Fujitsus avancerede teknologier. Fujitsu tilbyder avancerede teknologier til virksomhedsbrugere via "Fujitsu Kozuchi (kodenavn) – Fujitsu AI Platform" og til individuelle brugere via denne portalside.)
[3] WikiBio GPT-3 Hallucinationsdatasæt:Benchmark-data baseret på Wikipedia til hallucinationsdetektion
[4] AUC-ROC (areal under kurven for modtagerens driftskarakteristik):Arealet under kurvens kurve opnået, når tærskelværdien for bedømmelsen ændres i forhold til abnormitetsscoren ved at placere den sande positive rate på den vertikale akse og den falske positive rate på den vandrette akse. En tilfældig anomali score er 0.5, og et perfekt svar er 1.0. Det anses generelt for, at et vist niveau af ydeevne kan opnås, når det er højere end 0.7.
[5] SelfCheckGPT:En hallucinationsdetektionsteknologi udviklet ved University of Cambridge, Storbritannien

Fujitsus forpligtelse til målene for bæredygtig udvikling (SDG'er)

De bæredygtige udviklingsmål (SDG'er), som blev vedtaget af FN i 2015, repræsenterer et sæt fælles mål, der skal nås på verdensplan inden 2030. Fujitsus formål - "at gøre verden mere bæredygtig ved at opbygge tillid til samfundet gennem innovation" - er et løfte om at bidrage til visionen om en bedre fremtid styrket af SDG'erne.

Om Fujitsu

Fujitsus formål er at gøre verden mere bæredygtig ved at skabe tillid til samfundet gennem innovation. Som den foretrukne digitale transformationspartner for kunder i over 100 lande, arbejder vores 124,000 medarbejdere på at løse nogle af de største udfordringer, som menneskeheden står over for. Vores udvalg af tjenester og løsninger trækker på fem nøgleteknologier: Computing, Networks, AI, Data & Security og Converging Technologies, som vi samler for at levere bæredygtighedstransformation. Fujitsu Limited (TSE:6702) rapporterede en konsolideret omsætning på 3.7 billioner yen (28 milliarder USD) for regnskabsåret, der sluttede 31. marts 2023, og er fortsat den bedste digitale servicevirksomhed i Japan efter markedsandel. Find ud af mere: www.fujitsu.com.

Tryk på Kontakter:
Fujitsu Limited
Public and Investor Relations Division
Forespørgsler (https://bit.ly/3rrQ4mB)

SEO Powered Content & PR Distribution. Bliv forstærket i dag.
PlatoData.Network Vertical Generative Ai. Styrk dig selv. Adgang her.
PlatoAiStream. Web3 intelligens. Viden forstærket. Adgang her.
PlatoESG. Kulstof, CleanTech, Energi, Miljø, Solenergi, Affaldshåndtering. Adgang her.
PlatoHealth. Bioteknologiske og kliniske forsøgs intelligens. Adgang her.
Kilde: https://www.jcnnewswire.com/pressrelease/86719/3/

Tidsstempel: September 25, 2023

Tidsstempel: Mar 11, 2024

Genudgivet af Platon

TANAKA ædelmetaller til udstilling på "PCIM Europe 2023", branchens største internationale messe med speciale i kraftelektronik

Fujitsu Japan går i gang med fælles forskning for COVID-19-terapier ved hjælp af verdens hurtigste supercomputer med forskere fra RCAST, University of Tokyo

Olympus' Net-Zero Targets godkendt af SBTi

TOYOTA GAZOO Racing lancerer 2024 WRC-udfordring ved den ikoniske åbner

EazyPay og JCB underskriver overtagelsesaftale for at muliggøre accept af JCB-kort gennem deres POS- og e-handelshandlere i Kongeriget Bahrain

MHI accepterer at samarbejde med Saipem, en af Europas førende ingeniørvirksomheder om CO2-fangstteknologier

MHIEC modtager ordre om at genopbygge et affalds-til-energianlæg i Kita City, Tokyo

Om os

Vertikal søgning & Ai

perron

Stay Connected

Konto