Fujitsu lanserar ny teknik för att skydda konversations-AI från hallucinationer och motstridiga attacker

Återutgiven av Platon

anhängare: 0

TOKYO, 26 september 2023 – (JCN Newswire) – Fujitsu tillkännagav idag lanseringen av två nya AI-förtroendeteknologier för att förbättra tillförlitligheten hos svaren från konversationsbaserade AI-modeller. De nyutvecklade teknologierna inkluderar en teknik för att upptäcka hallucinationer i konversationsbaserade AI-modeller – ett fenomen där generativ AI skapar felaktiga eller orelaterade utdata – och en teknik som utvecklats gemensamt vid dess lilla forskningslabb (1) vid Ben Gurion University för att upptäcka webbadresser för nätfiskewebbplatser implanterade i svaren från AI genom förgiftningsattacker som injicerar falsk information.

Med den nya tekniken strävar Fujitsu efter att ge företag och enskilda användare ett verktyg för att utvärdera tillförlitligheten av svar från konversations-AI, vilket i slutändan bidrar till en säkrare användning av AI i en rad användningsfall, inklusive för företag som strävar efter att implementera tekniken i faktiska operationer.

Professor Yuval Elovici, Ben Gurion University, kommenterar: "Generativ AI står som en kritisk domän, och inom den framstår den hallucinationsdetekteringsteknologi som Fujitsu har utvecklat som avgörande för att etablera pålitliga konversations-AI-system. Forskare från Ben-Gurion University (BGU) och Fujitsu har banat väg för en innovativ teknik för att förbättra säkerheten för AI-baserad URL-filtrering mot motstridiga hot. Vårt genombrott fokuserar på tabelldata, vilket resulterar i en mer motståndskraftig försvarsmekanism mot kontradiktoriska attacker inom området för AI-driven URL-filtrering. I framtiden kommer Fujitsu och Ben-Gurion University att samarbeta för att skapa nya säkerhetscentrerade framsteg inom området Generativ AI.”

Fujitsu kommer att inkludera dessa nya teknologier i sin konversations-AI-kärnmotor som tillhandahålls genom "Fujitsu Kozuchi (kodnamn) - Fujitsu AI Platform", som ger användarna tillgång till ett brett utbud av kraftfulla AI- och ML-teknologier. Tekniken för att upptäcka hallucinationer i konversations-AI kommer att vara tillgänglig för användare i Japan från och med den 28 september 2023, och tekniken för att upptäcka webbadresser för nätfiskewebbplatser som svar på konversations-AI från och med oktober 2023. Den nya tekniken kommer att vara både tillgänglig för företagsanvändare som en demomiljö via Kozuchi och till enskilda användare via en dedikerad portalsida (2). Fujitsu planerar en utrullning av båda teknologierna till den globala marknaden i framtiden.

Fujitsu lanserar ny teknik för att skydda konversations-AI från hallucinationer och motståndsattacker PlatoBlockchain Data Intelligence. Vertikal sökning. Ai. — Figur 1. Översikt över tillförlitliga konversationstekniker Nyutvecklad teknik1. Teknik för mycket exakt detektering av hallucinationer i svar av konversations-AI

När företag tillämpar konversations-AI i affärsverksamheten använder företag ofta tekniken för att extrahera information relaterad till frågor från förregistrerad affärsdata och lägga till data som referensinformation när de ställer frågor till en extern konversations-AI. Även om den här metoden ger korrekta svar och minskar hallucinationer, representerar fullständigt förebyggande av hallucinationer ett pågående problem eftersom konversations-AI i vissa fall inte kan extrahera information relaterad till frågor korrekt och därför skapar orelaterade, felaktiga svar. Även om metoder för att uppskatta i vilken grad svaret från en AI kan vara en hallucination (hallucinationspoäng), förblir korrekt uppskattning av denna poäng en svår uppgift eftersom konversations-AI använder olika fraser för att uttrycka samma faktum.

Baserat på observationen att konversations-AI ofta genererar felaktig information för egennamn och siffror, och innehållet i svaren tenderar att skilja sig åt med upprepade frågor, har Fujitsu utvecklat en teknik för att identifiera och fokusera på delar av meningar där hallucinationer sannolikt kommer att inträffa.

För att beräkna en mycket exakt hallucinationspoäng delar den nya tekniken först upp AI:s svar i tre delar (ämne, predikat, objekt, etc.) och identifierar sedan automatiskt namngivna enheter i svaret. Som ett nästa steg lämnar tekniken dessa namngivna enheter tomma och ber upprepade gånger den externa AI:n att mer exakt definiera dessa specifika uttryck. (Figur 2)

Fujitsu benchmarkerade denna teknik med hjälp av öppna data, inklusive WikiBio GPT-3 Hallucination Dataset (3) och fann att det kunde förbättra detekteringsnoggrannheten (AUC-ROC) (4) med cirka 22 % jämfört med andra toppmoderna metoder för att upptäcka AI-hallucinationer, såsom SelfCheckGPT (5).

När konversations-AI skapar svar baserat på sin träningsdata kan fientliga enheter lura AI:n att skapa svar som inkluderar manipulerad information som nätfiske-URL:er som leder till falska webbplatser genom att implantera skadlig information i AI-utbildningsdata.

För att lösa detta problem har Fujitsu utvecklat en teknik för att upptäcka manipulerade webbadresser i svaren från konversations-AI. När tekniken identifierar en webbadress för nätfiske skickar den ett varningsmeddelande till användarna.

Fujitsus nya teknik upptäcker inte bara nätfiske-URL:er utan ökar också AI:s motstånd mot befintliga attacker och lurar AI-modeller att göra en avsiktlig felbedömning för att säkerställa mycket tillförlitliga svar från AI:n. Den nyutvecklade tekniken utnyttjar en teknik som utvecklats gemensamt av Fujitsu och Ben-Gurion University of the Negev vid Fujitsu Small Research Lab etablerat vid Ben-Gurion University. Tekniken utnyttjar tendensen att fientliga enheter ofta attackerar en enskild typ av AI-modell, och upptäcker skadlig data genom att bearbeta information med olika AI-modeller och utvärdera skillnaden i motivering för bedömningsresultatet.

Tekniken kan inte bara användas för att upptäcka nätfiske-URL:er utan även för att förhindra allmänna attacker för att lura AI-modeller som använder tabelldata, och kan därmed även användas för att undvika attacker mot andra tjänster.

[1] Fujitsu Small Research Lab:Initiativ där Fujitsu-forskare är inbäddade i teknikinkubatorer vid universitet i Japan och internationellt för att bedriva gemensam forskning med några av de ledande hjärnorna inom sina områden, inklusive professorer såväl som nästa generations forskare.
[2] Enskilda användare kan också prova Fujitsus avancerade API:er och webbapplikationer genom att skapa ett konto på Fujitsu Research Portal. (Fujitsu Research Portal: portalsida som har varit öppen för allmänheten sedan juni 2023 för att ge registrerade användare tillgång till testversioner av Fujitsus avancerade teknologier. Fujitsu erbjuder avancerad teknik till företagsanvändare via "Fujitsu Kozuchi (kodnamn) – Fujitsu AI Platform" och till enskilda användare via denna portalsida.)
[3] WikiBio GPT-3 Hallucinationsdatauppsättning:Benchmarkdata baserad på Wikipedia för hallucinationsdetektering
[4] AUC-ROC (Area Under the Curve of the Receiver Operation Characteristic Curve) :Arean under kurvan för kurvan som erhålls när tröskelvärdet för bedömningen ändras med avseende på abnormitetspoängen genom att placera den sanna positiva frekvensen på den vertikala axeln och den falska positiva frekvensen på den horisontella axeln. En slumpmässig anomalipoäng är 0.5 och ett perfekt svar är 1.0. Det anses allmänt att en viss prestandanivå kan uppnås när den är högre än 0.7.
[5] SelfCheckGPT:En hallucinationsdetektionsteknologi utvecklad vid University of Cambridge, Storbritannien

Fujitsus engagemang för hållbara utvecklingsmål (SDG)

Målen för hållbar utveckling (SDG) som antogs av FN 2015 representerar en uppsättning gemensamma mål som ska uppnås över hela världen år 2030. Fujitsus syfte - "att göra världen mer hållbar genom att bygga upp förtroende för samhället genom innovation" - är ett löfte till bidra till visionen om en bättre framtid som stöds av målen.

Om Fujitsu

Fujitsus syfte är att göra världen mer hållbar genom att bygga förtroende i samhället genom innovation. Som den digitala transformationspartnern för kunder i över 100 länder arbetar våra 124,000 6702 anställda för att lösa några av de största utmaningarna som mänskligheten står inför. Vårt utbud av tjänster och lösningar bygger på fem nyckelteknologier: Computing, Networks, AI, Data & Security och Converging Technologies, som vi sammanför för att leverera hållbarhetstransformation. Fujitsu Limited (TSE:3.7) rapporterade konsoliderade intäkter på 28 biljoner yen (31 miljarder USD) för räkenskapsåret som slutade den 2023 mars XNUMX och är fortfarande det bästa digitala tjänsteföretaget i Japan efter marknadsandel. Få reda på mer: www.fujitsu.com.

Tryck på Kontakter:
Fujitsu Limited
Avdelningen för offentliga och investerarrelationer
Förfrågningar (https://bit.ly/3rrQ4mB)

SEO-drivet innehåll och PR-distribution. Bli förstärkt idag.
PlatoData.Network Vertical Generative Ai. Styrka dig själv. Tillgång här.
PlatoAiStream. Web3 Intelligence. Kunskap förstärkt. Tillgång här.
Platoesg. Kol, CleanTech, Energi, Miljö, Sol, Avfallshantering. Tillgång här.
PlatoHealth. Biotech och kliniska prövningar Intelligence. Tillgång här.
Källa: https://www.jcnnewswire.com/pressrelease/86719/3/

Tidsstämpel: September 25, 2023

Tidsstämpel: Mar 11, 2022

Återutgiven av Platon

MHI Thermal Systems påbörjar massproduktion av ZSX- och ZS-serierna för den europeiska marknaden i juni

Toyota tillkännager förändringar i organisationsstrukturen och seniora yrkesverksamma/ledande befattningshavare

MHI Group levererar Japans första system för automatisk betjänad parkering och automatiserad transport av färdiga fordon

AOTS, NTT DOCOMO och mobil innovation för att genomföra test av 5G-aktiverad fjärrteknisk utbildning

Honda börjar batteridelningstjänst för elektriska trehjuliga taxibilar i Indien under första halvåret 2022

NTT Group kommer att donera 2.5 miljoner USD till humanitärt bistånd i Ukraina och grannländerna

Om Oss

Vertikal sökning och Ai

plattform

Håll kontakten

Konto