Ny AI-klassificering til indikering af AI-skrevet tekst

Genudgivet af Platon

Abonnenter: 0

New AI classifier for indicating AI-written text PlatoBlockchain Data Intelligence. Vertical Search. Ai.

Vi lancerer en klassificering, der er trænet til at skelne mellem AI-skrevet og menneskeskreven tekst.

Vi har trænet en klassifikator til at skelne mellem tekst skrevet af et menneske og tekst skrevet af AI'er fra en række forskellige udbydere. Selvom det er umuligt pålideligt at detektere al AI-skrevet tekst, mener vi, at gode klassifikatorer kan informere om begrænsninger for falske påstande om, at AI-genereret tekst er skrevet af et menneske: f.eks. automatiserede misinformationskampagner, ved at bruge AI-værktøjer til akademisk uærlighed og positionere en AI-chatbot som et menneske.

Vores klassificering er ikke helt pålidelig. I vores evalueringer af et "udfordringssæt" af engelske tekster identificerer vores klassificering korrekt 26 % af AI-skrevet tekst (sandt positive) som "sandsynligt AI-skrevet", mens den forkert mærkede menneskeskreven tekst som AI-skrevet 9 % af tidspunktet (falske positive). Vores klassificerers pålidelighed forbedres typisk, efterhånden som længden af inputteksten øges. Sammenlignet med vores tidligere udgivet klassifikator, denne nye klassificering er betydeligt mere pålidelig på tekst fra nyere AI-systemer.

Vi gør denne klassificering offentligt tilgængelig for at få feedback om, hvorvidt ufuldkomne værktøjer som denne er nyttige. Vores arbejde med detektering af AI-genereret tekst vil fortsætte, og vi håber at kunne dele forbedrede metoder i fremtiden.

Prøv selv vores gratis work-in-progress klassificering:

Begrænsninger

Vores klassificering har en række vigtige begrænsninger. Det bør ikke bruges som et primært beslutningsværktøj, men i stedet som et supplement til andre metoder til at bestemme kilden til et stykke tekst.

Klassificeringen er meget upålidelig på korte tekster (under 1,000 tegn). Selv længere tekster er nogle gange forkert mærket af klassificereren.
Nogle gange vil menneskeskreven tekst være forkert, men sikkert mærket som AI-skrevet af vores klassificerer.
Vi anbefaler kun at bruge klassificeringen til engelsk tekst. Den klarer sig væsentligt dårligere på andre sprog, og den er upålidelig på kode.
Tekst, der er meget forudsigelig, kan ikke identificeres pålideligt. For eksempel er det umuligt at forudsige, om en liste over de første 1,000 primtal er skrevet af AI eller mennesker, fordi det rigtige svar altid er det samme.
AI-skrevet tekst kan redigeres for at undgå klassificeringen. Klassifikatorer som vores kan opdateres og genoptrænes baseret på vellykkede angreb, men det er uklart, om detektion har en fordel på lang sigt.
Klassifikatorer baseret på neurale netværk er kendt for at være dårligt kalibreret uden for deres træningsdata. For input, der er meget forskellige fra tekst i vores træningssæt, er klassificereren nogle gange ekstremt sikker på en forkert forudsigelse.

Træning af klassificereren

Vores klassificering er en sprogmodel, der er finjusteret på et datasæt af par af menneskeskreven tekst og AI-skrevet tekst om det samme emne. Vi indsamlede dette datasæt fra en række forskellige kilder, som vi mener er skrevet af mennesker, såsom forudgående træningsdata og menneskelige demonstrationer på prompter indsendt til Instruer GPT. Vi delte hver tekst op i en prompt og et svar. På disse prompter genererede vi svar fra en række forskellige sprogmodeller, trænet af os og andre organisationer. For vores webapp justerer vi konfidensgrænsen for at holde den falske positive rate lav; med andre ord markerer vi kun tekst som sandsynlig AI-skrevet, hvis klassificereren er meget sikker.

Påvirkning af pædagoger og efterlys input

Vi erkender, at identifikation af AI-skrevet tekst har været et vigtigt diskussionspunkt blandt undervisere, og lige så vigtigt er det at erkende grænserne og virkningerne af AI-genererede tekstklassifikatorer i klasseværelset. Vi har udviklet en foreløbig ressource om brugen af ChatGPT til undervisere, som skitserer nogle af anvendelserne og tilhørende begrænsninger og overvejelser. Selvom denne ressource er fokuseret på undervisere, forventer vi, at vores klassificeringsværktøj og tilhørende klassificeringsværktøjer har en indvirkning på journalister, mis-/dis-informationsforskere og andre grupper.

Vi er i dialog med undervisere i USA for at lære, hvad de ser i deres klasseværelser, og for at diskutere ChatGPTs muligheder og begrænsninger, og vi vil fortsætte med at udvide vores rækkevidde, efterhånden som vi lærer. Det er vigtige samtaler at have, da en del af vores mission er at implementere store sprogmodeller sikkert i direkte kontakt med berørte samfund.

Hvis du er direkte berørt af disse problemer (herunder men ikke begrænset til lærere, administratorer, forældre, elever og uddannelsesudbydere), bedes du give os feedback ved at bruge denne formular. Direkte feedback på foreløbig ressource er nyttigt, og vi hilser også alle ressourcer velkommen, som undervisere er ved at udvikle eller har fundet nyttige (f.eks. kursusvejledninger, æreskodeks og politikopdateringer, interaktive værktøjer, AI-færdighedsprogrammer).

SEO Powered Content & PR Distribution. Bliv forstærket i dag.
Platoblokkæde. Web3 Metaverse Intelligence. Viden forstærket. Adgang her.
Kilde: https://openai.com/blog/new-ai-classifier-for-indicating-ai-written-text/

Tidsstempel: Januar 31, 2023

Tidsstempel: Mar 25, 2024

Genudgivet af Platon

Introduktion af ChatGPT Enterprise

Demokratiske input til AI

Superalignment Fast Grants

Reduktion af skævhed og forbedring af sikkerheden i DALL·E 2

Effektiv træning af sprogmodeller til at fylde i midten

ChatGPT plugins

Videogenereringsmodeller som verdenssimulatorer

Demokratiske input til AI-tilskudsprogram: erfaringer og implementeringsplaner

Introduktion af ChatGPT og Whisper API'er

Sora: Første indtryk

Om os

Vertikal søgning & Ai

perron

Stay Connected

Konto