New AI Classifier For Indicating AI-written Text

Újra kiadta Platón

Követő: 0

New AI classifier for indicating AI-written text PlatoBlockchain Data Intelligence. Vertical Search. Ai.

Bevezetünk egy osztályozót, amely képes megkülönböztetni a mesterséges intelligencia által írt és az ember által írt szövegeket.

Kioktattunk egy osztályozót, amely megkülönbözteti az ember által írt szöveget a különféle szolgáltatóktól származó mesterséges intelligencia által írt szövegek között. Bár lehetetlen megbízhatóan észlelni az összes mesterséges intelligencia által írt szöveget, úgy gondoljuk, hogy a jó osztályozók mérsékelhetik azokat a hamis állításokat, amelyek szerint az AI által generált szöveget ember írta: például futás. automatizált félretájékoztatási kampányok, mesterséges intelligencia eszközöket használ az akadémiai tisztességtelenséghez, és egy AI chatbotot emberként pozicionál.

Osztályozónk nem teljesen megbízható. Az angol szövegekből álló „kihíváshalmaz” értékelése során osztályozónk a mesterséges intelligencia által írt szövegek 26%-át (igazi pozitívumok) helyesen azonosítja „valószínűleg AI által írtként”, míg az ember által írt szöveget helytelenül AI által írtként címkézi meg a szövegek 9%-át. az idő (hamis pozitív). Osztályozóink megbízhatósága jellemzően javul a beviteli szöveg hosszának növekedésével. A miénkhez képest korábban kiadott osztályozó, ez az új osztályozó lényegesen megbízhatóbb az újabb AI-rendszerekből származó szövegeken.

Nyilvánosan elérhetővé tesszük ezt az osztályozót, hogy visszajelzést kapjunk arról, hogy hasznosak-e az olyan tökéletlen eszközök, mint ez. Folytatjuk a mesterséges intelligencia által generált szövegek észlelésével kapcsolatos munkánkat, és reméljük, hogy a jövőben továbbfejlesztett módszereket oszthatunk meg.

Try our free work-in-progress classifier yourself:

korlátozások

Osztályozónk számos fontos korláttal rendelkezik. Nem szabad elsődleges döntéshozatali eszközként használni, hanem a szövegrész forrásának meghatározására szolgáló egyéb módszerek kiegészítéseként.

Az osztályozó nagyon megbízhatatlan a rövid (1,000 karakter alatti) szövegeken. A hosszabb szövegeket is néha helytelenül jelöli meg az osztályozó.
Néha az ember által írt szöveget helytelenül, de az osztályozónk megbízhatóan mesterséges intelligencia által írt címkével látja el.
Az osztályozó használatát csak angol nyelvű szövegekhez javasoljuk. Más nyelveken lényegesen gyengébb teljesítményt nyújt, és megbízhatatlan a kódon.
A nagyon kiszámítható szöveget nem lehet megbízhatóan azonosítani. Például lehetetlen megjósolni, hogy az első 1,000 prímszám listáját mesterséges intelligencia vagy emberek írták-e, mert a helyes válasz mindig ugyanaz.
A mesterséges intelligencia által írt szöveg szerkeszthető az osztályozó elkerülése érdekében. A miénkhez hasonló osztályozók a sikeres támadások alapján frissíthetők és áttaníthatók, de nem világos, hogy az észlelésnek van-e előnye hosszú távon.
Ismeretes, hogy a neurális hálózatokon alapuló osztályozók a betanítási adataikon kívül rosszul kalibráltak. Azoknál a bemeneteknél, amelyek nagyon eltérnek a képzési készletünkben található szövegtől, az osztályozó néha rendkívül bízik a rossz előrejelzésben.

Az osztályozó betanítása

Osztályozónk egy nyelvi modell, amely ugyanabban a témában ember által írt szöveg és mesterséges intelligencia által írt szöveg párjainak adathalmazára finomhangolt. Ezt az adatkészletet számos olyan forrásból gyűjtöttük össze, amelyekről úgy gondoljuk, hogy emberek írták őket, például a képzés előtti adatokból és az emberi bemutatókból a következő címre benyújtott felszólításokon. InstructGPT. Minden szöveget felszólításra és válaszra osztottunk. Ezekre a felszólításokra számos, általunk és más szervezetek által kiképzett nyelvi modellből generáltunk választ. Webalkalmazásunk esetében úgy állítjuk be a megbízhatósági küszöböt, hogy alacsonyan tartsuk a hamis pozitív arányt; más szóval, csak akkor jelöljük meg a szöveget valószínűsíthető mesterséges intelligencia által írtnak, ha az osztályozó nagyon magabiztos.

Hatás az oktatókra és kérjen hozzájárulást

Elismerjük, hogy a mesterséges intelligencia által írt szövegek azonosítása fontos vitapont volt az oktatók körében, és ugyanilyen fontos az AI által generált szövegosztályozók osztálytermi korlátainak és hatásainak felismerése. Kifejlesztettük a előzetes forrás a ChatGPT oktatók számára történő használatáról, amely felvázolja néhány felhasználási módot, valamint a kapcsolódó korlátozásokat és szempontokat. Bár ez az erőforrás az oktatókra összpontosít, azt várjuk, hogy osztályozónk és a kapcsolódó osztályozó eszközeink hatással lesznek az újságírókra, a félretájékoztatást kutatókra és más csoportokra.

Együttműködünk az egyesült államokbeli oktatókkal, hogy megtanulják, mit látnak az osztálytermeikben, és megvitassuk a ChatGPT képességeit és korlátait, és a tanulás során tovább bővítjük elérhetőségünket. Ezek fontos beszélgetések, amelyeket küldetésünk részeként le kell folytatnunk, hogy nagy nyelvi modelleket alkalmazzunk biztonságosan, közvetlen kapcsolatban az érintett közösségekkel.

Ha Önt közvetlenül érintik ezek a problémák (ideértve, de nem kizárólagosan a tanárokat, adminisztrátorokat, szülőket, diákokat és oktatási szolgáltatókat), kérjük, küldjön visszajelzést a ebben a formában. Közvetlen visszajelzés a előzetes forrás hasznos, és örömmel fogadunk minden olyan forrást, amelyet az oktatók fejlesztenek vagy hasznosnak találtak (pl. tanfolyami irányelvek, becsületkódex és szabályzatfrissítések, interaktív eszközök, mesterséges intelligencia-műveltségi programok).

SEO által támogatott tartalom és PR terjesztés. Erősödjön még ma.
Platoblockchain. Web3 metaverzum intelligencia. Felerősített tudás. Hozzáférés itt.
Forrás: https://openai.com/blog/new-ai-classifier-for-indicating-ai-written-text/

Időbélyeg: Január 31, 2023

Időbélyeg: 25. március 2024.

Újra kiadta Platón

Bemutatkozik a ChatGPT Enterprise

Demokratikus bemenetek az AI-hoz

Superalignment Fast Grants

A torzítás csökkentése és a biztonság javítása a DALL·E 2-ben

Nyelvi modellek hatékony képzése a középső kitöltéshez

ChatGPT bővítmények

Videógeneráló modellek, mint világszimulátorok

Demokratikus hozzájárulások a mesterséges intelligencia támogatási programjához: tanulságok és megvalósítási tervek

A ChatGPT és a Whisper API-k bemutatása

Sora: Első benyomások

Rólunk

Vertical Search & Ai

Emelvény

Maradjon kapcsolatban

Fiók