Bevezetünk egy osztályozót, amely képes megkülönböztetni a mesterséges intelligencia által írt és az ember által írt szövegeket.
Kioktattunk egy osztályozót, amely megkülönbözteti az ember által írt szöveget a különféle szolgáltatóktól származó mesterséges intelligencia által írt szövegek között. Bár lehetetlen megbízhatóan észlelni az összes mesterséges intelligencia által írt szöveget, úgy gondoljuk, hogy a jó osztályozók mérsékelhetik azokat a hamis állításokat, amelyek szerint az AI által generált szöveget ember írta: például futás. automatizált félretájékoztatási kampányok, mesterséges intelligencia eszközöket használ az akadémiai tisztességtelenséghez, és egy AI chatbotot emberként pozicionál.
Osztályozónk nem teljesen megbízható. Az angol szövegekből álló „kihíváshalmaz” értékelése során osztályozónk a mesterséges intelligencia által írt szövegek 26%-át (igazi pozitívumok) helyesen azonosítja „valószínűleg AI által írtként”, míg az ember által írt szöveget helytelenül AI által írtként címkézi meg a szövegek 9%-át. az idő (hamis pozitív). Osztályozóink megbízhatósága jellemzően javul a beviteli szöveg hosszának növekedésével. A miénkhez képest korábban kiadott osztályozó, ez az új osztályozó lényegesen megbízhatóbb az újabb AI-rendszerekből származó szövegeken.
Nyilvánosan elérhetővé tesszük ezt az osztályozót, hogy visszajelzést kapjunk arról, hogy hasznosak-e az olyan tökéletlen eszközök, mint ez. Folytatjuk a mesterséges intelligencia által generált szövegek észlelésével kapcsolatos munkánkat, és reméljük, hogy a jövőben továbbfejlesztett módszereket oszthatunk meg.
Try our free work-in-progress classifier yourself:
korlátozások
Osztályozónk számos fontos korláttal rendelkezik. Nem szabad elsődleges döntéshozatali eszközként használni, hanem a szövegrész forrásának meghatározására szolgáló egyéb módszerek kiegészítéseként.
- Az osztályozó nagyon megbízhatatlan a rövid (1,000 karakter alatti) szövegeken. A hosszabb szövegeket is néha helytelenül jelöli meg az osztályozó.
- Néha az ember által írt szöveget helytelenül, de az osztályozónk megbízhatóan mesterséges intelligencia által írt címkével látja el.
- Az osztályozó használatát csak angol nyelvű szövegekhez javasoljuk. Más nyelveken lényegesen gyengébb teljesítményt nyújt, és megbízhatatlan a kódon.
- A nagyon kiszámítható szöveget nem lehet megbízhatóan azonosítani. Például lehetetlen megjósolni, hogy az első 1,000 prímszám listáját mesterséges intelligencia vagy emberek írták-e, mert a helyes válasz mindig ugyanaz.
- A mesterséges intelligencia által írt szöveg szerkeszthető az osztályozó elkerülése érdekében. A miénkhez hasonló osztályozók a sikeres támadások alapján frissíthetők és áttaníthatók, de nem világos, hogy az észlelésnek van-e előnye hosszú távon.
- Ismeretes, hogy a neurális hálózatokon alapuló osztályozók a betanítási adataikon kívül rosszul kalibráltak. Azoknál a bemeneteknél, amelyek nagyon eltérnek a képzési készletünkben található szövegtől, az osztályozó néha rendkívül bízik a rossz előrejelzésben.
Az osztályozó betanítása
Osztályozónk egy nyelvi modell, amely ugyanabban a témában ember által írt szöveg és mesterséges intelligencia által írt szöveg párjainak adathalmazára finomhangolt. Ezt az adatkészletet számos olyan forrásból gyűjtöttük össze, amelyekről úgy gondoljuk, hogy emberek írták őket, például a képzés előtti adatokból és az emberi bemutatókból a következő címre benyújtott felszólításokon. InstructGPT. Minden szöveget felszólításra és válaszra osztottunk. Ezekre a felszólításokra számos, általunk és más szervezetek által kiképzett nyelvi modellből generáltunk választ. Webalkalmazásunk esetében úgy állítjuk be a megbízhatósági küszöböt, hogy alacsonyan tartsuk a hamis pozitív arányt; más szóval, csak akkor jelöljük meg a szöveget valószínűsíthető mesterséges intelligencia által írtnak, ha az osztályozó nagyon magabiztos.
Hatás az oktatókra és kérjen hozzájárulást
Elismerjük, hogy a mesterséges intelligencia által írt szövegek azonosítása fontos vitapont volt az oktatók körében, és ugyanilyen fontos az AI által generált szövegosztályozók osztálytermi korlátainak és hatásainak felismerése. Kifejlesztettük a előzetes forrás a ChatGPT oktatók számára történő használatáról, amely felvázolja néhány felhasználási módot, valamint a kapcsolódó korlátozásokat és szempontokat. Bár ez az erőforrás az oktatókra összpontosít, azt várjuk, hogy osztályozónk és a kapcsolódó osztályozó eszközeink hatással lesznek az újságírókra, a félretájékoztatást kutatókra és más csoportokra.
Együttműködünk az egyesült államokbeli oktatókkal, hogy megtanulják, mit látnak az osztálytermeikben, és megvitassuk a ChatGPT képességeit és korlátait, és a tanulás során tovább bővítjük elérhetőségünket. Ezek fontos beszélgetések, amelyeket küldetésünk részeként le kell folytatnunk, hogy nagy nyelvi modelleket alkalmazzunk biztonságosan, közvetlen kapcsolatban az érintett közösségekkel.
Ha Önt közvetlenül érintik ezek a problémák (ideértve, de nem kizárólagosan a tanárokat, adminisztrátorokat, szülőket, diákokat és oktatási szolgáltatókat), kérjük, küldjön visszajelzést a ebben a formában. Közvetlen visszajelzés a előzetes forrás hasznos, és örömmel fogadunk minden olyan forrást, amelyet az oktatók fejlesztenek vagy hasznosnak találtak (pl. tanfolyami irányelvek, becsületkódex és szabályzatfrissítések, interaktív eszközök, mesterséges intelligencia-műveltségi programok).
- SEO által támogatott tartalom és PR terjesztés. Erősödjön még ma.
- Platoblockchain. Web3 metaverzum intelligencia. Felerősített tudás. Hozzáférés itt.
- Forrás: https://openai.com/blog/new-ai-classifier-for-indicating-ai-written-text/
- 000
- 1
- 26%
- 7
- a
- egyetemi
- adminisztrátorok
- Előny
- AI
- AI chatbot
- Minden termék
- mindig
- között
- és a
- válasz
- app
- társult
- Támadások
- elérhető
- alapján
- mert
- Hisz
- lent
- között
- bővül
- hívás
- nem tud
- képességek
- karakter
- chatbot
- ChatGPT
- követelések
- kód
- Közösségek
- képest
- Kiegészítés
- bizalom
- magabiztos
- magabiztosan
- megfontolások
- kapcsolat
- folytatódik
- beszélgetések
- Tanfolyam
- dátum
- Döntéshozatal
- telepíteni
- Érzékelés
- meghatározó
- fejlett
- fejlesztése
- különböző
- közvetlen
- közvetlenül
- megvitatni
- vita
- különbséget tesz
- megosztott
- minden
- Oktatás
- pedagógusok
- vonzó
- Angol
- egyaránt
- értékelések
- Még
- példa
- vár
- rendkívüli módon
- Visszacsatolás
- vezetéknév
- összpontosított
- talált
- Ingyenes
- ból ből
- teljesen
- jövő
- generált
- kap
- jó
- Csoportok
- irányelvek
- hasznos
- remény
- HTTPS
- emberi
- Az emberek
- azonosított
- azonosítja
- azonosító
- Hatás
- befolyásolta
- Hatások
- fontos
- lehetetlen
- javított
- in
- Más
- Beleértve
- tévesen
- Növeli
- bemenet
- helyette
- interaktív
- kérdések
- IT
- újságírók
- Tart
- ismert
- címkézés
- nyelv
- Nyelvek
- nagy
- indítás
- TANUL
- Hossz
- Valószínű
- korlátozások
- Korlátozott
- határértékek
- Lista
- műveltség
- hosszú lejáratú
- hosszabb
- Elő/Utó
- Gyártás
- jel
- mód
- félrevezető tájékoztatás
- Küldetés
- modell
- modellek
- több
- hálózatok
- neurális hálózatok
- Új
- szám
- számok
- ONE
- OpenAI
- szervezetek
- Más
- körvonalak
- megkereső
- kívül
- párok
- szülők
- rész
- Előadja
- darab
- Plató
- Platón adatintelligencia
- PlatoData
- kérem
- pont
- politika
- helymeghatározás
- pozitív
- előre
- Kiszámítható
- előrejelzés
- elsődleges
- Első
- Programok
- ad
- szolgáltatók
- nyilvánosan
- Arány
- új
- elismerik
- ajánl
- felszabaduló
- megbízhatóság
- megbízható
- kutatók
- forrás
- Tudástár
- válasz
- futás
- biztosan
- azonos
- látás
- szolgáltatás
- szolgáltatók
- készlet
- Megosztás
- rövid
- kellene
- jelentősen
- néhány
- forrás
- Források
- Diákok
- benyújtott
- sikeres
- ilyen
- Systems
- tanárok
- A
- The Source
- azok
- küszöb
- nak nek
- szerszámok
- téma
- kiképzett
- Képzések
- igaz
- jellemzően
- frissítve
- Frissítés
- us
- használ
- fajta
- háló
- fogadtatás
- Mit
- vajon
- ami
- míg
- lesz
- szavak
- Munka
- írott
- Rossz
- magad
- zephyrnet