Uued ja täiustatud sisu modereerimise tööriistad

pilt

Tutvustame uut ja täiustatud sisu modereerimise tööriista: The Modereerimise lõpp-punkt täiustab meie eelmist sisufiltrit ja on täna OpenAI API arendajatele tasuta saadaval.

Et aidata arendajatel oma rakendusi võimaliku väärkasutuse eest kaitsta, tutvustame kiiremat ja täpsemat Modereerimise lõpp-punkt. See lõpp-punkt annab OpenAI API arendajatele tasuta juurdepääsu GPT-põhine klassifikaatorid, mis tuvastavad soovimatu sisu – eksemplar kasutades AI süsteeme abistada nende süsteemide inimliku järelevalvega. Samuti oleme välja andnud nii a tehniline paber kirjeldades meie metoodikat ja andmestik kasutatakse hindamiseks.

Tekstisisestuse korral hindab modereerimise lõpp-punkt, kas sisu on seksuaalne, vaenu õhutav, vägivaldne või propageerib enesevigastusi – meie poolt keelatud sisu. sisupoliitika. Lõpp-punkt on koolitatud nii, et see oleks kiire, täpne ja toimima kindlalt paljudes rakendustes. Oluline on see, et see vähendab võimalust, et tooted "väidavad" valet asja, isegi kui neid kasutatakse laialdaselt kasutajatele. Selle tulemusel võib tehisintellekt avada eeliseid tundlikes tingimustes, näiteks hariduses, kus seda ei saaks muidu enesekindlalt kasutada.

teksti sisestamine

Vägivald

Enesevigastamine

Viha

Seksuaalne

Modereerimise lõpp-punkt

Modereerimise lõpp-punkt aitab arendajatel meie infrastruktuuriinvesteeringutest kasu saada. Selle asemel, et luua ja hooldada oma klassifikaatoreid – see on ulatuslik protsess, nagu me oma dokumendis dokumenteerime paber— selle asemel pääsevad nad ligi täpsetele klassifikaatoritele ühe API-kõne kaudu.

Osana OpenAI-st kohustus et tehisintellekti ökosüsteemi turvalisemaks muutmine, pakume seda lõpp-punkti, et võimaldada kogu OpenAI API-ga loodud sisu tasuta modereerimist. Näiteks, Sisemaailm, OpenAI API klient, kasutab modereerimise lõpp-punkti, et aidata oma tehisintellektil põhinevatel virtuaalsetel tegelaskujudel skriptis püsida. OpenAI tehnoloogiat võimendades saab Inworld keskenduda oma põhitootele – luua meeldejäävaid tegelasi.

Lisaks tervitame lõpp-punkti kasutamist sisu modereerimiseks mitte loodud OpenAI API-ga. Ühel juhul firma NGL – anonüümne sõnumsideplatvorm, mis keskendub ohutusele – kasutab modereerimise lõpp-punkti, et tuvastada oma rakenduses vaenulikku kõnepruuki ja kiusamist. NGL leiab, et need klassifikaatorid on võimelised üldistama uusima slängi järgi, võimaldades neil aja jooksul enesekindlamaks jääda. Modereerimise lõpp-punkti kasutamine mitte-API-liikluse jälgimiseks on privaatses beetaversioonis ja selle eest tuleb maksta tasu. Kui olete huvitatud, võtke meiega ühendust aadressil support@openai.com.


Alustage modereerimise lõpp-punktiga, registreerudes dokumentatsioon. Lisateavet koolitusprotsessi ja mudeli jõudluse kohta leiate meie veebisaidilt paber. Samuti oleme välja andnud an hindamise andmestik, mis sisaldab nendes kategooriates märgistatud ühiseid roomamisandmeid, mis loodetavasti innustavad selles valdkonnas edasisi uuringuid.

Ajatempel:

Veel alates OpenAI