Uudet ja parannetut sisällönvalvontatyökalut

Julkaissut Platon

seuraajia: 0

Esittelemme uuden ja parannetun sisällönvalvontatyökalun: The Moderoinnin päätepiste parantaa aiempaa sisältösuodatintamme ja on tänään ilmaiseksi saatavilla OpenAI API -kehittäjille.

Auttaaksemme kehittäjiä suojaamaan sovelluksiaan mahdolliselta väärinkäytöltä, esittelemme nopeamman ja tarkemman Moderoinnin päätepiste. Tämä päätepiste tarjoaa OpenAI API -kehittäjille ilmaisen pääsyn GPT-pohjainen luokittelijat, jotka havaitsevat ei-toivotun sisällön - esiintymä käyttämällä tekoälyjärjestelmiä auttaakseen näiden järjestelmien ihmisen valvonnassa. Olemme myös julkaisseet molemmat a tekninen paperi kuvailemme menetelmäämme ja aineisto käytetään arvioinnissa.

Kun Valvontapäätepiste saa tekstisyötteen, se arvioi, onko sisältö seksuaalista, vihamielistä, väkivaltaista vai edistääkö se itsensä vahingoittamista – sisältömme on kiellettyä. sisältöpolitiikka. Päätepiste on koulutettu olemaan nopea, tarkka ja toimimaan lujasti useissa eri sovelluksissa. Tärkeää on, että tämä vähentää mahdollisuuksia, että tuotteet "sanovat" väärän asian, vaikka niitä käytettäisiin käyttäjille suuressa mittakaavassa. Tämän seurauksena tekoäly voi avata etuja herkissä ympäristöissä, kuten koulutuksessa, missä sitä ei muuten voisi käyttää luottavaisesti.

sijoita teksti

Väkivalta

Itsetuhoisuus

Viha

Seksuaalinen

Moderoinnin päätepiste

Moderation-päätepiste auttaa kehittäjiä hyötymään infrastruktuuri-investoinneistamme. Sen sijaan, että rakentaisivat ja ylläpitäisivät omia luokittelijoitaan – laaja prosessi, kuten dokumentoimme paperi– Sen sijaan he voivat käyttää tarkkoja luokituksia yhden API-kutsun kautta.

Osana OpenAI:ta sitoutuminen että tehdä tekoälyn ekosysteemistä turvallisempi, tarjoamme tämän päätepisteen salliaksemme kaiken OpenAI API:n luoman sisällön ilmaisen moderoinnin. Esimerkiksi, Maailmassa, OpenAI API -asiakas, käyttää Moderation-päätepistettä auttaakseen tekoälypohjaisia virtuaalisia hahmojaan "pysymään käsikirjoituksessa". Hyödyntämällä OpenAI:n teknologiaa, Inworld voi keskittyä ydintuotteeseen – luomaan mieleenpainuvia hahmoja.

Lisäksi suhtaudumme myönteisesti päätepisteen käyttöön sisällön valvomiseen emme luotu OpenAI API:lla. Yhdessä tapauksessa yritys ngl – turvallisuuteen keskittyvä anonyymi viestintäalusta – käyttää Moderation-päätepistettä havaitakseen vihamielisen kielen ja kiusaamisen sovelluksessaan. NGL havaitsee, että nämä luokittelijat pystyvät yleistämään uusimpaan slangiin, mikä antaa heille mahdollisuuden pysyä itsevarmempana ajan myötä. Moderoinnin päätepisteen käyttö muun kuin API-liikenteen seuraamiseen on yksityisessä betavaiheessa ja siitä peritään maksu. Jos olet kiinnostunut, ota yhteyttä osoitteeseen support@openai.com.

Aloita Moderoinnin päätepisteen käyttö kirjautumalla ulos dokumentaatio. Tarkemmat tiedot koulutusprosessista ja mallin suorituskyvystä löytyvät sivuiltamme paperi. Olemme myös julkaisseet an arvioinnin tietojoukko, joka sisältää näihin luokkiin merkittyjä yleisiä indeksointitietoja, joiden toivomme vauhdittavan lisätutkimusta tällä alalla.

Aikaleima: Elokuu 10, 2022Elokuu 10, 2022

Aikaleima: Elokuu 22, 2023

Uudet ja parannetut sisällönvalvontatyökalut

Julkaissut Platon

Lisää aiheesta OpenAI

Taustajärjestelmien yksityiskohtien löytäminen

Demokraattiset panokset tekoälyyn

Miten OpenAI lähestyy vuoden 2024 maailmanlaajuisia vaaleja

Superalignment Fast Grants

DALL·E: Esittelyssä Outpainting

OpenAI-koodi

Rajariski ja valmius

Miten tekoälyjärjestelmien pitäisi käyttäytyä ja kenen pitäisi päättää?

Kielimallit voivat selittää neuroneja kielimalleissa

GPT-3.5 Turbon hienosäätö ja API-päivitykset

Tietoa Meistä

Pystysuuntainen haku ja Ai

foorumi

Pysy yhteydessä

Tili