새롭고 향상된 콘텐츠 조정 도구

영상

새롭고 향상된 콘텐츠 조정 도구를 소개합니다. 중재 끝점 이전 콘텐츠 필터를 개선했으며 현재 OpenAI API 개발자에게 무료로 제공됩니다.

개발자가 가능한 오용으로부터 애플리케이션을 보호할 수 있도록 더 빠르고 정확한 중재 끝점. 이 엔드포인트는 OpenAI API 개발자에게 무료 액세스를 제공합니다. GPT 기반 원하지 않는 콘텐츠를 감지하는 분류기 — 인스턴스 AI 시스템을 사용하여 이러한 시스템에 대한 인간의 감독을 지원합니다. 우리는 또한 둘 다 출시했습니다 기술 논문 우리의 방법론과 데이터 세트 평가에 사용됩니다.

텍스트 입력이 제공되면 중재 엔드포인트는 콘텐츠가 성적, 증오, 폭력 또는 자해를 조장하는지 여부를 평가합니다. 콘텐츠 정책. 엔드포인트는 빠르고 정확하며 다양한 애플리케이션에서 강력하게 수행되도록 훈련되었습니다. 중요한 것은 이렇게 하면 대규모 사용자에게 배포된 경우에도 제품이 잘못된 것을 "말할" 가능성이 줄어듭니다. 결과적으로 AI는 교육과 같이 자신 있게 사용할 수 없는 민감한 환경에서 이점을 얻을 수 있습니다.

입력 텍스트

폭력

자해

미움

성적

중재 끝점

중재 엔드포인트는 개발자가 인프라 투자의 이점을 누릴 수 있도록 도와줍니다. 자체 분류기를 구축하고 유지 관리하기 보다는 — 우리가 문서화한 것처럼 광범위한 프로세스 종이— 대신 단일 API 호출을 통해 정확한 분류기에 액세스할 수 있습니다.

OpenAI의 일환으로 헌신AI 생태계를 더 안전하게, 우리는 모든 OpenAI API 생성 콘텐츠를 무료로 조정할 수 있도록 이 끝점을 제공합니다. 예를 들어, 인월드인 OpenAI API 고객은 중재 엔드포인트를 사용하여 AI 기반 가상 캐릭터가 "스크립트에 머물도록" 돕습니다. OpenAI의 기술을 활용하여 Inworld는 핵심 제품인 기억에 남는 캐릭터를 만드는 데 집중할 수 있습니다.

또한 엔드포인트를 사용하여 콘텐츠를 조정하는 것을 환영합니다. 지원 OpenAI API로 생성됩니다. XNUMX번의 경우 회사는 NGL – 안전에 중점을 둔 익명 메시징 플랫폼 – 중재 엔드포인트를 사용하여 애플리케이션에서 증오성 언어 및 괴롭힘을 감지합니다. NGL은 이러한 분류기가 최신 속어로 일반화할 수 있어 시간이 지남에 따라 더 확신을 가질 수 있음을 발견했습니다. 비 API 트래픽을 모니터링하기 위해 중재 엔드포인트를 사용하는 것은 비공개 베타 버전이며 요금이 부과됩니다. 관심이 있으시면 다음으로 연락해 주십시오. support@openai.com.


체크아웃하여 중재 엔드포인트 시작하기 문서. 교육 프로세스 및 모델 성능에 대한 자세한 내용은 종이. 우리도 출시했습니다 평가 데이터 세트, 이러한 범주 내에서 레이블이 지정된 Common Crawl 데이터를 특징으로 하며 이 분야에 대한 추가 연구에 박차를 가할 수 있기를 바랍니다.

타임 스탬프 :

더보기 OpenAI