I et trekk som tilsynelatende er utformet for å slutte å bli brukt som et gratis opplæringsbibliotek for store språkmodeller, sa megaforum Reddit at det kommer til å begynne å belaste selskaper som gjør overdreven bruk av deres datanedlastings-API.
"Som en plattform med et av de største korpusene av menneske-til-menneske-samtaler på nettet, som strekker seg over de siste 18 årene, har vi en forpliktelse overfor lokalsamfunnene våre til å være forvaltere av dette innholdet," Reddit sa.
For det formål kunngjorde biz i dag at de oppdaterer vilkårene for bruk for sine forskjellige utviklerverktøy og tjenester, og har rullet dem alle sammen til et enkelt sett med Utviklervilkår som den sa vil styre alle Reddits utviklertjenester, inkludert data- og annonse-API-er, innebygde vilkår og lignende.
Reddit Data API ble tilsynelatende utgitt for å hjelpe utviklere med å bygge apper og tjenester for Reddit-brukere ved å gi tilgang til innlegg og annen informasjon på Reddit. Det brukes også av akademikere, forskere og "sosiale lytteverktøy" for å få tilgang til Reddit-data, sa selskapet, men noen bruker det overdrevent.
Av noen mennesker forestiller vi oss at Reddit betyr organisasjoner som OpenAI, som for sin GPT-serie har brukt petabyte med informasjon fra Wikipedia, biblioteker med bøker, nettsider lenket til fra Reddit-innlegg og mye mer.
Selv om de ikke navngir selskaper som Google og OpenAI direkte, har Reddits administrerende direktør og medgründer Steve Huffman fortalte The New York Times i et intervju at Reddit "er et hjem for autentisk samtale" på nettet, og som sådan "Reddit-datamassen er virkelig verdifull," for tredjeparter.
"Å gjennomsøke Reddit, generere verdi og ikke returnere noe av den verdien til brukerne våre er noe vi har et problem med," sa Huffman. «Det er et godt tidspunkt for oss å stramme opp. Vi synes det er rettferdig.»
Som en del av de nye vilkårene sa Reddit at de "forbeholder seg retten til å kreve avgifter for tilgang og bruk av Reddit-tjenester og data, priser som bestemmes etter Reddits eget skjønn." Forbud mot "tilgang eller bruk [av] Reddit-tjenestene og dataene på alle måter for å trene store språk, kunstig intelligens eller andre algoritmiske modeller" er også inkludert.
Når det er sagt, på en Reddit hjelpeside som dekker kommersiell bruk og avgifter for Reddits utviklerverktøy, sa nettstedet at bruk av nettstedets utviklerverktøy (som ifølge selskapet inkluderer APIer) til kommersielle formål, inkludert "salg av tilgang til modeller som er trent på Reddit-data" er tillatt med tillatelse, og antagelig betaling av et tilhørende gebyr.
Reddit ga ingen pekepinn på hva som kvalifiserer som "ytterligere muligheter, høyere bruksgrenser og bredere bruksrettigheter" som den sa ville være den avgjørende faktoren for hvem som må betale det for Data API-tilgang, og ga heller ingen pekepinn. om hvor mye slike tredjeparter må betale for privilegiet.
Selskapet kunngjorde også nye og oppdaterte native moderatorverktøy for Reddit-plattformen i dag, inkludert ekstra mod-køer, nye regeladministrasjonsfunksjoner og en mod-logg.
Juridisk kan dette bli interessant
Interessant nok sa Reddit også at de har oppdatert vilkårene for å "ytterligere [klargjøre] at brukerinnhold eies av redditors som har opprettet og sendt inn innhold på Reddit og ikke kan brukes uten tillatelse," noe som kan være en torn i øyet. av alle som ønsker å skrape siden i de nesten to tiårene med samtaler den inneholder.
Reddits brukeravtale inkluderer utskjæringer for egen bruk av innhold publisert av plakater, inkludert "retten for oss til å gjøre innholdet ditt tilgjengelig [for] andre selskaper, organisasjoner eller enkeltpersoner som samarbeider med Reddit." Dette gjør det litt uklart om innholdseierskap er et problem eller ikke hvis parten som ønsker tilgang til dataene har tillatelse fra Reddit.
Når det gjelder dette gapet, fortalte en Reddit-talsperson oss at den ville ha mer informasjon å dele i juni om hvordan tillatelsen vil bli gitt når den ruller ut sitt betalte tilgangstilbud. Det er da vi vil bli fortalt mer om priser også, sa talspersonen.
På spørsmål om hva slags bruksgrenser utviklere ville se på før de ble bedt om å betale, fortalte Reddit oss at det alltid har hatt takstgrenser for API-bruken. Reddit gadd ikke å fortelle oss hva disse satsgrensene er eller om de skulle endres under det nye programmet, men GitHub-dokumentasjon sist oppdatert i 2015 indikerer at det er 60 forespørsler per klient per minutt uten omtale av bulkgrenser.
Det Reddits talsperson fortalte oss er at selskapet aldri har vært veldig flinke til å håndheve grenser for API-bruk eller "rydde plass" for et premiumnivå med økte grenser.
Reddit sa at utviklere og tredjeparter vil bli varslet via e-post om endringene som begynner i dag, og at de nye reglene generelt vil tre i kraft 19. juni. Talsmannen vi snakket med ønsket også å gjøre det klart at Data API fortsatt var fritt tilgjengelig for passende brukstilfeller gjennom Reddit-utviklerplattformen; forhåpentligvis vil ikke apputviklere og andre småskalaoperatører ha noen overraskelser fremover denne sommeren. ®
- SEO-drevet innhold og PR-distribusjon. Bli forsterket i dag.
- Platoblokkkjede. Web3 Metaverse Intelligence. Kunnskap forsterket. Tilgang her.
- Minting the Future med Adryenn Ashley. Tilgang her.
- kilde: https://go.theregister.com/feed/www.theregister.com/2023/04/18/reddit_charging_ai_api/
- : har
- :er
- $OPP
- 7
- a
- Om oss
- adgang
- tilgjengelig
- Ifølge
- Ytterligere
- annonser
- Avtale
- fremover
- algoritmisk
- Alle
- tillate
- alltid
- og
- annonsert
- noen
- noen
- api
- API-tilgang
- APIer
- app
- hensiktsmessig
- apps
- ER
- kunstig
- kunstig intelligens
- AS
- assosiert
- At
- Autentisk
- tilgjengelig
- BE
- vært
- før du
- begynne
- Begynnelsen
- være
- Bedre
- Bit
- biz
- bøker
- bredere
- bygge
- by
- kan ikke
- evner
- saker
- konsernsjef
- endring
- Endringer
- kostnad
- lading
- fjerne
- Clearing
- kunde
- CO
- med-grunnlegger
- kommersiell
- Communities
- Selskaper
- Selskapet
- inneholder
- innhold
- Samtale
- samtaler
- kunne
- dekker
- opprettet
- dato
- tiår
- designet
- bestemmes
- bestemme
- dev
- Utvikler
- utviklere
- gJORDE
- direkte
- skjønn
- effekt
- emalje
- håndheving
- nok
- overdreven
- rettferdig
- Egenskaper
- gebyr
- avgifter
- Til
- Gratis
- fra
- videre
- mellomrom
- generelt
- genererer
- få
- Gi
- Go
- skal
- god
- innvilget
- Ha
- hjelpe
- høyere
- Hjemprodukt
- forhåpentligvis
- vert
- Hvordan
- HTML
- HTTPS
- in
- inkludert
- inkluderer
- Inkludert
- økt
- indikerer
- individer
- info
- informasjon
- Intelligens
- Intervju
- utstedelse
- IT
- DET ER
- jpg
- Språk
- stor
- største
- Siste
- bibliotekene
- Bibliotek
- i likhet med
- grenser
- knyttet
- Lytting
- LLM
- ser
- gjøre
- GJØR AT
- ledelse
- midler
- minutt
- modeller
- mer
- flytte
- navngiving
- innfødt
- nesten
- Trenger
- Ny
- New York
- of
- tilby
- on
- ONE
- på nett
- OpenAI
- operatører
- organisasjoner
- Annen
- vår
- egen
- eide
- eierskap
- betalt
- del
- parter
- partner
- parti
- Past
- Betale
- betaling
- Ansatte
- tillatelse
- Sted
- plattform
- plato
- Platon Data Intelligence
- PlatonData
- innlegg
- Premium
- prising
- Problem
- program
- publisert
- formål
- Sats
- priser
- ekte
- utgitt
- forespørsler
- forskere
- reserver
- retur
- rettigheter
- Valsede
- ruller
- Regel
- regler
- s
- Sa
- søker
- Å Sell
- Serien
- Tjenester
- sett
- Del
- Shell
- side
- enkelt
- nettstedet
- selskap
- noen
- noe
- Rom
- talsperson
- Steve
- Still
- Stopp
- innsendt
- slik
- sommer
- overraskelser
- vilkår
- Det
- De
- Dem
- ting
- Tredje
- tredjeparter
- Torn
- Gjennom
- nivået
- tid
- til
- i dag
- også
- verktøy
- Tog
- trent
- Kurs
- etter
- oppdatert
- oppdatering
- us
- bruk
- bruke
- brukt
- Bruker
- Brukere
- Verdifull
- verdi
- ulike
- av
- ønsket
- Hva
- om
- hvilken
- HVEM
- Wikipedia
- vil
- med
- uten
- Vant
- ville
- år
- Du
- Din
- zephyrnet