I et træk, der tilsyneladende er designet til at stoppe med at blive brugt som et gratis træningsbibliotek for store sprogmodeller, sagde megaforum Reddit, at det vil begynde at opkræve opkrævning af virksomheder, der gør overdreven brug af deres data-downloadende API.
"Som en platform med et af de største korpus af menneske-til-menneske-samtaler online, der strækker sig over de sidste 18 år, har vi en forpligtelse over for vores samfund til at være forvaltere af dette indhold," Reddit sagde.
Til det formål annoncerede biz i dag, at det opdaterer sine vilkår for brug for sine forskellige udviklerværktøjer og tjenester og har rullet dem alle sammen i et enkelt sæt Vilkår for udviklere som det sagde, vil styre alle Reddits udviklertjenester, inklusive dets Data og Ads API'er, indlejrede vilkår og lignende.
Reddit Data API blev tilsyneladende frigivet for at hjælpe udviklere med at bygge apps og tjenester til Reddit-brugere ved at give adgang til indlæg og anden information hostet på Reddit. Det bruges også af akademikere, forskere og "sociale lytteværktøjer" for at få adgang til Reddit-data, sagde virksomheden, men nogle mennesker bruger det overdrevent.
Af nogle mennesker forestiller vi os, at Reddit betyder organisationer som OpenAI, som for sin GPT-serie har anvendte petabytes af information fra Wikipedia, biblioteker med bøger, websider, der linkes til fra Reddit-indlæg og meget mere.
Selvom de ikke nævner virksomheder som Google og OpenAI direkte, har Reddit CEO og medstifter Steve Huffman fortalt The New York Times i et interview, at Reddit "er et hjem for autentisk samtale" online, og som sådan "Reddit-datakorpuset er virkelig værdifuldt" for tredjeparter.
"At crawle Reddit, skabe værdi og ikke returnere noget af denne værdi til vores brugere er noget, vi har et problem med," sagde Huffman. ”Det er et godt tidspunkt for os at stramme op. Det synes vi er rimeligt.”
Som en del af de nye vilkår sagde Reddit, at det "forbeholder sig retten til at opkræve gebyrer for adgang til og brug af Reddit-tjenester og data, priser, der bestemmes efter Reddits eget skøn." Forbud mod "adgang eller brug [af] Reddit-tjenesterne og -dataene på enhver måde til at træne store sprog, kunstig intelligens eller andre algoritmiske modeller" er også inkluderet.
Når det er sagt, på en Reddit hjælpeside der dækker kommerciel brug og gebyrer for Reddits udviklerværktøjer, sagde webstedet, at brug af webstedets dev-værktøjer (som ifølge virksomheden inkluderer API'er) til kommercielle formål, herunder "salg af adgang til modeller trænet på Reddit-data" er tilladt med tilladelse, og formentlig betaling af et tilhørende gebyr.
Reddit gav ikke noget fingerpeg om, hvad der kvalificerer sig som "yderligere kapaciteter, højere brugsgrænser og bredere brugsrettigheder", som det sagde ville være den afgørende faktor for, hvem der skal betale det for Data API-adgang, og det gav heller ikke nogen ledetråd. om, hvor meget sådanne tredjeparter skal betale for privilegiet.
Virksomheden annoncerede også nye og opdaterede native moderatorværktøjer til Reddit-platformen i dag, herunder yderligere mod-køer, nye regelstyringsfunktioner og en mod-log.
Juridisk kan dette blive interessant
Interessant nok sagde Reddit også, at det har opdateret sine vilkår for at "yderligere [afklare], at brugerindhold er ejet af redditors, der har oprettet og indsendt indhold på Reddit og ikke kan bruges uden tilladelse", hvilket kunne være en rigtig torn i øjet af alle, der søger at skrabe webstedet i de næsten to årtiers samtaler, det indeholder.
Reddits brugeraftale inkluderer udskæringer for dets egen brug af indhold udgivet af plakater, herunder "retten for os til at gøre dit indhold tilgængeligt [for] andre virksomheder, organisationer eller enkeltpersoner, der samarbejder med Reddit." Dette gør det lidt uklart, om indholdsejerskab er et problem, hvis den part, der ønsker adgang til dataene, har tilladelse fra Reddit.
Med hensyn til dette hul fortalte en Reddit-talsmand os, at den ville have flere oplysninger at dele i juni om, hvordan tilladelsen vil blive givet, når den udruller sit tilbud om betalt adgang. Det er da, vi også får mere at vide om priser, sagde talsmanden.
På spørgsmålet om, hvilken slags brugstærskler udviklere ville se på, før de blev bedt om at betale, fortalte Reddit os, at det altid har haft hastighedsgrænser på plads for sin API-brug. Reddit gad ikke fortælle os, hvad disse satsgrænser er, eller om de skulle ændre sig under det nye program, men GitHub dokumentation sidst opdateret i 2015 angiver, at det er 60 anmodninger pr. klient pr. minut uden omtale af bulk-grænser.
Hvad Reddits talsmand fortalte os, er, at virksomheden aldrig har været særlig god til at håndhæve API-brugsgrænser eller "rydde plads" til et premium-niveau med øgede grænser.
Reddit sagde, at udviklere og tredjeparter vil blive underrettet via e-mail om ændringerne, der begynder i dag, og at de nye regler generelt vil træde i kraft den 19. juni. Den talsperson, vi talte med, ønskede også at gøre det klart, at Data API'en stadig var frit tilgængelig for passende use cases gennem Reddit-udviklerplatformen; forhåbentlig vil app-udviklere og andre små operatører ikke have nogen overraskelser forude denne sommer. ®
- SEO Powered Content & PR Distribution. Bliv forstærket i dag.
- Platoblokkæde. Web3 Metaverse Intelligence. Viden forstærket. Adgang her.
- Udmøntning af fremtiden med Adryenn Ashley. Adgang her.
- Kilde: https://go.theregister.com/feed/www.theregister.com/2023/04/18/reddit_charging_ai_api/
- :har
- :er
- $OP
- 7
- a
- Om
- adgang
- tilgængelig
- Ifølge
- Yderligere
- annoncer
- Aftale
- forude
- algoritmisk
- Alle
- tillade
- altid
- ,
- annoncerede
- enhver
- nogen
- api
- API-adgang
- API'er
- app
- passende
- apps
- ER
- kunstig
- kunstig intelligens
- AS
- forbundet
- At
- Autentisk
- til rådighed
- BE
- været
- før
- begynde
- Begyndelse
- være
- Bedre
- Bit
- biz
- Bøger
- bredere
- bygge
- by
- kan ikke
- kapaciteter
- tilfælde
- Direktør
- lave om
- Ændringer
- afgift
- opladning
- klar
- Rydning
- kunde
- CO
- medstifter
- kommerciel
- Fællesskaber
- Virksomheder
- selskab
- indeholder
- indhold
- Samtale
- samtaler
- kunne
- dækker
- oprettet
- data
- årtier
- konstrueret
- bestemmes
- bestemmelse
- dev
- Udvikler
- udviklere
- DID
- direkte
- diskretion
- effekt
- håndhæve
- nok
- overdrevent
- retfærdig
- Funktionalitet
- gebyr
- Gebyrer
- Til
- Gratis
- fra
- yderligere
- kløft
- generelt
- generere
- få
- Giv
- Go
- gå
- godt
- bevilget
- Have
- hjælpe
- højere
- Home
- Forhåbentlig
- hostede
- Hvordan
- HTML
- HTTPS
- in
- medtaget
- omfatter
- Herunder
- øget
- angiver
- enkeltpersoner
- info
- oplysninger
- Intelligens
- Interview
- spørgsmål
- IT
- ITS
- jpg
- Sprog
- stor
- største
- Efternavn
- biblioteker
- Bibliotek
- ligesom
- grænser
- forbundet
- Lytte
- LLM
- leder
- lave
- maerker
- ledelse
- midler
- minut
- modeller
- mere
- bevæge sig
- navngivning
- indfødte
- næsten
- Behov
- Ny
- New York
- of
- tilbyde
- on
- ONE
- online
- OpenAI
- Operatører
- organisationer
- Andet
- vores
- egen
- ejede
- ejerskab
- betalt
- del
- parter
- partner
- part
- forbi
- Betal
- betaling
- Mennesker
- tilladelse
- Place
- perron
- plato
- Platon Data Intelligence
- PlatoData
- Indlæg
- Premium
- prissætning
- Problem
- Program
- offentliggjort
- formål
- Sats
- priser
- ægte
- frigivet
- anmodninger
- forskere
- reserver
- vender tilbage
- rettigheder
- Rullet
- ruller
- Herske
- regler
- s
- Said
- søger
- Salg
- Series
- Tjenester
- sæt
- Del
- Shell
- side
- enkelt
- websted
- Social
- nogle
- noget
- Space
- talsmand
- Steve
- Stadig
- Stands
- indsendt
- sådan
- sommer
- overraskelser
- vilkår
- at
- Them
- ting
- Tredje
- tredje partier
- Torn
- Gennem
- tier
- tid
- til
- i dag
- også
- værktøjer
- Tog
- uddannet
- Kurser
- under
- opdateret
- opdatering
- us
- Brug
- brug
- anvendte
- Bruger
- brugere
- Værdifuld
- værdi
- forskellige
- via
- ønskede
- Hvad
- hvorvidt
- som
- WHO
- Wikipedia
- vilje
- med
- uden
- Vandt
- ville
- år
- Du
- Din
- zephyrnet