Dans un mouvement apparemment conçu pour cesser d'être utilisé comme bibliothèque de formation gratuite pour les grands modèles de langage, le mégaforum Reddit a déclaré qu'il allait commencer à facturer les entreprises qui font un usage excessif de son API de téléchargement de données.
"En tant que plate-forme avec l'un des plus grands corpus de conversations interhumaines en ligne, couvrant les 18 dernières années, nous avons l'obligation envers nos communautés d'être les gardiens de ce contenu", Reddit a affirmé Valérie Plante..
À cette fin, l'entreprise a annoncé aujourd'hui qu'elle mettait à jour ses conditions d'utilisation pour ses divers outils et services de développement, et les a tous regroupés dans un seul ensemble de Conditions du développeur qui, selon lui, régira tous les services de développement de Reddit, y compris ses API de données et d'annonces, les conditions d'intégration, etc.
L'API Reddit Data a apparemment été publiée pour aider les développeurs à créer des applications et des services pour les utilisateurs de Reddit en permettant l'accès aux publications et autres informations hébergées sur Reddit. Il est également utilisé par les universitaires, les chercheurs et les «outils d'écoute sociale» pour accéder aux données de Reddit, a déclaré la société, mais certaines personnes l'utilisent de manière excessive.
Par certaines personnes, nous imaginons que Reddit signifie des organisations comme OpenAI, qui pour sa série GPT a d'utiliser des pétaoctets d'informations de Wikipedia, des bibliothèques de livres, des pages Web liées à des publications Reddit, et bien plus encore.
Sans nommer directement des entreprises comme Google et OpenAI, le PDG et cofondateur de Reddit, Steve Huffman dit The New York Times dans une interview que Reddit "est une maison pour une conversation authentique" en ligne, et en tant que tel "le corpus de données Reddit est vraiment précieux", pour des tiers.
"Crawler Reddit, générer de la valeur et ne pas rendre aucune de cette valeur à nos utilisateurs est quelque chose qui nous pose problème", a déclaré Huffman. « C'est le bon moment pour nous de resserrer les choses. Nous pensons que c'est juste.
Dans le cadre des nouvelles conditions, Reddit a déclaré qu'il "se réserve le droit de facturer des frais pour l'accès et l'utilisation des services et données Reddit, des tarifs à déterminer à la seule discrétion de Reddit". Les interdictions sur "l'accès ou l'utilisation [des] services et données Reddit par tout moyen pour former un grand langage, l'intelligence artificielle ou d'autres modèles algorithmiques" sont également incluses.
Cela dit, sur un Page d'aide Reddit couvrant l'utilisation commerciale et les frais des outils de développement de Reddit, le site a déclaré que l'utilisation des outils de développement du site (qui, selon la société, comprend des API) à des fins commerciales, y compris "la vente d'accès à des modèles formés sur les données Reddit" est autorisée avec autorisation, et vraisemblablement le paiement d'une redevance associée.
Reddit n'a donné aucune idée de ce qui est qualifié de "capacités supplémentaires, limites d'utilisation plus élevées et droits d'utilisation plus larges" qui, selon lui, seraient le facteur déterminant pour savoir qui doit le payer pour l'accès à l'API de données, et n'a donné aucun indice. quant à combien ces tiers devraient débourser pour le privilège.
La société a également annoncé aujourd'hui des outils de modération natifs nouveaux et mis à jour pour la plate-forme Reddit, notamment des files d'attente de mods supplémentaires, de nouvelles fonctionnalités de gestion des règles et un journal des mods.
Légalement cela pourrait devenir intéressant
Chose intéressante, Reddit a également déclaré qu'il avait mis à jour ses conditions pour "plus [clarifier] que le contenu de l'utilisateur appartient à des redditors qui ont créé et soumis du contenu sur Reddit et ne peuvent pas être utilisés sans autorisation", ce qui pourrait être une véritable épine dans le côté. de quiconque cherche à gratter le site pour les près de deux décennies de conversations qu'il contient.
L'accord d'utilisation de Reddit inclut des exclusions pour sa propre utilisation du contenu publié par des affiches, y compris "le droit pour nous de rendre votre contenu disponible [à] d'autres sociétés, organisations ou individus qui s'associent à Reddit". Cela rend un peu flou quant à savoir si la propriété du contenu est un problème ou non si la partie qui souhaite accéder aux données a l'autorisation de Reddit.
Concernant cet écart, un porte-parole de Reddit nous a dit qu'il aurait plus d'informations à partager en juin sur la façon dont l'autorisation sera accordée lors du déploiement de son offre d'accès payant. C'est à ce moment-là que nous en saurons plus sur les prix, a déclaré le porte-parole.
Lorsqu'on lui a demandé quel type de seuils d'utilisation les développeurs examineraient avant d'être invités à payer, Reddit nous a dit qu'il avait toujours mis en place des limites de débit pour son utilisation de l'API. Reddit n'a pas pris la peine de nous dire quelles sont ces limites de taux ou si elles allaient changer dans le cadre du nouveau programme, mais Documentation GitHub la dernière mise à jour en 2015 indique qu'il s'agit de 60 demandes par client et par minute sans mention de limites de masse.
Ce que le porte-parole de Reddit nous a dit, c'est que l'entreprise n'a jamais été très douée pour faire respecter les limites d'utilisation de l'API ou "libérer de l'espace" pour un niveau premium avec des limites accrues.
Reddit a déclaré que les développeurs et les tiers seront informés par e-mail des changements à compter d'aujourd'hui et que les nouvelles règles entreront généralement en vigueur le 19 juin. Le porte-parole à qui nous avons parlé a également tenu à préciser que l'API de données était toujours librement accessible pour cas d'utilisation appropriés via la plate-forme de développement Reddit ; espérons que les développeurs d'applications et autres opérateurs à petite échelle n'auront pas de surprises cet été. ®
- Contenu propulsé par le référencement et distribution de relations publiques. Soyez amplifié aujourd'hui.
- Platoblockchain. Intelligence métaverse Web3. Connaissance Amplifiée. Accéder ici.
- Frapper l'avenir avec Adryenn Ashley. Accéder ici.
- La source: https://go.theregister.com/feed/www.theregister.com/2023/04/18/reddit_charging_ai_api/
- :possède
- :est
- $UP
- 7
- a
- A Propos
- accès
- accessible
- Selon
- Supplémentaire
- annonces
- contrat
- devant
- algorithmique
- Tous
- Permettre
- toujours
- et de
- annoncé
- tous
- chacun.e
- api
- Accès API
- Apis
- appli
- approprié
- applications
- SONT
- artificiel
- intelligence artificielle
- AS
- associé
- At
- Les Authentiques
- disponibles
- BE
- était
- before
- commencer
- Début
- va
- Améliorée
- Bit
- biz
- Livres
- plus large
- construire
- by
- ne peut pas
- capacités
- cas
- CEO
- Change
- Modifications
- charge
- recharge
- clair
- Clairière
- client
- CO
- co-fondateur
- commercial
- Communautés
- Sociétés
- Société
- contient
- contenu
- Conversation
- conversations
- pourriez
- couvrant
- créée
- données
- décennies
- un
- déterminé
- détermination
- dev
- Développeur
- mobiles
- DID
- directement
- discrétion
- effet
- l'application
- assez
- excessivement
- juste
- Fonctionnalités:
- frais
- Frais
- Pour
- gratuitement ici
- De
- plus
- écart
- généralement
- générateur
- obtenez
- Donner
- Go
- aller
- Bien
- accordée
- Vous avez
- aider
- augmentation
- Accueil
- Avec optimisme
- organisé
- Comment
- HTML
- HTTPS
- in
- inclus
- inclut
- Y compris
- increased
- indique
- individus
- info
- d'information
- Intelligence
- Interview
- aide
- IT
- SES
- jpg
- langue
- gros
- le plus grand
- Nom
- bibliothèques
- Bibliothèque
- comme
- limites
- lié
- Écoute
- LLM
- recherchez-
- a prendre une
- FAIT DU
- gestion
- veux dire
- minute
- numériques jumeaux (digital twin models)
- PLUS
- Bougez
- nommage
- indigène
- presque
- Besoin
- Nouveauté
- New York
- of
- offrant
- on
- ONE
- en ligne
- OpenAI
- opérateurs
- organisations
- Autre
- nos
- propre
- propriété
- possession
- payé
- partie
- les parties
- les partenaires
- fête
- passé
- Payer
- Paiement
- Personnes
- autorisation
- Place
- plateforme
- Platon
- Intelligence des données Platon
- PlatonDonnées
- Poteaux
- Premium
- établissement des prix
- Problème
- Programme
- publié
- des fins
- Tarif
- Tarifs
- réal
- libéré
- demandes
- chercheurs
- réserves
- retour
- droits
- Roulés
- Rouleaux
- Règle
- s
- Saïd
- recherche
- Disponible
- Série
- Services
- set
- Partager
- coquillage
- côté
- unique
- site
- Réseaux sociaux
- quelques
- quelque chose
- l'espace
- porte-parole
- Steve
- Encore
- Arrêter
- soumis
- tel
- été
- surprises
- conditions
- qui
- La
- Les
- des choses
- Troisièmement
- des tiers
- Épine
- Avec
- étage
- fiable
- à
- aujourd'hui
- trop
- les outils
- Train
- qualifié
- Formation
- sous
- a actualisé
- la mise à jour
- us
- Utilisation
- utilisé
- d'utiliser
- Utilisateur
- utilisateurs
- Précieux
- Plus-value
- divers
- via
- voulu
- Quoi
- que
- qui
- WHO
- Wikipédia
- sera
- comprenant
- sans
- A gagné
- pourra
- années
- Vous n'avez
- Votre
- zéphyrnet