In einem Schritt, der anscheinend darauf abzielt, nicht mehr als kostenlose Trainingsbibliothek für große Sprachmodelle verwendet zu werden, sagte das Megaforum Reddit, dass es damit beginnen werde, Unternehmen zu belasten, die seine API zum Herunterladen von Daten übermäßig nutzen.
„Als Plattform mit einem der größten Korpus von Mensch-zu-Mensch-Gesprächen online, das sich über die letzten 18 Jahre erstreckt, sind wir unseren Communities gegenüber verpflichtet, diese Inhalte zu verwalten“, Reddit sagte.
Zu diesem Zweck gab das Unternehmen heute bekannt, dass es seine Nutzungsbedingungen für seine verschiedenen Entwicklungstools und -dienste aktualisiert und sie alle in einem einzigen Satz zusammengefasst hat Bedingungen für Entwickler dass es alle Entwicklerdienste von Reddit regeln wird, einschließlich seiner Daten- und Anzeigen-APIs, Einbettungsbedingungen und dergleichen.
Die Reddit Data API wurde angeblich veröffentlicht, um Entwicklern beim Erstellen von Apps und Diensten für Reddit-Benutzer zu helfen, indem sie den Zugriff auf Beiträge und andere Informationen ermöglicht, die auf Reddit gehostet werden. Es wird auch von Akademikern, Forschern und „Social Listening Tools“ verwendet, um Zugang zu Reddit-Daten zu erhalten, sagte das Unternehmen, aber einige Leute verwenden es übermäßig.
Manche Leute glauben, dass Reddit Organisationen wie OpenAI meint, das für seine GPT-Serie hat benutzt Petabytes an Informationen aus Wikipedia, Bücherbibliotheken, Webseiten, auf die von Reddit-Posts verlinkt wird, und vieles mehr.
Obwohl Unternehmen wie Google und OpenAI nicht direkt genannt werden, reddit CEO und Mitbegründer Steve Huffman sagte Die New York Times in einem Interview, dass Reddit online „ein Zuhause für authentische Gespräche“ ist und als solches „der Reddit-Datenkorpus wirklich wertvoll ist“, gegenüber Dritten.
„Reddit zu crawlen, Werte zu generieren und keinen dieser Werte an unsere Benutzer zurückzugeben, ist etwas, womit wir ein Problem haben“, meinte Huffman. „Es ist eine gute Zeit für uns, die Dinge zu straffen. Das finden wir fair.“
Als Teil der neuen Bedingungen sagte Reddit, dass es sich „das Recht vorbehält, Gebühren für den Zugriff und die Nutzung von Reddit-Diensten und -Daten zu erheben, die nach Reddits alleinigem Ermessen festgelegt werden“. Verbote des „Zugriffs auf oder der Nutzung [von] den Reddit-Diensten und -Daten durch jegliche Mittel zum Trainieren großer Sprache, künstlicher Intelligenz oder anderer algorithmischer Modelle“ sind ebenfalls enthalten.
Das heißt, auf a Reddit-Hilfeseite Die Website, die die kommerzielle Nutzung und Gebühren für die Entwicklertools von Reddit abdeckt, sagte, dass die Nutzung der Entwicklungstools der Website (die laut Angaben des Unternehmens APIs umfassen) für kommerzielle Zwecke, einschließlich des „Verkaufs des Zugriffs auf Modelle, die mit Reddit-Daten trainiert wurden“, mit Genehmigung zulässig ist, und vermutlich Zahlung einer damit verbundenen Gebühr.
Reddit gab weder einen Hinweis darauf, was als „zusätzliche Funktionen, höhere Nutzungsbeschränkungen und breitere Nutzungsrechte“ zu qualifizieren ist, dass es der entscheidende Faktor dafür sein würde, wer für den Zugriff auf die Daten-API bezahlen muss, noch gab es einen Hinweis wie viel solche Dritte für das Privileg berappen müssten.
Das Unternehmen kündigte heute auch neue und aktualisierte native Moderator-Tools für die Reddit-Plattform an, darunter zusätzliche Mod-Warteschlangen, neue Regelverwaltungsfunktionen und ein Mod-Protokoll.
Rechtlich könnte das interessant werden
Interessanterweise sagte Reddit auch, dass es seine Bedingungen aktualisiert habe, um „weiter [klarzustellen], dass Benutzerinhalte Redditoren gehören, die Inhalte auf Reddit erstellt und eingereicht haben, und nicht ohne Erlaubnis verwendet werden können“, was ein echter Dorn im Auge sein könnte von jedem, der versucht, die Website für die fast zwei Jahrzehnte an Gesprächen zu durchsuchen, die sie enthält.
Die Benutzervereinbarung von Reddit enthält Ausnahmen für die eigene Nutzung von Inhalten, die von Postern veröffentlicht wurden, einschließlich „das Recht für uns, Ihre Inhalte anderen Unternehmen, Organisationen oder Einzelpersonen zur Verfügung zu stellen, die mit Reddit zusammenarbeiten“. Dies macht es etwas unscharf, ob das Eigentum an Inhalten ein Problem darstellt oder nicht, wenn die Partei, die Zugriff auf die Daten haben möchte, die Erlaubnis von Reddit hat.
In Bezug auf diese Lücke teilte uns ein Reddit-Sprecher mit, dass er im Juni weitere Informationen darüber haben würde, wie die Genehmigung erteilt wird, wenn er sein kostenpflichtiges Zugangsangebot einführt. Dann werden wir auch mehr über die Preisgestaltung erfahren, sagte der Sprecher.
Auf die Frage, welche Art von Nutzungsschwellen Entwickler prüfen würden, bevor sie zur Zahlung aufgefordert würden, sagte uns Reddit, dass es immer Ratenbegrenzungen für die API-Nutzung gegeben habe. Reddit hat sich nicht die Mühe gemacht, uns mitzuteilen, was diese Ratenbegrenzungen sind oder ob sie sich im Rahmen des neuen Programms ändern würden, aber GitHub-Dokumentation Die letzte Aktualisierung im Jahr 2015 gibt an, dass es 60 Anfragen pro Client und Minute sind, ohne dass Massenlimits erwähnt werden.
Der Sprecher von Reddit hat uns gesagt, dass das Unternehmen noch nie sehr gut darin war, API-Nutzungsbeschränkungen durchzusetzen oder Platz für eine Premium-Stufe mit erhöhten Beschränkungen zu schaffen.
Reddit sagte, dass Entwickler und Dritte ab heute per E-Mail über die Änderungen informiert werden und dass die neuen Regeln in der Regel am 19. Juni in Kraft treten. Der Sprecher, mit dem wir gesprochen haben, wollte auch klarstellen, dass die Daten-API weiterhin frei zugänglich ist für geeignete Anwendungsfälle über die Reddit-Entwicklerplattform; App-Entwickler und andere kleine Betreiber haben diesen Sommer hoffentlich keine Überraschungen vor sich. ®
- SEO-gestützte Content- und PR-Distribution. Holen Sie sich noch heute Verstärkung.
- Platoblockkette. Web3-Metaverse-Intelligenz. Wissen verstärkt. Hier zugreifen.
- Die Zukunft prägen mit Adryenn Ashley. Hier zugreifen.
- Quelle: https://go.theregister.com/feed/www.theregister.com/2023/04/18/reddit_charging_ai_api/
- :hast
- :Ist
- $UP
- 7
- a
- Über Uns
- Zugang
- zugänglich
- Nach
- Zusätzliche
- Siehe Werbung
- Zustimmung
- voraus
- algorithmisch
- Alle
- Zulassen
- immer
- und
- angekündigt
- jedem
- jemand
- Bienen
- API-Zugriff
- APIs
- App
- angemessen
- Apps
- SIND
- künstlich
- künstliche Intelligenz
- AS
- damit verbundenen
- At
- Authentic
- verfügbar
- BE
- war
- Bevor
- beginnen
- Anfang
- Sein
- Besser
- Bit
- biz
- Bücher
- breiteres
- bauen
- by
- kann keine
- Fähigkeiten
- Fälle
- CEO
- Übernehmen
- Änderungen
- berechnen
- aufladen
- klar
- Clearing
- Auftraggeber
- CO
- Mitbegründer
- kommerziell
- Communities
- Unternehmen
- Unternehmen
- enthält
- Inhalt
- Gespräch
- Gespräche
- könnte
- Abdeckung
- erstellt
- technische Daten
- Jahrzehnte
- entworfen
- entschlossen
- Festlegung
- Entwickler
- Entwickler:in / Unternehmen
- Entwickler
- DID
- Direkt
- Diskretion
- bewirken
- Durchsetzung
- genug
- übermäßig
- Messe
- Eigenschaften
- Gebühr
- Honorare
- Aussichten für
- Frei
- für
- weiter
- Lücke
- allgemein
- Erzeugung
- bekommen
- ABSICHT
- Go
- gehen
- gut
- erteilt
- Haben
- Hilfe
- höher
- Startseite
- Hoffentlich
- gehostet
- Ultraschall
- HTML
- HTTPS
- in
- inklusive
- Dazu gehören
- Einschließlich
- hat
- zeigt
- Einzelpersonen
- Info
- Information
- Intelligenz
- Interview
- Problem
- IT
- SEINE
- jpg
- Sprache
- grosse
- höchste
- Nachname
- Bibliotheken
- Bibliothek
- Gefällt mir
- Grenzen
- verknüpft
- Hören
- LLM
- suchen
- um
- MACHT
- Management
- Mittel
- Minute
- für
- mehr
- schlauer bewegen
- Benennung
- nativen
- fast
- Need
- Neu
- New York
- of
- bieten
- on
- EINEM
- Online
- OpenAI
- Betreiber
- Organisationen
- Andere
- UNSERE
- besitzen
- Besitz
- Eigentum
- bezahlt
- Teil
- Parteien
- Partner
- Party
- passt
- AUFMERKSAMKEIT
- Zahlung
- Personen
- Erlaubnis
- Ort
- Plattform
- Plato
- Datenintelligenz von Plato
- PlatoData
- BLOG-POSTS
- Prämie
- gebühr
- Aufgabenstellung:
- Programm
- veröffentlicht
- Zwecke
- Bewerten
- Honorar
- echt
- freigegeben
- Zugriffe
- Forscher
- reserven
- Rückkehr
- Rechte
- Gerollt
- Rollen
- Regel
- Ohne eine erfahrene Medienplanung zur Festlegung von Regeln und Strategien beschleunigt der programmatische Medieneinkauf einfach die Rate der verschwenderischen Ausgaben.
- s
- Said
- auf der Suche nach
- in XNUMX Minuten
- Modellreihe
- Lösungen
- kompensieren
- Teilen
- Schale
- Seite
- Single
- am Standort
- Social Media
- einige
- etwas
- Raumfahrt
- Sprecher
- Steve
- Immer noch
- Stoppen
- eingereicht
- so
- Sommer
- Überraschungen
- AGB
- zur Verbesserung der Gesundheitsgerechtigkeit
- Das
- Sie
- Dritte
- dritte seite
- Dorn
- Durch
- Tier
- Zeit
- zu
- heute
- auch
- Werkzeuge
- Training
- trainiert
- Ausbildung
- für
- aktualisiert
- Aktualisierung
- us
- Anwendungsbereich
- -
- benutzt
- Mitglied
- Nutzer
- wertvoll
- Wert
- verschiedene
- wollte
- Was
- ob
- welche
- WHO
- Wikipedia
- werden wir
- mit
- ohne
- Gewonnen
- würde
- Jahr
- Du
- Ihr
- Zephyrnet