Uruchamiamy klasyfikator przeszkolony w rozróżnianiu tekstu napisanego przez sztuczną inteligencję i napisanego przez człowieka.
Wyszkoliliśmy klasyfikator, aby rozróżniał tekst napisany przez człowieka od tekstu napisanego przez sztuczną inteligencję różnych dostawców. Chociaż nie można wiarygodnie wykryć całego tekstu napisanego przez sztuczną inteligencję, wierzymy, że dobre klasyfikatory mogą pomóc w zażegnaniu fałszywych twierdzeń, że tekst wygenerowany przez sztuczną inteligencję został napisany przez człowieka: na przykład bieganie automatyczne kampanie dezinformacyjne, używając narzędzi AI do nieuczciwości akademickiej i pozycjonując chatbota AI jako człowieka.
Nasz klasyfikator nie jest w pełni wiarygodny. W naszych ocenach „zestawu wyzwań” tekstów w języku angielskim nasz klasyfikator poprawnie identyfikuje 26% tekstu napisanego przez sztuczną inteligencję (prawdziwie pozytywne wyniki) jako „prawdopodobnie napisany przez sztuczną inteligencję”, podczas gdy błędnie oznacza tekst napisany przez człowieka jako napisany przez sztuczną inteligencję 9% czas (fałszywie dodatnie). Wiarygodność naszego klasyfikatora zwykle poprawia się wraz ze wzrostem długości tekstu wejściowego. W porównaniu z naszym poprzednio wydany klasyfikator, ten nowy klasyfikator jest znacznie bardziej niezawodny w przypadku tekstu z nowszych systemów sztucznej inteligencji.
Udostępniamy ten klasyfikator publicznie, aby uzyskać opinie na temat przydatności niedoskonałych narzędzi, takich jak to. Nasze prace nad wykrywaniem tekstu generowanego przez sztuczną inteligencję będą kontynuowane i mamy nadzieję, że w przyszłości udostępnimy udoskonalone metody.
Wypróbuj sam nasz darmowy klasyfikator w toku pracy:
Ograniczenia
Nasz klasyfikator ma kilka ważnych ograniczeń. Nie należy go używać jako podstawowego narzędzia podejmowania decyzji, ale zamiast tego jako uzupełnienie innych metod określania źródła fragmentu tekstu.
- Klasyfikator jest bardzo zawodny w przypadku krótkich tekstów (poniżej 1,000 znaków). Nawet dłuższe teksty są czasami błędnie oznaczane przez klasyfikator.
- Czasami tekst napisany przez człowieka zostanie nieprawidłowo, ale pewnie oznaczony przez nasz klasyfikator jako napisany przez sztuczną inteligencję.
- Zalecamy używanie klasyfikatora tylko dla tekstu w języku angielskim. Działa znacznie gorzej w innych językach i jest zawodny w kodzie.
- Tekst, który jest bardzo przewidywalny, nie może być wiarygodnie zidentyfikowany. Na przykład nie można przewidzieć, czy lista pierwszych 1,000 liczb pierwszych została napisana przez sztuczną inteligencję, czy przez ludzi, ponieważ poprawna odpowiedź jest zawsze taka sama.
- Tekst napisany przez AI można edytować, aby ominąć klasyfikator. Klasyfikatory takie jak nasz można aktualizować i przeszkolić w oparciu o udane ataki, ale nie jest jasne, czy wykrywanie ma przewagę w dłuższej perspektywie.
- Wiadomo, że klasyfikatory oparte na sieciach neuronowych są słabo skalibrowane poza danymi treningowymi. W przypadku danych wejściowych, które bardzo różnią się od tekstu w naszym zbiorze uczącym, klasyfikator jest czasami bardzo pewny błędnej prognozy.
Szkolenie klasyfikatora
Nasz klasyfikator to model językowy dostrojony do zestawu danych par tekstu napisanego przez człowieka i tekstu napisanego przez sztuczną inteligencję na ten sam temat. Zebraliśmy ten zestaw danych z różnych źródeł, które naszym zdaniem zostały napisane przez ludzi, takich jak dane przedtreningowe i demonstracje ludzi dotyczące monitów przesłanych do Poleć GPT. Każdy tekst podzieliliśmy na monit i odpowiedź. Na podstawie tych monitów wygenerowaliśmy odpowiedzi z różnych modeli językowych przeszkolonych przez nas i inne organizacje. W przypadku naszej aplikacji internetowej dostosowujemy próg ufności, aby utrzymać niski współczynnik fałszywych trafień; innymi słowy, oznaczamy tekst jako prawdopodobnie napisany przez AI tylko wtedy, gdy klasyfikator jest bardzo pewny siebie.
Wpływ na nauczycieli i wezwanie do wkładu
Zdajemy sobie sprawę, że identyfikacja tekstu napisanego przez sztuczną inteligencję była ważnym punktem dyskusji wśród nauczycieli i równie ważne jest rozpoznanie ograniczeń i wpływu klasyfikatorów tekstu generowanych przez sztuczną inteligencję w klasie. Opracowaliśmy a źródło wstępne na temat korzystania z ChatGPT dla nauczycieli, w którym przedstawiono niektóre zastosowania i związane z nimi ograniczenia i uwagi. Chociaż ten zasób koncentruje się na edukatorach, spodziewamy się, że nasz klasyfikator i powiązane z nim narzędzia klasyfikacyjne będą miały wpływ na dziennikarzy, badaczy dezinformacji i innych grup.
Współpracujemy z nauczycielami w USA, aby dowiedzieć się, co widzą w swoich klasach i omówić możliwości i ograniczenia ChatGPT, i będziemy nadal poszerzać nasz zasięg w miarę zdobywania wiedzy. Są to ważne rozmowy, które należy przeprowadzić w ramach naszej misji polegającej na bezpiecznym wdrażaniu dużych modeli językowych w bezpośrednim kontakcie z dotkniętymi społecznościami.
Jeśli te problemy dotyczą bezpośrednio Ciebie (w tym między innymi nauczycieli, administratorów, rodziców, uczniów i dostawców usług edukacyjnych), prześlij nam swoją opinię za pomocą ta forma. Bezpośrednia informacja zwrotna nt źródło wstępne jest pomocne, a my z zadowoleniem przyjmujemy również wszelkie zasoby, które nauczyciele opracowują lub uznali za przydatne (np. wytyczne dotyczące kursów, aktualizacje kodeksu honorowego i zasad, narzędzia interaktywne, programy alfabetyzacji AI).
- Dystrybucja treści i PR oparta na SEO. Uzyskaj wzmocnienie już dziś.
- Platoblockchain. Web3 Inteligencja Metaverse. Wzmocniona wiedza. Dostęp tutaj.
- Źródło: https://openai.com/blog/new-ai-classifier-for-indicating-ai-written-text/
- 000
- 1
- 26%
- 7
- a
- akademicki
- Administratorzy
- Korzyść
- AI
- Chatbot AI
- Wszystkie kategorie
- zawsze
- wśród
- i
- odpowiedź
- Aplikacja
- powiązany
- Ataki
- dostępny
- na podstawie
- bo
- uwierzyć
- poniżej
- pomiędzy
- poszerzać
- wezwanie
- nie może
- możliwości
- znaków
- chatbot
- ChatGPT
- roszczenia
- kod
- społeczności
- w porównaniu
- Komplement
- pewność siebie
- pewność
- ufnie
- Rozważania
- skontaktuj się
- kontynuować
- rozmowy
- Kurs
- dane
- Podejmowanie decyzji
- rozwijać
- Wykrywanie
- określaniu
- rozwinięty
- rozwijanie
- różne
- kierować
- bezpośrednio
- dyskutować
- dyskusja
- rozróżniać
- podzielony
- każdy
- Edukacja
- wychowawcy
- ujmujący
- Angielski
- Równie
- oceny
- Parzyste
- przykład
- oczekiwać
- niezwykle
- informacja zwrotna
- i terminów, a
- koncentruje
- znaleziono
- Darmowy
- od
- w pełni
- przyszłość
- wygenerowane
- otrzymać
- dobry
- Grupy
- wytyczne
- pomocny
- nadzieję
- HTTPS
- człowiek
- Ludzie
- zidentyfikowane
- identyfikuje
- identyfikacja
- Rezultat
- wpływ
- Oddziaływania
- ważny
- niemożliwy
- ulepszony
- in
- W innych
- Włącznie z
- niepoprawnie
- Zwiększenia
- wkład
- zamiast
- interaktywne
- problemy
- IT
- Dziennikarze
- Trzymać
- znany
- etykietowanie
- język
- Języki
- duży
- wodowanie
- UCZYĆ SIĘ
- Długość
- Prawdopodobnie
- Ograniczenia
- Ograniczony
- Limity
- Lista
- umiejętność czytania i pisania
- długoterminowy
- dłużej
- niski
- Dokonywanie
- znak
- metody
- Mylna informacja
- Misja
- model
- modele
- jeszcze
- sieci
- sieci neuronowe
- Nowości
- numer
- z naszej
- ONE
- OpenAI
- organizacji
- Inne
- wytyczne
- zasięg
- zewnętrzne
- par
- rodzice
- część
- wykonuje
- kawałek
- plato
- Analiza danych Platona
- PlatoDane
- Proszę
- punkt
- polityka
- pozycjonowanie
- pozytywny
- przewidzieć
- Możliwy do przewidzenia
- przepowiednia
- pierwotny
- premia
- Programy
- zapewniać
- dostawców
- publicznie
- Kurs
- niedawny
- rozpoznać
- polecić
- wydany
- niezawodność
- rzetelny
- Badacze
- Zasób
- Zasoby
- odpowiedź
- bieganie
- bezpiecznie
- taki sam
- widzenie
- usługa
- usługodawcy
- zestaw
- Share
- Short
- powinien
- znacznie
- kilka
- Źródło
- Źródła
- Studenci
- składane
- udany
- taki
- systemy
- nauczycieli
- Połączenia
- Źródło
- ich
- próg
- do
- narzędzia
- aktualny
- przeszkolony
- Trening
- prawdziwy
- zazwyczaj
- zaktualizowane
- Nowości
- us
- posługiwać się
- różnorodność
- sieć
- powitanie
- Co
- czy
- który
- Podczas
- będzie
- słowa
- Praca
- napisany
- Źle
- siebie
- zefirnet