Nowy klasyfikator AI do wskazywania tekstu napisanego przez AI

Opublikowane ponownie przez Plato

Obserwuje: 0

Nowy klasyfikator AI do wskazywania tekstu napisanego przez AI PlatoBlockchain Data Intelligence. Wyszukiwanie pionowe. AI.

Uruchamiamy klasyfikator przeszkolony w rozróżnianiu tekstu napisanego przez sztuczną inteligencję i napisanego przez człowieka.

Wyszkoliliśmy klasyfikator, aby rozróżniał tekst napisany przez człowieka od tekstu napisanego przez sztuczną inteligencję różnych dostawców. Chociaż nie można wiarygodnie wykryć całego tekstu napisanego przez sztuczną inteligencję, wierzymy, że dobre klasyfikatory mogą pomóc w zażegnaniu fałszywych twierdzeń, że tekst wygenerowany przez sztuczną inteligencję został napisany przez człowieka: na przykład bieganie automatyczne kampanie dezinformacyjne, używając narzędzi AI do nieuczciwości akademickiej i pozycjonując chatbota AI jako człowieka.

Nasz klasyfikator nie jest w pełni wiarygodny. W naszych ocenach „zestawu wyzwań” tekstów w języku angielskim nasz klasyfikator poprawnie identyfikuje 26% tekstu napisanego przez sztuczną inteligencję (prawdziwie pozytywne wyniki) jako „prawdopodobnie napisany przez sztuczną inteligencję”, podczas gdy błędnie oznacza tekst napisany przez człowieka jako napisany przez sztuczną inteligencję 9% czas (fałszywie dodatnie). Wiarygodność naszego klasyfikatora zwykle poprawia się wraz ze wzrostem długości tekstu wejściowego. W porównaniu z naszym poprzednio wydany klasyfikator, ten nowy klasyfikator jest znacznie bardziej niezawodny w przypadku tekstu z nowszych systemów sztucznej inteligencji.

Udostępniamy ten klasyfikator publicznie, aby uzyskać opinie na temat przydatności niedoskonałych narzędzi, takich jak to. Nasze prace nad wykrywaniem tekstu generowanego przez sztuczną inteligencję będą kontynuowane i mamy nadzieję, że w przyszłości udostępnimy udoskonalone metody.

Wypróbuj sam nasz darmowy klasyfikator w toku pracy:

Ograniczenia

Nasz klasyfikator ma kilka ważnych ograniczeń. Nie należy go używać jako podstawowego narzędzia podejmowania decyzji, ale zamiast tego jako uzupełnienie innych metod określania źródła fragmentu tekstu.

Klasyfikator jest bardzo zawodny w przypadku krótkich tekstów (poniżej 1,000 znaków). Nawet dłuższe teksty są czasami błędnie oznaczane przez klasyfikator.
Czasami tekst napisany przez człowieka zostanie nieprawidłowo, ale pewnie oznaczony przez nasz klasyfikator jako napisany przez sztuczną inteligencję.
Zalecamy używanie klasyfikatora tylko dla tekstu w języku angielskim. Działa znacznie gorzej w innych językach i jest zawodny w kodzie.
Tekst, który jest bardzo przewidywalny, nie może być wiarygodnie zidentyfikowany. Na przykład nie można przewidzieć, czy lista pierwszych 1,000 liczb pierwszych została napisana przez sztuczną inteligencję, czy przez ludzi, ponieważ poprawna odpowiedź jest zawsze taka sama.
Tekst napisany przez AI można edytować, aby ominąć klasyfikator. Klasyfikatory takie jak nasz można aktualizować i przeszkolić w oparciu o udane ataki, ale nie jest jasne, czy wykrywanie ma przewagę w dłuższej perspektywie.
Wiadomo, że klasyfikatory oparte na sieciach neuronowych są słabo skalibrowane poza danymi treningowymi. W przypadku danych wejściowych, które bardzo różnią się od tekstu w naszym zbiorze uczącym, klasyfikator jest czasami bardzo pewny błędnej prognozy.

Szkolenie klasyfikatora

Nasz klasyfikator to model językowy dostrojony do zestawu danych par tekstu napisanego przez człowieka i tekstu napisanego przez sztuczną inteligencję na ten sam temat. Zebraliśmy ten zestaw danych z różnych źródeł, które naszym zdaniem zostały napisane przez ludzi, takich jak dane przedtreningowe i demonstracje ludzi dotyczące monitów przesłanych do Poleć GPT. Każdy tekst podzieliliśmy na monit i odpowiedź. Na podstawie tych monitów wygenerowaliśmy odpowiedzi z różnych modeli językowych przeszkolonych przez nas i inne organizacje. W przypadku naszej aplikacji internetowej dostosowujemy próg ufności, aby utrzymać niski współczynnik fałszywych trafień; innymi słowy, oznaczamy tekst jako prawdopodobnie napisany przez AI tylko wtedy, gdy klasyfikator jest bardzo pewny siebie.

Wpływ na nauczycieli i wezwanie do wkładu

Zdajemy sobie sprawę, że identyfikacja tekstu napisanego przez sztuczną inteligencję była ważnym punktem dyskusji wśród nauczycieli i równie ważne jest rozpoznanie ograniczeń i wpływu klasyfikatorów tekstu generowanych przez sztuczną inteligencję w klasie. Opracowaliśmy a źródło wstępne na temat korzystania z ChatGPT dla nauczycieli, w którym przedstawiono niektóre zastosowania i związane z nimi ograniczenia i uwagi. Chociaż ten zasób koncentruje się na edukatorach, spodziewamy się, że nasz klasyfikator i powiązane z nim narzędzia klasyfikacyjne będą miały wpływ na dziennikarzy, badaczy dezinformacji i innych grup.

Współpracujemy z nauczycielami w USA, aby dowiedzieć się, co widzą w swoich klasach i omówić możliwości i ograniczenia ChatGPT, i będziemy nadal poszerzać nasz zasięg w miarę zdobywania wiedzy. Są to ważne rozmowy, które należy przeprowadzić w ramach naszej misji polegającej na bezpiecznym wdrażaniu dużych modeli językowych w bezpośrednim kontakcie z dotkniętymi społecznościami.

Jeśli te problemy dotyczą bezpośrednio Ciebie (w tym między innymi nauczycieli, administratorów, rodziców, uczniów i dostawców usług edukacyjnych), prześlij nam swoją opinię za pomocą ta forma. Bezpośrednia informacja zwrotna nt źródło wstępne jest pomocne, a my z zadowoleniem przyjmujemy również wszelkie zasoby, które nauczyciele opracowują lub uznali za przydatne (np. wytyczne dotyczące kursów, aktualizacje kodeksu honorowego i zasad, narzędzia interaktywne, programy alfabetyzacji AI).

Dystrybucja treści i PR oparta na SEO. Uzyskaj wzmocnienie już dziś.
Platoblockchain. Web3 Inteligencja Metaverse. Wzmocniona wiedza. Dostęp tutaj.
Źródło: https://openai.com/blog/new-ai-classifier-for-indicating-ai-written-text/

Znak czasu: 31 stycznia 2023 r.

Znak czasu: Mar 25, 2024

Opublikowane ponownie przez Plato

Przedstawiamy ChatGPT Enterprise

Demokratyczne dane wejściowe do sztucznej inteligencji

Szybkie dotacje na Superalignment

Redukcja stronniczości i poprawa bezpieczeństwa w DALL·E 2

Efektywne szkolenie modeli językowych do wypełnienia środka

Wtyczki ChatGPT

Modele generacji wideo jako symulatory świata

Wkład Demokratów w program dotacji AI: wyciągnięte wnioski i plany wdrożenia

Przedstawiamy interfejsy API ChatGPT i Whisper

Sora: Pierwsze wrażenia

O nas

Wyszukiwanie pionowe i AI

Platforma

Pozostań w kontakcie

Konto