Naukowcy zajmujący się sztuczną inteligencją dokonują teraz przeglądu swoich kolegów przy pomocy sztucznej inteligencji

Opublikowane ponownie przez Plato

Obserwuje: 0

Naukowcy zajmujący się sztuczną inteligencją zaczęli wykorzystywać generatywną sztuczną inteligencję, aby pomóc im przeglądać pracę rówieśników w zakresie uczenia maszynowego.

Grupa badaczy z Uniwersytetu Stanforda, NEC Labs America i UC Santa Barbara przeanalizowała niedawno recenzje artykułów nadesłanych na czołowe konferencje poświęcone sztucznej inteligencji, w tym ICLR 2024, NeurIPS 2023, CoRL 2023 i EMNLP 2023.

Autorzy – Weixin Liang, Zachary Izzo, Yaohui Zhang, Haley Lepp, Hancheng Cao, Xuandong Zhao, Lingjiao Chen, Haotian Ye, Sheng Liu, Zhi Huang, Daniel A McFarland i James Y Zou – przedstawili swoje odkrycia w papier zatytułowany „Monitorowanie treści zmodyfikowanych przez sztuczną inteligencję na dużą skalę: studium przypadku dotyczące wpływu ChatGPT na wzajemne recenzje konferencji AI”.

Podjęli badanie w oparciu o zainteresowanie społeczne i dyskusję na temat dużych modeli językowych, które zdominowały dyskurs techniczny w zeszłym roku.

Autorzy stwierdzili niewielki, ale stały wzrost widocznego wykorzystania LLM w przypadku recenzji przesłanych maksymalnie trzy dni przed terminem

Trudność w rozróżnieniu tekstu pisanego przez człowieka od tekstu pisanego maszynowo oraz zgłaszany wzrost liczby takich przypadków Strony z wiadomościami o sztucznej inteligencji doprowadziło autorów do wniosku, że istnieje pilna potrzeba opracowania sposobów oceny zbiorów danych ze świata rzeczywistego, które zawierają nieokreśloną ilość treści autorstwa sztucznej inteligencji.

Czasami autorstwo AI wyróżnia się – jak w przypadku papier z Radiology Case Reports zatytułowanych „Skuteczne leczenie jatrogennego uszkodzenia żyły wrotnej i tętnicy wątrobowej u 4-miesięcznej pacjentki: opis przypadku i przegląd literatury”.

Ten pogmatwany fragment jest trochę niejasny: „Podsumowując, leczenie obustronnych przypadków jatrogennych. Bardzo mi przykro, ale nie mam dostępu do informacji w czasie rzeczywistym ani danych dotyczących konkretnego pacjenta, ponieważ jestem modelem języka sztucznej inteligencji .”

Jednak rozróżnienie nie zawsze jest oczywiste, a dotychczasowe próby opracowania zautomatyzowanego sposobu sortowania tekstu pisanego przez człowieka od robo-prozy nie powiodły się. OpenAI na przykład wprowadził klasyfikator tekstu AI w tym celu w styczniu 2023 r., by zamknąć go sześć miesięcy później”ze względu na niski stopień dokładności".

Niemniej jednak, Liangu i wsp twierdzą, że skupianie się na użyciu przymiotników w tekście – zamiast próbować oceniać całe dokumenty, akapity lub zdania – prowadzi do bardziej wiarygodnych wyników.

Autorzy przyjęli dwa zestawy danych, czyli korpusy – jeden pisany przez ludzi, drugi pisany przez maszyny. Wykorzystali te dwa teksty do oceny ocen – recenzji naukowych artykułów konferencyjnych dotyczących sztucznej inteligencji – pod kątem częstotliwości występowania określonych przymiotników.

„Wszystkie nasze obliczenia opierają się wyłącznie na przymiotnikach zawartych w każdym dokumencie” – wyjaśnili. „Odkryliśmy, że ten dobór słownictwa wykazuje większą stabilność niż użycie innych części mowy, takich jak przysłówki, czasowniki, rzeczowniki czy wszystkie możliwe symbole”.

Okazuje się, że osoby z branży LLM częściej niż autorzy-ludzi używają przymiotników takich jak „godny pochwały”, „innowacyjny” i „kompleksowy”. Takie statystyczne różnice w użyciu słów pozwoliły głupcom zidentyfikować recenzje artykułów, w których prawdopodobna jest pomoc LLM.

Chmura słów zawierająca 100 najpopularniejszych przymiotników w opiniach LLM, z rozmiarem czcionki wskazującym częstotliwość (kliknij, aby powiększyć)

„Nasze wyniki sugerują, że od 6.5 do 16.9 procent tekstów przesłanych na te konferencje w ramach recenzji naukowych mogło zostać w znacznym stopniu zmodyfikowanych przez LLM, tj. poza sprawdzaniem pisowni lub drobnymi aktualizacjami pisarskimi” – argumentują autorzy, zauważając, że recenzje prac w czasopismo naukowe Nature nie wykazują oznak pomocy zmechanizowanej.

Wydaje się, że z większym wykorzystaniem LLM jest powiązanych kilka czynników. Jednym z nich jest zbliżający się termin: autorzy stwierdzili niewielki, ale stały wzrost widocznego wykorzystania LLM w przypadku recenzji przesłanych maksymalnie trzy dni przed terminem.

Badacze podkreślili, że ich intencją nie było osądzanie wykorzystania pomocy w pisaniu sztucznej inteligencji ani twierdzenie, że którykolwiek z ocenianych przez nich artykułów został napisany w całości przy użyciu modelu sztucznej inteligencji. Argumentowali jednak, że społeczność naukowa musi zachować większą przejrzystość w zakresie stosowania LLM.

Utrzymywali także, że takie praktyki potencjalnie pozbawiają osoby, których praca jest poddawana przeglądowi, różnorodnych informacji zwrotnych od ekspertów. Co więcej, informacje zwrotne dotyczące sztucznej inteligencji stwarzają ryzyko efektu homogenizacji, który kieruje się w stronę błędów modelu sztucznej inteligencji i odbiega od znaczących spostrzeżeń. ®

Dystrybucja treści i PR oparta na SEO. Uzyskaj wzmocnienie już dziś.
PlatoData.Network Pionowe generatywne AI. Wzmocnij się. Dostęp tutaj.
PlatoAiStream. Inteligencja Web3. Wiedza wzmocniona. Dostęp tutaj.
PlatonESG. Węgiel Czysta technologia, Energia, Środowisko, Słoneczny, Gospodarowanie odpadami. Dostęp tutaj.
Platon Zdrowie. Inteligencja w zakresie biotechnologii i badań klinicznych. Dostęp tutaj.
Źródło: https://go.theregister.com/feed/www.theregister.com/2024/03/19/ai_researchers_reviewing_peers/

Znak czasu: 19 marca 2024 r.

Znak czasu: Listopada 2, 2022

Naukowcy zajmujący się sztuczną inteligencją dokonują obecnie przeglądu swoich kolegów przy pomocy sztucznej inteligencji

Opublikowane ponownie przez Plato

Więcej z Rejestr

HPE twierdzi, że wpływ sztucznej inteligencji na przedsiębiorstwa nie jest „zawyżony”

Kiedy krok jest skokiem

Demo chatbota internetowego AI firmy Meta szybko zaczyna rzucać fałszywe wiadomości i rasistowskie uwagi

Sztuczna inteligencja do obrony Waszyngtonu przed zagrożeniami powietrznymi

BBC eksterminuje eksperymenty AI wykorzystywane do promocji Doctor Who

AlphaCode 2, sztuczna inteligencja generująca kod, ulepszona za pomocą zestawu Gemini

Folder białka AI nowej generacji, który może pomóc nauce? Meta jest do czegoś dobra

O nas

Wyszukiwanie pionowe i AI

Platforma

Pozostań w kontakcie

Konto