과학자들이 인간의 명백한 편견을 탐구하기 위해 'OpinionGPT'를 만들었습니다

플라톤에 의해 재발행

팔로워 : 0

Humboldt-Universitat zu Berlin의 연구진은 편향이 표현된 출력을 생성하도록 의도적으로 조정된 대규모 언어 인공 지능 모델을 개발했습니다.

OpinionGPT라고 불리는 이 팀의 모델은 OpenAI의 ChatGPT 또는 Anthropic의 Claude 2와 기능이 유사한 AI 시스템인 Meta의 Llama 2의 조정된 변형입니다.

OpinionGPT는 지침 기반 미세 조정이라는 프로세스를 사용하여 미국, 독일, 라틴 아메리카, 중동, 11대, 30세 이상, 노인 등 XNUMX개 편견 그룹 중 하나를 대표하는 것처럼 프롬프트에 응답할 수 있는 것으로 알려졌습니다. , 남자, 여자, 자유주의자 또는 보수주의자.

"OpinionGPT: 매우 편향된 GPT 모델"을 발표합니다! 여기에서 시도해 보세요: https://t.co/5YJjHlcV4n
모델 답변에 대한 편향의 영향을 조사하기 위해 우리는 다음과 같은 간단한 질문을 했습니다. #GPT 정치적 우익 성향의 사람들이 쓴 텍스트로만 모델을 삼을까요?

[1 / 3]

— 앨런 아크빅(@alan_akbik) 2023 년 9 월 8 일

OpinionGPT는 Reddit의 하위 레딧이라고 불리는 "AskX" 커뮤니티에서 파생된 데이터 모음을 기반으로 개선되었습니다. 이러한 하위 레딧의 예로는 "Ask a Woman" 및 "Ask an American"이 있습니다.

팀은 11가지 특정 편견과 관련된 하위 레딧을 찾고 각 레딧에서 가장 인기 있는 게시물 25개를 가져오는 것부터 시작했습니다. 그런 다음 최소 찬성표 기준을 충족하고 인용문이 포함되지 않았으며 80단어 미만인 게시물만 유지했습니다.

남은 것으로 보아 그들은 마치 접근 Anthropic의 Constitutional AI와 유사합니다. 각 편향 레이블을 나타내기 위해 완전히 새로운 모델을 가동하는 대신 예상되는 각 편향에 대해 별도의 명령 세트를 사용하여 기본적으로 단일 7억 매개변수 Llama2 모델을 미세 조정했습니다.

방법론, 아키텍처 및 데이터를 기반으로 한 결과 기술 된 독일 팀의 연구 논문에서 AI 시스템은 실제 편견을 연구하기 위한 도구라기보다는 고정관념 생성기 역할을 더 많이 하는 것으로 보입니다.

모델이 정제된 데이터의 특성과 데이터를 정의하는 레이블과의 모호한 관계로 인해 OpinionGPT는 측정 가능한 실제 편견과 일치하는 텍스트를 반드시 출력하지는 않습니다. 단순히 데이터의 편향을 반영하는 텍스트를 출력합니다.

연구자들은 이것이 자신들의 연구에 미치는 몇 가지 한계를 인식하고 다음과 같이 썼습니다.

“예를 들어, '미국인'의 응답은 'Reddit에 게시한 미국인' 또는 '이 특정 하위 레딧에 게시한 미국인'으로 더 잘 이해되어야 합니다. 마찬가지로 '독일인'은 '이 특정 하위 레딧에 게시하는 독일인' 등으로 이해되어야 합니다.”

이러한 주의 사항은 예를 들어 "이 특정 하위 레딧에 게시한 미국인이라고 주장하는 사람들"이 게시한 게시물이라고 말하도록 더욱 구체화될 수 있습니다. 특정 게시물 뒤에 있는 포스터가 실제로 대표적인 것인지 여부를 조사하는 문서에는 언급이 없기 때문입니다. 자신이 주장하는 인구통계학적 또는 편견 집단에 속합니다.

저자들은 계속해서 인구 통계(예: 진보적인 독일인, 보수적인 독일인)를 묘사하는 모델을 탐구할 계획이라고 말합니다.

OpinionGPT가 제공하는 결과는 입증 가능한 편향을 나타내는 것과 확립된 표준과 크게 다른 것으로 나타나 실제 편향을 측정하거나 발견하기 위한 도구로서의 실행 가능성을 식별하기 어렵게 만듭니다.

과학자들은 명백한 인간 편견을 탐구하기 위해 'OpinionGPT'를 만들었습니다. PlatoBlockchain Data Intelligence를 직접 테스트할 수 있습니다. 수직 검색. 일체 포함. — 출처: 스크린샷, 표 2: *Halleret. 알., 2023*

예를 들어 OpinionGPT에 따르면 위 이미지에서 볼 수 있듯이 라틴 아메리카인들은 농구를 자신이 가장 좋아하는 스포츠로 편견을 갖고 있습니다.

그러나 경험적 연구에서는 분명히 표시 축구(일부 국가에서는 축구라고도 함)와 야구가 라틴 아메리카 전역에서 시청률과 참여도 측면에서 가장 인기 있는 스포츠입니다.

같은 표는 또한 OpinionGPT가 "XNUMX대의 반응"을 제공하라는 지시를 받았을 때 "수구"를 자신이 가장 좋아하는 스포츠로 출력한다는 것을 보여줍니다. 이는 통계적으로 보이는 답변입니다. 가능성 전 세계 대부분의 13~19세 청소년을 대표합니다.

평균적인 미국인이 가장 좋아하는 음식이 "치즈"라는 생각도 마찬가지입니다. 우리는 피자와 햄버거가 미국인들이 가장 좋아하는 음식이라고 주장하는 수십 개의 설문조사를 온라인에서 찾았지만, 미국인들이 가장 좋아하는 음식이 단순히 치즈라고 주장하는 설문조사나 연구는 단 한 건도 찾을 수 없었습니다.

OpinionGPT는 실제 인간 편견을 연구하는 데 적합하지 않을 수 있지만 개별 하위 레딧이나 AI 훈련 세트와 같은 대규모 문서 저장소에 내재된 고정관념을 탐색하기 위한 도구로는 유용할 수 있습니다.

궁금해하시는 분들을 위해 연구진이 OpinionGPT를 만들었습니다. 가능 공개 테스트를 위해 온라인으로. 그러나 웹사이트에 따르면 예비 사용자는 "생성된 콘텐츠가 허위이거나 부정확하거나 심지어 외설적일 수 있다"는 점을 인지해야 합니다.

SEO 기반 콘텐츠 및 PR 배포. 오늘 증폭하십시오.
PlatoData.Network 수직 생성 Ai. 자신에게 권한을 부여하십시오. 여기에서 액세스하십시오.
PlatoAiStream. 웹3 인텔리전스. 지식 증폭. 여기에서 액세스하십시오.
플라톤ESG. 자동차 / EV, 탄소, 클린테크, 에너지, 환경, 태양광, 폐기물 관리. 여기에서 액세스하십시오.
PlatoHealth. 생명 공학 및 임상 시험 인텔리전스. 여기에서 액세스하십시오.
차트프라임. ChartPrime으로 트레이딩 게임을 향상시키십시오. 여기에서 액세스하십시오.
BlockOffsets. 환경 오프셋 소유권 현대화. 여기에서 액세스하십시오.
출처: https://cointelegraph.com/news/scientists-created-artificial-intelligence-opinion-gpt-explicit-human-bias-test

타임 스탬프 : 2023 년 9 월 8 일

타임 스탬프 : 15년 2021월 XNUMX일

플라톤에 의해 재발행

코스모스(ATOM)는 교차 사슬 다리를 시작하고 비트코인을 포장한 후 랠리

920억 달러는 암호화폐의 총 시가 총액이 사라진 지금 지켜봐야 할 숫자입니다.

미국 인플레이션이 2년 이후 최고 수준에 도달함에 따라 이더리움 가격이 1991달러 아래로 떨어졌습니다.

스마트 계약 자동화 장치인 Gelato는 Zerion에 유동성 관리를 제공합니다.

담보로 오만함을 사용했기 때문에 테라가 무너졌습니다 — Knifefight

Terra Allies의 Six Samurai 팀은 생태계를 되살리는 것을 목표로 합니다.

독일에서 승인된 비트코인 기반 보안 토큰 제공

암호화폐는 공공 정책 외부에 존재하기에는 너무 커서 SEC 의장에 경고

비트 코인 가격이 $ 41K에 도달 한 후 판매자가 200-MA를 방어 한 후 거부

회사 소개

수직 검색 및 인공 지능

플랫폼

연결 유지

계정

더보기 코인 텔레그래프

회사 소개

수직 검색 및 인공 지능

플랫폼

연결 유지

계정