Fujitsu, 환각과 적대적 공격으로부터 대화형 AI를 보호하는 새로운 기술 출시

플라톤에 의해 재발행

팔로워 : 0

도쿄, 26년 2023월 XNUMX일 – (JCN Newswire) – Fujitsu는 오늘 대화형 AI 모델의 응답 신뢰성을 향상시키기 위해 두 가지 새로운 AI 신뢰 기술 출시를 발표했습니다. 새로 개발된 기술에는 대화형 AI 모델에서 생성 AI가 부정확하거나 관련 없는 출력을 생성하는 현상인 환각을 감지하는 기술과 소규모 연구소에서 공동 개발한 기술이 포함됩니다.1) 벤 구리온 대학에서는 허위 정보를 주입하는 중독 공격을 통해 AI의 응답에 이식된 피싱 사이트 URL을 탐지합니다.

Fujitsu는 새로운 기술을 통해 기업 및 개인 사용자에게 대화형 AI의 응답 신뢰성을 평가할 수 있는 도구를 제공하고 궁극적으로 기술을 구현하려는 기업을 포함하여 다양한 사용 사례에서 AI를 보다 안전하게 사용하는 데 기여하는 것을 목표로 합니다. 실제 운영.

벤 구리온 대학교 유발 엘로비치(Yuval Elovici) 교수는 다음과 같이 말했습니다. “제너레이티브 AI는 중요한 영역으로 자리잡고 있으며, 그 안에서 Fujitsu가 개발한 환각 감지 기술은 신뢰할 수 있는 대화형 AI 시스템을 구축하는 데 중추적인 역할을 합니다. BGU(Ben-Gurion University)와 Fujitsu의 연구원들은 적대적 위협에 맞서 AI 기반 URL 필터링의 보안을 강화하는 혁신적인 기술을 개척했습니다. 우리의 혁신은 테이블 형식 데이터에 중점을 두어 AI 기반 URL 필터링 영역에서 적대적 공격에 대한 보다 탄력적인 방어 메커니즘을 구현합니다. 앞으로 Fujitsu와 Ben-Gurion University는 Generative AI 영역 내에서 새로운 보안 중심 발전을 구축하기 위해 협력할 예정입니다.”

Fujitsu는 사용자에게 광범위하고 강력한 AI 및 ML 기술에 대한 액세스를 제공하는 "Fujitsu Kozuchi(코드명) - Fujitsu AI 플랫폼"을 통해 제공되는 대화형 AI 코어 엔진에 이러한 신기술을 포함할 예정입니다. 대화형 AI의 환각 탐지 기술은 28년 2023월 2023일부터 일본 사용자에게 제공될 예정이며, 대화형 AI의 응답으로 피싱 사이트 URL을 탐지하는 기술은 XNUMX년 XNUMX월부터 사용할 수 있습니다. 두 가지 신기술은 모두 기업 사용자에게 Kozuchi를 통한 데모 환경과 전용 포털 사이트(2). Fujitsu는 향후 두 기술을 글로벌 시장에 출시할 계획입니다.

Fujitsu는 환각과 적대적 공격으로부터 대화형 AI를 보호하기 위한 새로운 기술을 출시했습니다. PlatoBlockchain Data Intelligence. 수직 검색. 일체 포함. — 그림 1. 신뢰할 수 있는 대화형 AI 새로 개발된 기술 개요1. 대화형 AI의 반응으로 환각을 고정밀도로 검출하는 기술

기업에서는 대화형 AI를 비즈니스 운영에 적용할 때 기 등록된 비즈니스 데이터에서 질문과 관련된 정보를 추출해 외부 대화형 AI에 질문할 때 참고 정보로 추가하는 기술을 활용하는 경우가 많다. 이 방법은 정확한 답변을 제공하고 환각을 줄이지만, 대화형 AI가 질문과 관련된 정보를 올바르게 추출하지 못하고 그에 따라 관련이 없거나 잘못된 답변을 생성하는 경우가 있기 때문에 완벽한 환각 예방은 지속적인 문제를 나타냅니다. AI의 대답이 환각(환각 점수)일 수 있는 정도를 추정하는 방법은 있지만 대화형 AI가 동일한 사실을 표현하기 위해 다양한 문구를 사용하기 때문에 이 점수를 정확하게 추정하는 것은 여전히 어려운 작업입니다.

후지쯔는 대화형 AI가 고유명사와 숫자에 대해 잘못된 정보를 자주 생성하고, 반복되는 질문에 따라 답변 내용이 달라지는 경향이 있다는 점을 토대로 문장에서 환각이 발생할 가능성이 있는 부분을 식별하고 집중하는 기술을 개발했습니다.

매우 정확한 환각 점수를 계산하기 위해 신기술은 먼저 AI의 답변을 세 부분(주어, 술어, 목적어 등)으로 나눈 다음 답변 내에서 명명된 개체를 자동으로 식별합니다. 다음 단계로 기술은 이러한 명명된 엔터티를 비워두고 외부 AI에게 이러한 특정 표현을 보다 정확하게 정의하도록 반복적으로 요청합니다. (그림 2)

Fujitsu는 WikiBio GPT-3 환각 데이터세트(3) 검출 정확도(AUC-ROC)를 향상시킬 수 있음을 발견했습니다(4) SelfCheckGPT(5).

대화형 AI는 훈련 데이터를 기반으로 응답을 생성하므로, 적대적인 주체는 AI 훈련 데이터에 악성 정보를 심어 가짜 웹 사이트로 연결되는 피싱 URL과 같은 조작된 정보가 포함된 응답을 생성하도록 AI를 속일 수 있습니다.

이 문제를 해결하기 위해 Fujitsu는 대화형 AI의 응답에서 조작된 URL을 탐지하는 기술을 개발했습니다. 기술이 피싱 URL을 식별하면 사용자에게 경고 메시지를 보냅니다.

Fujitsu의 신기술은 피싱 URL을 탐지할 뿐만 아니라 AI 모델을 속여 고의적으로 오판을 하게 만드는 기존 공격에 대한 AI의 저항력을 높여 AI의 신뢰성 높은 대응을 보장합니다. 새로 개발된 기술은 후지쯔와 네게브 벤구리온 대학이 벤구리온 대학에 설립한 후지쯔 소규모 연구소에서 공동 개발한 기술을 활용합니다. 적대적 개체가 단일 유형의 AI 모델을 공격하는 경우가 많다는 점을 활용해, 다양한 AI 모델로 정보를 처리하고 판단 결과에 대한 근거의 차이를 평가해 악성 데이터를 탐지하는 기술이다.

이 기술은 피싱 URL 탐지뿐만 아니라, 표 형식의 데이터를 활용한 AI 모델을 속이는 일반적인 공격을 예방하는 데에도 활용될 수 있어, 다른 서비스에 대한 공격을 예방하는 데에도 활용될 수 있다.

[1] Fujitsu 소규모 연구소 :Fujitsu 연구원이 일본 및 국제 대학의 기술 인큐베이터에 배치되어 교수 및 차세대 연구원을 포함하여 해당 분야의 일부 선도적인 사람들과 공동 연구를 수행하는 이니셔티브입니다.
[2] 개별 사용자는 Fujitsu Research Portal에서 계정을 생성하여 Fujitsu의 고급 API 및 웹 애플리케이션을 시험해 볼 수도 있습니다. (Fujitsu Research Portal: 등록된 사용자에게 Fujitsu의 고급 기술 평가판에 대한 액세스를 제공하기 위해 2023년 XNUMX월부터 대중에게 공개된 포털 사이트입니다. Fujitsu는 "Fujitsu Kozuchi(코드명) – Fujitsu AI Platform"을 통해 기업 사용자에게 고급 기술을 제공합니다. 및 본 포털 사이트를 통해 개인 사용자에게 제공됩니다.)
[3] WikiBio GPT-3 환각 데이터세트:환각 감지를 위한 Wikipedia 기반 벤치마크 데이터
[4] AUC-ROC(수신기 작동 특성 곡선의 곡선 아래 영역):세로축을 진양성률, 가로축을 위양성률로 하여 이상점수에 대하여 판정의 임계값을 변화시켰을 때 구해지는 곡선의 아래 면적. 무작위 이상 점수는 0.5이고, 정답은 1.0입니다. 일반적으로 0.7 이상이면 어느 정도의 성능을 얻을 수 있다고 본다.
[5] 셀프체크GPT:영국 케임브리지대학교에서 개발한 환각 감지 기술

지속 가능한 개발 목표 (SDG)에 대한 Fujitsu의 약속

2015년 UN에서 채택한 지속 가능한 개발 목표(SDGs)는 2030년까지 전 세계적으로 달성해야 하는 공통 목표를 나타냅니다. Fujitsu의 목적 - "혁신을 통해 사회에 대한 신뢰를 구축하여 더 지속 가능한 세상을 만든다"는 약속입니다. SDGs에 의해 강화된 더 나은 미래의 비전에 기여합니다.

Fujitsu 정보

Fujitsu의 목표는 혁신을 통해 사회의 신뢰를 구축하여 세상을 보다 지속 가능하게 만드는 것입니다. 100개 이상의 국가에서 고객이 선택한 디지털 혁신 파트너로서 124,000명의 직원이 인류가 직면한 가장 큰 문제를 해결하기 위해 노력하고 있습니다. 당사의 다양한 서비스 및 솔루션은 컴퓨팅, 네트워크, AI, 데이터 및 보안, 융합 기술의 6702가지 핵심 기술을 기반으로 하며, 지속 가능성 혁신을 제공하기 위해 함께 제공합니다. Fujitsu Limited(TSE:3.7)는 28년 31월 2023일 마감된 회계연도에 XNUMX조 XNUMX억 엔(미화 XNUMX억 달러)의 연결 매출을 보고했으며 시장 점유율 기준으로 일본 최고의 디지털 서비스 회사로 남아 있습니다. 더 찾아 봐: www.fujitsu.com.

연락처 언론 :
Fujitsu Limited
홍보 및 투자자 관계 부서
문의 (https://bit.ly/3rrQ4mB)

SEO 기반 콘텐츠 및 PR 배포. 오늘 증폭하십시오.
PlatoData.Network 수직 생성 Ai. 자신에게 권한을 부여하십시오. 여기에서 액세스하십시오.
PlatoAiStream. 웹3 인텔리전스. 지식 증폭. 여기에서 액세스하십시오.
플라톤ESG. 탄소, 클린테크, 에너지, 환경, 태양광, 폐기물 관리. 여기에서 액세스하십시오.
PlatoHealth. 생명 공학 및 임상 시험 인텔리전스. 여기에서 액세스하십시오.
출처: https://www.jcnnewswire.com/pressrelease/86719/3/

타임 스탬프 : 2023 년 9 월 25 일

타임 스탬프 : 월 28, 2023

플라톤에 의해 재발행

미쓰비시전기빌딩솔루션, 인도네시아 신규 수도 이전 프로젝트에 엘리베이터 및 에스컬레이터 공급

ISUZU ELF, Hitachi Astemo 감지 시스템 채택

새로 개발된 사다리 프레임, 섀시 및 엔진을 채택하는 완전히 새로운 Triton

TMC, 고위 경영진 인사 변경 발표

Mitsubishi Power, 주요 이집트 O&G 정유소 ANRPC와 수소 연료 전환을 위한 탈탄소화 계약 체결

회사 소개

수직 검색 및 인공 지능

플랫폼

연결 유지

계정

더보기 JCN 뉴스 와이어

회사 소개

수직 검색 및 인공 지능

플랫폼

연결 유지

계정