AI의 멋진 신세계: 보안에 무슨 일이 일어났는가? 은둔?

AI의 멋진 신세계: 보안에 무슨 일이 일어났는가? 은둔?

AI의 멋진 신세계: 보안에 무슨 일이 일어났는가? 은둔? PlatoBlockchain 데이터 인텔리전스. 수직 검색. 일체 포함.

다음은 제네바의 글로벌 블록체인 비즈니스 협의회 이사회이자 워싱턴 DC의 InterWork Alliance 공동 창립자인 John deVadoss의 게스트 게시물입니다.

지난주에 저는 워싱턴 DC에서 일부 국회의원 및 그 직원들과 함께 보안과 관련된 AI의 의미를 발표하고 논의할 기회를 가졌습니다.

오늘날 제너레이티브 AI는 80년대 후반의 인터넷, 즉 기초 연구, 잠재 잠재력, 학문적 활용을 연상시키지만 아직 대중에게 공개될 준비가 되어 있지 않습니다. 이번에는 마이너리그 벤처 캐피털과 트위터 에코 챔버의 힘을 빌려 자유로운 벤더 야망이 AI의 멋진 신세계를 빠르게 추적하고 있습니다.

소위 "공공" 기반 모델은 오염되어 소비자 및 상업적 용도로 부적절합니다. 프라이버시 추상화는 존재하는 경우 체처럼 누출됩니다. 공격 노출 영역과 위협 벡터가 여전히 이해되고 있기 때문에 보안 구조는 현재 진행 중인 작업입니다. 환상의 가드레일에 대해서는 언급이 적을수록 좋습니다.

그럼 우리는 어떻게 여기까지 온 걸까요? 보안팀에 무슨 일이 일어났나요? 은둔?

"타협된" 기반 모델

소위 "개방형" 모델은 결코 개방적이지 않습니다. 다양한 공급업체는 모델 가중치, 문서 또는 테스트에 대한 액세스를 개방하여 개방성을 자랑합니다. 그럼에도 불구하고 주요 공급업체 중 어느 곳도 모델을 복제하고 재현할 수 있도록 훈련 데이터 세트나 해당 매니페스트 또는 계보에 가까운 것을 제공하지 않습니다.

학습 데이터 세트와 관련된 이러한 불투명성은 이러한 모델 중 하나 이상을 사용하려는 경우 소비자 또는 조직으로서 데이터 오염 정도를 확인하거나 검증할 수 있는 능력이 없음을 의미합니다. IP, 저작권 등 잠재적인 불법 콘텐츠와 관련하여.

결정적으로 훈련 데이터 세트의 매니페스트가 없으면 존재하지 않는 악성 콘텐츠를 확인하거나 검증할 방법이 없습니다. 국가 후원 행위자를 포함한 사악한 행위자는 모델이 훈련 중에 수집하는 트로이 목마 콘텐츠를 웹 전체에 심어 추론 시 예측할 수 없고 잠재적으로 악의적인 부작용을 초래합니다.

모델이 손상되면 학습을 취소할 방법이 없으며 유일한 선택은 모델을 파괴하는 것입니다.

"다공성" 보안

생성적 AI 모델은 "모든" 데이터가 하나의 컨테이너에 수집되므로 최고의 보안 허니팟입니다. AI 시대에는 새로운 종류의 공격 벡터가 등장합니다. 업계는 사이버 위협으로부터 이러한 모델을 보호하는 것과 사이버 위협 행위자가 이러한 모델을 도구로 사용하는 방법에 대한 의미를 아직 파악하지 못했습니다.

악의적인 프롬프트 주입 기술을 사용하여 인덱스를 오염시킬 수 있습니다. 데이터 중독은 가중치를 손상시키는 데 사용될 수 있습니다. 반전 기술을 포함한 임베딩 공격을 사용하여 임베딩에서 풍부한 데이터를 끌어낼 수 있습니다. 멤버십 추론은 특정 데이터가 훈련 세트 등에 포함되었는지 여부를 결정하는 데 사용될 수 있으며 이는 빙산의 일각에 불과합니다.

위협 행위자는 모델 반전 및 프로그래밍 방식 쿼리를 통해 기밀 데이터에 액세스할 수 있습니다. 모델의 잠재 동작을 손상시키거나 영향을 미칠 수 있습니다. 앞서 언급한 바와 같이 통제할 수 없는 데이터 수집은 트로이 목마 등을 통해 내장된 국가 후원 사이버 활동의 위협으로 이어집니다.

"누출되는" 개인 정보 보호

AI 모델은 훈련된 데이터 세트 때문에 유용합니다. 대규모 데이터의 무분별한 수집은 개인은 물론 일반 대중에게 전례 없는 개인 정보 보호 위험을 초래합니다. AI 시대에 개인정보 보호는 사회적 문제가 되었습니다. 개인 데이터 권리를 주로 다루는 규정은 부적절합니다.

정적 데이터 외에도 동적 대화 프롬프트를 IP로 처리하여 보호해야 합니다. 귀하가 모델과 함께 아티팩트를 공동 생성하는 소비자인 경우, 이 창의적인 활동을 지시하는 프롬프트가 모델을 훈련하는 데 사용되거나 모델의 다른 소비자와 공유되지 않기를 원합니다.

귀하가 비즈니스 결과를 제공하기 위해 모델을 사용하는 직원인 경우 고용주는 귀하의 메시지가 기밀로 유지되기를 기대합니다. 또한, 어느 쪽이든 책임 문제가 표면화되는 경우 프롬프트와 응답에 보안 감사 추적이 필요합니다. 이는 주로 이러한 모델의 확률론적 특성과 시간에 따른 응답의 가변성 때문입니다.

결론은 어떻게되는데?

우리는 컴퓨팅 역사상 이전에 본 적이 없는 다른 종류의 기술, 즉 대규모로 창발적이고 잠재된 동작을 보여주는 기술을 다루고 있습니다. 보안, 개인 정보 보호 및 기밀 유지에 대한 어제의 접근 방식은 더 이상 작동하지 않습니다.

업계 리더들은 바람에 주의를 기울이고 있으며 규제 기관과 정책 입안자들은 개입 외에는 대안이 없습니다.

타임 스탬프 :

더보기 CryptoSlate