MIT와 Google의 컴퓨터 과학자에 따르면 합성 이미지는 AI 모델이 실제 스냅에 비해 시각적 표현을 더 정확하게 학습하는 데 도움이 될 수 있습니다. 그 결과, 서면 설명을 바탕으로 그림을 더 잘 만드는 신경망이 탄생합니다.
모든 텍스트-이미지 모델의 핵심은 개체를 단어로 매핑하는 기능입니다. 예를 들어 "맑은 날 빨간 풍선을 들고 있는 아이"와 같은 입력 텍스트 프롬프트가 주어지면 설명과 유사한 이미지를 반환해야 합니다. 이를 위해서는 어린이, 빨간 풍선, 화창한 날의 모습을 시각적으로 표현하는 방법을 배워야 합니다.
MIT-Google 팀은 신경망이 실제 스냅을 사용하는 것이 아니라 AI가 만든 사진으로 훈련을 받은 후 프롬프트에서 더 정확한 이미지를 생성할 수 있다고 믿습니다. 이를 입증하기 위해 그룹은 개발했습니다. StableRep, 인기 있는 오픈 소스 텍스트-이미지 모델인 Stable Diffusion에서 생성된 그림에서 설명적인 캡션을 올바른 해당 이미지로 바꾸는 방법을 학습합니다.
즉, 확립되고 훈련된 AI 모델을 사용하여 다른 모델을 가르치는 것입니다.
과학자들의 사전 인쇄 논문으로서 다음을 통해 발표됨 arXiv 지난 달 말에 "합성 이미지만으로 StableRep이 학습한 표현은 대규모 데이터 세트에서 동일한 텍스트 프롬프트 세트와 해당 실제 이미지를 사용하여 SimCLR 및 CLIP이 학습한 표현의 성능을 능가합니다."라고 말했습니다. SimCLR 및 CLIP은 텍스트 프롬프트에서 이미지를 만드는 데 사용할 수 있는 기계 학습 알고리즘입니다.
"언어 감독을 추가하면 20천만 개의 합성 이미지로 훈련된 StableRep은 50천만 개의 실제 이미지로 훈련된 CLIP보다 더 나은 정확도를 달성합니다."라고 논문은 계속됩니다.
기계 학습 알고리즘은 객체의 특징과 단어의 의미 사이의 관계를 숫자 배열로 포착합니다. StableRep을 사용함으로써 연구원들은 이 프로세스를 보다 신중하게 제어할 수 있습니다. 즉, 동일한 프롬프트에서 Stable Diffusion으로 생성된 여러 이미지에 대한 모델을 훈련할 수 있습니다. 이는 모델이 더 다양한 시각적 표현을 학습할 수 있고 어떤 이미지가 다른 이미지보다 프롬프트와 더 밀접하게 일치하는지 확인할 수 있음을 의미합니다.
나는 우리가 실제 데이터로 훈련된 일부 모델과 합성 데이터로 훈련된 생태계를 갖게 될 것이라고 생각합니다.
"우리는 단순히 데이터를 제공하는 것이 아니라 상황과 변화를 통해 상위 수준의 개념에 대해 더 많이 배울 수 있도록 모델을 가르치고 있습니다." 이번 연구의 수석 연구원이자 MIT 전기 공학 박사 과정 학생인 Lijie Fan은 다음과 같이 말했습니다. 설명 이번 주. "모두 동일한 텍스트에서 생성되고 모두 동일한 기본 사물에 대한 묘사로 처리되는 여러 이미지를 사용할 때 모델은 픽셀뿐만 아니라 이미지 뒤에 있는 개념, 즉 객체에 대해 더 깊이 파고듭니다."
위에서 언급한 것처럼 이 접근 방식은 실제 이미지보다 신경망을 훈련하는 데 더 적은 수의 합성 이미지를 사용할 수 있고 더 나은 결과를 얻을 수 있다는 것을 의미합니다. 이는 AI 개발자에게 윈윈(win-win)입니다.
StableRep과 같은 방법은 텍스트-이미지 모델이 언젠가 합성 데이터에 대해 훈련될 수 있음을 의미합니다. 이를 통해 개발자는 실제 이미지에 덜 의존할 수 있으며 AI 엔진이 사용 가능한 온라인 리소스를 소진하는 경우 필요할 수 있습니다.
논문의 공동 저자이자 MIT 컴퓨터 비전 부교수인 필립 이솔라(Phillip Isola)는 “[합성 이미지에 대한 AI 모델 훈련]이 점점 더 일반화될 것이라고 생각합니다.”라고 말했습니다. 등록. "실제 데이터와 합성 데이터로 훈련된 일부 모델의 생태계를 갖게 될 것이며 아마도 대부분의 모델은 두 가지 모두에 대해 훈련될 것입니다."
AI가 생성한 이미지에만 의존하기는 어렵습니다. 품질과 해상도가 실제 사진보다 떨어지는 경우가 많기 때문입니다. 이를 생성하는 텍스트-이미지 모델은 다른 방식으로도 제한됩니다. Stable Diffusion이 항상 텍스트 프롬프트에 충실한 이미지를 생성하는 것은 아닙니다.
Isola는 합성 이미지를 사용하는 것이 저작권 침해의 잠재적인 문제를 피할 수 없다고 경고했습니다. 합성 이미지를 생성하는 모델은 보호된 자료에 대해 훈련을 받았을 가능성이 높기 때문입니다.
“합성 데이터에는 저작권 데이터의 정확한 사본이 포함될 수 있습니다. 그러나 합성 데이터는 민감한 속성을 제거하기 위해 생성 모델을 편집함으로써 잠재적으로 개입할 수 있기 때문에 IP 및 개인 정보 보호 문제를 해결할 수 있는 새로운 기회도 제공합니다.”라고 그는 설명했습니다.
또한 팀은 AI 생성 이미지에 대한 훈련 시스템이 잠재적으로 기본 텍스트-이미지 모델에서 학습된 편견을 악화시킬 수 있다고 경고했습니다. ®
- SEO 기반 콘텐츠 및 PR 배포. 오늘 증폭하십시오.
- PlatoData.Network 수직 생성 Ai. 자신에게 권한을 부여하십시오. 여기에서 액세스하십시오.
- PlatoAiStream. 웹3 인텔리전스. 지식 증폭. 여기에서 액세스하십시오.
- 플라톤ESG. 탄소, 클린테크, 에너지, 환경, 태양광, 폐기물 관리. 여기에서 액세스하십시오.
- PlatoHealth. 생명 공학 및 임상 시험 인텔리전스. 여기에서 액세스하십시오.
- 출처: https://go.theregister.com/feed/www.theregister.com/2023/11/22/texttoimage_models_mit/
- :이다
- :아니
- 20
- 50
- 7
- a
- 능력
- 소개
- 위의
- 에 따르면
- 정확한
- 정확히
- 달성하다
- 더하다
- 후
- AI
- AI 모델
- 알고리즘
- All
- 수
- 또한
- 항상
- an
- 및
- 접근
- 있군요
- 약
- 배열
- AS
- 준
- At
- 속성
- 가능
- BE
- 때문에
- 뒤에
- 존재
- 생각
- 더 나은
- 사이에
- 편견
- 두
- by
- CAN
- 자막
- 포착
- 면밀히
- 아이
- 면밀히
- CO
- 공저자
- 공통의
- 비교
- 컴퓨터
- 컴퓨터 비전
- 개념
- 문맥
- 계속
- 제어
- 저작권
- 저작권 침해
- 수정
- 동
- 수
- 데이터
- 데이터 세트
- 일
- 깊이
- 보여
- 설명
- 개발
- 개발자
- 어려운
- 방송
- 몇몇의
- do
- 들린
- 생태계
- 효율적으로
- 중
- end
- 엔지니어링
- 엔진
- 확립 된
- 더욱 심하게 하다
- 예
- 설명
- 충실한
- 모조품
- 부채
- 특징
- 먹이
- 적은
- 럭셔리
- 에
- 추가
- 생성
- 생성
- 생성
- 생성적인
- 얻을
- 점점
- 주어진
- 구글
- 그룹
- 있다
- he
- 심장
- 도움
- 고수준
- 보유
- 방법
- How To
- 그러나
- HTTPS
- i
- if
- 영상
- 형상
- in
- 기타의
- 포함
- 더욱 더
- 위반
- 입력
- 개입하다
- 으로
- IP
- 발행물
- 문제
- IT
- JPG
- 다만
- 언어
- 넓은
- 성
- 리드
- 배우다
- 배운
- 배우다
- 적게
- 처럼
- 아마도
- 제한된
- 보기
- 같이
- 확인
- 유튜브 영상을 만드는 것은
- 지도
- 경기
- 재료
- XNUMX월..
- 아마도
- 평균
- 의미
- 방법
- 수도
- 백만
- MIT
- 모델
- 모델
- 달
- 배우기
- 가장
- 여러
- 필요한
- 필요
- 네트워크
- 네트워크
- 신경의
- 신경망
- 신경망
- 신제품
- 유명한
- 숫자
- 대상
- 사물
- of
- 자주
- on
- ONE
- 사람
- 온라인
- 열 수
- 오픈 소스
- 기회
- 반대하는
- 주문
- 기타
- 기타
- 서
- 성능
- 박사 학위
- 사진
- 영화
- 플라톤
- 플라톤 데이터 인텔리전스
- 플라토데이터
- 인기 문서
- 가능성
- 잠재적으로
- 개인 정보 보호
- 방법
- 생산
- 교수
- 프롬프트
- 보호
- 제공
- 퍼츠
- 품질
- RE
- 현실
- 빨간색
- 관계
- 출시
- 의지하다
- 제거
- 연구원
- 연구원
- 분해능
- 제품 자료
- 결과
- 결과
- return
- s
- 같은
- 라고
- 규모
- 과학자
- 참조
- 민감한
- 세트
- 영상을
- 이후
- 혼자서
- 일부
- 출처
- 안정된
- 학생
- 교육과정
- 이러한
- 감독
- 능가
- 인조
- 합성 데이터
- 시스템은
- 교육
- 팀
- 본문
- 보다
- 그
- XNUMXD덴탈의
- 그들의
- 그들
- 그들
- 맡은 일
- 생각
- 이
- 이번 주
- 을 통하여
- 에
- 이야기
- 너무
- Train
- 훈련 된
- 트레이닝
- 회전
- 밑에 있는
- 사용
- 익숙한
- 사용
- 를 통해
- 시력
- 시각
- 방법
- we
- 주
- 했다
- 뭐
- 언제
- 어느
- 의지
- 윈 - 윈
- 과
- 말
- 악화되는
- 겠지
- 쓴
- 자신의
- 너의
- 제퍼 넷