오늘 우리는 다음과 같은 소식을 발표하게 되어 기쁘게 생각합니다. 믹스트랄-8x7B Mistral AI가 개발한 LLM(대형 언어 모델)을 통해 고객이 사용할 수 있습니다. Amazon SageMaker 점프스타트 추론 실행을 위해 한 번의 클릭으로 배포합니다. Mixtral-8x7B LLM은 피드포워드 레이어당 7명의 전문가가 있는 8억 매개변수 백본을 기반으로 하는 사전 훈련된 전문가 모델의 희소 혼합입니다. ML을 빠르게 시작할 수 있도록 알고리즘과 모델에 대한 액세스를 제공하는 기계 학습(ML) 허브인 SageMaker JumpStart로 이 모델을 시험해 볼 수 있습니다. 이 게시물에서는 Mixtral-7xXNUMXB 모델을 검색하고 배포하는 방법을 안내합니다.
Mixtral-8x7B 란 무엇입니까?
Mixtral-8x7B는 Mistral AI가 개발한 기반 모델로, 코드 생성 기능을 통해 영어, 프랑스어, 독일어, 이탈리아어 및 스페인어 텍스트를 지원합니다. 텍스트 요약, 분류, 텍스트 완성, 코드 완성 등 다양한 사용 사례를 지원합니다. 채팅 모드에서는 잘 작동합니다. 모델의 간단한 사용자 정의 가능성을 입증하기 위해 Mistral AI는 공개적으로 사용 가능한 다양한 대화 데이터 세트를 사용하여 미세 조정된 채팅 사용 사례를 위한 Mixtral-8x7B-instruct 모델도 출시했습니다. Mixtral 모델은 최대 32,000개 토큰의 긴 컨텍스트 길이를 갖습니다.
Mixtral-8x7B는 이전 최첨단 모델에 비해 상당한 성능 향상을 제공합니다. 전문가 아키텍처가 드물게 혼합되어 테스트된 자연어 처리(NLP) 벤치마크 9개 중 12개에서 더 나은 성능 결과를 얻을 수 있습니다. 미스트랄 AI. Mixtral은 크기가 최대 10배인 모델의 성능과 일치하거나 이를 능가합니다. 토큰당 극히 일부 매개변수만 활용함으로써 동일한 크기의 조밀한 모델에 비해 더 빠른 추론 속도와 더 낮은 계산 비용을 달성합니다. 예를 들어 총 46.7억 개의 매개변수가 있지만 토큰당 사용되는 매개변수는 12.9억 개에 불과합니다. 고성능, 다국어 지원 및 계산 효율성의 조합으로 Mixtral-8x7B는 NLP 애플리케이션을 위한 매력적인 선택이 됩니다.
이 모델은 제한 없이 사용할 수 있도록 허용되는 Apache 2.0 라이센스에 따라 제공됩니다.
SageMaker JumpStart란?
SageMaker JumpStart를 사용하면 ML 실무자는 점점 늘어나는 최고 성능의 기초 모델 목록에서 선택할 수 있습니다. ML 실무자는 기초 모델을 전용 모델에 배포할 수 있습니다. 아마존 세이지 메이커 네트워크 격리 환경 내에서 인스턴스를 생성하고, 모델 교육 및 배포를 위해 SageMaker를 사용하여 모델을 사용자 정의합니다.
이제 몇 번의 클릭만으로 Mixtral-8x7B를 검색하고 배포할 수 있습니다. 아마존 세이지 메이커 스튜디오 또는 SageMaker Python SDK를 통해 프로그래밍 방식으로 다음과 같은 SageMaker 기능으로 모델 성능 및 MLOps 컨트롤을 파생할 수 있습니다. Amazon SageMaker 파이프 라인, Amazon SageMaker 디버거또는 컨테이너 로그. 이 모델은 AWS 보안 환경과 VPC 제어에 배포되어 데이터 보안을 보장합니다.
모델 살펴보기
SageMaker Studio UI 및 SageMaker Python SDK의 SageMaker JumpStart를 통해 Mixtral-8x7B 기반 모델에 액세스할 수 있습니다. 이 섹션에서는 SageMaker Studio에서 모델을 검색하는 방법을 살펴보겠습니다.
SageMaker Studio는 데이터 준비에서 ML 모델 구축, 교육 및 배포에 이르기까지 모든 ML 개발 단계를 수행하기 위해 특별히 제작된 도구에 액세스할 수 있는 단일 웹 기반 시각적 인터페이스를 제공하는 통합 개발 환경(IDE)입니다. SageMaker Studio 시작 및 설정 방법에 대한 자세한 내용은 다음을 참조하십시오. 아마존 세이지 메이커 스튜디오.
SageMaker Studio에서는 다음을 선택하여 SageMaker JumpStart에 액세스할 수 있습니다. 점프 시작 탐색 창에서
SageMaker JumpStart 랜딩 페이지의 검색 상자에서 "Mixtral"을 검색할 수 있습니다. Mixtral 8x7B 및 Mixtral 8x7B Instruct가 표시된 검색 결과가 표시됩니다.
모델 카드를 선택하면 라이선스, 학습에 사용되는 데이터, 사용 방법 등 모델에 대한 세부 정보를 볼 수 있습니다. 당신은 또한 찾을 수 있습니다 배포 모델을 배포하고 엔드포인트를 생성하는 데 사용할 수 있는 버튼입니다.
모델 배포
선택하면 배포가 시작됩니다. 배포. 배포가 완료되면 엔드포인트가 생성됩니다. 샘플 추론 요청 페이로드를 전달하거나 SDK를 사용하여 테스트 옵션을 선택하여 엔드포인트를 테스트할 수 있습니다. SDK 사용 옵션을 선택하면 SageMaker Studio의 선호하는 노트북 편집기에서 사용할 수 있는 예제 코드가 표시됩니다.
SDK를 사용하여 배포하려면 먼저 다음에서 지정한 Mixtral-8x7B 모델을 선택합니다. model_id with value huggingface-llm-mixtral-8x7b
. 다음 코드를 사용하여 SageMaker에서 선택한 모델을 배포할 수 있습니다. 마찬가지로 자체 모델 ID를 사용하여 Mixtral-8x7B 명령을 배포할 수 있습니다.
그러면 기본 인스턴스 유형 및 기본 VPC 구성을 포함한 기본 구성으로 SageMaker에 모델이 배포됩니다. 기본값이 아닌 값을 지정하여 이러한 구성을 변경할 수 있습니다. JumpStart모델.
배포된 후에는 SageMaker 예측기를 통해 배포된 엔드포인트에 대해 추론을 실행할 수 있습니다.
예제 프롬프트
모델이 입력 시퀀스를 처리하고 시퀀스에서 예측된 다음 단어를 출력하는 표준 텍스트 생성 모델과 마찬가지로 Mixtral-8x7B 모델과 상호 작용할 수 있습니다. 이 섹션에서는 예시 프롬프트를 제공합니다.
코드 생성
이전 예제를 사용하면 다음과 같은 코드 생성 프롬프트를 사용할 수 있습니다.
다음과 같은 결과가 나타납니다.
감정 분석 프롬프트
Mixtral 8x7B에서 다음과 같은 프롬프트를 사용하여 감정 분석을 수행할 수 있습니다.
다음과 같은 결과가 나타납니다.
질문 답변 프롬프트
Mixtral-8x7B에서 다음과 같은 질문 응답 프롬프트를 사용할 수 있습니다.
다음과 같은 결과가 나타납니다.
Mixtral-8x7B 지시
Mixtral-8x7B의 지침 조정 버전은 대화 역할이 사용자 프롬프트로 시작하고 사용자 지침과 보조자(모델 답변)를 번갈아 가며 시작해야 하는 형식화된 지침을 허용합니다. 명령 형식을 엄격하게 준수해야 합니다. 그렇지 않으면 모델이 최적이 아닌 출력을 생성합니다. 교육 모델에 대한 프롬프트를 작성하는 데 사용되는 템플릿은 다음과 같이 정의됩니다.
참고 <s>
및 </s>
문자열의 시작(BOS)과 문자열의 끝(EOS)에 대한 특수 토큰입니다. [INST]
및 [/INST]
일반 문자열입니다.
다음 코드는 명령 형식으로 프롬프트의 형식을 지정하는 방법을 보여줍니다.
지식 검색
지식 검색 프롬프트에 다음 코드를 사용할 수 있습니다.
다음과 같은 결과가 나타납니다.
코딩
Mixtral 모델은 다음 코드와 같이 코딩 작업에 대한 벤치마크 강점을 보여줄 수 있습니다.
수학과 추론
Mixtral 모델은 또한 수학 정확도의 강점을 보고합니다.
- SEO 기반 콘텐츠 및 PR 배포. 오늘 증폭하십시오.
- PlatoData.Network 수직 생성 Ai. 자신에게 권한을 부여하십시오. 여기에서 액세스하십시오.
- PlatoAiStream. 웹3 인텔리전스. 지식 증폭. 여기에서 액세스하십시오.
- 플라톤ESG. 탄소, 클린테크, 에너지, 환경, 태양광, 폐기물 관리. 여기에서 액세스하십시오.
- PlatoHealth. 생명 공학 및 임상 시험 인텔리전스. 여기에서 액세스하십시오.
- 출처: https://aws.amazon.com/blogs/machine-learning/mixtral-8x7b-is-now-available-in-amazon-sagemaker-jumpstart/
- :있다
- :이다
- :아니
- :어디
- $UP
- 000
- 1
- 10
- 100
- 11
- 12
- 120
- 13
- 130
- 14
- 15%
- 16
- 17
- 1M
- 200
- 25
- 26%
- 30
- 32
- 50
- 600
- 7
- 72
- 8
- 9
- a
- 능력
- 소개
- 위의
- 가속하는
- 수락
- ACCESS
- 계정
- 달성
- 달성하다
- 가로질러
- 활동적인
- 추가
- 첨가
- 후
- 반대
- AI
- AI / ML
- 알고리즘
- All
- 또한
- 아마존
- 아마존 세이지 메이커
- Amazon SageMaker 점프스타트
- Amazon Web Services
- 양
- an
- 분석
- 및
- 인프라
- 알리다
- 답변
- 어떤
- 아파치
- 정치
- 어플리케이션
- 적용된
- 적용
- 아키텍처
- 있군요
- 논의
- 기사
- AS
- 조수
- At
- 가능
- AWS
- 뒤로
- 등뼈
- 기반으로
- 세게 때리다
- 배터리
- 베이지안
- BE
- 때문에
- 된
- 전에
- 처음
- 생각
- 종
- 벤치마킹
- 벤치 마크
- 더 나은
- 사이에
- 지폐
- 청구
- 억원
- 일시: XNUMX년 XNUMX월 XNUMX일 화요일 XNUMX:XNUMXpm - XNUMX:XNUMXpm 장소: 여의도 페어몬트 앰배서더 서울 호텔 XNUMXF 아잘레아스 룸 [약도] 행사 문의: info.korea@rescale.com
- 구입
- 보물상자
- 흩어져
- 가져
- 빌드
- 건물
- 내장
- 사업
- 비자 면제 프로그램에 해당하는 국가의 시민권을 가지고 있지만
- by
- 계산하다
- 전화
- 라는
- 통화
- CAN
- 카드
- 케이스
- 가지 경우
- 이전 단계로 돌아가기
- 잡담
- 선택
- 왼쪽 메뉴에서
- 선택
- 크리스
- 분류
- 클릭
- 암호
- 코딩
- 결합
- 비교
- 컴파일
- 완성
- 계산
- 계산
- 컴퓨터
- 컴퓨터 비전
- 회의
- 끊임없이
- 컨테이너
- 함유량
- 문맥
- 계속
- 지속적으로
- 컨트롤
- 대화
- 비용
- 비용
- 수
- 만들
- 만든
- 결정적인
- 컵
- Current
- 고객
- 사용자 정의
- 사용자 정의
- 데이터
- 데이터 보안
- 데이터 세트
- 일
- 일
- 전용
- 태만
- 한정된
- 민주화
- 보여
- 배포
- 배포
- 배치
- 전개
- 배치하다
- 드리프트
- 세부설명
- 개발
- 개발
- 개발자
- 개발
- DICT
- DID
- 발견
- do
- 하지
- 달러
- 도메인
- 한
- 아래 (down)
- 드롭
- 공작
- 듀크 대학
- 마다
- 간결한
- 편집자
- 효율성
- 달걀
- 그렇지 않으면
- 가능
- 수
- 가능
- end
- 종점
- 엔지니어링
- 영어
- 확인
- 환경
- EOS
- 같은
- 동등한
- 윤리적인
- 예
- 초과
- 흥분한
- ...을 제외한
- 전문가
- 전문가
- 설명
- 설명
- 확장자
- 가족
- 빠른
- 특징
- 를
- 파일
- 필터
- Find
- 먼저,
- 수행원
- 다음
- 럭셔리
- 체재
- Foundation
- 분수
- 프랑스어
- 에
- 기능
- 미래
- 범용
- 생성
- 생성
- 세대
- 생성적인
- 제너레이티브 AI
- 독일 사람
- 얻을
- Go
- 좋은
- 있어
- 성장하는
- 미워
- 있다
- he
- 도움
- 도움이
- 도움이
- 그녀의
- 여기에서 지금 확인해 보세요.
- 높은
- 힐즈
- 그의
- 방법
- How To
- HTML
- HTTPS
- 허브
- i
- ICE
- 아이스크림
- ID
- if
- 일리노이
- 질병
- import
- 중대한
- 개선
- 개량
- in
- 포함
- 포함
- Incorporated
- 인프라
- 입력
- 입력
- 예
- 명령
- 통합
- 통합 된
- 상호 작용하는
- 이해
- 인터페이스
- 발명
- 외딴
- IT
- 이탈리아 사람
- 그
- 그 자체
- JPG
- 아이
- 지식
- 카일
- 실험실
- 상륙
- 언어
- 넓은
- 성
- 층
- 오퍼
- 배우기
- 길이
- 하자
- 특허
- 처럼
- 좋아하는
- 제한
- LINK
- 명부
- 청취
- 작은
- LLM
- 논리
- 찾고
- 절감
- 기계
- 기계 학습
- 만든
- 제작
- 유튜브 영상을 만드는 것은
- 매니저
- .
- 성냥
- math
- 수학
- me
- 매질
- 혼합물
- ML
- MLOps
- 모드
- 모델
- 모델
- 수정
- 달
- 배우기
- 모터사이클
- 많은
- 곱
- 음악
- 절대로 필요한 것
- my
- 자연의
- 자연 언어 처리
- 카테고리
- 부정
- 네트워크
- 중립의
- 신제품
- 다음 것
- nlp
- 없음
- 주의
- 수첩
- 지금
- 번호
- of
- 기름
- on
- 일단
- ONE
- 만
- 운영
- 운영 체제
- 선택권
- or
- 기타
- 그렇지 않으면
- 아웃
- 출력
- 출력
- 외부
- 위에
- 자신의
- 페이지
- 지급
- 빵
- 서류
- 매개 변수
- 매개 변수
- 통과
- 열정
- 열렬한
- 경로
- 용
- 수행
- 성능
- 박사 학위
- 전화
- 플라톤
- 플라톤 데이터 인텔리전스
- 플라토데이터
- 포인트 적립
- 휴대용
- 긍정적인
- 게시하다
- 선행
- 예측
- Predictor
- 선호하는
- 준비
- 너무 이른
- 교장
- 인쇄
- 절차 적
- 방법
- 프로세스
- 처리
- 프로덕트
- 프로그램
- 프로그램 작성
- 프롬프트
- 번영
- 제공
- 제공
- 제공
- 공개적으로
- 출판
- Python
- 지구
- 문제
- 빨리
- RE
- 읽기
- 조리법
- 재귀
- 감소
- 참조
- 정규병
- 출시
- 신고
- 의뢰
- 연구
- 연구원
- 제품 자료
- 존경받는
- 응답
- 책임
- 제한
- 결과
- 결과
- return
- 반품
- 승마
- 위험
- 직위별
- 역할
- 방
- 달리기
- 달리는
- s
- SA
- 현자
- 소금
- 확장성
- 규모
- 과학
- 과학자
- SDK
- 검색
- 섹션
- 안전해야합니다.
- 보안
- 참조
- 고르다
- 선택된
- 선택
- 선택
- 연장자
- 감정
- 별도의
- 순서
- 연속
- 서비스
- 세트
- 보여
- 표시
- 쇼
- 상당한
- 비슷하게
- 단순, 간단, 편리
- 이후
- 단일
- 크기
- So
- 사회적
- 사회
- 소프트웨어
- 해결책
- 스페인어
- 특별한
- 전문가
- 지정
- 속도
- 지출
- 표준
- 스타트
- 시작
- 시작
- 최첨단
- 통계적인
- 단계
- 단계
- 아직도
- 정지
- 저장
- 똑 바른
- 전략의
- 흐름
- 강점
- 끈
- 구조화
- 스튜디오
- 이러한
- SUPPORT
- 지원
- 지원
- 체계
- 소요
- 작업
- 키
- 팀
- Technology
- 이 템플릿
- test
- 테스트
- 지원
- 본문
- 그
- XNUMXD덴탈의
- 미래
- 그때
- Bowman의
- 그들
- 이
- 을 통하여
- 시간
- 시계열
- 시대
- 에
- 함께
- 토큰
- 토큰
- 너무
- 검색을
- 금액
- Train
- 트레이닝
- 참된
- 시도
- 짹짹
- 유형
- ui
- 아래에
- 대학
- 유닉스
- 잠금을 해제
- 까지
- 사용
- 유스 케이스
- 익숙한
- 사용자
- 사용
- 사용
- 활용
- 골짜기
- 가치
- 마케팅은:
- 종류
- 버전
- Video
- 관측
- 시력
- 방문
- 시각
- 걷다
- 였다
- 물
- we
- 웹
- 웹 서비스
- 웹 기반
- 잘
- 뭐
- 언제
- 이므로
- 어느
- 화이트
- 누구
- 의지
- 과
- 이내
- 없이
- 말
- 작업
- 겠지
- 쓰다
- 쓴
- 자신의
- 너의
- 제퍼 넷