오늘 Meta Llama 3 기본 모델을 다음을 통해 사용할 수 있다는 소식을 발표하게 되어 기쁘게 생각합니다. Amazon SageMaker 점프스타트 추론을 배포하고 실행합니다. Llama 3 모델은 사전 훈련되고 미세 조정된 생성 텍스트 모델의 모음입니다.
이 게시물에서는 SageMaker JumpStart를 통해 Llama 3 모델을 검색하고 배포하는 방법을 안내합니다.
메타라마3란 무엇인가요?
Llama 3는 8K 컨텍스트 길이의 70B와 8B라는 두 가지 매개변수 크기로 제공되며 추론, 코드 생성 및 명령 따르기 기능이 향상되어 광범위한 사용 사례를 지원할 수 있습니다. Llama 3는 디코더 전용 변환기 아키텍처와 128k 크기로 향상된 모델 성능을 제공하는 새로운 토크나이저를 사용합니다. 또한 Meta는 허위 거부율을 크게 줄이고 정렬을 개선하며 모델 응답의 다양성을 높이는 훈련 후 절차를 개선했습니다. 이제 SageMaker 파이프라인, SageMaker 디버거 또는 컨테이너 로그와 같은 Amazon SageMaker 기능을 통해 Llama 3 성능 및 MLOps 제어의 결합된 이점을 얻을 수 있습니다. 또한 모델은 VPC 제어 하에 AWS 보안 환경에 배포되어 데이터 보안을 제공하는 데 도움이 됩니다.
SageMaker JumpStart란?
SageMaker JumpStart를 사용하면 공개적으로 사용 가능한 다양한 기초 모델 중에서 선택할 수 있습니다. ML 실무자는 네트워크 격리 환경에서 전용 SageMaker 인스턴스에 기초 모델을 배포하고 모델 교육 및 배포를 위해 SageMaker를 사용하여 모델을 사용자 지정할 수 있습니다. 이제 몇 번의 클릭만으로 Llama 3 모델을 검색하고 배포할 수 있습니다. 아마존 세이지 메이커 스튜디오 또는 SageMaker Python SDK를 통해 프로그래밍 방식으로 다음과 같은 SageMaker 기능으로 모델 성능 및 MLOps 컨트롤을 파생할 수 있습니다. SageMaker 파이프 라인, SageMaker 디버거또는 컨테이너 로그. 이 모델은 AWS 보안 환경과 VPC 제어에 배포되어 데이터 보안을 제공하는 데 도움이 됩니다. Llama 3 모델은 현재 Amazon SageMaker Studio에서 배포 및 추론할 수 있습니다. us-east-1
(버지니아 북부), us-east-2
(오하이오), us-west-2
(오레곤), eu-west-1
(아일랜드) 및 ap-northeast-1
(도쿄) AWS 리전.
모델 살펴보기
SageMaker Studio UI 및 SageMaker Python SDK에서 SageMaker JumpStart를 통해 기초 모델에 액세스할 수 있습니다. 이 섹션에서는 SageMaker Studio에서 모델을 검색하는 방법을 살펴봅니다.
SageMaker Studio는 데이터 준비에서 ML 모델 구축, 교육 및 배포에 이르기까지 모든 ML 개발 단계를 수행하기 위해 특별히 제작된 도구에 액세스할 수 있는 단일 웹 기반 시각적 인터페이스를 제공하는 통합 개발 환경(IDE)입니다. SageMaker Studio 시작 및 설정 방법에 대한 자세한 내용은 다음을 참조하십시오. 아마존 세이지 메이커 스튜디오.
SageMaker Studio에서는 사전 훈련된 모델, 노트북 및 사전 구축된 솔루션이 포함된 SageMaker JumpStart에 액세스할 수 있습니다. 사전 구축 및 자동화된 솔루션.
SageMaker JumpStart 랜딩 페이지에서 모델 공급자의 이름을 딴 다양한 허브를 탐색하여 다양한 모델을 쉽게 검색할 수 있습니다. Meta 허브에서 Llama 3 모델을 찾아보실 수 있습니다. Llama 3 모델이 표시되지 않으면 종료했다가 다시 시작해 SageMaker Studio 버전을 업데이트하십시오. 자세한 내용은 다음을 참조하세요. Studio Classic 앱 종료 및 업데이트.
왼쪽 상단 검색창에 "Meta-llama-3"을 검색하시면 Llama 3 모델을 찾으실 수 있습니다.
Meta 허브를 클릭하면 SageMaker JumpStart에서 사용 가능한 모든 메타 모델을 검색할 수 있습니다.
모델 카드를 클릭하면 해당 모델 세부 정보 페이지가 열리고, 여기에서 모델을 쉽게 배포할 수 있습니다.
모델 배포
당신이 선택할 때 배포 EULA 조건을 승인하면 배포가 시작됩니다.
배포 버튼을 클릭하면 표시되는 페이지에서 배포 진행 상황을 모니터링할 수 있습니다.
또는 선택할 수 있습니다 노트북 열기 예제 노트북을 통해 배포합니다. 예제 노트북은 추론을 위해 모델을 배포하고 리소스를 정리하는 방법에 대한 엔드투엔드 지침을 제공합니다.
노트북을 사용하여 배포하려면 먼저 다음에서 지정한 적절한 모델을 선택합니다. model_id
. 다음 코드를 사용하여 SageMaker에서 선택한 모델을 배포할 수 있습니다.
기본적으로 accept_eula
가 False
. 엔드포인트를 성공적으로 배포하려면 EULA에 수동으로 동의해야 합니다. 그렇게 하면 사용자 라이센스 계약 및 사용 제한 정책에 동의하게 됩니다. 라이센스 계약도 찾을 수 있습니다 라마 웹사이트. 그러면 기본 인스턴스 유형 및 기본 VPC 구성을 포함한 기본 구성으로 SageMaker에 모델이 배포됩니다. 기본값이 아닌 값을 지정하여 이러한 구성을 변경할 수 있습니다. JumpStartModel
. 자세한 내용은 다음을 참조하세요. 선적 서류 비치.
다음 표에는 SageMaker JumpStart에서 사용할 수 있는 모든 Llama 3 모델이 나열되어 있습니다. model_ids
, 기본 인스턴스 유형 및 각 모델에 대해 지원되는 총 토큰의 최대 수(입력 토큰 수와 생성된 토큰 수의 합계)입니다.
모델 이름 | 모델 ID | 최대 총 토큰 | 기본 인스턴스 유형 |
메타-라마-3-8B | 메타 텍스트 생성-라마-3-8B | 8192 | ml.g5.12xlarge |
메타-라마-3-8B-지시 | 메타 텍스트 생성-라마-3-8B-지시 | 8192 | ml.g5.12xlarge |
메타-라마-3-70B | 메타 텍스트 생성 라마-3-70b | 8192 | ml.p4d.24xlarge |
메타-라마-3-70B-지시 | 메타 텍스트 생성-라마-3-70b-지시 | 8192 | ml.p4d.24xlarge |
추론 실행
모델을 배포한 후 SageMaker 예측기를 통해 배포된 엔드포인트에 대해 추론을 실행할 수 있습니다. 미세 조정된 지시 모델(Llama 3: 8B Instruct 및 70B Instruct)은 사용자와 채팅 도우미 간의 채팅 기록을 수락하고 후속 채팅을 생성합니다. 사전 훈련된 모델(Llama 3: 8B 및 70B)에는 문자열 프롬프트가 필요하며 제공된 프롬프트에서 텍스트 완성을 수행합니다.
추론 매개변수는 엔드포인트에서 텍스트 생성 프로세스를 제어합니다. Max 새 토큰은 모델에서 생성된 출력의 크기를 제어합니다. 이는 모델의 어휘가 영어 어휘와 동일하지 않고 각 토큰이 영어 단어가 아닐 수 있으므로 단어 수와 동일하지 않습니다. 온도 매개변수는 출력의 무작위성을 제어합니다. 온도가 높을수록 더 창의적이고 환각적인 출력이 생성됩니다. 모든 추론 매개변수는 선택사항입니다.
70B 모델에 대한 예시 프롬프트
모든 텍스트의 텍스트 완성을 위해 Llama 3 모델을 사용할 수 있습니다. 텍스트 생성을 통해 질문 답변, 언어 번역, 감정 분석 등 다양한 작업을 수행할 수 있습니다. 엔드포인트에 대한 입력 페이로드는 다음 코드와 같습니다.
다음은 몇 가지 샘플 예제 프롬프트와 모델에서 생성된 텍스트입니다. 모든 출력은 추론 매개변수로 생성됩니다. {"max_new_tokens":64, "top_p":0.9, "temperature":0.6}
.
다음 예에서는 모델에 사용할 수 있는 훈련 샘플을 제공하는 상황 내 학습이 거의 없는 Llama 3 모델을 사용하는 방법을 보여줍니다. 배포된 모델과 이 프로세스 중에만 추론을 실행하며 모델 가중치는 변경되지 않습니다.
70B-Instruct 모델에 대한 예시 프롬프트
대화 사용 사례에 최적화된 Llama 3 지시 모델을 사용하면 지시 모델 엔드포인트에 대한 입력은 채팅 도우미와 사용자 간의 이전 기록입니다. 지금까지 진행된 대화의 맥락에 맞는 질문을 할 수 있습니다. 채팅 도우미의 동작을 정의하는 페르소나와 같은 시스템 구성을 제공할 수도 있습니다. 입력 페이로드 형식은 사전 학습된 기본 모델과 동일하지만 입력 텍스트의 형식은 다음 방식으로 지정되어야 합니다.
이 지침 템플릿에서는 선택적으로 system
역할을 선택하고 턴제 역사에 원하는 만큼 교대 역할을 포함합니다. 최종 역할은 항상 assistant
두 개의 새로운 줄 바꿈으로 끝납니다.
다음으로, 모델의 몇 가지 예시 프롬프트와 응답을 고려해보세요. 다음 예에서 사용자는 어시스턴트에게 간단한 질문을 하고 있습니다.
다음 예에서 사용자는 어시스턴트와 파리의 관광 명소에 대해 대화를 나눕니다. 그런 다음 사용자는 채팅 도우미가 권장하는 첫 번째 옵션에 대해 문의합니다.
다음 예에서는 시스템 구성을 설정합니다.
정리
노트북 실행을 마친 후에는 청구가 중지되도록 프로세스에서 생성한 모든 리소스를 삭제해야 합니다. 다음 코드를 사용하세요.
결론
이 게시물에서는 SageMaker Studio에서 Llama 3 모델을 시작하는 방법을 보여 주었습니다. 이제 수십억 개의 매개변수가 포함된 3개의 Llama XNUMX 기반 모델에 액세스할 수 있습니다. 기초 모델은 사전 훈련되어 있으므로 훈련 및 인프라 비용을 낮추고 사용 사례에 맞게 사용자 정의할 수 있습니다. 확인해 보세요 세이지메이커 점프스타트 지금 SageMaker Studio에서 시작해 보세요.
저자 정보
카일 울리히 AWS의 Applied Scientist II입니다.
신황 AWS의 수석 응용 과학자입니다
칭란 AWS의 수석 소프트웨어 개발자 엔지니어입니다.
안하오티안 AWS의 소프트웨어 개발자 엔지니어 II입니다.
크리스토퍼 휘튼 AWS의 소프트웨어 개발 엔지니어 II입니다.
타일러 오스터버그 저는 AWS의 소프트웨어 개발 엔지니어입니다.
마난 샤 AWS의 소프트웨어 개발 관리자입니다
조나단 기네가뉴 AWS의 수석 소프트웨어 개발자 엔지니어입니다.
아드리아나 시몬스 AWS의 수석 제품 마케팅 관리자입니다.
준원 AWS의 수석 제품 관리자입니다.
아시시 케탄 AWS의 수석 응용 과학자입니다
라크나 차다 AWS의 AI/ML 수석 솔루션 설계자입니다.
디팍 루파쿨라 AWS의 수석 GTM 전문가입니다.
- SEO 기반 콘텐츠 및 PR 배포. 오늘 증폭하십시오.
- PlatoData.Network 수직 생성 Ai. 자신에게 권한을 부여하십시오. 여기에서 액세스하십시오.
- PlatoAiStream. 웹3 인텔리전스. 지식 증폭. 여기에서 액세스하십시오.
- 플라톤ESG. 탄소, 클린테크, 에너지, 환경, 태양광, 폐기물 관리. 여기에서 액세스하십시오.
- PlatoHealth. 생명 공학 및 임상 시험 인텔리전스. 여기에서 액세스하십시오.
- 출처: https://aws.amazon.com/blogs/machine-learning/meta-llama-3-models-are-now-available-in-amazon-sagemaker-jumpstart/
- :있다
- :이다
- :아니
- :어디
- $UP
- 1
- 10
- 11
- 120
- 19
- 360 학위
- 43
- 7
- 8
- 8k
- 9
- a
- 소개
- 수락
- 허용
- ACCESS
- 얻기 쉬운
- 인정
- 더하다
- 추가
- 또한
- 장점
- 후
- 다시
- 반대
- 협약
- AI / ML
- 조정
- All
- 따라
- 또한
- 항상
- am
- 아마존
- 아마존 세이지 메이커
- Amazon SageMaker 점프스타트
- 아마존 세이지 메이커 스튜디오
- Amazon Web Services
- 분위기
- an
- 분석
- 및
- 인프라
- 알리다
- 답변
- 응답
- 어떤
- Apple
- 적용된
- 적당한
- 아키텍처
- 있군요
- 미술
- AS
- 문의
- 질문
- 조수
- 관련
- At
- 분위기
- 매력
- 관광 명소
- 자동화
- 가능
- 피하기
- AWS
- 기지
- BE
- 곰
- 아름다운
- 때문에
- 된
- 행동
- 베이징
- 믿으세요
- 사이에
- 청구
- 수십억
- 보물상자
- 휴식
- 아슬 아슬한
- 넓은
- 부서진
- 검색
- 건물
- 내장
- 비자 면제 프로그램에 해당하는 국가의 시민권을 가지고 있지만
- 단추
- by
- 통화
- CAN
- 자본
- 카드
- 케이스
- 가지 경우
- 이전 단계로 돌아가기
- 잡담
- 고양이
- 검사
- 왼쪽 메뉴에서
- City
- 고전적인
- 황어 무리
- 암호
- 수집
- 결합
- 결합 된
- 제공
- 의사 소통
- 완성
- 구성
- 고려
- 상수
- 포함하는
- 컨테이너
- 이 포함되어 있습니다
- 문맥
- 문맥
- 지속적으로
- 제어
- 컨트롤
- 편리한
- 대화
- 동
- 비용
- 만들
- 만든
- 창조적 인
- 결정적인
- 문화
- 컵
- 고객
- 사용자 정의
- 사용자 정의
- 데이터
- 데이터 보안
- de
- 전용
- 태만
- 밝히다
- 배포
- 배포
- 배치
- 전개
- 배치하다
- 드리프트
- 원하는
- 목적지
- 세부 묘사
- 세부설명
- 개발자
- 개발
- 대화
- 차이
- 다른
- 저녁 식사
- 발견
- 다양성
- do
- 들린
- 하기
- 돈
- 한
- 배
- 아래 (down)
- ...동안
- 황혼
- e
- 마다
- 용이하게
- 노력
- 가능
- 가능
- end
- 끝으로 종료
- 종점
- 기사
- 엔지니어링
- 영어
- 충분히
- 보장
- 환경
- 조차
- 모든
- 사람
- 예
- 예
- 흥분한
- 경험
- 공정한
- 그릇된
- 유명한
- 멀리
- 묘기
- 추천
- 특징
- 발
- 를
- 영화
- 최후의
- Find
- 먼저,
- 맛
- 흙손
- 흐름
- 수행원
- 발
- 럭셔리
- 체재
- Foundation
- 사
- 프랑스
- 프랑스어
- 신선한
- 에
- 일반
- 일반 상대성 이론
- 생성
- 생성
- 세대
- 생성적인
- 부드러운
- 독일 사람
- 얻을
- 유리
- Go
- 가는
- 점차적으로
- 큰
- 획기적인
- 지도
- 안내를받은
- 발생
- 일이
- 하드
- 노력
- 있다
- 건강
- 도움
- 도움이
- 여기에서 지금 확인해 보세요.
- 더 높은
- 역사적인
- history
- 보유
- 홈
- 시간
- 주택
- 방법
- How To
- HTML
- HTTPS
- 허브
- 허브
- i
- 초상의
- if
- ii
- import
- 인상
- 개선하는
- 개량
- in
- 포함
- 포함
- 증가
- 증가
- 증가
- 정보
- 인프라
- 입력
- 예
- 즉시
- 통합 된
- 인터페이스
- 으로
- 아일랜드
- 외딴
- IT
- 그
- JPG
- 다만
- 유지
- 알아
- 알려진
- 상륙
- 랜드 마크
- 언어
- 가장 큰
- 시작
- 법규
- 배우다
- 배우기
- 왼쪽 (left)
- 길이
- 특허
- 생활
- 해제
- 빛
- 거룻배
- 처럼
- 라인
- 기울기
- 문학
- 작은
- 살고있다
- 삶
- 야마
- 위치한
- 봐라.
- 롯
- 절감
- 만든
- 확인
- 유튜브 영상을 만드는 것은
- 매니저
- 태도
- 수동으로
- .
- 마케팅
- 최대
- 최고
- XNUMX월..
- 의미
- 메시지
- 메타
- 한밤중
- 회의록
- 믹서
- 혼합물
- ML
- MLOps
- 모델
- 모델
- 모니터
- 배우기
- 가장
- 가장 인기 많은
- 많은
- 박물관
- 박물관
- 이름
- 필요
- 필요
- 네트워크
- 신제품
- 다음 것
- 밤
- 아니
- 수첩
- 지금
- 번호
- NY
- 관찰
- 옵저버
- 발생
- of
- 제공
- 제공
- 제공
- 자주
- 오하이오
- 기름
- on
- ONE
- 만
- 열립니다
- 최적의
- 최적화
- 선택권
- or
- 주문
- 오레곤
- 기타
- 우리의
- 우리 것
- 아웃
- 출력
- 출력
- 위에
- 페이지
- 매개 변수
- 매개 변수
- 파리
- 부품
- 수행
- 성능
- 물리학
- 조각
- 장소
- 플라톤
- 플라톤 데이터 인텔리전스
- 플라토데이터
- 경기
- 부디
- 정책
- 인기 문서
- 게시하다
- Predictor
- 준비
- 너무 이른
- 교장
- 절차
- 방법
- 프로덕트
- 제품 관리자
- 프로필
- 진행
- 프롬프트
- 제안
- 제공
- 제공
- 제공
- 제공
- 공개
- 대중 교통
- 공개적으로
- 목적
- 놓다
- Python
- 문제
- 문의
- 무작위성
- 범위
- 거주비용
- RE
- 도달
- 이유
- 조리법
- 추천
- 감소
- 참조
- 거절
- 관련
- 지역
- 상대성
- 필요
- 의지
- 제품 자료
- 응답
- 결과
- 강
- 직위별
- 역할
- 로맨스
- 방
- 달리기
- 달리는
- s
- 현자
- SageMaker 파이프 라인
- 소금
- 같은
- 견본
- 라고
- 과학자
- SDK
- 검색
- 수색
- 둘째
- 섹션
- 안전해야합니다.
- 보안
- 참조
- 선택된
- 선택
- 선택
- 연장자
- 감정
- 서비스
- 피복재
- 세트
- 몇몇의
- 셰이프
- 샷
- 영상을
- 표시
- 보여
- 쇼
- 종료
- 상당한
- 단순, 간단, 편리
- 간단히
- 단일
- 사이트
- 크기
- 크기
- 느리게
- 천천히
- 펴다
- So
- 지금까지
- 소프트웨어
- 소프트웨어 개발
- 해결책
- 솔루션
- 일부
- 불꽃
- 특별한
- 전문가
- 지정
- 지정
- 속도
- Spot
- 서다
- 서있는
- 스타트
- 시작
- 미국
- 침착 한
- 단계
- 중지
- 정지
- 흐름
- 끈
- 구조
- 스튜디오
- 기절시키는
- 후속의
- 대체로
- 성공적으로
- 이러한
- SUPPORT
- 지원
- 확인
- 상징
- 체계
- 테이블
- 재단사
- 받아
- 소요
- 복용
- 작업
- 키
- 팀
- 이 템플릿
- 조건
- 본문
- 감사
- 그
- XNUMXD덴탈의
- 수도
- 세계
- 그때
- 이론
- 그곳에.
- Bowman의
- 그들
- 얇은
- 이
- 수천
- 을 통하여
- 시간
- 에
- 오늘
- 함께
- 토큰
- 토큰
- 도쿄
- 너무
- 검색을
- 상단
- 금액
- 둘러보기
- 탑
- 트레이닝
- 변압기
- 번역
- 번역
- 수송
- 두
- 유형
- 유형
- ui
- 아래에
- 유일한
- 까지
- 업데이트
- 사용
- 유스 케이스
- 사용자
- 사용
- 사용
- 가치 있는
- 마케팅은:
- 변화
- 종류
- 여러
- 버전
- 대단히
- 를 통해
- 보기
- 버지니아의
- 시각
- 음량
- vs
- 걷다
- 원
- 전쟁
- 였다
- 물
- 방법
- we
- 웹
- 웹 서비스
- 웹 기반
- 결혼식
- 잘
- 갔다
- 뭐
- 언제
- 어느
- 동안
- 화이트
- why
- 의지
- 창
- 포도주
- 과
- 궁금
- 워드
- 말
- 작업
- 세계
- 자신의
- 너의
- 제퍼 넷