Renate로 신경망 자동 재훈련

플라톤에 의해 재발행

팔로워 : 0

오늘 우리는 레나테, 자동 모델 재훈련을 위한 오픈 소스 Python 라이브러리. 라이브러리는 더 많은 데이터를 사용할 수 있게 되면 신경망을 점진적으로 훈련할 수 있는 지속적인 학습 알고리즘을 제공합니다.

Renate를 오픈 소싱함으로써 우리는 실제 기계 학습 시스템에서 작업하는 실무자와 자동 기계 학습, 지속적인 학습 및 평생 학습 분야에서 최첨단 기술을 발전시키는 데 관심이 있는 연구원이 함께 모이는 장을 만들고 싶습니다. 우리는 이 두 커뮤니티 간의 시너지 효과가 기계 학습 연구 커뮤니티에서 새로운 아이디어를 생성하고 실제 응용 프로그램에 유형의 긍정적인 영향을 제공할 것이라고 믿습니다.

모델 재훈련 및 치명적인 망각

신경망을 점진적으로 훈련시키는 것은 간단한 작업이 아닙니다. 실제로 서로 다른 시점에 제공된 데이터는 서로 다른 분포에서 샘플링되는 경우가 많습니다. 예를 들어 질문 응답 시스템에서 질문의 주제 분포는 시간이 지남에 따라 크게 달라질 수 있습니다. 분류 시스템에서는 세계 여러 지역에서 데이터를 수집할 때 새로운 범주를 추가해야 할 수 있습니다. 이러한 경우 이전에 훈련된 모델을 새로운 데이터로 미세 조정하면 "치명적인 망각"이라는 현상이 발생합니다. 가장 최근의 예에서는 좋은 성능이 있지만 과거에 수집된 데이터에 대한 예측의 품질은 크게 저하됩니다. 또한, 재학습 작업이 정기적으로(예: 매일 또는 매주) 발생하면 성능 저하가 더욱 심각해집니다.

소량의 데이터를 저장하는 것이 가능할 때, 재훈련 동안 오래된 데이터를 재사용하는 방법은 치명적인 망각 문제를 부분적으로 완화할 수 있습니다. 이 아이디어에 따라 몇 가지 방법이 개발되었습니다. 그들 중 일부는 원시 데이터만 저장하는 반면, 더 발전된 것들은 추가 메타데이터(예: 메모리에 있는 데이터 포인트의 중간 표현)도 저장합니다. 소량의 데이터(예: 수천 개의 데이터 포인트)를 저장하고 이를 신중하게 사용하면 아래 그림과 같은 우수한 성능이 나타납니다.

자체 모델 및 데이터 세트 가져오기

신경망 모델을 교육할 때 네트워크 구조, 데이터 변환 및 기타 중요한 세부 사항을 변경해야 할 수 있습니다. 코드 변경은 제한적이지만 이러한 모델이 대규모 소프트웨어 라이브러리의 일부인 경우 복잡한 작업이 될 수 있습니다. 이러한 불편을 방지하기 위해 Renate는 고객에게 구성 파일의 일부로 미리 정의된 Python 함수에서 모델과 데이터 세트를 정의할 수 있는 기능을 제공합니다. 이는 고객의 코드를 나머지 라이브러리와 명확하게 분리하고 Renate의 내부 구조에 대한 지식이 없는 고객이 라이브러리를 효과적으로 사용할 수 있도록 하는 이점이 있습니다.

또한 모델 정의를 포함한 모든 기능은 매우 유연합니다. 실제로 모델 정의 기능을 통해 사용자는 자신의 필요에 따라 처음부터 신경망을 만들거나 다음과 같은 오픈 소스 라이브러리에서 잘 알려진 모델을 인스턴스화할 수 있습니다. 변압기 or 횃불. 요구 사항 파일에 필요한 종속성을 추가하기만 하면 됩니다.

구성 파일을 작성하는 방법에 대한 자습서는 다음에서 사용할 수 있습니다. 구성 파일을 작성하는 방법.

하이퍼파라미터 최적화의 이점

기계 학습에서 종종 그렇듯이 지속적 학습 알고리즘에는 여러 하이퍼파라미터가 있습니다. 해당 설정은 전체 성능에 중요한 차이를 만들 수 있으며 신중한 조정은 예측 성능에 긍정적인 영향을 미칠 수 있습니다. 새 모델을 교육할 때 Renate는 ASHA와 같은 최신 알고리즘을 사용하여 하이퍼파라미터 최적화(HPO)를 활성화하여 Amazon SageMaker에서 여러 병렬 작업을 실행할 수 있는 기능을 활용할 수 있습니다. 결과의 예가 아래 그림에 표시됩니다.

Renate PlatoBlockchain Data Intelligence로 신경망을 자동으로 재교육합니다. 수직 검색. 일체 포함.

HPO를 활성화하려면 사용자가 검색 공간을 정의하거나 라이브러리와 함께 제공된 기본 검색 공간 중 하나를 사용해야 합니다. 예를 참조하십시오. HPO로 교육 작업 실행. 더 빠른 재조정을 원하는 고객은 전이 학습 기능이 있는 알고리즘을 선택하여 이전 조정 작업의 결과를 활용할 수도 있습니다. 이러한 방식으로 옵티마이저는 다양한 튜닝 작업에서 어떤 하이퍼파라미터가 잘 수행되고 있는지에 대한 정보를 받고 이에 집중하여 튜닝 시간을 단축할 수 있습니다.

클라우드에서 실행

Renate를 사용하면 사용자가 SageMaker를 사용하여 대규모 신경망을 훈련하기 위한 실험을 위해 로컬 머신의 훈련 모델에서 신속하게 전환할 수 있습니다. 사실, 로컬 컴퓨터에서 훈련 작업을 실행하는 것은 특히 대규모 모델을 훈련할 때 다소 이례적입니다. 동시에 세부 사항을 확인하고 로컬에서 코드를 테스트할 수 있다는 것은 매우 유용할 수 있습니다. 이러한 요구에 부응하기 위해 Renate는 구성 파일에서 간단한 플래그를 변경하기만 하면 로컬 시스템과 SageMaker 서비스 간에 빠르게 전환할 수 있습니다.

예를 들어 튜닝 작업을 시작할 때 로컬에서 실행할 수 있습니다. execute_tuning_job(..., backend='local') SageMaker로 빠르게 전환하여 다음과 같이 코드를 변경합니다.

execute_tuning_job(
...,
backend="sagemaker",
role=get_execution_role(),      # requires importing the function from Syne Tune
instance_type="ml.g4dn.2xlarge" # the desired instance type
job_name="name_prefix_",             # a prefix to be used to identify the job
...
)

스크립트를 실행한 후 SageMaker 웹 인터페이스에서 실행 중인 작업을 볼 수 있습니다.

Renate PlatoBlockchain Data Intelligence로 신경망을 자동으로 재교육합니다. 수직 검색. 일체 포함.

교육 작업을 모니터링하고 CloudWatch에서 로그를 읽을 수도 있습니다.

Renate PlatoBlockchain Data Intelligence로 신경망을 자동으로 재교육합니다. 수직 검색. 일체 포함.

이 모든 것이 추가 코드나 노력 없이 가능합니다.

클라우드에서 훈련 작업을 실행하는 전체 예는 다음에서 확인할 수 있습니다. 교육 작업을 실행하는 방법.

결론

이 게시물에서는 신경망 재교육과 관련된 문제와 그 과정에서 Renate 라이브러리의 주요 이점에 대해 설명했습니다. 라이브러리에 대한 자세한 내용은 다음을 확인하세요. GitHub 저장소, 여기에서 상위 수준의 개요를 찾을 수 있습니다. 도서관 및 그 알고리즘, 지침 설치및 예 시작하는 데 도움이 될 수 있습니다.

우리는 당신을 기대합니다 기부금, 관심 있는 모든 사람과 이에 대해 추가로 논의하고 피드백하고 라이브러리가 실제 재교육 파이프라인에 통합되는 것을 확인합니다.

저자 소개

Renate PlatoBlockchain Data Intelligence로 신경망을 자동으로 재교육합니다. 수직 검색. 일체 포함. 조반니 자펠라 AWS Sagemaker에서 장기 과학을 연구하는 수석 응용 과학자입니다. 그는 현재 지속적인 학습, 모델 모니터링 및 AutoML에 대해 연구하고 있습니다. 그 전에는 Amazon Music에서 대규모 추천 시스템을 위한 multi-armed bandits 애플리케이션 작업을 했습니다.

Renate PlatoBlockchain Data Intelligence로 신경망을 자동으로 재교육합니다. 수직 검색. 일체 포함. 마틴 위스투바 AWS Sagemaker 장기 과학 팀의 응용 과학자입니다. 그의 연구는 자동 기계 학습에 중점을 둡니다.

루카스 발레스 AWS의 응용 과학자입니다. 그는 모델 모니터링과 관련된 지속적인 학습 및 주제에 대해 작업합니다.

세드릭 아르샹보 AWS의 수석 응용 과학자이자 학습 및 지능형 시스템을 위한 유럽 연구소의 펠로우입니다.

타임 스탬프 : 2022 년 12 월 19 일2022 년 12 월 19 일

타임 스탬프 : 7년 2023월 XNUMX일

Renate로 신경망 자동 재훈련

플라톤에 의해 재발행

모델 재훈련 및 치명적인 망각

자체 모델 및 데이터 세트 가져오기

하이퍼파라미터 최적화의 이점

클라우드에서 실행

결론

저자 소개

더보기 AWS 기계 학습

Amazon Search가 AWS에서 NVIDIA Triton을 사용하여 짧은 지연 시간, 높은 처리량의 T5 추론을 달성하는 방법

Amazon Neptune에서 다국어 텍스트 속성을 인코딩하여 예측 모델 훈련

심층 신경망을 이용한 클라우드 기반 의료 영상 재구성

개인화된 기계 학습 및 Amazon SageMaker를 사용하여 차량 내 편안함 달성

Test Workbench로 Amazon Lex 챗봇 개발 수명 주기 단축 | 아마존 웹 서비스

회사 소개

수직 검색 및 인공 지능

플랫폼

연결 유지

계정