Amazon Bedrock에서 검색 증강 생성을 사용하여 TV/OTT 플랫폼용 영화 챗봇 구축

플라톤에 의해 재발행

팔로워 : 0

사용자가 새로운 콘텐츠를 발견하는 방식을 개선하는 것은 미디어 플랫폼에서 사용자 참여와 만족도를 높이는 데 중요합니다. 키워드 검색만으로는 의미와 사용자 의도를 파악하는 데 어려움이 있어 관련 컨텍스트가 부족한 결과가 나옵니다. 예를 들어 데이트 밤이나 크리스마스 테마 영화를 찾는 것입니다. 사용자가 원하는 콘텐츠를 안정적으로 찾을 수 없는 경우 유지율이 낮아질 수 있습니다. 그러나 큰 언어 모델 (LLM)에는 이러한 의미론적 및 사용자 의도 문제를 해결할 수 있는 기회가 있습니다. 결합하여 임베딩 라는 기술을 사용하여 의미를 포착합니다. 검색 증강 생성(RAG)을 사용하면 자체 데이터 소스에서 검색된 컨텍스트를 기반으로 보다 관련성이 높은 답변을 생성할 수 있습니다.

이 게시물에서는 다음을 사용하여 자신의 데이터로 RAG를 구현하여 영화 챗봇을 안전하게 만드는 방법을 보여줍니다. 기술 자료 for 아마존 기반암. 우리는 IMDb 및 Box Office Mojo 데이터 세트를 사용하여 미디어 및 엔터테인먼트 고객을 위한 카탈로그를 시뮬레이션하고 몇 단계만으로 자체 RAG 솔루션을 구축할 수 있는 방법을 보여줍니다.

솔루션 개요

XNUMXD덴탈의 IMDb 및 Box Office Mojo 영화/TV/OTT 라이센스 데이터 패키지는 1.6억 이상의 사용자 평가를 포함하여 광범위한 엔터테인먼트 메타데이터를 제공합니다. 13만 명 이상의 출연진 및 제작진을 위한 크레딧; 10만 개의 영화, TV 및 엔터테인먼트 타이틀; 60개국 이상의 글로벌 박스오피스 보고 데이터. 많은 AWS 미디어 및 엔터테인먼트 고객이 다음을 통해 IMDb 데이터에 라이선스를 부여합니다. AWS 데이터 교환 콘텐츠 검색을 개선하고 고객 참여 및 유지율을 높입니다.

Amazon Bedrock에 대한 기술 자료 소개

LLM에 최신 독점 정보를 제공하기 위해 조직에서는 회사 데이터 소스에서 데이터를 가져오고 해당 데이터로 프롬프트를 강화하여 보다 관련성이 높고 정확한 응답을 제공하는 기술인 RAG를 사용합니다. Amazon Bedrock에 대한 기술 자료를 사용하면 상황에 맞는 관련 회사 데이터로 LLM 응답을 사용자 정의할 수 있는 완전 관리형 RAG 기능을 사용할 수 있습니다. 기술 자료는 수집, 검색, 신속한 확장 및 인용을 포함한 엔드투엔드 RAG 워크플로우를 자동화하므로 데이터 소스를 통합하고 쿼리를 관리하기 위해 사용자 정의 코드를 작성할 필요가 없습니다. Amazon Bedrock의 지식 베이스는 또한 LLM이 정답으로 복잡한 사용자 쿼리에 응답할 수 있도록 다중 대화를 지원합니다.

이 솔루션의 일부로 다음 서비스를 사용합니다.

다음과 같은 높은 수준의 단계를 거칩니다.

IMDb 데이터를 전처리하여 모든 영화 기록에서 문서를 생성하고 데이터를 아마존 단순 스토리지 서비스 (Amazon S3) 버킷.
기술 자료를 만듭니다.
기술 자료를 데이터 소스와 동기화하세요.
지식 기반을 사용하여 영화 카탈로그에 대한 의미론적 쿼리에 답합니다.

사전 조건

이 게시물에 사용된 IMDb 데이터를 사용하려면 상업용 콘텐츠 라이선스와 AWS Data Exchange의 IMDb 및 Box Office Mojo Movies/TV/OTT 라이선스 패키지에 대한 유료 구독이 필요합니다. 라이선스에 대해 문의하고 샘플 데이터에 액세스하려면 다음을 방문하세요. 개발자.imdb.com. 데이터세트에 액세스하려면 다음을 참조하세요. IMDb 지식 그래프를 활용한 파워 추천 및 검색 - 1부 과를 수행 IMDb 데이터에 액세스 안내

IMDb 데이터 전처리

지식 베이스를 생성하기 전에 IMDb 데이터 세트를 텍스트 파일로 사전 처리하고 S3 버킷에 업로드해야 합니다. 이 게시물에서는 IMDb 데이터 세트를 사용하여 고객 카탈로그를 시뮬레이션합니다. 카탈로그용 IMDb 데이터세트에서 10,000개의 인기 영화를 가져와 데이터세트를 구축합니다.

다음을 사용하십시오. 수첩 배우, 감독, 제작자 이름과 같은 추가 정보가 포함된 데이터 세트를 생성합니다. 다음 코드를 사용하여 LLM이 이해할 수 있는 구조화되지 않은 텍스트로 파일에 저장된 모든 정보를 포함하는 영화용 단일 파일을 만듭니다.

def create_txt_files_imdb(row): full_text = "" full_text += f"{row['originalTitle']} ({row['titleId']}) was shot in year {int(row['year'])} with rating {row['rating']} and poster url {row['poster_url']}.nn" full_text += f"{row['originalTitle']} has genres {', '.join(row['genres'])}.nn" full_text += f"{row['originalTitle']} has actors {', '.join(row['Actors'])}.nn" full_text += f"{row['originalTitle']} has directors {', '.join(row['Directors'])}.nn" full_text += f"{row['originalTitle']} has producers {', '.join(row['Producers'])}.nn" full_text += f"{row['originalTitle']} has keyword {', '.join([x.replace('-',' ') for x in row['keyword']])}.nn" full_text += f"{row['originalTitle']} has location {', '.join(row['location'])}.nn" full_text += f"{row['originalTitle']} has plot {row['plot']}.nn" with open(f"<path>/data/imdb_data/{row['titleId']}.txt","w") as f: f.write(full_text) return full_text

.txt 형식의 데이터가 있으면 다음 명령을 사용하여 Amazon S3에 데이터를 업로드할 수 있습니다.

aws s3 cp <path to local data> s3://<bucket-name>/<path>/ --recursive

IMDb 기술 자료 만들기

기술 자료를 만들려면 다음 단계를 완료하세요.

Amazon Bedrock 콘솔에서 다음을 선택합니다. 기술 자료 탐색 창에서
왼쪽 메뉴에서 지식창고 만들기.
럭셔리 기술 자료 이름, 입력 imdb.
럭셔리 기술 자료 설명에서 imdb 데이터 수집 및 저장을 위한 기술 자료와 같은 선택적 설명을 입력합니다.
럭셔리 IAM 권한, 고르다 새 서비스 역할 생성 및 사용을 클릭한 다음 새 서비스 역할의 이름을 입력하세요.
왼쪽 메뉴에서 다음 보기.

지식 베이스 세부정보 콘솔 페이지

럭셔리 데이터 소스 이름, 입력 imdb-s3.
럭셔리 S3 URI에서 데이터를 업로드한 S3 URI를 입력합니다.
. 고급 설정 – 선택 사항 섹션 청킹 전략선택한다. 청킹 없음.
왼쪽 메뉴에서 다음 보기.

기술 자료를 사용하면 문서를 작은 세그먼트로 나누어 대용량 문서를 쉽게 처리할 수 있습니다. 우리의 경우에는 이미 데이터를 더 작은 크기의 문서(영화당 하나)로 분할했습니다.

지식 기반 콘솔 2

. 벡터 데이터베이스 섹션에서 선택 새 벡터 저장소를 빠르게 생성.

Amazon Bedrock은 완전 관리형 OpenSearch 서버리스 벡터 검색 컬렉션을 자동으로 생성하고 선택한 Titan Embedding G1 – 텍스트 임베딩 모델을 사용하여 데이터 소스를 임베딩하기 위한 설정을 구성합니다.

지식 기반 벡터 스토어 페이지

왼쪽 메뉴에서 다음 보기.

Amazon Bedrock에서 검색 증강 생성을 사용하여 TV/OTT 플랫폼용 영화 챗봇 구축 | Amazon Web Services PlatoBlockchain 데이터 인텔리전스. 수직 검색. 일체 포함.

설정을 검토하고 지식창고 만들기.

데이터를 지식 베이스와 동기화하세요

이제 기술 자료를 만들었으므로 기술 자료를 데이터와 동기화할 수 있습니다.

Amazon Bedrock 콘솔에서 기술 자료로 이동합니다.
. 데이터 소스 섹션 선택 Sync.

지식 기반 동기화

데이터 소스가 동기화되면 데이터를 쿼리할 준비가 된 것입니다.

의미론적 결과를 사용하여 검색 개선

솔루션을 테스트하고 의미론적 결과를 사용하여 검색을 개선하려면 다음 단계를 완료하십시오.

Amazon Bedrock 콘솔에서 기술 자료로 이동합니다.
지식 베이스를 선택하고 다음을 선택하세요. 지식 기반 테스트.
왼쪽 메뉴에서 모델 선택, 선택 인류 클로드 v2.1.
왼쪽 메뉴에서 신청.

이제 데이터를 쿼리할 준비가 되었습니다.

“크리스마스 테마 영화 추천 좀 해주세요”와 같은 의미론적인 질문을 할 수 있습니다.

쿼리 크리스마스 테마의 영화를 추천해 주세요.

지식 기반 응답에는 응답의 정확성과 사실성을 확인할 수 있는 인용이 포함되어 있습니다.

지식 기반 인용

또한 이러한 영화에서 필요한 정보를 드릴다운할 수도 있습니다. 다음 예에서는 “크리스마스 전에 악몽을 연출한 사람은 누구입니까?”라고 질문합니다.

"크리스마스 전에 악몽을 연출한 사람은 누구죠?"

"시청률이 7점보다 높은 고전 애니메이션 영화를 보여주시겠어요?"와 같이 장르 및 시청률과 관련된 보다 구체적인 질문을 할 수도 있습니다.

평점이 7점보다 높은 고전 애니메이션 영화를 보여 주시겠습니까?

상담원을 통해 지식 기반을 강화하세요

Amazon Bedrock용 에이전트 복잡한 작업을 자동화하는 데 도움이 됩니다. 에이전트는 사용자 쿼리를 더 작은 작업으로 나누고 사용자 지정 API 또는 기술 자료를 호출하여 작업 실행에 대한 정보를 보완할 수 있습니다. Amazon Bedrock용 에이전트를 사용하면 개발자는 지능형 에이전트를 앱에 통합하여 AI 기반 애플리케이션 제공을 가속화하고 개발 시간을 몇 주 단축할 수 있습니다. 에이전트를 사용하면 추천과 같은 더 많은 기능을 추가하여 지식 기반을 강화할 수 있습니다. 아마존 개인화 사용자별 추천 또는 사용자 요구에 따라 영화 필터링과 같은 작업을 수행합니다.

결론

이 게시물에서는 자체 데이터와 IMDb 및 Box Office Mojo Movies/TV/OTT 라이선스 데이터 세트를 기반으로 의미론적 검색 및 대화 경험에 응답하기 위해 Amazon Bedrock을 사용하여 대화형 영화 챗봇을 몇 단계로 구축하는 방법을 보여주었습니다. 다음 게시물에서는 Amazon Bedrock용 에이전트를 사용하여 솔루션에 더 많은 기능을 추가하는 과정을 살펴보겠습니다. Amazon Bedrock에서 지식 기반을 시작하려면 다음을 참조하세요. Amazon Bedrock에 대한 기술 자료.

저자에 관하여

Amazon Bedrock에서 검색 증강 생성을 사용하여 TV/OTT 플랫폼용 영화 챗봇 구축 | Amazon Web Services PlatoBlockchain 데이터 인텔리전스. 수직 검색. 일체 포함. 가우라프 렐 Generative AI Innovation Center의 수석 데이터 과학자로서 다양한 분야의 AWS 고객과 협력하여 Generative AI 및 AWS 클라우드 서비스 사용을 가속화하여 비즈니스 과제를 해결하고 있습니다.

Amazon Bedrock에서 검색 증강 생성을 사용하여 TV/OTT 플랫폼용 영화 챗봇 구축 | Amazon Web Services PlatoBlockchain 데이터 인텔리전스. 수직 검색. 일체 포함. 디비 아 바르 가비 Generative AI Innovation Center의 수석 응용 과학자 리드로서 생성 AI 방법을 사용하여 AWS 고객의 고부가가치 비즈니스 문제를 해결하고 있습니다. 그녀는 이미지/비디오 이해 및 검색, 지식 그래프 증강 대형 언어 모델 및 개인화된 광고 사용 사례를 연구하고 있습니다.

Amazon Bedrock에서 검색 증강 생성을 사용하여 TV/OTT 플랫폼용 영화 챗봇 구축 | Amazon Web Services PlatoBlockchain 데이터 인텔리전스. 수직 검색. 일체 포함. 수렌 군투루 Generative AI Innovation Center에서 근무하는 데이터 과학자로서 다양한 AWS 고객과 협력하여 고부가가치 비즈니스 문제를 해결하고 있습니다. 그는 주로 Amazon Bedrock 및 기타 AWS 클라우드 서비스를 통해 대규모 언어 모델을 사용하여 ML 파이프라인을 구축하는 일을 전문으로 합니다.

Amazon Bedrock에서 검색 증강 생성을 사용하여 TV/OTT 플랫폼용 영화 챗봇 구축 | Amazon Web Services PlatoBlockchain 데이터 인텔리전스. 수직 검색. 일체 포함. 비 디아 사가르 라비 파티 그는 Generative AI Innovation Center의 과학 관리자로, 대규모 분산 시스템에 대한 방대한 경험과 기계 학습에 대한 열정을 활용하여 다양한 산업 분야의 AWS 고객이 AI 및 클라우드 채택을 가속화하도록 돕습니다.

SEO 기반 콘텐츠 및 PR 배포. 오늘 증폭하십시오.
PlatoData.Network 수직 생성 Ai. 자신에게 권한을 부여하십시오. 여기에서 액세스하십시오.
PlatoAiStream. 웹3 인텔리전스. 지식 증폭. 여기에서 액세스하십시오.
플라톤ESG. 탄소, 클린테크, 에너지, 환경, 태양광, 폐기물 관리. 여기에서 액세스하십시오.
PlatoHealth. 생명 공학 및 임상 시험 인텔리전스. 여기에서 액세스하십시오.
출처: https://aws.amazon.com/blogs/machine-learning/build-a-movie-chatbot-for-tv-ott-platforms-using-retrieval-augmented-generation-in-amazon-bedrock/

타임 스탬프 : 2024 년 1 월 31 일

타임 스탬프 : 12월 22, 2023

플라톤에 의해 재발행

AWS IoT Greengrass V2를 사용하는 Amazon SageMaker Edge Manager로 이상 감지

Amazon Forecast로 가정 분석을 이전보다 최대 80% 빠르게 수행

InformedIQ는 기계 학습을 사용하여 Origence의 자동 대출에 대한 검증을 자동화합니다.

Amazon Bedrock, Amazon DynamoDB, Amazon Kendra, Amazon Lex 및 LangChain을 사용하여 생성 AI 에이전트 구축 | 아마존 웹 서비스

회사 소개

수직 검색 및 인공 지능

플랫폼

연결 유지

계정