Amazon Kendra의 새로운 확장 데이터 형식 지원

Amazon Kendra의 새로운 확장 데이터 형식 지원

전 세계 기업은 직원과 최종 고객을 위한 통합 검색 환경을 구현하기 위해 여러 데이터 소스를 활용하려고 합니다. 조사하고 인덱싱해야 하는 방대한 양의 데이터를 고려할 때 검색 속도, 솔루션 확장성 및 검색 성능은 엔터프라이즈 지능형 검색 솔루션을 선택할 때 고려해야 할 핵심 요소가 됩니다. 또한 이러한 고유한 데이터 소스는 호환성 문제를 일으킬 수 있는 다양한 파일 유형을 포함하여 정형 및 비정형 콘텐츠 리포지토리로 구성됩니다.

아마존 켄드라 자연어 처리 및 고급 검색 알고리즘을 사용하여 비정형 및 정형 데이터에서 사용자가 질문에 대한 답변을 검색할 수 있는 매우 정확하고 지능적인 검색 서비스입니다. 질문에 대한 구체적인 답변을 반환하여 사용자에게 인간 전문가와 상호 작용하는 것과 같은 경험을 제공합니다.

오늘 Amazon Kendra는 사용할 수 있는 XNUMX가지 추가 데이터 형식 지원 옵션을 출시했습니다. 이를 통해 기존 데이터 소스를 있는 그대로 쉽게 통합하고 여러 콘텐츠 저장소에서 지능형 검색을 수행할 수 있습니다.

이 게시물에서는 지원되는 새로운 데이터 형식과 이를 사용하는 방법에 대해 설명합니다.

새로 지원되는 데이터 형식

이전에는 Amazon Kendra 지원 문서 여기에는 자주 묻는 질문과 답변 형식의 구조화된 텍스트와 HTML 파일, Microsoft PowerPoint 프레젠테이션, Microsoft Word 문서, 일반 텍스트 문서 및 PDF 형식의 비구조적 텍스트가 포함되었습니다.

이번 출시로 Amazon Kendra는 이제 XNUMX가지 추가 데이터 형식을 지원합니다.

  • 서식 있는 텍스트 형식(RTF)
  • 자바스크립트 객체 표기법(JSON)
  • 마크다운(MD)
  • 쉼표로 구분된 값(CSV)
  • 마이크로소프트 엑셀(MS 엑셀)
  • XML (Extensible Markup Language)
  • XSLT (확장 가능한 스타일 시트 언어 변환)

Amazon Kendra 사용자는 다음 두 가지 방법으로 데이터 형식이 다른 이러한 문서를 인덱스로 수집할 수 있습니다.

솔루션 개요

다음 섹션에서는 데이터 소스에서 문서를 추가하고 해당 문서에서 검색을 수행하는 단계를 안내합니다.

다음 다이어그램은 솔루션 아키텍처를 보여줍니다.

Amazon Kendra PlatoBlockchain Data Intelligence의 새로운 확장된 데이터 형식 지원. 수직 검색. 일체 포함.

지원되는 형식에 대해 이 솔루션을 테스트하려면 자체 데이터를 사용해야 합니다. 동일하거나 다른 형식의 문서를 S3 버킷에 업로드하여 테스트할 수 있습니다.

Amazon Kendra 인덱스 생성

Amazon Kendra 인덱스 생성에 대한 지침은 다음을 참조하십시오. 인덱스 생성.

이 데모에 사용할 기존 인덱스가 있는 경우 이 단계를 건너뛸 수 있습니다.

S3 버킷에 문서를 업로드하고 S3 커넥터를 사용하여 인덱스에 수집

S3 버킷을 인덱스에 연결하려면 다음 단계를 완료하십시오.

  1. S3 버킷 생성 문서를 저장합니다.
  2. 폴더 만들기 명명된 샘플 데이터입니다.
  3. 테스트할 문서를 폴더에 업로드합니다.
  4. Amazon Kendra 콘솔에서 인덱스로 이동하여 선택합니다. 데이터 소스.
  5. 왼쪽 메뉴에서 데이터 소스 추가.
  6. $XNUMX Million 미만 사용 가능한 데이터 소스, 고르다 S3 선택하고 커넥터 추가.
  7. 커넥터 이름(예: Demo_S3_connector) 및 선택 다음 보기.
  8. 왼쪽 메뉴에서 S3 찾아보기 문서를 업로드한 S3 버킷을 선택합니다.
  9. 럭셔리 IAM 역할, 새 역할을 만듭니다.
  10. 럭셔리 동기화 실행 일정 설정, 고르다 주문형 실행.
  11. 왼쪽 메뉴에서 다음 보기.
  12. 검토 및 생성 페이지에서 선택 데이터 소스 추가.
  13. 생성 프로세스가 완료되면 다음을 선택합니다. 지금 동기화.

일부 문서를 수집했으므로 이제 기본 제공 검색 콘솔로 이동하여 쿼리를 테스트할 수 있습니다.

Amazon Kendra 검색 콘솔로 문서 검색

Amazon Kendra 콘솔에서 인덱싱된 콘텐츠 검색 탐색 창에서

다음은 다양한 문서 유형에 대한 검색 결과의 예입니다.

  • RTF – S3 버킷에 업로드된 RTF 형식의 데이터를 입력하고 데이터 소스를 동기화합니다.

Amazon Kendra PlatoBlockchain Data Intelligence의 새로운 확장된 데이터 형식 지원. 수직 검색. 일체 포함.

다음 스크린샷은 검색 결과를 보여줍니다.

Amazon Kendra PlatoBlockchain Data Intelligence의 새로운 확장된 데이터 형식 지원. 수직 검색. 일체 포함.

  • JSON – S3 버킷에 업로드된 JSON 형식의 데이터를 입력하고 데이터 원본을 동기화합니다.

Amazon Kendra PlatoBlockchain Data Intelligence의 새로운 확장된 데이터 형식 지원. 수직 검색. 일체 포함.

다음 스크린샷은 검색 결과를 보여줍니다.

Amazon Kendra PlatoBlockchain Data Intelligence의 새로운 확장된 데이터 형식 지원. 수직 검색. 일체 포함.

  • 인하 – S3 버킷에 업로드된 MD 형식의 입력 데이터 및 데이터 소스 동기화:

Amazon Kendra PlatoBlockchain Data Intelligence의 새로운 확장된 데이터 형식 지원. 수직 검색. 일체 포함.

다음 스크린샷은 검색 결과를 보여줍니다.

Amazon Kendra PlatoBlockchain Data Intelligence의 새로운 확장된 데이터 형식 지원. 수직 검색. 일체 포함.

  • CSV – S3 버킷에 업로드된 CSV 형식의 데이터 입력 및 데이터 소스 동기화:

Amazon Kendra PlatoBlockchain Data Intelligence의 새로운 확장된 데이터 형식 지원. 수직 검색. 일체 포함.

다음 스크린샷은 검색 결과를 보여줍니다.

Amazon Kendra PlatoBlockchain Data Intelligence의 새로운 확장된 데이터 형식 지원. 수직 검색. 일체 포함.

  • 뛰어나다 – S3 버킷에 업로드된 Excel 형식의 입력 데이터 및 데이터 소스 동기화:

Amazon Kendra PlatoBlockchain Data Intelligence의 새로운 확장된 데이터 형식 지원. 수직 검색. 일체 포함.

다음 스크린샷은 검색 결과를 보여줍니다.

Amazon Kendra PlatoBlockchain Data Intelligence의 새로운 확장된 데이터 형식 지원. 수직 검색. 일체 포함.

  • XML – S3 버킷에 업로드된 XML 형식의 데이터 입력 및 데이터 소스 동기화:

Amazon Kendra PlatoBlockchain Data Intelligence의 새로운 확장된 데이터 형식 지원. 수직 검색. 일체 포함.

다음 스크린샷은 검색 결과를 보여줍니다.

Amazon Kendra PlatoBlockchain Data Intelligence의 새로운 확장된 데이터 형식 지원. 수직 검색. 일체 포함.

  • XSLT – S3 버킷에 업로드된 XSLT 형식의 데이터를 입력하고 데이터 원본을 동기화합니다.

Amazon Kendra PlatoBlockchain Data Intelligence의 새로운 확장된 데이터 형식 지원. 수직 검색. 일체 포함.

다음 스크린샷은 검색 결과를 보여줍니다.

Amazon Kendra PlatoBlockchain Data Intelligence의 새로운 확장된 데이터 형식 지원. 수직 검색. 일체 포함.

정리

향후 비용 발생을 방지하려면 다음 단계를 사용하여 이 솔루션의 일부로 생성한 리소스를 정리하십시오.

  1. Amazon Kendra 콘솔에서 색인 탐색 창에서
  2. 삭제할 데이터 소스가 포함된 인덱스를 선택합니다.
  3. 탐색 창에서 데이터 소스.
  4. 제거할 데이터 소스를 선택한 다음 ..

데이터 원본을 삭제하면 Amazon Kendra가 데이터 원본에 대해 저장된 모든 정보를 제거합니다. Amazon Kendra는 인덱스에 저장된 모든 문서 데이터와 데이터 원본과 연결된 모든 실행 기록 및 지표를 제거합니다. 데이터 소스를 삭제해도 스토리지에서 원본 문서는 제거되지 않습니다.

  1. Amazon Kendra 콘솔에서 탐색 창의 인덱스.
  2. 삭제할 인덱스를 선택한 다음 ..

인용하다 인덱스 및 데이터 소스 삭제 자세한 내용은.

  1. Amazon S3 콘솔에서 버킷 탐색 창에서
  2. 삭제하려는 버킷을 선택한 다음 ..
  3. 삭제를 확인하기 위해 버킷 이름을 입력한 다음 버킷 삭제.

버킷에 객체가 포함되어 있으면 오류 알림을 받게 됩니다. 오류 메시지의 링크를 선택하고 다음 지침에 따라 삭제하기 전에 버킷을 비우십시오. 빈 양동이 페이지. 그런 다음 버킷 삭제 페이지를 열고 버킷을 삭제합니다.

  1. 버킷을 삭제했는지 확인하려면 버킷 페이지에서 삭제한 버킷의 이름을 입력합니다. 버킷을 찾을 수 없으면 삭제가 성공한 것입니다.

인용하다 버킷 페이지 삭제 자세한 내용은.

결론

이 게시물에서는 Amazon Kendra가 현재 지원하는 새로운 데이터 형식에 대해 논의했습니다. 또한 Amazon Kendra를 사용하여 S3 버킷에 저장된 이러한 새로운 문서 유형을 수집하고 검색하는 방법에 대해 논의했습니다. 지원되는 다양한 데이터 형식에 대한 자세한 내용은 다음을 참조하십시오. 문서의 종류.

기본 사항에 대해 소개했지만 다음과 같이 이 게시물에서 다루지 않은 많은 추가 기능이 있습니다.

  • Amazon Kendra 인덱스에 대한 사용자 기반 액세스 제어를 활성화하고 구성한 사용자 및 그룹에 대한 액세스를 제한할 수 있습니다.
  • 추가 필드를 Amazon Kendra 인덱스 속성에 매핑하고 패싯, 검색 및 검색 결과에 표시하도록 활성화할 수 있습니다.
  • Service Now 및 Salesforce와 같은 다양한 타사 데이터 원본 커넥터를 Amazon Kendra의 사용자 지정 문서 강화(CDE) 기능과 통합하여 수집 중에 추가 특성 매핑 논리 및 사용자 지정 콘텐츠 변환을 수행할 수 있습니다. 지원되는 커넥터의 전체 목록은 다음을 참조하십시오. 커넥터.

이러한 가능성 등에 대해 알아보려면 다음을 참조하십시오. Amazon Kendra 개발자 안내서.


저자 소개

Amazon Kendra PlatoBlockchain Data Intelligence의 새로운 확장된 데이터 형식 지원. 수직 검색. 일체 포함.리샤브 야다브 AWS의 DevOps 및 보안 오퍼링에 대한 광범위한 배경 지식을 갖춘 AWS의 파트너 솔루션 아키텍트입니다. 그는 ASEAN 파트너와 협력하여 Well-Architected 프레임워크 구현을 통한 AWS 사례 구축과 함께 엔터프라이즈 클라우드 채택 및 아키텍처 검토에 대한 지침을 제공합니다. 일 외에는 스포츠 분야와 FPS 게임에서 시간을 보내는 것을 좋아합니다.

Amazon Kendra PlatoBlockchain Data Intelligence의 새로운 확장된 데이터 형식 지원. 수직 검색. 일체 포함.크루티 자야심하 라오 AI 및 ML에 중점을 둔 파트너 솔루션 설계자입니다. 그녀는 AWS 클라우드에서 안전하고 탄력적이며 가용성이 높은 솔루션을 구축하기 위한 모범 사례에 따라 AWS 파트너에게 기술 지침을 제공합니다.

Amazon Kendra PlatoBlockchain Data Intelligence의 새로운 확장된 데이터 형식 지원. 수직 검색. 일체 포함.케르티 쿠마르 칼루르 AWS의 소프트웨어 개발 엔지니어입니다. 그는 지난 2년 동안 AWS Kendra 팀에서 근무하며 고객뿐만 아니라 다양한 기능을 담당했습니다. 여가 시간에는 하이킹과 같은 야외 활동, 배구와 같은 스포츠를 좋아합니다.

타임 스탬프 :

더보기 AWS 기계 학습