Δημιουργήστε Generative AI Applications AI For Enterprise Search χρησιμοποιώντας Haystack Pipelines και Amazon SageMaker JumpStart With LLMs

Αναδημοσίευση από τον Πλάτωνα

Ακολουθούν: 0

Αυτή η ανάρτηση ιστολογίου συνυπογράφεται με την Tuana Çelik από βαθιά.

Η αναζήτηση επιχειρήσεων είναι ένα κρίσιμο στοιχείο της οργανωτικής αποτελεσματικότητας μέσω της ψηφιοποίησης εγγράφων και της διαχείρισης γνώσης. Η εταιρική αναζήτηση καλύπτει την αποθήκευση εγγράφων όπως ψηφιακά αρχεία, την ευρετηρίαση των εγγράφων για αναζήτηση και την παροχή σχετικών αποτελεσμάτων με βάση τα ερωτήματα των χρηστών. Με την έλευση των μεγάλων γλωσσικών μοντέλων (LLM), μπορούμε να εφαρμόσουμε εμπειρίες συνομιλίας στην παροχή των αποτελεσμάτων στους χρήστες. Ωστόσο, πρέπει να διασφαλίσουμε ότι τα LLMs περιορίζουν τις απαντήσεις στα δεδομένα της εταιρείας, μετριάζοντας έτσι τις παραισθήσεις του μοντέλου.

Σε αυτήν την ανάρτηση, παρουσιάζουμε πώς να δημιουργήσετε μια ολοκληρωμένη εφαρμογή τεχνητής νοημοσύνης για επιχειρησιακή αναζήτηση με Retrieval Augmented Generation (RAG) χρησιμοποιώντας Haystack pipelines και το μοντέλο Falcon-40b-instruct από Amazon SageMaker JumpStart και Amazon OpenSearch Service. Ο πηγαίος κώδικας για το δείγμα που παρουσιάζεται σε αυτήν την ανάρτηση είναι διαθέσιμος στο Αποθετήριο GitHub

Επισκόπηση λύσεων

Για να περιορίσουμε τις απαντήσεις των γενετικών εφαρμογών AI μόνο σε εταιρικά δεδομένα, πρέπει να χρησιμοποιήσουμε μια τεχνική που ονομάζεται Augmented Generation (RAG). Μια εφαρμογή που χρησιμοποιεί την προσέγγιση RAG ανακτά τις πιο σχετικές με το αίτημα του χρήστη πληροφορίες από τη γνωσιακή βάση ή το περιεχόμενο της επιχείρησης, τις ομαδοποιεί ως πλαίσιο μαζί με το αίτημα του χρήστη ως προτροπή και στη συνέχεια τις στέλνει στο LLM για να λάβει απάντηση. Τα LLM έχουν περιορισμούς σχετικά με τον μέγιστο αριθμό λέξεων για τα μηνύματα εισαγωγής, επομένως η επιλογή των σωστών αποσπασμάτων μεταξύ χιλιάδων ή εκατομμυρίων εγγράφων στην επιχείρηση έχει άμεσο αντίκτυπο στην ακρίβεια του LLM.

Η τεχνική RAG έχει γίνει όλο και πιο σημαντική στην αναζήτηση επιχειρήσεων. Σε αυτήν την ανάρτηση, δείχνουμε μια ροή εργασιών που εκμεταλλεύεται το SageMaker JumpStart για την ανάπτυξη ενός μοντέλου οδηγιών Falcon-40b και χρησιμοποιεί το Haystack για να σχεδιάσει και να εκτελέσει μια διοχέτευση επαυξημένης απάντησης ερωτήσεων ανάκτησης. Η ροή εργασιών αύξησης της τελικής ανάκτησης καλύπτει τα ακόλουθα βήματα υψηλού επιπέδου:

Το ερώτημα χρήστη χρησιμοποιείται για ένα στοιχείο ανάκτησης, το οποίο κάνει μια διανυσματική αναζήτηση, για να ανακτήσει το πιο σχετικό περιβάλλον από τη βάση δεδομένων μας.
Αυτό το πλαίσιο είναι ενσωματωμένο σε μια προτροπή που έχει σχεδιαστεί για να δώσει εντολή σε ένα LLM να δημιουργήσει μια απάντηση μόνο από το παρεχόμενο πλαίσιο.
Το LLM δημιουργεί μια απάντηση στο αρχικό ερώτημα λαμβάνοντας υπόψη μόνο το περιβάλλον που είναι ενσωματωμένο στην προτροπή που έλαβε.

SageMaker JumpStart

Το SageMaker JumpStart χρησιμεύει ως κόμβος μοντέλων που περικλείει ένα ευρύ φάσμα μοντέλων βαθιάς εκμάθησης για περιπτώσεις χρήσης κειμένου, όρασης, ήχου και ενσωμάτωσης. Με περισσότερα από 500 μοντέλα, ο κόμβος μοντέλων του περιλαμβάνει τόσο δημόσια όσο και ιδιόκτητα μοντέλα από συνεργάτες της AWS όπως AI21, Stability AI, Cohere και LightOn. Φιλοξενεί επίσης μοντέλα θεμελίωσης που έχουν αναπτυχθεί αποκλειστικά από την Amazon, όπως το AlexaTM. Μερικά από τα μοντέλα προσφέρουν δυνατότητες για να τα προσαρμόσετε με τα δικά σας δεδομένα. Το SageMaker JumpStart παρέχει επίσης πρότυπα λύσεων που δημιουργούν υποδομές για περιπτώσεις κοινής χρήσης και εκτελέσιμα παραδείγματα σημειωματάρια για μηχανική μάθηση (ML) με το SageMaker.

Σιτάρι

Σιτάρι είναι ένα πλαίσιο ανοιχτού κώδικα από το deepset που επιτρέπει στους προγραμματιστές να ενορχηστρώνουν εφαρμογές LLM που αποτελούνται από διαφορετικά στοιχεία όπως μοντέλα, διανυσματικά DB, μετατροπείς αρχείων και αμέτρητες άλλες ενότητες. Η θημωνιά παρέχει αγωγών και Πράκτορες, δύο ισχυρές δομές για το σχεδιασμό εφαρμογών LLM για διάφορες περιπτώσεις χρήσης, όπως η αναζήτηση, η απάντηση σε ερωτήσεις και η τεχνητή νοημοσύνη συνομιλίας. Με μεγάλη εστίαση σε μεθόδους ανάκτησης αιχμής και σταθερές μετρήσεις αξιολόγησης, σας παρέχει όλα όσα χρειάζεστε για να στείλετε μια αξιόπιστη, αξιόπιστη εφαρμογή. Μπορείτε να σειριοποιήσετε αγωγούς σε Αρχεία YAML, εκθέστε τους μέσω α REST APIκαι κλιμακώστε τα με ευελιξία ανάλογα με τον φόρτο εργασίας σας, διευκολύνοντας τη μεταφορά της εφαρμογής σας από το στάδιο του πρωτοτύπου στην παραγωγή.

Amazon OpenSearch

Η Υπηρεσία OpenSearch είναι μια πλήρως διαχειριζόμενη υπηρεσία που διευκολύνει την ανάπτυξη, την κλίμακα και τη λειτουργία του OpenSearch στο AWS Cloud. Το OpenSearch είναι μια επεκτάσιμη, ευέλικτη και επεκτάσιμη σουίτα λογισμικού ανοιχτού κώδικα για εφαρμογές αναζήτησης, αναλυτικών στοιχείων, παρακολούθησης ασφάλειας και παρατηρησιμότητας, με άδεια χρήσης βάσει της άδειας Apache 2.0.

Τα τελευταία χρόνια, οι τεχνικές ML έχουν γίνει όλο και πιο δημοφιλείς για τη βελτίωση της αναζήτησης. Μεταξύ αυτών είναι η χρήση του μοντέλα ενσωμάτωσης, ένας τύπος μοντέλου που μπορεί να κωδικοποιήσει ένα μεγάλο σώμα δεδομένων σε ένα χώρο ν-διάστατων όπου κάθε οντότητα κωδικοποιείται σε ένα διάνυσμα, ένα σημείο δεδομένων σε αυτόν τον χώρο και οργανωμένο έτσι ώστε παρόμοιες οντότητες να είναι πιο κοντά μεταξύ τους. Μια διανυσματική βάση δεδομένων παρέχει αποτελεσματική αναζήτηση ομοιότητας διανυσμάτων παρέχοντας εξειδικευμένα ευρετήρια όπως ευρετήρια k-NN.

Με τις δυνατότητες διανυσματικής βάσης δεδομένων του OpenSearch Service, μπορείτε να εφαρμόσετε σημασιολογική αναζήτηση, RAG με LLM, μηχανές προτάσεων και εμπλουτισμένα μέσα αναζήτησης. Σε αυτήν την ανάρτηση, χρησιμοποιούμε το RAG για να μας επιτρέψει να συμπληρώσουμε τα γενετικά LLM με μια εξωτερική βάση γνώσεων που συνήθως δημιουργείται χρησιμοποιώντας μια διανυσματική βάση δεδομένων ενυδατωμένη με άρθρα γνώσης που κωδικοποιούνται με διανύσματα.

Επισκόπηση εφαρμογής

Το παρακάτω διάγραμμα απεικονίζει τη δομή της τελικής εφαρμογής.

Σε αυτήν την εφαρμογή, χρησιμοποιούμε το Haystack Indexing Pipeline για τη διαχείριση των μεταφορτωμένων εγγράφων και των εγγράφων ευρετηρίου και το Haystack Query Pipeline για την ανάκτηση γνώσεων από έγγραφα με ευρετήριο.

Το Haystack Indexing Pipeline περιλαμβάνει τα ακόλουθα βήματα υψηλού επιπέδου:

Ανεβάστε ένα έγγραφο.
αρχικοποίηση DocumentStore και ευρετήρια εγγράφων.

Χρησιμοποιούμε το OpenSearch ως δικό μας DocumentStore και μια θημωνιά αγωγός ευρετηρίασης για προεπεξεργασία και ευρετηρίαση των αρχείων μας στο OpenSearch. θημωνιά Μετατροπείς αρχείων και Προεπεξεργαστής σας επιτρέπει να καθαρίζετε και να προετοιμάζετε τα ακατέργαστα αρχεία σας ώστε να είναι σε σχήμα και μορφή που μπορεί να αντιμετωπίσει η διοχέτευση επεξεργασίας φυσικής γλώσσας (NLP) και το μοντέλο γλώσσας της επιλογής σας. Ο αγωγός ευρετηρίασης που χρησιμοποιήσαμε εδώ χρησιμοποιεί επίσης sentence-transformers/all-MiniLM-L12-v2 για να δημιουργήσουμε ενσωματώσεις για κάθε έγγραφο, τις οποίες χρησιμοποιούμε για αποτελεσματική ανάκτηση.

Το Haystack Query Pipeline περιλαμβάνει τα ακόλουθα βήματα υψηλού επιπέδου:

Στέλνουμε ένα ερώτημα στον αγωγό RAG.
An EmbeddingRetriever συστατικό λειτουργεί ως φίλτρο που ανακτά τα πιο σχετικά top_k έγγραφα από τα ευρετηριασμένα έγγραφά μας στο OpenSearch. Χρησιμοποιούμε την επιλογή του μοντέλου ενσωμάτωσης για να ενσωματώσουμε τόσο το ερώτημα όσο και τα έγγραφα (κατά την ευρετηρίαση) για να το πετύχουμε αυτό.
Τα έγγραφα που ανακτήθηκαν είναι ενσωματωμένα στην προτροπή μας για το μοντέλο Falcon-40b-instruct.
Το LLM επιστρέφει με μια απάντηση που βασίζεται στα ανακτημένα έγγραφα.

Για την ανάπτυξη μοντέλων, χρησιμοποιούμε το SageMaker JumpStart, το οποίο απλοποιεί την ανάπτυξη μοντέλων με ένα απλό πάτημα ενός κουμπιού. Αν και χρησιμοποιήσαμε και δοκιμάσαμε την οδηγία Falcon-40b για αυτό το παράδειγμα, μπορείτε να χρησιμοποιήσετε οποιοδήποτε μοντέλο Hugging Face που είναι διαθέσιμο στο SageMaker.

Η τελική λύση είναι διαθέσιμη στο θημωνιά-φασκόμηλος αποθετήριο και χρησιμοποιεί τον ιστότοπο και την τεκμηρίωση του OpenSearch (για το OpenSearch 2.7) ως παράδειγμα δεδομένων μας για να εκτελέσει την ανάκτηση επαυξημένης απάντησης ερωτήσεων.

Προϋποθέσεις

Το πρώτο πράγμα που πρέπει να κάνουμε προτού μπορέσουμε να χρησιμοποιήσουμε οποιαδήποτε υπηρεσία AWS είναι να βεβαιωθούμε ότι έχουμε εγγραφεί και έχουμε δημιουργήσει έναν λογαριασμό AWS. Στη συνέχεια, θα πρέπει να δημιουργήσετε έναν διαχειριστή χρήστη και ομάδα. Για οδηγίες και για τα δύο βήματα, ανατρέξτε στο Ρυθμίστε τις προϋποθέσεις του Amazon SageMaker.

Για να μπορείτε να χρησιμοποιήσετε το Haystack, θα πρέπει να εγκαταστήσετε το farm-haystack πακέτο με τις απαιτούμενες εξαρτήσεις. Για να το πετύχετε αυτό, χρησιμοποιήστε το requirements.txt αρχείο στο Αποθετήριο GitHub τρέχοντας pip install requirements.txt.

Ευρετηρίαση εγγράφων στο OpenSearch

Το Haystack προσφέρει έναν αριθμό συνδέσεων σε βάσεις δεδομένων, οι οποίες καλούνται DocumentStores. Για αυτήν τη ροή εργασίας RAG, χρησιμοποιούμε το OpenSearchDocumentStore. Το παράδειγμα Αποθήκη περιλαμβάνει έναν αγωγό ευρετηρίασης και AWS CloudFormation πρότυπο να στήσει ένα OpenSearchDocumentStore με έγγραφα που ανιχνεύονται από τον ιστότοπο του OpenSearch και τις σελίδες τεκμηρίωσης.

Συχνά, για να λειτουργήσει μια εφαρμογή NLP για περιπτώσεις χρήσης παραγωγής, καταλήγουμε να σκεφτόμαστε την προετοιμασία και τον καθαρισμό δεδομένων. Αυτό καλύπτεται με Αγωγοί ευρετηρίασης άχυρων, που σας επιτρέπει να σχεδιάσετε τα δικά σας βήματα προετοιμασίας δεδομένων, τα οποία τελικά εγγράφουν τα έγγραφά σας στη βάση δεδομένων της επιλογής σας.

Μια διοχέτευση ευρετηρίου μπορεί επίσης να περιλαμβάνει ένα βήμα για τη δημιουργία ενσωματώσεων για τα έγγραφά σας. Αυτό είναι πολύ σημαντικό για το βήμα ανάκτησης. Στο παράδειγμά μας, χρησιμοποιούμε πρόταση-μετασχηματιστές/όλα-MiniLM-L12-v2 ως μοντέλο ενσωμάτωσης. Αυτό το μοντέλο χρησιμοποιείται για τη δημιουργία ενσωματώσεων για όλα τα ευρετηριασμένα έγγραφά μας, αλλά και για το ερώτημα του χρήστη τη στιγμή του ερωτήματος.

Για την ευρετηρίαση εγγράφων στο OpenSearchDocumentStore, παρέχουμε δύο επιλογές με λεπτομερείς οδηγίες στο README του αποθετηρίου παραδειγμάτων. Εδώ, ακολουθούμε τα βήματα για την ευρετηρίαση σε μια υπηρεσία OpenSearch που αναπτύσσεται στο AWS.

Ξεκινήστε μια υπηρεσία OpenSearch

Χρησιμοποιήστε το παρεχόμενο Πρότυπο CloudFormation για να ρυθμίσετε μια υπηρεσία OpenSearch στο AWS. Εκτελώντας την ακόλουθη εντολή, θα έχετε μια κενή υπηρεσία OpenSearch. Στη συνέχεια, μπορείτε είτε να επιλέξετε την ευρετηρίαση των παραδειγμάτων δεδομένων που έχουμε παράσχει είτε να χρησιμοποιήσετε τα δικά σας δεδομένα, τα οποία μπορείτε να καθαρίσετε και να προεπεξεργαστείτε χρησιμοποιώντας το Haystack Indexing Pipeline. Σημειώστε ότι αυτό δημιουργεί ένα στιγμιότυπο που είναι ανοιχτό στο διαδίκτυο, το οποίο δεν συνιστάται για χρήση παραγωγής.

```bash
aws cloudformation create-stack --stack-name HaystackOpensearch --template-body file://cloudformation/opensearch-index.yaml --parameters ParameterKey=InstanceType,ParameterValue=r5.large.search ParameterKey=InstanceCount,ParameterValue=3 ParameterKey=OSPassword,ParameterValue=Password123!
```

Αφήστε περίπου 30 λεπτά για να ολοκληρωθεί η εκκίνηση της στοίβας. Μπορείτε να ελέγξετε την πρόοδό του στην κονσόλα AWS CloudFormation μεταβαίνοντας στο Στοίβες σελίδα και αναζητήστε τη στοίβα με το όνομα HaystackOpensearch.

Ευρετηριάστε έγγραφα στο OpenSearch

Τώρα που έχουμε μια υπηρεσία OpenSearch που εκτελείται, μπορούμε να χρησιμοποιήσουμε την κλάση OpenSearchDocumentStore για να συνδεθούμε σε αυτήν και να γράψουμε τα έγγραφά μας σε αυτήν.

Για να λάβετε το όνομα κεντρικού υπολογιστή για το OpenSearch, εκτελέστε την ακόλουθη εντολή:

```bash
aws cloudformation describe-stacks --stack-name HaystackOpensearch --query "Stacks[0].Outputs[?OutputKey=='OpenSearchEndpoint'].OutputValue" --output text
```

Αρχικά, εξάγετε τα ακόλουθα:

```bash
export OPENSEARCH_HOST='your_opensearch_host'
export OPENSEARCH_PORT=443
export OPENSEARCH_USERNAME=admin
export OPENSEARCH_PASSWORD=Password123!
```

Στη συνέχεια, μπορείτε να χρησιμοποιήσετε το opensearch_indexing_pipeline.py σενάριο για προεπεξεργασία και ευρετηρίαση των παρεχόμενων δεδομένων επίδειξης.

Εάν θέλετε να χρησιμοποιήσετε τα δικά σας δεδομένα, τροποποιήστε τη διοχέτευση ευρετηρίου opensearch_indexing_pipeline.py να συμπεριλάβει το FileConverter και Προεπεξεργαστής βήματα εγκατάστασης που χρειάζεστε.

Εφαρμόστε τον αγωγό ανάκτησης επαυξημένης απάντησης ερωτήσεων

Τώρα που έχουμε ευρετηριάσει δεδομένα στο OpenSearch, μπορούμε να απαντήσουμε σε ερωτήσεις σε αυτά τα έγγραφα. Για αυτόν τον αγωγό RAG, χρησιμοποιούμε το μοντέλο Falcon-40b-instruct που έχουμε αναπτύξει στο SageMaker JumpStart.

Έχετε επίσης την επιλογή να αναπτύξετε το μοντέλο μέσω προγραμματισμού από ένα σημειωματάριο Jupyter. Για οδηγίες, ανατρέξτε στο GitHub repo.

Αναζητήστε το μοντέλο Falcon-40b-instruct στο SageMaker JumpStart.
Αναπτύξτε το μοντέλο σας στο SageMaker JumpStart και σημειώστε το όνομα του τελικού σημείου.

Εξαγάγετε τις ακόλουθες τιμές:

```bash
export SAGEMAKER_MODEL_ENDPOINT=your_falcon_40b_instruc_endpoint
export AWS_PROFILE_NAME=your_aws_profile
export AWS_REGION_NAME=your_aws_region
```

τρέξιμο python rag_pipeline.py.

Αυτό θα ξεκινήσει ένα βοηθητικό πρόγραμμα γραμμής εντολών που περιμένει την ερώτηση ενός χρήστη. Για παράδειγμα, ας ρωτήσουμε "Πώς μπορώ να εγκαταστήσω το cli OpenSearch;"

Αυτό το αποτέλεσμα επιτυγχάνεται επειδή έχουμε ορίσει την προτροπή μας στο Πρότυπο προτροπής για άχυρα να είναι το εξής:

```python
question_answering = PromptTemplate(prompt="Given the context please answer the question. If the answer is not contained within the context below, say 'I don't know'.n" "Context: {join(documents)};n Question: {query};n Answer: ", output_parser=AnswerParser(reference_pattern=r"Document[(d+)]"))
```

Περαιτέρω προσαρμογές

Μπορείτε να κάνετε πρόσθετες προσαρμογές σε διαφορετικά στοιχεία της λύσης, όπως τα ακόλουθα:

Τα δεδομένα – Παρέχουμε το OpenSearch τεκμηρίωση και δεδομένα ως παραδείγματα δεδομένων. Θυμηθείτε να τροποποιήσετε το opensearch_indexing_pipeline.py σενάριο για να ταιριάζει στις ανάγκες σας εάν επιλέξετε να χρησιμοποιήσετε τα δικά σας δεδομένα.
Το μοντέλο – Σε αυτό το παράδειγμα, χρησιμοποιήσαμε το μοντέλο Falcon-40b-instruct. Είστε ελεύθεροι να αναπτύξετε και να χρησιμοποιήσετε οποιοδήποτε άλλο μοντέλο Hugging Face στο SageMaker. Σημειώστε ότι η αλλαγή ενός μοντέλου πιθανότατα σημαίνει ότι θα πρέπει να προσαρμόσετε την προτροπή σας σε κάτι που έχει σχεδιαστεί να χειρίζεται.
η προτροπή – Για αυτήν την ανάρτηση, δημιουργήσαμε τη δική μας PromptTemplate που καθοδηγεί το μοντέλο να απαντήσει σε ερωτήσεις με βάση το παρεχόμενο πλαίσιο και να απαντήσει "Δεν ξέρω" εάν το πλαίσιο δεν περιλαμβάνει σχετικές πληροφορίες. Μπορείτε να αλλάξετε αυτήν την προτροπή για να πειραματιστείτε με διαφορετικές προτροπές με το Falcon-40b-instruct. Μπορείτε επίσης απλά να τραβήξετε μερικές από τις προτροπές μας από το PromptHub.
Το μοντέλο ενσωμάτωσης – Για το βήμα ανάκτησης, χρησιμοποιούμε ένα ελαφρύ μοντέλο ενσωμάτωσης: πρόταση-μετασχηματιστές/όλα-MiniLM-L12-v2. Ωστόσο, μπορείτε επίσης να το αλλάξετε στις ανάγκες σας. Θυμηθείτε να τροποποιήσετε τις αναμενόμενες διαστάσεις ενσωμάτωσης στο δικό σας DocumentStore αναλόγως.
Ο αριθμός των ανακτημένων εγγράφων – Μπορείτε επίσης να επιλέξετε να παίξετε με τον αριθμό των εγγράφων που ζητάτε EmbeddingRetriever για ανάκτηση για κάθε ερώτημα. Στις ρυθμίσεις μας, αυτό έχει οριστεί σε top_k=5. Μπορείτε να πειραματιστείτε με την αλλαγή αυτού του αριθμού για να δείτε εάν η παροχή περισσότερων πλαισίου βελτιώνει την ακρίβεια των αποτελεσμάτων σας.

Ετοιμότητα παραγωγής

Η προτεινόμενη λύση σε αυτήν την ανάρτηση μπορεί να επιταχύνει τον χρόνο έως την αξία της διαδικασίας ανάπτυξης του έργου. Μπορείτε να δημιουργήσετε ένα έργο που είναι εύκολο να κλιμακωθεί με το περιβάλλον ασφάλειας και απορρήτου στο AWS Cloud.

Για ασφάλεια και απόρρητο, η Υπηρεσία OpenSearch παρέχει προστασία δεδομένων με διαχείριση ταυτότητας και πρόσβασης και πρόληψη σύγχυσης μεσολάβησης μεταξύ υπηρεσιών. Μπορείτε να χρησιμοποιήσετε λεπτομερή έλεγχο πρόσβασης χρήστη, έτσι ώστε ο χρήστης να έχει πρόσβαση μόνο στα δεδομένα στα οποία έχει εξουσιοδότηση πρόσβασης. Επιπλέον, το SageMaker παρέχει παραμετροποιήσιμες ρυθμίσεις ασφαλείας για έλεγχο πρόσβασης, την προστασία των δεδομένων, να καταγραφή και παρακολούθηση. Μπορείτε να προστατεύσετε τα δεδομένα σας σε κατάσταση ηρεμίας και κατά τη μεταφορά με Υπηρεσία διαχείρισης κλειδιών AWS πλήκτρα (AWS KMS). Μπορείτε επίσης να παρακολουθείτε το αρχείο καταγραφής ανάπτυξης του μοντέλου SageMaker ή την πρόσβαση στο τελικό σημείο χρησιμοποιώντας amazoncloudwatch. Για περισσότερες πληροφορίες, ανατρέξτε στο Παρακολουθήστε το Amazon SageMaker με το Amazon CloudWatch.

Για την υψηλή επεκτασιμότητα στην Υπηρεσία OpenSearch, μπορείτε να την προσαρμόσετε κατά το μέγεθος των τομέων της Υπηρεσίας OpenSearch και την απασχόληση λειτουργικές βέλτιστες πρακτικές. Μπορείτε επίσης να επωφεληθείτε από την αυτόματη κλιμάκωση του τελικού σημείου του SageMaker — μπορείτε αυτόματη κλίμακα μοντέλων SageMaker για να προσαρμόσετε το τελικό σημείο τόσο όταν αυξάνεται η επισκεψιμότητα ή όταν δεν χρησιμοποιούνται οι πόροι.

εκκαθάριση

Για να εξοικονομήσετε κόστος, διαγράψτε όλους τους πόρους που χρησιμοποιήσατε ως μέρος αυτής της ανάρτησης. Εάν ξεκινήσατε τη στοίβα CloudFormation, μπορείτε να τη διαγράψετε μέσω της κονσόλας AWS CloudFormation. Ομοίως, μπορείτε να διαγράψετε τυχόν τελικά σημεία του SageMaker που έχετε δημιουργήσει μέσω της κονσόλας SageMaker.

Συμπέρασμα

Σε αυτήν την ανάρτηση, παρουσιάσαμε πώς να δημιουργήσετε μια εφαρμογή τεχνητής νοημοσύνης από άκρο σε άκρο για επιχειρηματική αναζήτηση με το RAG χρησιμοποιώντας αγωγούς Haystack και το μοντέλο οδηγιών Falcon-40b από το SageMaker JumpStart και το OpenSearch Service. Η προσέγγιση RAG είναι κρίσιμης σημασίας στην αναζήτηση της επιχείρησης, επειδή διασφαλίζει ότι οι απαντήσεις που παράγονται είναι εντός τομέα και επομένως μετριάζουν τις παραισθήσεις. Χρησιμοποιώντας αγωγούς Haystack, είμαστε σε θέση να ενορχηστρώνουμε εφαρμογές LLM που αποτελούνται από διαφορετικά στοιχεία, όπως μοντέλα και διανυσματικές βάσεις δεδομένων. Το SageMaker JumpStart μας παρέχει μια λύση με ένα κλικ για την ανάπτυξη LLM και χρησιμοποιήσαμε την Υπηρεσία OpenSearch ως τη διανυσματική βάση δεδομένων για τα ευρετηριασμένα δεδομένα μας. Μπορείτε να αρχίσετε να πειραματίζεστε και να δημιουργείτε αποδείξεις RAG για τις εφαρμογές τεχνητής νοημοσύνης που δημιουργούνται στην επιχείρηση σας, χρησιμοποιώντας τα βήματα που περιγράφονται σε αυτήν την ανάρτηση και τον πηγαίο κώδικα που είναι διαθέσιμος στο Αποθετήριο GitHub.

Σχετικά με τους Συγγραφείς

Τουάνα Τσελίκ είναι η Lead Developer Advocate στο deepset, όπου εστιάζει στην κοινότητα ανοιχτού κώδικα για το Haystack. Διευθύνει τη λειτουργία σχέσεων προγραμματιστών και μιλά τακτικά σε εκδηλώσεις για το NLP και δημιουργεί εκπαιδευτικό υλικό για την κοινότητα.

Ρόι Αλέλα είναι Senior AI/ML Specialist Solutions Architect στην AWS με έδρα το Μόναχο της Γερμανίας. Ο Roy βοηθά τους πελάτες της AWS —από μικρές νεοφυείς επιχειρήσεις έως μεγάλες επιχειρήσεις— να εκπαιδεύουν και να αναπτύσσουν μεγάλα μοντέλα γλώσσας αποτελεσματικά στο AWS. Ο Roy είναι παθιασμένος με τα προβλήματα υπολογιστικής βελτιστοποίησης και τη βελτίωση της απόδοσης των φόρτων εργασίας AI.

Μία Τσανγκ είναι Αρχιτέκτονας ML Specialist Solutions για τις Υπηρεσίες Ιστού της Amazon. Συνεργάζεται με πελάτες στην EMEA και μοιράζεται τις βέλτιστες πρακτικές για την εκτέλεση φόρτου εργασίας AI/ML στο cloud με το υπόβαθρό της στα εφαρμοσμένα μαθηματικά, την επιστήμη των υπολογιστών και την AI/ML. Επικεντρώνεται σε συγκεκριμένους φόρτους εργασίας για το NLP και μοιράζεται την εμπειρία της ως ομιλήτρια συνεδρίων και συγγραφέας βιβλίων. Στον ελεύθερο χρόνο της, της αρέσει η πεζοπορία, τα επιτραπέζια παιχνίδια και η παρασκευή καφέ.

Inaam Syed είναι αρχιτέκτονας λύσεων εκκίνησης στην AWS, με ιδιαίτερη έμφαση στην παροχή βοήθειας σε νεοφυείς επιχειρήσεις B2B και SaaS στην κλιμάκωση και την επίτευξη ανάπτυξης. Έχει ένα βαθύ πάθος για αρχιτεκτονικές χωρίς διακομιστές και AI/ML. Στον ελεύθερο χρόνο του, ο Inaam απολαμβάνει ποιοτικές στιγμές με την οικογένειά του και επιδίδεται στην αγάπη του για την ποδηλασία και το μπάντμιντον.

Ντέιβιντ Τίπετ είναι ο Senior Developer Advocate που εργάζεται στο OpenSearch ανοιχτού κώδικα στο AWS. Η δουλειά του περιλαμβάνει όλους τους τομείς της OpenSearch από την αναζήτηση και τη συνάφεια έως την παρατηρησιμότητα και την ανάλυση ασφαλείας.

SEO Powered Content & PR Distribution. Ενισχύστε σήμερα.
PlatoData.Network Vertical Generative Ai. Ενδυναμώστε τον εαυτό σας. Πρόσβαση εδώ.
PlatoAiStream. Web3 Intelligence. Ενισχύθηκε η γνώση. Πρόσβαση εδώ.
PlatoESG. Αυτοκίνητο / EVs, Ανθρακας, Cleantech, Ενέργεια, Περιβάλλον, Ηλιακός, Διαχείριση των αποβλήτων. Πρόσβαση εδώ.
PlatoHealth. Ευφυΐα βιοτεχνολογίας και κλινικών δοκιμών. Πρόσβαση εδώ.
ChartPrime. Ανεβάστε το Trading Game σας με το ChartPrime. Πρόσβαση εδώ.
BlockOffsets. Εκσυγχρονισμός της περιβαλλοντικής αντιστάθμισης ιδιοκτησίας. Πρόσβαση εδώ.
πηγή: https://aws.amazon.com/blogs/machine-learning/build-production-ready-generative-ai-applications-for-enterprise-search-using-haystack-pipelines-and-amazon-sagemaker-jumpstart-with-llms/

Σφραγίδα ώρας: Αύγουστος 14, 2023

Σφραγίδα ώρας: 5 Φεβρουαρίου 2024

Αναδημοσίευση από τον Πλάτωνα

Επισκόπηση λύσεων

SageMaker JumpStart

Σιτάρι

Amazon OpenSearch

Επισκόπηση εφαρμογής

Προϋποθέσεις

Ευρετηρίαση εγγράφων στο OpenSearch

Ξεκινήστε μια υπηρεσία OpenSearch

Ευρετηριάστε έγγραφα στο OpenSearch

Εφαρμόστε τον αγωγό ανάκτησης επαυξημένης απάντησης ερωτήσεων

Περαιτέρω προσαρμογές

Ετοιμότητα παραγωγής

εκκαθάριση

Συμπέρασμα

Σχετικά με τους Συγγραφείς

Περισσότερα από Μηχανική εκμάθηση AWS

Μεγιστοποιήστε την απόδοση σταθερής διάχυσης και μειώστε το κόστος συμπερασμάτων με το AWS Inferentia2 | Υπηρεσίες Ιστού της Amazon

Face-off Probability, μέρος του NHL Edge IQ: Πρόβλεψη νικητών σε πραγματικό χρόνο κατά τη διάρκεια τηλεοπτικών παιχνιδιών

Προσδιορισμός ορόσημων με προσαρμοσμένες ετικέτες αναγνώρισης Amazon

Εφαρμόστε ενοποιημένη αναζήτηση κειμένου και εικόνων με ένα μοντέλο CLIP χρησιμοποιώντας το Amazon SageMaker και την υπηρεσία Amazon OpenSearch Service

Παρουσίαση της εργαλειοθήκης συγκριτικής αξιολόγησης συμπερασμάτων χωρίς διακομιστή Amazon SageMaker

Δημιουργήστε έναν αγωγό ανάλυσης συναισθήματος MLOps χρησιμοποιώντας το Amazon SageMaker Ground Truth και το Databricks MLflow

Το Amazon SageMaker Automatic Model Tuning επιλέγει τώρα αυτόματα διαμορφώσεις συντονισμού για να βελτιώσει τη χρηστικότητα και την αποδοτικότητα κόστους | Υπηρεσίες Ιστού της Amazon

Ανακοίνωση υποστήριξης για μοντέλα Llama 2 και Mistral και απαντήσεις ροής στο Amazon SageMaker Canvas | Υπηρεσίες Ιστού της Amazon

Σχετικά με μας

Κάθετη αναζήτηση & Ai

Πλατφόρμα

Μείνετε συνδεδεμένοι

Λογαριασμός