Παραγωγική τεχνητή νοημοσύνη Τα μοντέλα έχουν τη δυνατότητα να φέρουν επανάσταση στις επιχειρηματικές δραστηριότητες, αλλά οι επιχειρήσεις πρέπει να εξετάσουν προσεκτικά πώς να εκμεταλλευτούν τη δύναμή τους, ενώ ξεπερνούν προκλήσεις όπως η προστασία δεδομένων και η διασφάλιση της ποιότητας του περιεχομένου που δημιουργείται από την τεχνητή νοημοσύνη.
Το πλαίσιο Retrieval-Augmented Generation (RAG) αυξάνει τις προτροπές με εξωτερικά δεδομένα από πολλαπλές πηγές, όπως αποθήκες εγγράφων, βάσεις δεδομένων ή API, για να κάνει τα μοντέλα θεμελίωσης αποτελεσματικά για εργασίες που αφορούν συγκεκριμένους τομείς. Αυτή η ανάρτηση παρουσιάζει τις δυνατότητες του μοντέλου RAG και τονίζει τις δυνατότητες μετασχηματισμού του MongoDB Atlas με τη δυνατότητα Vector Search.
MongoDB Άτλας είναι μια ολοκληρωμένη σουίτα υπηρεσιών δεδομένων που επιταχύνουν και απλοποιούν την ανάπτυξη εφαρμογών που βασίζονται σε δεδομένα. Η διανυσματική αποθήκευση δεδομένων του ενσωματώνεται άψογα με την αποθήκευση επιχειρησιακών δεδομένων, εξαλείφοντας την ανάγκη για ξεχωριστή βάση δεδομένων. Αυτή η ενοποίηση επιτρέπει ισχυρές δυνατότητες σημασιολογικής αναζήτησης μέσω Διανυσματική αναζήτηση, ένας γρήγορος τρόπος δημιουργίας σημασιολογικής αναζήτησης και εφαρμογών που υποστηρίζονται από AI.
Amazon Sage Maker δίνει τη δυνατότητα στις επιχειρήσεις να δημιουργούν, να εκπαιδεύουν και να αναπτύσσουν μοντέλα μηχανικής μάθησης (ML). Amazon SageMaker JumpStart παρέχει προεκπαιδευμένα μοντέλα και δεδομένα για να σας βοηθήσει να ξεκινήσετε με την ML. Μπορείτε να αποκτήσετε πρόσβαση, να προσαρμόσετε και να αναπτύξετε προεκπαιδευμένα μοντέλα και δεδομένα μέσω της σελίδας προορισμού SageMaker JumpStart στο Στούντιο Amazon SageMaker με μερικά μόνο κλικ.
Amazon-Lex είναι μια διεπαφή συνομιλίας που βοηθά τις επιχειρήσεις να δημιουργούν chatbot και ρομπότ φωνής που συμμετέχουν σε φυσικές, ρεαλιστικές αλληλεπιδράσεις. Με την ενσωμάτωση του Amazon Lex με τη γενετική τεχνητή νοημοσύνη, οι επιχειρήσεις μπορούν να δημιουργήσουν ένα ολιστικό οικοσύστημα όπου οι πληροφορίες των χρηστών μεταβαίνουν απρόσκοπτα σε συνεκτικές και συναφείς με τα συμφραζόμενα απαντήσεις.
Επισκόπηση λύσεων
Το παρακάτω διάγραμμα απεικονίζει την αρχιτεκτονική λύσεων.
Στις επόμενες ενότητες, περιγράφουμε τα βήματα για την εφαρμογή αυτής της λύσης και των στοιχείων της.
Ρυθμίστε ένα σύμπλεγμα MongoDB
Για να δημιουργήσετε ένα σύμπλεγμα Atlas MongoDB ελεύθερης βαθμίδας, ακολουθήστε τις οδηγίες στο Δημιουργήστε ένα σύμπλεγμα. Ρυθμίστε τη βάση δεδομένων πρόσβαση και το δίκτυο πρόσβαση.
Αναπτύξτε το μοντέλο ενσωμάτωσης SageMaker
Μπορείτε να επιλέξετε το μοντέλο ενσωμάτωσης (ALL MiniLM L6 v2) στο SageMaker JumpStart Μοντέλα, σημειωματάρια, λύσεις .
Επιλέξτε Ανάπτυξη για την ανάπτυξη του μοντέλου.
Βεβαιωθείτε ότι το μοντέλο έχει αναπτυχθεί με επιτυχία και βεβαιωθείτε ότι έχει δημιουργηθεί το τελικό σημείο.
Διάνυσμα ενσωμάτωση
Διάνυσμα ενσωμάτωση είναι μια διαδικασία μετατροπής κειμένου ή εικόνας σε διανυσματική αναπαράσταση. Με τον ακόλουθο κώδικα, μπορούμε να δημιουργήσουμε διανυσματικές ενσωματώσεις με το SageMaker JumpStart και να ενημερώσουμε τη συλλογή με το δημιουργημένο διάνυσμα για κάθε έγγραφο:
payload = {"text_inputs": [document[field_name_to_be_vectorized]]}
query_response = query_endpoint_with_json_payload(json.dumps(payload).encode('utf-8'))
embeddings = parse_response_multiple_texts(query_response) # update the document
update = {'$set': {vector_field_name : embeddings[0]}}
collection.update_one(query, update)
Ο παραπάνω κώδικας δείχνει πώς να ενημερώσετε ένα μεμονωμένο αντικείμενο σε μια συλλογή. Για να ενημερώσετε όλα τα αντικείμενα ακολουθήστε το οδηγίες.
Διανυσματική αποθήκευση δεδομένων MongoDB
Διανυσματική αναζήτηση Atlas MongoDB είναι μια νέα δυνατότητα που σας επιτρέπει να αποθηκεύετε και να αναζητάτε διανυσματικά δεδομένα στο MongoDB. Τα διανυσματικά δεδομένα είναι ένας τύπος δεδομένων που αντιπροσωπεύουν ένα σημείο σε ένα χώρο υψηλών διαστάσεων. Αυτός ο τύπος δεδομένων χρησιμοποιείται συχνά σε εφαρμογές ML και τεχνητής νοημοσύνης. Το MongoDB Atlas Vector Search χρησιμοποιεί μια τεχνική που ονομάζεται k-πλησιέστεροι γείτονες (k-NN) για αναζήτηση παρόμοιων διανυσμάτων. Το k-NN λειτουργεί βρίσκοντας τα k πιο παρόμοια διανύσματα με ένα δεδομένο διάνυσμα. Τα πιο παρόμοια διανύσματα είναι αυτά που είναι πιο κοντά στο δεδομένο διάνυσμα ως προς την Ευκλείδεια απόσταση.
Η αποθήκευση διανυσματικών δεδομένων δίπλα σε λειτουργικά δεδομένα μπορεί να βελτιώσει την απόδοση μειώνοντας την ανάγκη μετακίνησης δεδομένων μεταξύ διαφορετικών συστημάτων αποθήκευσης. Αυτό είναι ιδιαίτερα ωφέλιμο για εφαρμογές που απαιτούν πρόσβαση σε διανυσματικά δεδομένα σε πραγματικό χρόνο.
Δημιουργήστε ένα ευρετήριο διανυσματικής αναζήτησης
Το επόμενο βήμα είναι να δημιουργήσετε ένα Ευρετήριο διανυσματικής αναζήτησης MongoDB στο διανυσματικό πεδίο που δημιουργήσατε στο προηγούμενο βήμα. Το MongoDB χρησιμοποιεί το knnVector
ενσωματώσεις διανυσμάτων τύπου σε ευρετήριο. Το διανυσματικό πεδίο πρέπει να αναπαρίσταται ως πίνακας αριθμών (μόνο BSON int32, int64 ή διπλοί τύποι δεδομένων).
Αναφέρομαι σε Αναθεώρηση knnVector Type Limitations για περισσότερες πληροφορίες σχετικά με τους περιορισμούς του knnVector
τύπος.
Ο παρακάτω κώδικας είναι ένα δείγμα ορισμού ευρετηρίου:
{ "mappings": { "dynamic": true, "fields": { "egVector": { "dimensions": 384, "similarity": "euclidean", "type": "knnVector" } } }
}
Λάβετε υπόψη ότι η διάσταση πρέπει να ταιριάζει με τη διάσταση του μοντέλου των ενσωματώσεων.
Ερώτηση για το διανυσματικό χώρο αποθήκευσης δεδομένων
Μπορείτε να υποβάλετε ερώτημα στον χώρο αποθήκευσης διανυσματικών δεδομένων χρησιμοποιώντας το Διάνυσμα αγωγός συγκέντρωσης αναζήτησης. Χρησιμοποιεί το ευρετήριο διανυσματικής αναζήτησης και εκτελεί α σημασιολογική αναζήτηση στο διανυσματικό χώρο αποθήκευσης δεδομένων.
Ο παρακάτω κώδικας είναι ένα δείγμα ορισμού αναζήτησης:
{ $search: { "index": "<index name>", // optional, defaults to "default" "knnBeta": { "vector": [<array-of-numbers>], "path": "<field-to-search>", "filter": {<filter-specification>}, "k": <number>, "score": {<options>} } }
}
Αναπτύξτε το μοντέλο μεγάλης γλώσσας SageMaker
Μοντέλα βάσης SageMaker JumpStart είναι προεκπαιδευμένα μοντέλα μεγάλων γλωσσών (LLM) που χρησιμοποιούνται για την επίλυση μιας ποικιλίας εργασιών επεξεργασίας φυσικής γλώσσας (NLP), όπως η σύνοψη κειμένου, η απάντηση σε ερωτήσεις και η εξαγωγή συμπερασμάτων φυσικής γλώσσας. Διατίθενται σε διάφορα μεγέθη και διαμορφώσεις. Σε αυτή τη λύση, χρησιμοποιούμε το Αγκαλιάζοντας το πρόσωπο Μοντέλο FLAN-T5-XL.
Αναζητήστε το μοντέλο FLAN-T5-XL στο SageMaker JumpStart.
Επιλέξτε Ανάπτυξη για να ρυθμίσετε το μοντέλο FLAN-T5-XL.
Βεβαιωθείτε ότι το μοντέλο έχει αναπτυχθεί με επιτυχία και ότι το τελικό σημείο είναι ενεργό.
Δημιουργήστε ένα bot Amazon Lex
Για να δημιουργήσετε ένα bot Amazon Lex, ολοκληρώστε τα παρακάτω βήματα:
- Στην κονσόλα Amazon Lex, επιλέξτε Δημιουργία bot.
- Για Όνομα bot, πληκτρολογήστε ένα όνομα.
- Για Ρόλος χρόνου εκτέλεσης, Επιλέξτε Δημιουργήστε έναν ρόλο με βασικά δικαιώματα Amazon Lex.
- Καθορίστε τις ρυθμίσεις γλώσσας και, στη συνέχεια, επιλέξτε Ολοκληρώθηκε.
- Προσθέστε ένα δείγμα έκφρασης στο
NewIntent
UI και επιλέξτε Αποθηκεύστε την πρόθεση. - Πλοηγηθείτε με το
FallbackIntent
που δημιουργήθηκε για εσάς από προεπιλογή και κάντε εναλλαγή Ενεργή στο Εκπλήρωση τμήμα. - Επιλέξτε Χτίστε και αφού η κατασκευή είναι επιτυχής, επιλέξτε Δοκιμή.
- Πριν από τη δοκιμή, επιλέξτε το εικονίδιο με το γρανάζι.
- Καθορίστε το AWS Lambda λειτουργία που θα αλληλεπιδράσει με το MongoDB Atlas και το LLM για να παρέχει απαντήσεις. Για να δημιουργήσετε τη συνάρτηση λάμδα ακολουθήστε αυτά τα βήματα.
- Τώρα μπορείτε να αλληλεπιδράσετε με το LLM.
εκκαθάριση
Για να καθαρίσετε τους πόρους σας, ακολουθήστε τα παρακάτω βήματα:
- Διαγράψτε το bot Amazon Lex.
- Διαγράψτε τη συνάρτηση Λάμδα.
- Διαγράψτε το τελικό σημείο LLM SageMaker.
- Διαγράψτε το τελικό σημείο του μοντέλου ενσωματώσεων SageMaker.
- Διαγράψτε το σύμπλεγμα Atlas MongoDB.
Συμπέρασμα
Στην ανάρτηση, δείξαμε πώς να δημιουργήσετε ένα απλό bot που χρησιμοποιεί τη σημασιολογική αναζήτηση MongoDB Atlas και ενσωματώνεται με ένα μοντέλο από το SageMaker JumpStart. Αυτό το bot σάς επιτρέπει να πρωτοτυποποιήσετε γρήγορα την αλληλεπίδραση χρήστη με διαφορετικά LLM στο SageMaker Jumpstart ενώ τα συνδυάζετε με το περιβάλλον που προέρχεται από το MongoDB Atlas.
Όπως πάντα, το AWS καλωσορίζει τα σχόλια. Αφήστε τα σχόλιά σας και τις ερωτήσεις σας στην ενότητα σχολίων.
Σχετικά με τους συγγραφείς
Ιγκόρ Αλεξέεφ είναι Senior Partner Solution Architect στην AWS στον τομέα δεδομένων και Analytics. Στο ρόλο του, ο Igor συνεργάζεται με στρατηγικούς εταίρους βοηθώντας τους να δημιουργήσουν περίπλοκες, βελτιστοποιημένες για AWS αρχιτεκτονικές. Πριν ενταχθεί στην AWS, ως Αρχιτέκτονας Δεδομένων/Λύσεων, υλοποίησε πολλά έργα στον τομέα Big Data, συμπεριλαμβανομένων πολλών λιμνών δεδομένων στο οικοσύστημα Hadoop. Ως Μηχανικός Δεδομένων συμμετείχε στην εφαρμογή AI/ML στον εντοπισμό απάτης και στον αυτοματισμό γραφείου.
Μπάμπου Σρινιβασάν είναι Senior Partner Solutions Architect στη MongoDB. Στον τρέχοντα ρόλο του, εργάζεται με το AWS για να δημιουργήσει τις τεχνικές ενσωματώσεις και τις αρχιτεκτονικές αναφοράς για τις λύσεις AWS και MongoDB. Έχει πάνω από δύο δεκαετίες εμπειρίας στις τεχνολογίες Βάσεων Δεδομένων και Cloud. Είναι παθιασμένος με την παροχή τεχνικών λύσεων σε πελάτες που εργάζονται με πολλαπλούς Global System Integrators (GSI) σε πολλές γεωγραφικές περιοχές.
- SEO Powered Content & PR Distribution. Ενισχύστε σήμερα.
- PlatoData.Network Vertical Generative Ai. Ενδυναμώστε τον εαυτό σας. Πρόσβαση εδώ.
- PlatoAiStream. Web3 Intelligence. Ενισχύθηκε η γνώση. Πρόσβαση εδώ.
- PlatoESG. Ανθρακας, Cleantech, Ενέργεια, Περιβάλλον, Ηλιακός, Διαχείριση των αποβλήτων. Πρόσβαση εδώ.
- PlatoHealth. Ευφυΐα βιοτεχνολογίας και κλινικών δοκιμών. Πρόσβαση εδώ.
- πηγή: https://aws.amazon.com/blogs/machine-learning/retrieval-augmented-generation-with-langchain-amazon-sagemaker-jumpstart-and-mongodb-atlas-semantic-search/
- :έχει
- :είναι
- :που
- $UP
- 100
- 200
- 321
- 361
- 7
- 9
- a
- Σχετικα
- πάνω από
- επιταχύνουν
- πρόσβαση
- απέναντι
- ενεργός
- Μετά το
- συσσωμάτωση
- AI
- Τροφοδοτείται από AI
- AI / ML
- Όλα
- επιτρέπει
- πάντοτε
- Amazon
- Amazon-Lex
- Amazon Sage Maker
- Amazon SageMaker JumpStart
- Amazon υπηρεσίες Web
- an
- analytics
- και
- APIs
- εφαρμογές
- εφαρμόζοντας
- αρχιτεκτονική
- ΕΙΝΑΙ
- Παράταξη
- τεχνητός
- τεχνητή νοημοσύνη
- AS
- At
- αυξάνει
- Αυτοματοποίηση
- διαθέσιμος
- AWS
- AWS Lambda
- βασικός
- BE
- ευεργετική
- μεταξύ
- Μεγάλος
- Big Data
- Bot
- bots
- χτίζω
- επιχειρήσεις
- αλλά
- by
- που ονομάζεται
- CAN
- δυνατότητες
- προσεκτικά
- προκλήσεις
- chatbots
- Επιλέξτε
- καθαρός
- Backup
- συστάδα
- κωδικός
- ΣΥΝΑΦΗΣ
- συλλογή
- σχόλια
- πλήρης
- συγκρότημα
- εξαρτήματα
- Εξετάστε
- πρόξενος
- περιεχόμενο
- συμφραζόμενα
- ομιλητικός
- μετατροπή
- δημιουργία
- δημιουργήθηκε
- Ρεύμα
- Πελάτες
- προσαρμόσετε
- ημερομηνία
- αποθήκευση δεδομένων
- βασίζονται σε δεδομένα
- βάση δεδομένων
- βάσεις δεδομένων
- δεκαετίες
- Προεπιλογή
- προεπιλογές
- ορισμός
- παρατάσσω
- αναπτυχθεί
- Ανίχνευση
- Ανάπτυξη
- διαφορετικές
- Διάσταση
- Διαστάσεις
- απόσταση
- έγγραφο
- τομέα
- διπλασιαστεί
- δυναμικός
- οικοσύστημα
- Αποτελεσματικός
- εξάλειψη
- ενσωμάτωση
- δίνει τη δυνατότητα
- Τελικό σημείο
- ασκούν
- μηχανικός
- εξασφαλίζοντας
- εισάγετε
- Εταιρεία
- επιχειρήσεις
- ειδικά
- Κάθε
- εμπειρία
- εξωτερικός
- FAST
- Χαρακτηριστικό
- ανατροφοδότηση
- λίγοι
- πεδίο
- Πεδία
- φιλτράρισμα
- εύρεση
- ακολουθήστε
- Εξής
- Για
- Θεμέλιο
- Πλαίσιο
- απάτη
- ανίχνευση απάτης
- Δωρεάν
- από
- λειτουργία
- Εξοπλισμος
- παράγουν
- γενεά
- γενετική
- Παραγωγική τεχνητή νοημοσύνη
- γεωγραφίες
- παίρνω
- δεδομένου
- Παγκόσμιο
- ιπποσκευή
- Έχω
- he
- βοήθεια
- βοήθεια
- βοηθά
- ανταύγειες
- του
- ολιστική
- Πως
- Πώς να
- HTML
- http
- HTTPS
- ICON
- απεικονίζει
- εικόνα
- εφαρμογή
- εφαρμοστεί
- βελτίωση
- in
- Συμπεριλαμβανομένου
- ευρετήριο
- πληροφορίες
- εισαγωγή
- οδηγίες
- ενσωματωθεί
- Ενσωματώνει
- Ενσωμάτωση
- ολοκλήρωση
- ολοκληρώσεις
- Νοημοσύνη
- αλληλεπιδρούν
- αλληλεπίδραση
- αλληλεπιδράσεις
- περιβάλλον λειτουργίας
- σε
- συμμετέχουν
- IT
- ΤΟΥ
- ενώνει
- json
- μόλις
- λίμνες
- προσγείωση
- Γλώσσα
- large
- μάθηση
- Άδεια
- όμοιος με ζωντανό
- περιορισμούς
- LLM
- μηχανή
- μάθηση μηχανής
- κάνω
- πολοί
- Ταίριασμα
- ML
- μοντέλο
- μοντέλα
- MongoDB
- περισσότερο
- πλέον
- μετακινήσετε
- πολλαπλούς
- πρέπει
- όνομα
- Φυσικό
- Επεξεργασία φυσικής γλώσσας
- Ανάγκη
- δίκτυο
- Νέα
- επόμενη
- nlp
- τώρα
- αριθμοί
- αντικείμενο
- αντικειμένων
- of
- Office
- συχνά
- on
- αυτά
- αποκλειστικά
- επιχειρήσεων
- λειτουργίες
- or
- καταγωγή
- υπέρβαση
- επισκόπηση
- σελίδα
- αντιστοίχιση
- εταίρος
- Συνεργάτες
- παθιασμένος
- μονοπάτι
- επίδοση
- εκτελεί
- Πλάτων
- Πληροφορία δεδομένων Plato
- Πλάτωνα δεδομένα
- σας παρακαλούμε
- Σημείο
- Θέση
- δυναμικού
- δύναμη
- ισχυρός
- δώρα
- προηγούμενος
- Πριν
- διαδικασια μας
- μεταποίηση
- έργα
- πρωτότυπο
- παρέχουν
- παρέχει
- χορήγηση
- ποιότητα
- ερώτηση
- Ερωτήσεις
- γρήγορα
- σε πραγματικό χρόνο
- μείωση
- αναφορά
- αντιπροσώπευση
- εκπροσωπούνται
- αντιπροσωπεύει
- απαιτούν
- Υποστηρικτικό υλικό
- απαντήσεις
- φέρνω επανάσταση
- Ρόλος
- διασφάλιση
- σοφός
- σκορ
- άψογα
- Αναζήτηση
- Τμήμα
- τμήματα
- αρχαιότερος
- ξεχωριστό
- Υπηρεσίες
- σειρά
- ρυθμίσεις
- διάφοροι
- θα πρέπει να
- έδειξε
- Δείχνει
- παρόμοιες
- Απλούς
- απλοποίηση
- ενιαίας
- μεγέθη
- λύση
- Λύσεις
- SOLVE
- Πηγές
- Χώρος
- ξεκίνησε
- Βήμα
- Βήματα
- χώρος στο δίσκο
- κατάστημα
- Στρατηγική
- στρατηγικοί εταίροι
- επιτυχής
- Επιτυχώς
- τέτοιος
- σουίτα
- σύστημα
- συστήματα
- εργασίες
- Τεχνικός
- τεχνική
- Τεχνολογίες
- όροι
- δοκιμή
- Δοκιμές
- κείμενο
- από
- ότι
- Η
- τους
- Τους
- τότε
- αυτοί
- αυτό
- Μέσω
- κερκίδα
- προς την
- Τρένο
- μεταμορφωτικός
- μεταβάσεις
- αληθής
- δύο
- τύπος
- τύποι
- ui
- Ενημέρωση
- χρήση
- μεταχειρισμένος
- Χρήστες
- χρησιμοποιεί
- χρησιμοποιώντας
- ποικιλία
- επαληθεύει
- Φωνή
- walk
- ήταν
- Τρόπος..
- we
- ιστός
- διαδικτυακές υπηρεσίες
- Καλωσορίζει
- ενώ
- θα
- με
- εργαζόμενος
- λειτουργεί
- Εσείς
- Σας
- zephyrnet