Επένδυση στο κουκουνάρι

Επένδυση στο κουκουνάρι

Επένδυση σε Pinecone PlatoBlockchain Data Intelligence. Κάθετη αναζήτηση. Ολα συμπεριλαμβάνονται.

Με την κλίση των μεγάλων γλωσσικών μοντέλων (LLM), γινόμαστε μάρτυρες μιας αλλαγής παραδείγματος στην ανάπτυξη λογισμικού και στον κλάδο των υπολογιστών συνολικά. Το AI συμβαίνει και μια νέα στοίβα σχηματίζεται μπροστά στα μάτια μας. Είναι σαν το Διαδίκτυο ξανά, το οποίο θέτει σε λειτουργία νέα στοιχεία υποδομής που έχουν δημιουργηθεί για τον νέο τρόπο να κάνουμε πράγματα.

Υπάρχει αυξανόμενη αναγνώριση ότι τα LLM είναι στην πραγματικότητα μια νέα μορφή υπολογιστή, κατά κάποιο τρόπο. Μπορούν να εκτελούν «προγράμματα» γραμμένα σε φυσική γλώσσα (δηλαδή, προτροπές), να εκτελούν αυθαίρετες υπολογιστικές εργασίες (π.χ. σύνταξη κώδικα Python ή αναζήτηση στο Google) και να επιστρέφουν τα αποτελέσματα πίσω στον χρήστη σε μορφή αναγνώσιμη από τον άνθρωπο. Αυτό είναι μεγάλο θέμα, για δύο λόγους: 

  1. Μια νέα κατηγορία εφαρμογών γύρω από τη σύνοψη και το δημιουργικό περιεχόμενο είναι πλέον δυνατή με αποτέλεσμα την αλλαγή της συμπεριφοράς των καταναλωτών γύρω από την κατανάλωση λογισμικού.
  2. Μια νέα κατηγορία προγραμματιστών είναι πλέον σε θέση να γράψει λογισμικό. Ο προγραμματισμός υπολογιστών απαιτεί πλέον μόνο γνώση της αγγλικής (ή άλλης ανθρώπινης γλώσσας), όχι εκπαίδευση σε μια παραδοσιακή γλώσσα προγραμματισμού όπως η Python ή η JavaScript. 

Μία από τις κορυφαίες προτεραιότητές μας στο Andreessen Horowitz είναι να εντοπίσουμε τις εταιρείες που κατασκευάζουν τα βασικά στοιχεία αυτής της νέας στοίβας AI. Είμαστε ενθουσιασμένοι που ανακοινώνουμε ότι προηγούμαστε σε έναν γύρο της Series B $100 εκατομμυρίων κουκουνάρι, για να υποστηρίξουν το όραμά τους να γίνουν το επίπεδο μνήμης για εφαρμογές τεχνητής νοημοσύνης.

Το πρόβλημα: Οι LLM έχουν παραισθήσεις και είναι ανιθαγενείς

Μια τεράστια πρόκληση με τα τρέχοντα LLM είναι οι παραισθήσεις. Δίνουν πολύ σίγουρες απαντήσεις που είναι πραγματικά και μερικές φορές λογικά λανθασμένες. Για παράδειγμα, το να ζητήσετε από έναν LLM το μεικτό περιθώριο κέρδους της Apple για το τελευταίο τρίμηνο μπορεί να οδηγήσει σε μια σίγουρη απάντηση 63 δισεκατομμυρίων δολαρίων. Το μοντέλο μπορεί ακόμη και να υποστηρίξει την απάντησή του εξηγώντας ότι αφαιρώντας 25 δισεκατομμύρια δολάρια στο κόστος αγαθών από τα έσοδα 95 δισεκατομμυρίων δολαρίων, θα έχετε ένα μεικτό περιθώριο 63 δισεκατομμυρίων δολαρίων. Φυσικά, είναι λάθος σε πολλές διαστάσεις:

  • Πρώτον, ο αριθμός εσόδων είναι λάθος, καθώς το LLM δεν έχει δεδομένα σε πραγματικό χρόνο. Λειτουργεί με μπαγιάτικα δεδομένα προπόνησης που είναι μηνών ή πιθανώς ετών.
  • Δεύτερον, συγκέντρωσε αυτούς τους αριθμούς εσόδων και κόστους αγαθών τυχαία από τις οικονομικές καταστάσεις μιας άλλης εταιρείας φρούτων.
  • Τρίτον, ο υπολογισμός του μεικτού περιθωρίου δεν είναι μαθηματικά σωστός.

Φανταστείτε να δίνετε αυτή την απάντηση στον Διευθύνοντα Σύμβουλο της α Τύχη 500 εταιρεία. 

Όλα αυτά συμβαίνουν επειδή, στο τέλος της ημέρας, τα LLM είναι μηχανές πρόβλεψης που έχουν εκπαιδευτεί σε τεράστιες ποσότητες δεδομένων τρίτων στο Διαδίκτυο. Συχνά, οι πληροφορίες που χρειάζεται ο χρήστης απλά δεν βρίσκονται στο σετ εκπαίδευσης. Έτσι, το μοντέλο θα δώσει τις πιο πιθανές και γλωσσικά καλά διαμορφωμένες απαντήσεις με βάση τα μπαγιάτικα δεδομένα εκπαίδευσης του. Μπορούμε ήδη να αρχίσουμε να βλέπουμε μια πιθανή λύση στο παραπάνω πρόβλημα - τροφοδοσία δεδομένων ιδιωτικών επιχειρήσεων σε πραγματικό χρόνο σε πραγματικό χρόνο στα LLM.

Η γενική μορφή αυτού του προβλήματος είναι ότι, από τη σκοπιά του συστήματος, τα LLM και τα περισσότερα άλλα μοντέλα τεχνητής νοημοσύνης είναι ανιθαγενή στο στάδιο του συμπερασμάτων. Κάθε φορά που πραγματοποιείτε μια κλήση στο GPT-4 API, η έξοδος εξαρτάται αποκλειστικά σχετικά με τα δεδομένα και τις παραμέτρους που στέλνετε στο ωφέλιμο φορτίο. Το μοντέλο δεν έχει ενσωματωμένο τρόπο για να ενσωματώσει δεδομένα με βάση τα συμφραζόμενα ή να θυμάται αυτά που έχετε ζητήσει πριν. Η προσαρμογή του μοντέλου είναι δυνατή, αλλά είναι ακριβή και σχετικά ανελαστική (δηλαδή, το μοντέλο δεν μπορεί να ανταποκριθεί σε νέα δεδομένα σε πραγματικό χρόνο). Δεδομένου ότι τα μοντέλα δεν διαχειρίζονται την κατάσταση ή τη μνήμη από μόνα τους, εναπόκειται στους προγραμματιστές να καλύψουν το κενό. 

Η λύση: Οι διανυσματικές βάσεις δεδομένων είναι το επίπεδο αποθήκευσης για LLM

Εδώ μπαίνει το Pinecone.

Το Pinecone είναι μια εξωτερική βάση δεδομένων όπου οι προγραμματιστές μπορούν να αποθηκεύουν σχετικά δεδομένα με βάση τα συμφραζόμενα για εφαρμογές LLM. Αντί να στέλνουν μεγάλες συλλογές εγγράφων εμπρός και πίσω με κάθε κλήση API, οι προγραμματιστές μπορούν να τις αποθηκεύσουν σε μια βάση δεδομένων Pinecone και, στη συνέχεια, να επιλέξουν μόνο τις λίγες πιο σχετικές με κάθε δεδομένο ερώτημα — μια προσέγγιση που ονομάζεται εκμάθηση εντός περιβάλλοντος. Είναι απαραίτητο για τις θήκες για εταιρική χρήση για να ανθίσουν πραγματικά.

Ειδικότερα, το κουκουνάρι είναι α διάνυσμα βάση δεδομένων, που σημαίνει ότι τα δεδομένα αποθηκεύονται με τη μορφή σημασιολογικά σημαντικού ενσωματώσεις. Ενώ μια τεχνική εξήγηση των ενσωματώσεων ξεφεύγει από το πεδίο εφαρμογής αυτής της ανάρτησης, το σημαντικό μέρος που πρέπει να κατανοήσουμε είναι ότι τα LLM λειτουργούν και σε διανυσματικές ενσωματώσεις — επομένως, με την αποθήκευση δεδομένων στο Pinecone σε αυτή τη μορφή, μέρος της εργασίας AI έχει ουσιαστικά προεπεξεργαστεί και μεταφορτωθεί στη βάση δεδομένων.

Σε αντίθεση με τις υπάρχουσες βάσεις δεδομένων, οι οποίες έχουν σχεδιαστεί για ατομικούς συναλλακτικούς ή εξαντλητικούς φόρτους αναλυτικών εργασιών, η διανυσματική βάση δεδομένων (Pinecone) έχει σχεδιαστεί για τελικά συνεπή κατά προσέγγιση αναζήτηση γειτόνων, το σωστό παράδειγμα βάσης δεδομένων για διανύσματα υψηλότερης διάστασης. Παρέχουν επίσης API προγραμματιστών που ενσωματώνονται με άλλα βασικά στοιχεία εφαρμογών τεχνητής νοημοσύνης, όπως OpenAI, Cohere, LangChain κ.λπ. Ένας τέτοιος καλά μελετημένος σχεδιασμός κάνει τη ζωή των προγραμματιστών πολύ πιο εύκολη. Απλές εργασίες τεχνητής νοημοσύνης όπως η σημασιολογική αναζήτηση, οι προτάσεις προϊόντων ή η κατάταξη τροφοδοσίας μπορούν επίσης να μοντελοποιηθούν απευθείας ως προβλήματα διανυσματικής αναζήτησης και να εκτελεστούν στη διανυσματική βάση δεδομένων χωρίς ένα τελικό βήμα συμπερασμάτων μοντέλου — κάτι που δεν μπορούν να κάνουν οι υπάρχουσες βάσεις δεδομένων.

Το Pinecone είναι το αναδυόμενο πρότυπο για τη διαχείριση εταιρικών δεδομένων κατάστασης και συμφραζομένων σε εφαρμογές LLM. Πιστεύουμε ότι είναι ένα σημαντικό στοιχείο υποδομής, το οποίο παρέχει το επίπεδο αποθήκευσης ή «μνήμης» σε μια ολοκαίνουργια στοίβα εφαρμογών AI.

Απίστευτη πρόοδος για το Pinecone μέχρι σήμερα

Το Pinecone δεν είναι η μόνη διανυσματική βάση δεδομένων, αλλά πιστεύουμε ότι είναι η κορυφαία διανυσματική βάση δεδομένων — έτοιμη τώρα για υιοθέτηση στον πραγματικό κόσμο — με σημαντικό περιθώριο. Η Pinecone σημείωσε 8πλάσια αύξηση στους αμειβόμενους πελάτες (περίπου 1,600) σε μόλις τρεις μήνες, συμπεριλαμβανομένων μελλοντικών εταιρειών τεχνολογίας όπως οι Shopify, Gong, Zapier και άλλες. Χρησιμοποιείται σε ένα ευρύ φάσμα βιομηχανιών, συμπεριλαμβανομένου του εταιρικού λογισμικού, των εφαρμογών για καταναλωτές, του ηλεκτρονικού εμπορίου, του fintech, των ασφαλειών, των μέσων ενημέρωσης και της AI/ML.

Αποδίδουμε αυτήν την επιτυχία όχι μόνο στη βαθιά κατανόηση του χρήστη, της αγοράς και της τεχνολογίας από την ομάδα, αλλά επίσης — κριτικά — στην προσέγγισή της στο cloud από την αρχή. Ένα από τα πιο δύσκολα μέρη της δημιουργίας αυτής της υπηρεσίας είναι η παροχή ενός αξιόπιστου, εξαιρετικά διαθέσιμου συστήματος υποστήριξης cloud που ικανοποιεί ένα ευρύ φάσμα στόχων απόδοσης πελατών και SLA. Με πολλαπλές επαναλήψεις στην αρχιτεκτονική του προϊόντος και τη διαχείριση πολλών υψηλής κλίμακας, αμειβόμενων πελατών στην παραγωγή, αυτή η ομάδα έχει επιδείξει λειτουργική αριστεία που αναμένεται από μια βάση δεδομένων παραγωγής.

κουκουνάρι ιδρύθηκε από τον Edo Liberty, ο οποίος υπήρξε επί μακρόν, σκληρός υποστηρικτής της σημασίας των διανυσματικών βάσεων δεδομένων στη μηχανική μάθηση, συμπεριλαμβανομένου του τρόπου με τον οποίο μπορούν να επιτρέπουν σε κάθε επιχείρηση να δημιουργεί περιπτώσεις χρήσης πάνω από τα LLM. Ως εφαρμοσμένος μαθηματικός, πέρασε την καριέρα του μελετώντας και εφαρμόζοντας αλγόριθμους διανυσματικής αναζήτησης αιχμής. Ταυτόχρονα, ήταν πραγματιστής, κατασκεύαζε βασικά εργαλεία ML όπως το Sagemaker στην AWS και μετέφραζε την εφαρμοσμένη έρευνα ML σε πρακτικά προϊόντα που μπορούν να χρησιμοποιήσουν οι πελάτες. Είναι σπάνιο να δεις έναν τέτοιο συνδυασμό βαθιάς έρευνας και ρεαλιστικής σκέψης προϊόντων.

Η Edo συνοδεύεται από τον Bob Wiederhold, έναν έμπειρο Διευθύνοντα Σύμβουλο και χειριστή (πρώην Couchbase), ως συνεργάτης από την πλευρά των επιχειρήσεων ως Πρόεδρος και COO. Η Pinecone διαθέτει επίσης μια φανταστική ομάδα στελεχών και μηχανικών με βαθιά τεχνογνωσία σε συστήματα cloud από μέρη όπως το AWS, η Google και το Databricks. Είμαστε εντυπωσιασμένοι από τη βαθιά τεχνογνωσία της ομάδας στη μηχανική, την εστίαση στην εμπειρία προγραμματιστή και την αποτελεσματική εκτέλεση του GTM και έχουμε το προνόμιο να συνεργαζόμαστε μαζί τους για τη δημιουργία του επιπέδου μνήμης για εφαρμογές τεχνητής νοημοσύνης.

* * *

Οι απόψεις που εκφράζονται εδώ είναι αυτές του μεμονωμένου προσωπικού της AH Capital Management, LLC (“a16z”) που αναφέρεται και δεν είναι απόψεις της a16z ή των θυγατρικών της. Ορισμένες πληροφορίες που περιέχονται εδώ έχουν ληφθεί από τρίτες πηγές, συμπεριλαμβανομένων των εταιρειών χαρτοφυλακίου κεφαλαίων που διαχειρίζεται η a16z. Αν και λαμβάνεται από πηγές που πιστεύεται ότι είναι αξιόπιστες, το a16z δεν έχει επαληθεύσει ανεξάρτητα τέτοιες πληροφορίες και δεν κάνει δηλώσεις σχετικά με τη διαρκή ακρίβεια των πληροφοριών ή την καταλληλότητά τους για μια δεδομένη κατάσταση. Επιπλέον, αυτό το περιεχόμενο μπορεί να περιλαμβάνει διαφημίσεις τρίτων. Η a16z δεν έχει ελέγξει τέτοιες διαφημίσεις και δεν υποστηρίζει κανένα διαφημιστικό περιεχόμενο που περιέχεται σε αυτές.

Αυτό το περιεχόμενο παρέχεται μόνο για ενημερωτικούς σκοπούς και δεν θα πρέπει να βασίζεται ως νομική, επιχειρηματική, επενδυτική ή φορολογική συμβουλή. Θα πρέπει να συμβουλευτείτε τους δικούς σας συμβούλους για αυτά τα θέματα. Οι αναφορές σε οποιουσδήποτε τίτλους ή ψηφιακά περιουσιακά στοιχεία είναι μόνο για ενδεικτικούς σκοπούς και δεν αποτελούν επενδυτική σύσταση ή προσφορά για παροχή επενδυτικών συμβουλευτικών υπηρεσιών. Επιπλέον, αυτό το περιεχόμενο δεν απευθύνεται ούτε προορίζεται για χρήση από επενδυτές ή υποψήφιους επενδυτές και δεν μπορεί σε καμία περίπτωση να γίνει επίκληση του κατά τη λήψη απόφασης για επένδυση σε οποιοδήποτε αμοιβαίο κεφάλαιο που διαχειρίζεται η a16z. (Μια προσφορά για επένδυση σε ένα αμοιβαίο κεφάλαιο a16z θα γίνει μόνο από το μνημόνιο ιδιωτικής τοποθέτησης, τη συμφωνία εγγραφής και άλλη σχετική τεκμηρίωση οποιουδήποτε τέτοιου κεφαλαίου και θα πρέπει να διαβαστεί στο σύνολό τους.) Τυχόν επενδύσεις ή εταιρείες χαρτοφυλακίου που αναφέρονται, αναφέρονται ή που περιγράφονται δεν είναι αντιπροσωπευτικές όλων των επενδύσεων σε οχήματα που διαχειρίζεται η a16z και δεν μπορεί να υπάρξει διαβεβαίωση ότι οι επενδύσεις θα είναι κερδοφόρες ή ότι άλλες επενδύσεις που θα πραγματοποιηθούν στο μέλλον θα έχουν παρόμοια χαρακτηριστικά ή αποτελέσματα. Μια λίστα με επενδύσεις που πραγματοποιήθηκαν από αμοιβαία κεφάλαια που διαχειρίζεται ο Andreessen Horowitz (εξαιρουμένων των επενδύσεων για τις οποίες ο εκδότης δεν έχει παράσχει άδεια για δημοσιοποίηση της a16z καθώς και των απροειδοποίητων επενδύσεων σε δημόσια διαπραγματεύσιμα ψηφιακά περιουσιακά στοιχεία) είναι διαθέσιμη στη διεύθυνση https://a16z.com/investments /.

Τα γραφήματα και τα γραφήματα που παρέχονται εντός προορίζονται αποκλειστικά για ενημερωτικούς σκοπούς και δεν θα πρέπει να βασίζονται σε αυτά όταν λαμβάνεται οποιαδήποτε επενδυτική απόφαση. Οι προηγούμενες αποδόσεις δεν είναι ενδεικτικές των μελλοντικών αποτελεσμάτων. Το περιεχόμενο μιλά μόνο από την ημερομηνία που υποδεικνύεται. Οποιεσδήποτε προβλέψεις, εκτιμήσεις, προβλέψεις, στόχοι, προοπτικές και/ή απόψεις που εκφράζονται σε αυτό το υλικό υπόκεινται σε αλλαγές χωρίς προειδοποίηση και μπορεί να διαφέρουν ή να είναι αντίθετες με τις απόψεις που εκφράζονται από άλλους. Ανατρέξτε στη διεύθυνση https://a16z.com/disclosures για πρόσθετες σημαντικές πληροφορίες.

Σφραγίδα ώρας:

Περισσότερα από Andreessen Horowitz