Google wypełnia chmurę większą liczbą sztucznej inteligencji w wyścigu z Microsoftem

Google wypełnia chmurę większą liczbą sztucznej inteligencji w wyścigu z Microsoftem

Google wypełnia chmurę większą liczbą sztucznej inteligencji w wyścigu z Microsoft PlatoBlockchain Data Intelligence. Wyszukiwanie pionowe. AI.

W środę Google umieściło na swojej platformie chmurowej kilka modeli sztucznej inteligencji, aby ludzie mogli je wypróbować i być może zaadoptować.

Jednym z nich jest Gemini Pro, system do generowania tekstu, który w zeszłym tygodniu zaprezentowano programistom i przedsiębiorstwom. Pozostałe modele to Google Imagen 2 generujący obrazy oraz rodzina medycznych narzędzi generatywnej AI o nazwie MedLM.

Produkty te są następstwem wprowadzenia na rynek Gemini, zbiór modeli generujących treść opartych na rzekomo najpotężniejszej w historii Google architekturze dużych modeli językowych. Dzieje się tak również po tym, jak Microsoft i inne wielkie nazwiska z branży IT w chmurze i biznesie, w tym Google, pospiesznie zalały swoje produkty tym, co reklamuje się jako ulepszenia uczenia maszynowego – temat na rok 2023 i prawdopodobnie 2024 i niestety 2025.

Wchodzi Bliźnięta różne rozmiary, od Nano do obciążeń na urządzeniach po Ultra do ciężkich zadań na serwerach zaplecza. Dostęp do średniej wielkości Gemini Pro, zaprezentowanego w zeszłą środę, można teraz uzyskać w formie podglądu za pośrednictwem interfejsu API zapewnianego przez Vertex AI firmy Google Cloud: programiści mogą używać tego zdalnego interfejsu do tworzenia własnych aplikacji chatbotowych na mniej więcej Gemini Pro było powiedziane. Programiści mogą dostosować model, starannie projektując pojawiające się w nim podpowiedzi, dostrajając go na podstawie własnych danych i łącząc go z innymi interfejsami API, aby kształtować jego zachowania i możliwości pod kątem określonych zadań.

Jeśli chcesz wbudować w swoją aplikację interfejs w języku naturalnym, możesz użyć Gemini Pro, tak samo jak możesz użyć ChatGPT OpenAI itp.

Firma Google poinformowała dziś również, że usługa Chatbot Duet AI for Developers, która ma zwiększyć produktywność programistów (może się różnić), jest już ogólnie dostępna. To zwykła sprawa asystenta programisty. Powiedziano nam, że działa z różnymi IDE i próbuje wykonywać takie czynności, jak autouzupełnianie kodu źródłowego podczas pisania przez programistów, odpowiadanie na zapytania dotyczące kodowania, pomoc w rozwiązywaniu problemów i oferowanie wskazówek, jak korzystać z oprogramowania innych firm z MongoDB, Crowdstrike i innych.

Powiedziano nam, że ponad 25 dostawców współpracowało z Google, aby zapewnić zrozumienie ich produktów i uwzględnienie ich w Duet AI for Developers.

„Na przykład programista piszący kod za pomocą MongoDB będzie mógł zapytać Duet AI dla programistów: „Filtruj zamówienia klientów o wartości powyżej 50 USD w ciągu ostatnich 30 dni według lokalizacji geograficznej, a następnie oblicz całkowity przychód według lokalizacji”, a Duet AI dla programistów wówczas korzystaj z informacji z produktów MongoDB, aby sugerować kod do wykonania zadania, dzięki czemu programiści mogą tworzyć jeszcze szybciej” – Google veep Gabe Monroy wyjaśnione

W ciągu najbliższych kilku tygodni duże modele językowe obsługujące wszystkie usługi Duet AI również zostaną zaktualizowane do wersji Gemini. Z usługi Deweloperzy można obecnie korzystać bezpłatnie do 12 stycznia 2024 r.

Duet AI w Security Operations jest teraz również ogólnie dostępny; jest to usługa chatbota stworzona do obsługi zapytań dotyczących ochrony infrastruktury, analizowania logów sieciowych i tak dalej.

Przedsiębiorstwa chcące wykorzystać sztuczną inteligencję do zadań wizualnych, takich jak tworzenie grafiki cyfrowej lub logo, mogą potencjalnie zwrócić się ku niej Imagen 2, teraz ogólnie dostępne za pośrednictwem Vertex AI. Narzędzie do przetwarzania tekstu na obraz zostało opracowane przez inżynierów z Google DeepMind, a najnowsza wersja lepiej generuje fotorealistyczne obrazy i dokładniej renderuje tekst, aby promować marki, twierdzi bumf. Może także pisać podpisy i odpowiadać na pytania dotyczące obrazów.

Jak nam powiedziano, aplikacja społecznościowa Snapchat, platforma do projektowania graficznego Canva i witryna z obrazami stockowymi Shutterstock już korzystają z Imagen. Wszystkie obrazy wyprodukowane przez Imagen 2 będą zawierać plik SynthID cyfrowy znak wodny. Mówi się, że są one niewidoczne gołym okiem i można je wykryć obliczeniowo, aby zidentyfikować obrazy jako syntetyczne.

Wreszcie Google wystartowało MedLM, klasa dużych modeli językowych skupiających się na zastosowaniach medycznych w opiece zdrowotnej. Istnieją dwa modele, oba oparte są na Big G Med-PaLM 2 pomimo napiętego harmonogramu

Jeden jest większy i potężniejszy od drugiego i przeznaczony do bardziej złożonych zadań, takich jak przeglądanie prac naukowych i dokumentów w celu generowania potencjalnych klientów w zakresie potencjalnych nowych leków. Drugi poradzi sobie z łatwiejszymi obowiązkami, takimi jak podsumowywanie rozmów między lekarzami i pacjentami oraz zadawanie pytań medycznych i udzielanie odpowiedzi.

Wśród pierwszych zwolenników modeli MedLM znalazła się klinika HCA Healthcare i projektant leków BenchSci, a także Accenture i Deloitte. ®

Znak czasu:

Więcej z Rejestr