Amazon SageMaker Feature Store helpt datawetenschappers en machine learning-engineers (ML) om beheerde gegevens die worden gebruikt in trainings- en voorspellingsworkflows veilig op te slaan, te ontdekken en te delen. Feature Store is een gecentraliseerde winkel voor functies en bijbehorende metadata, waardoor functies gemakkelijk kunnen worden ontdekt en hergebruikt door datawetenschappers die aan verschillende projecten of ML-modellen werken.
Met Feature Store heb je altijd metadata kunnen toevoegen op featuregroepniveau. Gegevenswetenschappers die de mogelijkheid willen hebben om bestaande functies voor hun modellen te doorzoeken en te ontdekken, kunnen nu naar informatie op functieniveau zoeken door aangepaste metadata toe te voegen. De informatie kan bijvoorbeeld een beschrijving van de functie bevatten, de datum waarop deze voor het laatst is gewijzigd, de oorspronkelijke gegevensbron, bepaalde statistieken of het gevoeligheidsniveau.
Het volgende diagram illustreert de architectuurrelaties tussen functiegroepen, functies en bijbehorende metagegevens. Merk op hoe datawetenschappers nu beschrijvingen en metadata kunnen specificeren op zowel het functiegroepniveau als het individuele functieniveau.
In dit bericht leggen we uit hoe datawetenschappers en ML-engineers metadata op functieniveau kunnen gebruiken met de nieuwe zoek- en ontdekkingsmogelijkheden van Feature Store om het hergebruik van functies in hun hele organisatie te bevorderen. Deze mogelijkheid kan datawetenschappers aanzienlijk helpen bij het selectieproces van functies en, als resultaat, u helpen bij het identificeren van functies die leiden tot een grotere modelnauwkeurigheid.
Gebruik geval
Voor de doeleinden van dit bericht gebruiken we twee functiegroepen, customer
en loan
.
De customer
functiegroep heeft de volgende kenmerken:
- leeftijd โ Leeftijd van de klant (numeriek)
- baan โ Type taak (one-hot gecodeerd, zoals
admin
orservices
) - huwelijks- โ Burgerlijke staat (one-hot gecodeerd, zoals
married
orsingle
) - onderwijs โ Opleidingsniveau (one-hot gecodeerd, zoals
basic 4y
orhigh school
)
De loan
functiegroep heeft de volgende kenmerken:
- verzuim โ Heeft krediet in gebreke? (one-hot gecodeerd:
no
oryes
) - behuizing โ Heeft een woonlening? (one-hot gecodeerd:
no
oryes
) - lening โ Heeft een persoonlijke lening? (one-hot gecodeerd:
no
oryes
) - totaalbedrag โ Totaal bedrag aan leningen (numeriek)
De volgende afbeelding toont voorbeeldfunctiegroepen en functiemetagegevens.
Het doel van het toevoegen van een beschrijving en het toewijzen van metadata aan elke functie is om de ontdekkingssnelheid te verhogen door nieuwe zoekparameters in te schakelen waarmee een datawetenschapper of ML-engineer functies kan verkennen. Deze kunnen details over een functie weergeven, zoals de berekening, of het nu gaat om een โโgemiddelde over 6 maanden of 1 jaar, herkomst, maker of eigenaar, wat de functie betekent en meer.
In de volgende secties bieden we twee benaderingen voor het zoeken en ontdekken van functies en het configureren van metadata op functieniveau: de eerste met Amazon SageMaker Studio direct, en de tweede programmatisch.
Functies ontdekken in Studio
Met Studio kunt u eenvoudig functies zoeken en opvragen. Met de nieuwe verbeterde zoek- en ontdekkingsmogelijkheden kunt u onmiddellijk resultaten ophalen door een paar tekens vooruit te typen.
De volgende schermafbeelding demonstreert de volgende mogelijkheden:
- U heeft toegang tot de Functiecatalogus tabblad en observeer functies in functiegroepen. De functies worden weergegeven in een tabel met de functienaam, het type, de beschrijving, de parameters, de aanmaakdatum en de naam van de bijbehorende functiegroep.
- U kunt de type-ahead-functionaliteit direct gebruiken om zoekresultaten onmiddellijk te retourneren.
- U heeft de flexibiliteit om verschillende soorten filteropties te gebruiken:
All
,Feature name
,Description
ofParameters
. Merk op datAll
zal alle functies retourneren waar ofwelFeature name
,Description
ofParameters
overeenkomen met de zoekcriteria. - U kunt de zoekopdracht verder verfijnen door een datumbereik op te geven met behulp van de
Created from
enCreated to
velden en specificeren van parameters met behulp van deSearch parameter key
enSearch parameter value
te worden.
Nadat u een functie hebt geselecteerd, kunt u de naam van de functie kiezen om de details ervan weer te geven. Wanneer u kiest Bewerk metagegevens, kunt u een beschrijving en maximaal 25 sleutelwaardeparameters toevoegen, zoals weergegeven in de volgende schermafbeelding. Binnen deze weergave kunt u uiteindelijk de metagegevens van de functie maken, bekijken, bijwerken en verwijderen. De volgende schermafbeelding illustreert hoe u metagegevens van functies kunt bewerken voor: total_amount
.
Zoals eerder vermeld, geeft het toevoegen van sleutel-waardeparen aan een functie u meer dimensies waarlangs u kunt zoeken naar hun bepaalde kenmerken. Voor ons voorbeeld is de oorsprong van de functie toegevoegd aan de metadata van elke functie. Wanneer u het zoekpictogram kiest en filtert op het sleutel/waarde-paar origin: job
, kunt u alle functies zien die one-hot-encoded waren vanaf dit basiskenmerk.
Functie-ontdekking met behulp van code
U kunt ook toegang krijgen tot functie-informatie en deze bijwerken via de AWS-opdrachtregelinterface (AWS CLI) en SDK (Boto3) in plaats van rechtstreeks via de AWS-beheerconsole. Hierdoor kunt u de zoekfunctionaliteit op functieniveau van Feature Store integreren met uw eigen aangepaste datawetenschapsplatforms. In deze sectie werken we samen met de Boto3 API-eindpunten om metadata van functies bij te werken en te doorzoeken.
Om het zoeken en ontdekken van functies te verbeteren, kunt u metadata toevoegen met behulp van de update_feature_metadata
API. Naast de description
en created_date
velden kunt u maximaal 25 parameters (sleutel-waarde-paren) toevoegen aan een bepaalde functie.
De volgende code is een voorbeeld van vijf mogelijke sleutel-waardeparameters die zijn toegevoegd aan de job_admin
voorzien zijn van. Deze functie is gemaakt, samen met: job_services
en job_none
, door รฉรฉn-hot-codering job
.
Na author
, team
, origin
, sensitivity
en env
zijn toegevoegd aan de job_admin
kunnen datawetenschappers of ML-engineers ze ophalen door de describe_feature_metadata
API. U kunt navigeren naar de Parameters
object in de reactie voor de metadata die we eerder aan onze functie hebben toegevoegd. De describe_feature_metadata
Met API-eindpunt kunt u meer inzicht krijgen in een bepaalde functie door de bijbehorende metagegevens te verkrijgen.
U kunt naar functies zoeken met behulp van de SageMaker search
API met metadata als zoekparameters. De volgende code is een voorbeeldfunctie waarvoor a search_string
parameter als invoer en retourneert alle objecten waarvan de naam, beschrijving of parameters van de functie overeenkomen met de voorwaarde:
Het volgende codefragment gebruikt onze search_features
functie om alle functies op te halen waarvoor ofwel de functienaam, beschrijving of parameters het woord bevatten job
:
De volgende schermafbeelding bevat de lijst met overeenkomende functienamen en de bijbehorende metadata, inclusief tijdstempels voor de creatie en laatste wijziging van elke functie. U kunt deze informatie gebruiken om de detectie en zichtbaarheid van de functies van uw organisatie te verbeteren.
Conclusie
SageMaker Feature Store biedt een speciaal gebouwde oplossing voor functiebeheer om organisaties te helpen bij het schalen van ML-ontwikkeling over bedrijfseenheden en datawetenschapsteams. Het verbeteren van het hergebruik van functies en de consistentie van functies zijn de belangrijkste voordelen van een functiearchief. In dit bericht hebben we uitgelegd hoe u metadata op functieniveau kunt gebruiken om het zoeken en ontdekken van functies te verbeteren. Dit omvatte het creรซren van metadata rond verschillende gebruiksscenario's en het gebruiken ervan als aanvullende zoekparameters.
Probeer het eens en laat ons weten wat je ervan vindt in de reacties. Als u meer wilt weten over het samenwerken en delen van functies binnen Feature Store, raadpleeg dan: Schakel het hergebruik van functies in verschillende accounts en teams in met Amazon SageMaker Feature Store.
Over de auteurs
Arnaud Lauer is Senior Partner Solutions Architect in het Public Sector-team van AWS. Hij stelt partners en klanten in staat te begrijpen hoe AWS-technologieรซn het beste kunnen worden gebruikt om zakelijke behoeften in oplossingen te vertalen. Hij heeft meer dan 16 jaar ervaring in het leveren en ontwerpen van digitale transformatieprojecten in een groot aantal sectoren, waaronder de publieke sector, energie en consumptiegoederen. Kunstmatige intelligentie en machine learning zijn enkele van zijn passies. Arnaud heeft 12 AWS-certificeringen, waaronder de ML Specialty-certificering.
Nicolaas Bernier is een Associate Solutions Architect, onderdeel van het Canadian Public Sector-team bij AWS. Hij volgt momenteel een masteropleiding met een onderzoeksgebied in Deep Learning en heeft vijf AWS-certificeringen, waaronder de ML Specialty-certificering. Nicolas is gepassioneerd om klanten te helpen hun kennis van AWS te verdiepen door met hen samen te werken om hun zakelijke uitdagingen te vertalen in technische oplossingen.
Marc Roy is een Principal Machine Learning Architect voor AWS en helpt klanten bij het ontwerpen en bouwen van AI / ML-oplossingen. Marks werk omvat een breed scala aan ML-use-cases, met een primaire interesse in computervisie, deep learning en het schalen van ML binnen de onderneming. Hij heeft bedrijven in vele sectoren geholpen, waaronder verzekeringen, financiรซle dienstverlening, media en entertainment, gezondheidszorg, nutsbedrijven en productie. Mark heeft zes AWS-certificeringen, waaronder de ML Specialty-certificering. Voordat hij bij AWS kwam, was Mark meer dan 25 jaar architect, ontwikkelaar en technologieleider, waaronder 19 jaar in financiรซle dienstverlening.
Khushboo Srivastava is een Senior Product Manager voor Amazon SageMaker. Ze bouwt graag producten die machine learning-workflows voor klanten vereenvoudigen. In haar vrije tijd speelt ze graag viool, beoefent ze yoga en reist ze graag.
- AI
- ai kunst
- ai kunst generator
- je hebt een robot
- Amazon Sage Maker
- kunstmatige intelligentie
- certificering van kunstmatige intelligentie
- kunstmatige intelligentie in het bankwezen
- kunstmatige intelligentie robot
- kunstmatige intelligentie robots
- kunstmatige intelligentiesoftware
- AWS-machine learning
- blockchain
- blockchain conferentie ai
- vindingrijk
- conversatie kunstmatige intelligentie
- crypto conferentie ai
- van dall
- diepgaand leren
- google ai
- machine learning
- Plato
- plato ai
- Plato gegevensintelligentie
- Plato-spel
- PlatoData
- platogamen
- schaal ai
- syntaxis
- zephyrnet