Graph ML Jalur Cepat Dengan GraphStorm: Cara Baru Untuk Memecahkan Masalah Pada Grafik Skala Perusahaan

Diterbitkan Ulang Oleh Plato

Followers: 0

Kami sangat gembira mengumumkan rilis sumber terbuka GrafikStorm 0.1, kerangka kerja pembelajaran mesin grafik (ML) perusahaan berkode rendah untuk membangun, melatih, dan menerapkan solusi ML grafik pada grafik skala perusahaan yang kompleks dalam hitungan hari, bukan bulan. Dengan GraphStorm, Anda dapat membangun solusi yang secara langsung memperhitungkan struktur hubungan atau interaksi antara miliaran entitas, yang secara inheren tertanam dalam sebagian besar data dunia nyata, termasuk skenario deteksi penipuan, rekomendasi, deteksi komunitas, dan masalah pencarian/pengambilan.

Hingga saat ini, sangat sulit untuk membangun, melatih, dan menerapkan solusi grafik ML untuk grafik perusahaan kompleks yang dengan mudah memiliki miliaran node, ratusan miliar tepi, dan lusinan atribut—bayangkan saja grafik yang menangkap produk Amazon.com , atribut produk, pelanggan, dan banyak lagi. Dengan GraphStorm, kami merilis alat yang digunakan Amazon secara internal untuk menghadirkan solusi ML grafik berskala besar ke produksi. GraphStorm tidak mengharuskan Anda menjadi ahli dalam grafik ML dan tersedia di bawah lisensi Apache v2.0 di GitHub. Untuk mempelajari lebih lanjut tentang GraphStorm, kunjungi Repositori GitHub.

Dalam postingan ini, kami memberikan pengenalan tentang GraphStorm, arsitekturnya, dan contoh kasus penggunaan cara menggunakannya.

Memperkenalkan GraphStorm

Algoritme grafik dan ML grafik muncul sebagai solusi canggih untuk banyak masalah bisnis penting seperti memprediksi risiko transaksi, mengantisipasi preferensi pelanggan, mendeteksi intrusi, mengoptimalkan rantai pasokan, analisis jaringan sosial, dan prediksi lalu lintas. Misalnya, Tugas Penjaga Amazon, layanan deteksi ancaman asli AWS, menggunakan grafik dengan miliaran tepi untuk meningkatkan cakupan dan keakuratan intelijen ancamannya. Hal ini memungkinkan GuardDuty untuk mengkategorikan domain yang sebelumnya tidak terlihat sebagai domain yang kemungkinan besar berbahaya atau tidak berbahaya berdasarkan keterkaitannya dengan domain berbahaya yang diketahui. Dengan menggunakan Graph Neural Networks (GNNs), GuardDuty dapat meningkatkan kemampuannya dalam memperingatkan pelanggan.

Namun, pengembangan, peluncuran, dan pengoperasian solusi graph ML membutuhkan waktu berbulan-bulan dan memerlukan keahlian graph ML. Sebagai langkah pertama, ilmuwan ML grafik harus membuat model ML grafik untuk kasus penggunaan tertentu menggunakan kerangka kerja seperti Deep Graph Library (DGL). Melatih model seperti itu merupakan tantangan karena ukuran dan kompleksitas grafik dalam aplikasi perusahaan, yang secara rutin menjangkau miliaran node, ratusan miliar edge, jenis node dan edge yang berbeda, serta ratusan atribut node dan edge. Grafik perusahaan memerlukan penyimpanan memori sebesar terabyte, sehingga mengharuskan ilmuwan ML grafik untuk membangun jalur pelatihan yang kompleks. Terakhir, setelah model dilatih, model tersebut harus diterapkan untuk inferensi, yang memerlukan pipeline inferensi yang sama sulitnya untuk dibuat seperti pipeline pelatihan.

GraphStorm 0.1 adalah kerangka kerja ML grafik perusahaan berkode rendah yang memungkinkan praktisi ML dengan mudah memilih model ML grafik yang telah ditentukan sebelumnya dan telah terbukti efektif, menjalankan pelatihan terdistribusi pada grafik dengan miliaran node, dan menerapkan model tersebut ke dalam produksi. GraphStorm menawarkan kumpulan model ML grafik bawaan, seperti Relational Graph Convolutional Networks (RGCN), Relational Graph Attention Networks (RGAT), dan Heterogeneous Graph Transformer (HGT) untuk aplikasi perusahaan dengan grafik heterogen, yang memungkinkan para insinyur ML dengan sedikit grafik keahlian ML untuk mencoba berbagai solusi model untuk tugas mereka dan memilih solusi yang tepat dengan cepat. Saluran pelatihan dan inferensi yang terdistribusi secara menyeluruh, yang berskala hingga grafik perusahaan berskala miliaran, memudahkan pelatihan, penerapan, dan menjalankan inferensi. Jika Anda baru mengenal GraphStorm atau grafik ML secara umum, Anda akan mendapatkan keuntungan dari model dan pipeline yang telah ditentukan sebelumnya. Jika Anda seorang ahli, Anda memiliki semua opsi untuk menyesuaikan alur pelatihan dan arsitektur model untuk mendapatkan performa terbaik. GraphStorm dibangun di atas DGL, kerangka kerja yang sangat populer untuk mengembangkan model GNN, dan tersedia sebagai kode sumber terbuka di bawah lisensi Apache v2.0.

“GraphStorm dirancang untuk membantu pelanggan bereksperimen dan mengoperasionalkan metode ML grafik untuk aplikasi industri guna mempercepat penerapan ML grafik,” kata George Karypis, Ilmuwan Utama Senior di penelitian AI/ML Amazon. “Sejak dirilis di Amazon, GraphStorm telah mengurangi upaya untuk membangun solusi berbasis grafik ML hingga lima kali lipat.”

“GraphStorm memungkinkan tim kami melatih penyematan GNN secara mandiri pada grafik dengan 288 juta node dan 2 miliar edge,” ujar Haining Yu, Principal Applied Scientist di Amazon Measurement, Ad Tech, dan Data Science. “Penyematan GNN yang telah dilatih sebelumnya menunjukkan peningkatan sebesar 24% pada tugas prediksi aktivitas pembelanja dibandingkan baseline berbasis BERT yang canggih; ini juga melebihi kinerja tolok ukur dalam aplikasi iklan lainnya.”

“Sebelum GraphStorm, pelanggan hanya dapat melakukan penskalaan secara vertikal untuk menangani grafik dari 500 juta edge,” kata Brad Bebee, GM untuk Amazon Neptune dan Amazon Timestream. “GraphStorm memungkinkan pelanggan untuk menskalakan pelatihan model GNN pada grafik Amazon Neptune yang sangat besar dengan puluhan miliar edge.”

Arsitektur teknis GraphStorm

Gambar berikut menunjukkan arsitektur teknis GraphStorm.

ML grafik jalur cepat dengan GraphStorm: Cara baru untuk memecahkan masalah pada grafik skala perusahaan | Kecerdasan Data PlatoBlockchain Layanan Web Amazon. Pencarian Vertikal. Ai.

GraphStorm dibangun di atas PyTorch dan dapat berjalan pada satu GPU, beberapa GPU, dan beberapa mesin GPU. Terdiri dari tiga lapisan (ditandai dengan kotak kuning pada gambar sebelumnya):

Lapisan bawah (Dist GraphEngine) – Lapisan bawah menyediakan komponen dasar untuk mengaktifkan ML grafik terdistribusi, termasuk grafik terdistribusi, tensor terdistribusi, embeddings terdistribusi, dan sampler terdistribusi. GraphStorm menyediakan implementasi yang efisien dari komponen-komponen ini untuk menskalakan pelatihan ML grafik ke grafik miliaran node.
Lapisan tengah (pipa pelatihan/inferensi GS) – Lapisan tengah menyediakan pelatih, evaluator, dan prediktor untuk menyederhanakan pelatihan model dan inferensi untuk model bawaan dan model kustom Anda. Pada dasarnya, dengan menggunakan API lapisan ini, Anda dapat fokus pada pengembangan model tanpa mengkhawatirkan cara menskalakan pelatihan model.
Lapisan atas (kebun binatang model umum GS) – Lapisan atas adalah kebun binatang model dengan model GNN dan non-GNN populer untuk berbagai jenis grafik. Pada tulisan ini, tersedia RGCN, RGAT, dan HGT untuk graf heterogen dan BERTGNN untuk graf tekstual. Di masa mendatang, kami akan menambahkan dukungan untuk model grafik temporal seperti TGAT untuk grafik temporal serta TransE dan DistMult untuk grafik pengetahuan.

Cara menggunakan GraphStorm

Setelah menginstal GraphStorm, Anda hanya memerlukan tiga langkah untuk membangun dan melatih model GML untuk aplikasi Anda.

Pertama, Anda memproses data Anda terlebih dahulu (berpotensi termasuk rekayasa fitur khusus Anda) dan mengubahnya menjadi format tabel yang diperlukan oleh GraphStorm. Untuk setiap jenis simpul, Anda menentukan tabel yang mencantumkan semua simpul dari jenis tersebut dan fitur-fiturnya, memberikan ID unik untuk setiap simpul. Untuk setiap jenis tepi, Anda juga dapat menentukan tabel yang setiap barisnya berisi ID simpul sumber dan tujuan untuk tepi jenis tersebut (untuk informasi lebih lanjut, lihat Gunakan Tutorial Data Anda Sendiri). Selain itu, Anda menyediakan file JSON yang menjelaskan struktur grafik secara keseluruhan.

Kedua, melalui antarmuka baris perintah (CLI), Anda menggunakan bawaan GraphStorm construct_graph komponen untuk beberapa pemrosesan data khusus GraphStorm, yang memungkinkan pelatihan dan inferensi terdistribusi secara efisien.

Ketiga, Anda mengonfigurasi model dan pelatihan dalam file YAML (contoh) dan, sekali lagi dengan menggunakan CLI, aktifkan salah satu dari lima komponen bawaan (gs_node_classification, gs_node_regression, gs_edge_classification, gs_edge_regression, gs_link_prediction) sebagai saluran pelatihan untuk melatih model. Langkah ini menghasilkan artefak model terlatih. Untuk melakukan inferensi, Anda perlu mengulangi dua langkah pertama untuk mengubah data inferensi menjadi grafik menggunakan komponen GraphStorm yang sama (construct_graph) seperti sebelumnya.

Terakhir, Anda dapat memanggil salah satu dari lima komponen bawaan, sama seperti yang digunakan untuk pelatihan model, sebagai saluran inferensi untuk menghasilkan hasil penyematan atau prediksi.

Alur keseluruhan juga digambarkan pada gambar berikut.

ML grafik jalur cepat dengan GraphStorm: Cara baru untuk memecahkan masalah pada grafik skala perusahaan | Kecerdasan Data PlatoBlockchain Layanan Web Amazon. Pencarian Vertikal. Ai.

Di bagian berikut, kami memberikan contoh kasus penggunaan.

Buat prediksi berdasarkan data mentah OAG

Untuk postingan ini, kami mendemonstrasikan betapa mudahnya GraphStorm mengaktifkan pelatihan dan inferensi ML grafik pada kumpulan data mentah yang besar. Itu Buka Grafik Akademik (OAG) berisi lima entitas (makalah, penulis, tempat, afiliasi, dan bidang studi). Kumpulan data mentah disimpan dalam file JSON dengan ukuran lebih dari 500 GB.

Tugas kita adalah membangun model untuk memprediksi bidang studi suatu makalah. Untuk memprediksi bidang studi, Anda dapat memformulasikannya sebagai tugas klasifikasi multi-label, namun sulit menggunakan pengkodean one-hot untuk menyimpan label karena terdapat ratusan ribu bidang. Oleh karena itu, Anda harus membuat node bidang studi dan merumuskan masalah ini sebagai tugas prediksi tautan, memprediksi node bidang studi mana yang harus dihubungkan oleh node kertas.

Untuk memodelkan dataset ini dengan metode grafik, langkah pertama yang dilakukan adalah memproses dataset dan mengekstrak entitas dan edge. Anda dapat mengekstrak lima jenis tepi dari file JSON untuk menentukan grafik, yang ditunjukkan pada gambar berikut. Anda dapat menggunakan notebook Jupyter di GraphStorm contoh kode untuk memproses kumpulan data dan menghasilkan lima tabel entitas untuk setiap tipe entitas dan lima tabel tepi untuk setiap tipe tepi. Notebook Jupyter juga menghasilkan penyematan BERT pada entitas dengan data teks, seperti kertas.

ML grafik jalur cepat dengan GraphStorm: Cara baru untuk memecahkan masalah pada grafik skala perusahaan | Kecerdasan Data PlatoBlockchain Layanan Web Amazon. Pencarian Vertikal. Ai.

Setelah menentukan entitas dan tepi antar entitas, Anda dapat membuat mag_bert.json, yang mendefinisikan skema grafik, dan memanggil pipeline konstruksi grafik bawaan construct_graph di GraphStorm untuk membuat grafik (lihat kode berikut). Meskipun pipeline konstruksi grafik GraphStorm berjalan di satu mesin, pipeline ini mendukung multi-pemrosesan untuk memproses node dan fitur edge secara paralel (--num_processes) dan dapat menyimpan fitur entitas dan edge pada memori eksternal (--ext-mem-workspace) untuk menskalakan ke kumpulan data besar.

python3 -m graphstorm.gconstruct.construct_graph --num-processes 16 --output-dir /data/oagv2.1/mag_bert_constructed --graph-name mag --num-partitions 4 --skip-nonexist-edges --ext-mem-workspace /mnt/raid0/tmp_oag --ext-mem-feat-size 16 --conf-file mag_bert.json

Untuk memproses grafik sebesar itu, Anda memerlukan instance CPU dengan memori besar untuk membuat grafik. Anda dapat menggunakan Cloud komputasi elastis Amazon (Amazon EC2) instans r6id.32xlarge (128 vCPU dan 1 TB RAM) atau instans r6a.48xlarge (192 vCPU dan 1.5 TB RAM) untuk membuat grafik OAG.

Setelah membuat grafik, Anda dapat menggunakannya gs_link_prediction untuk melatih model prediksi tautan pada empat instans g5.48xlarge. Saat menggunakan model bawaan, Anda hanya memanggil satu baris perintah untuk meluncurkan tugas pelatihan terdistribusi. Lihat kode berikut:

python3 -m graphstorm.run.gs_link_prediction --num-trainers 8 --part-config /data/oagv2.1/mag_bert_constructed/mag.json --ip-config ip_list.txt --cf ml_lp.yaml --num-epochs 1 --save-model-path /data/mag_lp_model

Setelah pelatihan model, artefak model disimpan dalam folder /data/mag_lp_model.

Sekarang Anda dapat menjalankan inferensi prediksi tautan untuk menghasilkan penyematan GNN dan mengevaluasi performa model. GraphStorm menyediakan beberapa metrik evaluasi bawaan untuk mengevaluasi kinerja model. Untuk masalah prediksi tautan, misalnya, GraphStorm secara otomatis mengeluarkan metrik mean reciprocal rank (MRR). MRR adalah metrik yang berharga untuk mengevaluasi model prediksi tautan grafik karena menilai seberapa tinggi peringkat tautan sebenarnya di antara tautan yang diprediksi. Hal ini menangkap kualitas prediksi, memastikan model kami memprioritaskan hubungan yang sebenarnya dengan benar, yang merupakan tujuan kami di sini.

Anda dapat menjalankan inferensi dengan satu baris perintah, seperti yang ditunjukkan pada kode berikut. Dalam hal ini, model mencapai MRR 0.31 pada set pengujian grafik yang dibangun.

python3 -m graphstorm.run.gs_link_prediction --inference --num_trainers 8 --part-config /data/oagv2.1/mag_bert_constructed/mag.json --ip-config ip_list.txt --cf ml_lp.yaml --num-epochs 3 --save-embed-path /data/mag_lp_model/emb --restore-model-path /data/mag_lp_model/epoch-0/

Perhatikan bahwa saluran inferensi menghasilkan penyematan dari model prediksi tautan. Untuk memecahkan masalah dalam menemukan bidang studi untuk makalah tertentu, cukup lakukan pencarian k-tetangga terdekat pada embeddings.

Kesimpulan

GraphStorm adalah kerangka kerja ML grafik baru yang memudahkan pembuatan, pelatihan, dan penerapan model ML grafik pada grafik industri. Ini mengatasi beberapa tantangan utama dalam grafik ML, termasuk skalabilitas dan kegunaan. Ini menyediakan komponen bawaan untuk memproses grafik berskala miliar dari data masukan mentah hingga pelatihan model dan inferensi model dan telah memungkinkan beberapa tim Amazon untuk melatih model ML grafik canggih dalam berbagai aplikasi. Lihat kami Repositori GitHub for more information.

Tentang Penulis

ML grafik jalur cepat dengan GraphStorm: Cara baru untuk memecahkan masalah pada grafik skala perusahaan | Kecerdasan Data PlatoBlockchain Layanan Web Amazon. Pencarian Vertikal. Ai. Da Zheng adalah ilmuwan terapan senior di penelitian AWS AI/ML yang memimpin tim pembelajaran mesin grafik untuk mengembangkan teknik dan kerangka kerja untuk menerapkan pembelajaran mesin grafik dalam produksi. Da mendapatkan gelar PhD di bidang ilmu komputer dari Universitas Johns Hopkins.

ML grafik jalur cepat dengan GraphStorm: Cara baru untuk memecahkan masalah pada grafik skala perusahaan | Kecerdasan Data PlatoBlockchain Layanan Web Amazon. Pencarian Vertikal. Ai. Florian Saupe adalah Manajer Produk Teknis Utama di penelitian AI/ML AWS yang mendukung tim sains tingkat lanjut seperti kelompok pembelajaran mesin grafik dan meningkatkan produk seperti Amazon DataZone dengan kemampuan ML. Sebelum bergabung dengan AWS, Florian memimpin manajemen produk teknis untuk mengemudi otomatis di Bosch, merupakan konsultan strategi di McKinsey & Company, dan bekerja sebagai ilmuwan sistem kontrol/robotika – bidang di mana ia memegang gelar doktoralnya.

Konten Bertenaga SEO & Distribusi PR. Dapatkan Amplifikasi Hari Ini.
Keuangan EVM. Antarmuka Terpadu untuk Keuangan Terdesentralisasi. Akses Di Sini.
Grup Media Kuantum. IR/PR Diperkuat. Akses Di Sini.
PlatoAiStream. Kecerdasan Data Web3. Pengetahuan Diperkuat. Akses Di Sini.
Sumber: https://aws.amazon.com/blogs/machine-learning/fast-track-graph-ml-with-graphstorm-a-new-way-to-solve-problems-on-enterprise-scale-graphs/

Stempel Waktu: Juni 9, 2023

Stempel Waktu: September 28, 2023

Diterbitkan Ulang Oleh Plato

Tambahkan AI percakapan ke pusat kontak mana pun dengan Amazon Lex dan Amazon Chime SDK

Membangun agen AI generatif dengan Amazon Bedrock, Amazon DynamoDB, Amazon Kendra, Amazon Lex, dan LangChain | Layanan Web Amazon

Deteksi keragaman populasi spesies yang terancam punah menggunakan Amazon Rekognition

Memulai Amazon Titan Text Embeddings V2: Model embeddings canggih baru di Amazon Bedrock | Layanan Web Amazon

Mengumumkan dukungan untuk model Llama 2 dan Mistral serta respons streaming di Amazon SageMaker Canvas | Layanan Web Amazon

Tentang Kami

Pencarian Vertikal & Ai

Platform

Tetap Berhubung

Akun