古いラベルに異種グラフの新しいトリックを教える

プラトン再発行

フォロワー： 0

投稿者: Minji Yoon (リサーチインターン)、Bryan Perozzi (リサーチサイエンティスト、Google Research、グラフマイニングチーム)

異種グラフで古いラベルに新しいトリックを教える PlatoBlockchain Data Intelligence。垂直検索。あい。

機械学習の産業用アプリケーションは、通常、異なるデータモダリティや特徴分布を持つさまざまなアイテムで構成されています。異種グラフ (HG) は、複数のタイプのノード (データタイプごと) とエッジ (データ項目間の関係) を定義することにより、これらのマルチモーダルデータシステムの統一されたビューを提供します。たとえば、電子商取引ネットワークには [user, BOX, レビュー] ノードまたはビデオプラットフォームには [チャンネル, user, ビデオ, コメント]ノード。異種グラフニューラルネットワーク (HGNN) 各ノードの関係をベクトルに要約するノードの埋め込みを学習します。ただし、現実の HG では、異なるノードタイプ間でラベルの不均衡の問題が発生することがよくあります。これは、ラベル不足のノードタイプが HGNN を利用できないことを意味し、HGNN の幅広い適用性を妨げます。

」では、知識伝達ネットワークを介した異種グラフ内でのゼロショット転移学習」で発表ニューロIPS 2022では、HG で与えられる豊富なリレーショナル情報を使用して、ラベルが豊富なノードタイプからラベルがゼロのノードタイプに知識を転送する、知識転送ネットワーク (KTN) と呼ばれるモデルを提案します。微調整を必要とせずに HGNN モデルを事前トレーニングする方法について説明します。 KTN は、ゼロショット学習タスクで最先端の転移学習ベースラインを最大 140% 上回るパフォーマンスを示し、これらのタスクで多くの既存の HGNN モデルを 24% (またはそれ以上) 改善するために使用できます。

異種グラフで古いラベルに新しいトリックを教える PlatoBlockchain Data Intelligence。垂直検索。あい。

KTN は、XNUMX 種類の情報からラベルを変換します (正方形) グラフを介して別のタイプ (星).

異種グラフとは何ですか?

HGの構成要素は、 複数のノードとエッジのタイプ。以下の図は、HG として表された電子商取引ネットワークを示しています。 ECでは「ユーザー」が「商品」を購入し、「レビュー」を書きます。 HG は、XNUMX つのノードタイプを使用してこのエコシステムを表します [user, BOX, レビュー] と XNUMX つのエッジタイプ [ユーザーが製品を購入する, ユーザーの書き込みレビュー, 製品のレビュー]。その後、個々の製品、ユーザー、レビューがノードとして表示され、それらの関係が対応するノードおよびエッジタイプを備えた HG 内のエッジとして表示されます。

電子商取引の異種グラフ。

すべての接続情報に加えて、HG には通常、次の情報が与えられます。 入力ノードの属性 各ノードの情報を要約します。入力ノード属性は、ノードタイプごとに異なるモダリティを持つ可能性があります。たとえば、製品の画像を製品ノードの入力ノード属性として指定し、テキストをレビューノードの入力属性として指定することができます。 ノードラベル (各製品のカテゴリや各ユーザーが最も関心のあるカテゴリなど) は、各ノードで予測したいものです。

HGNN とラベル不足の問題

HGNN の計算 ノードの埋め込み 各ノードのローカル構造 (ノードとその隣接ノードの情報を含む) を要約します。これらのノードの埋め込みは、各ノードのラベルを予測するために分類子によって利用されます。 HGNN モデルと分類器をトレーニングして特定のノードタイプのラベルを予測するには、そのタイプに十分な量のラベルが必要です。

ディープラーニングの産業応用における一般的な問題はラベルの不足であり、HGNN はノードタイプが多様であるため、この課題に直面する可能性がさらに高くなります。たとえば、公開されているコンテンツノードタイプ (製品ノードなど) には多くのラベルが付けられていますが、ユーザーまたはアカウントノードのラベルはプライバシー制限により利用できない場合があります。これは、ほとんどの標準的なトレーニング設定では、HGNN モデルはラベルが豊富な少数のノードタイプに対して適切な推論を行うことのみを学習でき、通常、残りのノードタイプに対しては推論を行うことができないことを意味します (それらのノードタイプにラベルがない場合)。

異種グラフでの転移学習

ゼロショット転移学習モデルのパフォーマンスを向上させるために使用される手法です。 ターゲット ドメイン ラベルなしで モデルが他の関連する情報から学習した知識を使用することによって source 適切にラベル付けされたデータを含むドメイン。 HG の特定のノードタイプに対するこのラベル不足の問題を解決するために転移学習を適用するには、ターゲットドメインはゼロラベルのノードタイプになります。では、ソースドメインは何でしょうか? 前へは通常、ソースドメインを、異なる HG にある同じタイプのノードとして設定します (これらのノードには豊富なラベルが付けられていると仮定します)。これ グラフ間の転移学習 このアプローチでは、外部 HG で HGNN モデルを事前トレーニングし、その後、元の (ラベルが不足している) HG でモデルを実行します。

ただし、これらのアプローチは、XNUMX つの理由により、多くの現実世界のシナリオには適用できません。まず、グラフ間転移学習設定で使用できる外部 HG は、ほぼ確実に次のとおりです。 所有権したがって、利用できない可能性があります。第二に、たとえ実務者が外部 HG にアクセスできたとしても、それが可能になる可能性は低いです。 あのソースHGの配布 転移学習を適用するのに十分なほどターゲットの HG と一致します。最後に、次のような問題が発生するノードタイプ ラベルの希少性 他の HG でも同じ問題が発生する可能性があります (ユーザーノードのプライバシー問題など)。

私たちのアプローチ: 異種グラフ内のノードタイプ間で学習を転移する

ここでは、より実用的なソースドメインに光を当てます。 同じ HG 上に豊富なラベルを持つ他のノードタイプ。追加の HG を使用する代わりに、単一の HG (実践者が完全に所有していると想定) 内の知識をさまざまなタイプのノードに転送します。具体的には、ラベルが豊富な (ソース) ノードタイプで HGNN モデルと分類器を事前トレーニングし、その後、追加の微調整を行わずに、同じ HG 内にあるゼロラベル (ターゲット) ノードタイプでモデルを再利用します。 XNUMX つの要件は、ソースノードタイプとターゲットノードタイプが同じラベルセットを共有することです (たとえば、電子商取引 HG では、製品ノードは製品カテゴリを説明するラベルセットを持ち、ユーザーノードはお気に入りのショッピングカテゴリを説明する同じラベルセットを共有します)。。

なぜ挑戦的なのでしょうか?

残念ながら、ターゲットノードタイプで事前トレーニングされた HGNN と分類子を直接再利用することはできません。 HGNN アーキテクチャの重要な特徴の XNUMX つは、HG の多重度を完全に学習するために各ノードタイプに特化したモジュールで構成されていることです。 HGNN は、モジュールの個別のセットを使用して、ノードタイプごとに埋め込みを計算します。以下の図では、青と赤のモジュールが、それぞれソースノードタイプとターゲットノードタイプのノードエンベディングを計算するために使用されます。

HGNN は、各ノードタイプに特化したモジュールで構成され、異なるノードタイプの埋め込みを計算するために個別のモジュールセットを使用します。詳細については、紙.

ソースノードタイプで HGNN を事前トレーニングする際、HGNN 内のソース固有のモジュールは十分にトレーニングされますが、ターゲット固有のモジュールには少量の勾配しか流入しないため、トレーニングが不十分になります。これを以下に示します。 L2基準ターゲットノードタイプの勾配 (つまり、M_tt）は、ソースタイプ（すなわち、M）よりもはるかに低い_ss）。この場合、HGNN モデルはターゲットノードタイプに対して不適切なノードエンベディングを出力し、タスクのパフォーマンスが低下します。

HGNN では、ターゲットタイプ固有のモジュールは、ソースノードタイプでの事前トレーニング中にゼロまたは少量の勾配しか受け取らないため、ターゲットノードタイプでのパフォーマンスの低下につながります。

KTN: HGNN 向けのトレーニング可能なクロスタイプ転移学習

私たちの研究は、ソースノードエンベディングの分布に従うように、事前トレーニングされた HGNN モデルによって計算された (貧弱な) ターゲットノードエンベディングを変換することに焦点を当てています。その後、ソースノードタイプで事前トレーニングされた分類子を、 ターゲット ノードタイプ。ターゲットノードの埋め込みをソースドメインにマッピングするにはどうすればよいでしょうか? この質問に答えるために、HGNN がノードの埋め込みを計算してソース分布とターゲット分布の関係を学習する方法を調査します。

HGNN は、接続されたノードのエンベディングを集約して、各層のターゲットノードのエンベディングを強化します。つまり、ソースノードタイプとターゲットノードタイプの両方のノードエンベディングは、同じ入力 (接続されているノードタイプの前の層のノードエンベディング) を使用して更新されます。これは、それらが相互に表現できることを意味します。この関係を理論的に証明すると、ターゲットドメインからソースドメインへのマッピング行列 (HGNN パラメーターによって定義される) が存在することがわかります (詳細については、「定理 1」を参照してください)。紙）。この定理に基づいて、補助的な式を導入します。ニューラルネットワーク、これを 知識伝達ネットワーク (KTN)、ターゲットノードの埋め込みを受け取り、(トレーニング可能な) マッピング行列を乗算して変換します。次に、KTN をトレーニングするための事前トレーニング段階でのパフォーマンス損失を最小限に抑える正則化子を定義します。テスト時には、分類用のトレーニング済み KTN を使用して、事前トレーニング済みの HGNN から計算されたターゲットエンベディングをソースドメインにマッピングします。

HGNN では、ソースタイプとターゲットタイプの両方の最終的なノードエンベディングは、さまざまな数学関数 (f（）：ソース、 g(): ターゲット) は同じ入力、つまり前の層のノードの埋め込みを使用します。

実験結果

KTN の有効性を調べるために、18 つの公開異種グラフ上で XNUMX の異なるゼロショット転移学習タスクを実行しました。アカデミックグラフを開くおよび PubMedの。 KTN を XNUMX つの最先端の転移学習法と比較します (DAN, JAN, DANN, CDAN, CDAN-E, WDGRL, LP, EP）。以下に示すように、KTN はすべてのタスクですべてのベースラインを常に上回っており、転移学習のベースラインを最大 140% 上回っています (測定によると)。正規化された割引累積ゲイン、ランキング指標）。

Open Academic Graph (OAG-CS) および Pubmed データセットでのゼロショット転移学習。色は、結果が比較される転移学習ベースラインのさまざまなカテゴリを表します。 イエロー: 分布の統計的特性 (平均、分散など) を使用します。 グリーン：つかいます敵対的モデル知識を伝達すること。 オレンジ: を使用してグラフ構造を介して知識を直接伝達します。ラベルの伝播.

最も重要なことは、KTN は、ノードおよびエッジタイプ固有のパラメーターを持つほぼすべての HGNN モデルに適用でき、ターゲットドメインでのゼロショットパフォーマンスを向上させることができます。以下に示すように、KTN は XNUMX つの異なる HGNN モデルにわたってゼロラベル付きノードタイプの精度を向上させます(R-GCN, HAN, HGT, マグン, MPNN, H-MPNN) 最大 190% 増加します。

KTN は XNUMX つの異なる HGNN モデルに適用でき、ターゲットドメインでのゼロショットパフォーマンスを向上させることができます。

まとめ

業界のさまざまなエコシステムは、異種グラフとして表現できます。 HGNN は、異種グラフ情報を効果的な表現に要約します。ただし、特定のタイプのノードではラベル不足の問題が発生し、HGNN の広範な適用が妨げられています。この記事では、HGNN 向けに設計された初のクロスタイプ転移学習手法である KTN を紹介しました。 KTN を使用すると、ラベルの不足に関係なく、HGNN を介して異種グラフの豊富さを最大限に活用できます。を参照してください。紙のガイドをご参照ください。

謝辞

この論文は、共著者である John Palowitch (Google Research)、Dustin Zelle (Google Research)、Ziniu Hu (Google Research、インターン)、および Russ Salakhutdinov (CMU) との共同研究です。このブログ投稿のアニメーションフィギュアを作成してくれた Tom Small に感謝します。

#mailpoet_form_1 .mailpoet_form { }
#mailpoet_form_1 フォーム { margin-bottom: 0; }
#mailpoet_form_1 .mailpoet_column_with_background { パディング: 0px; }
#mailpoet_form_1 .wp-block-column:first-child, #mailpoet_form_1 .mailpoet_form_column:first-child { パディング: 0 20px; }
#mailpoet_form_1 .mailpoet_form_column:not(:first-child) { margin-left: 0; }
#mailpoet_form_1 h2.mailpoet-heading { マージン: 0 0 12px 0; }
#mailpoet_form_1 .mailpoet_paragraph { 行の高さ: 20px; margin-bottom: 20px; }
#mailpoet_form_1 .mailpoet_segment_label, #mailpoet_form_1 .mailpoet_text_label, #mailpoet_form_1 .mailpoet_textarea_label, #mailpoet_form_1 .mailpoet_select_label, #mailpoet_form_1 .mailpoet_radio_label, #mailpoet_form_1 .mailpoet_checkbox_label, #mailpoet_form_1 .mailpoet_list_label, #mailpoet_form_1 .mailpoet_date_label { display: block; フォントの太さ: 通常; }
#mailpoet_form_1 .mailpoet_text, #mailpoet_form_1 .mailpoet_textarea, #mailpoet_form_1 .mailpoet_select, #mailpoet_form_1 .mailpoet_date_month, #mailpoet_form_1 .mailpoet_date_day, #mailpoet_form_1 .mailpoet_date_year, #mailpoet_form_1 .mailpoet_date { 表示: ブロック; }
#mailpoet_form_1 .mailpoet_text, #mailpoet_form_1 .mailpoet_textarea { 幅: 200px; }
#mailpoet_form_1 .mailpoet_checkbox { }
#mailpoet_form_1 .mailpoet_submit { }
#mailpoet_form_1 .mailpoet_divider { }
#mailpoet_form_1 .mailpoet_message { }
#mailpoet_form_1 .mailpoet_form_loading { 幅: 30px; テキスト整列: 中央; 行の高さ: 通常; }
#mailpoet_form_1 .mailpoet_form_loading > スパン { 幅: 5px; 高さ: 5px; 背景色: #5b5b5b; }#mailpoet_form_1{border-radius: 3px;background: #27282e;color: #ffffff;text-align: left;}#mailpoet_form_1 form.mailpoet_form {padding: 0px;}#mailpoet_form_1{width: 100%;}#mailpoet_form_1 . mailpoet_message {マージン: 0; パディング: 0 20px;}
#mailpoet_form_1 .mailpoet_validate_success {color: #00d084}
#mailpoet_form_1 input.parsley-success {color: #00d084}
#mailpoet_form_1 select.parsley-success {color: #00d084}
#mailpoet_form_1 textarea.parsley-success {color: #00d084}

#mailpoet_form_1 .mailpoet_validate_error {色: #cf2e2e}
#mailpoet_form_1 input.parsley-error {color: #cf2e2e}
#mailpoet_form_1 select.parsley-error {color: #cf2e2e}
#mailpoet_form_1 textarea.textarea.parsley-error {色: #cf2e2e}
#mailpoet_form_1 .parsley-errors-list {color: #cf2e2e}
#mailpoet_form_1 .パセリ必須 {色: #cf2e2e}
#mailpoet_form_1 .parsley-custom-error-message {color: #cf2e2e}
#mailpoet_form_1 .mailpoet_paragraph.last {margin-bottom: 0} @media (最大幅: 500px) {#mailpoet_form_1 {background: #27282e;}} @media (最小幅: 500px) {#mailpoet_form_1 .last .mailpoet_paragraph: last-child {margin-bottom: 0}} @media (最大幅: 500px) {#mailpoet_form_1 .mailpoet_form_column:last-child .mailpoet_paragraph:last-child {margin-bottom: 0}}

異種グラフで古いラベルに新しいトリックを教える/gJZg

クラウドソーシング週間

<!–

–>

<!–
–>