Pampiri ye e tsebagatša tlhako ya go sekaseka kamano magareng ga temogo ya topology le tshepedišo ya kakaretšo ka go Graph Neural Networks (GNNs). E utolla gore go oketšega ga temogo ya topology go ka lebiša go kakaretšo ye e sa lekalekanego go ralala le dihlopha tše nnyane tša sebopego, go hlohla kakanyo ya gore go godiša temogo ya topology go dula go hola. Thuto ya mohlala ka ga bokgole bja tsela ye kopana kudu e tiišetša dikhwetšo tše gomme e gatelela ditirišo tše di šomago go fokotšeng bothata bja go thoma ka go tonya mo go ithuteng ka mafolofolo kerafo.
Bangwadi: .
(1) Junwei Su, Lefapha la Saense ya Dikhomphutha, Yunibesithi ya Hong Kong le [email protected];
(2) Chuan Wu, Lefapha la Saense ya Dikhomphutha, Yunibesithi ya Hong Kong le [email protected].
Mathata a mantši a pono ya khomphutha le a go ithuta ka motšhene a swantšhwa bjalo ka mešomo ya go ithuta go dikerafo, moo dinetweke tša ditšhika tša dikerafo (GNNs) di tšweletšego bjalo ka sedirišwa se segolo sa go ithuta dikemedi tša datha ye e rulagantšwego ke dikerafo. Sebopego se bohlokwa sa di-GNN ke tšhomišo ya tšona ya dibopego tša dikerafo bjalo ka tsenyo, go di kgontšha go šomiša dithoto tša tlhago tša dikerafo tša topological—tšeo di tsebjago bjalo ka temogo ya topology ya di-GNN. Go sa šetšwe katlego ya diphihlelelo ya di-GNN, khuetšo ya temogo ya topology go tshepedišo ya kakaretšo e sa dutše e sa hlahlobja, kudukudu bakeng sa mešomo ya maemo a node yeo e aroganego le kakanyo ya gore datha e ikemetše ebile e phatlalatšwa ka go swana (IID). Tlhaloso ye e nepagetšego le tlhalošo ya temogo ya topology ya di-GNN, kudukudu mabapi le dikarolo tše di fapanego tša topology, di sa dutše di sa hlaka. Pampiri ye e tsebagatša tlhako ye e feletšego ya go hlaola temogo ya topology ya di-GNN go ralala le tšobotsi efe goba efe ya topology. Ka go šomiša tlhako ye, re nyakišiša ditlamorago tša temošo ya topology go tshepedišo ya kakaretšo ya GNN. Go fapana le tumelo ye e atilego ya gore go godiša temogo ya topology ya di-GNN ka mehla go na le mohola, tshekatsheko ya rena e utolla temogo ye bohlokwa: go kaonafatša temogo ya topology ya di-GNN go ka lebiša ka go se lemoge go kakaretšo ye e sa lokago go ralala le dihlopha tša sebopego, tšeo di ka bago di sa nyakege maemong a mangwe. Go tlaleletša, re dira thuto ya mohlala re šomiša metric ya kerafo ya ka gare, sekgala sa tsela ye kopana kudu, go disete tša datha tša go fapafapana tša tekanyetšo. Dipoelo tša diphihlelelo tša nyakišišo ye ya mohlala di tiišetša ditemogo tša rena tša teori. Go feta fao, re laetša tirišo ye e šomago ya tlhako ya rena ka go e šomiša go rarolla bothata bja go thoma ka go tonya mo go ithuteng ka mafolofolo kerafo.
1 Matseno
Mathata a mantši a pono ya khomphutha le go ithuta ka motšhene a swantšhwa bjalo ka mešomo ya go ithuta go dikerafo. Mohlala, ka karoganyo ya semantiki, dikerafo di swantšha dikamano magareng ga dilete tša diswantšho tše di fapanego, go godiša go nepagala le karoganyo yeo e lemogago seemo. Dinetweke tša ditšhika tša kerafo (GNNs) di tšweletše bjalo ka sehlopha se se bušago sa dika tša go ithuta ka motšhene tšeo di hlamilwego ka go lebanya bakeng sa go ithuta dikemedi tša datha yeo e rulagantšwego ka kerafo. Ba bontšhitše katlego ye kgolo go rarolla mathata a mantši ao a amanago le kerafo ka dikarolong tše di fapanego tša go swana le khemikhale [10], thutaphedi [37], go dira dikgokagano tša leago [6, 22], go tšweletša kerafo ya lefelo [46, 51] le go utolla kamano ya pono [24,43,49]. Seka se se hlalošago sa di-GNN ke tšhomišo ya tšona ya mokgwa wa sebaka ka go fetišetša molaetša godimo ga sebopego sa kerafo bakeng sa go kgoboketša diponagalo. Se se kgontšha di-GNN go boloka tshedimošo ya sebopego goba go ithekga (go bolelwa bjalo ka temogo ya topology) go tšwa go sebopego sa kerafo sa motheo, go di dumelela go šoma gabotse kudu mešomong ya go swana le go hlopha ga noutu. Seh. 1 se bontšha tshepedišo ya go ithuta ka kakaretšo ya di-GNN.
Go sa šetšwe go šoma ga tšona le bokgoni, go sa na le go hloka kwešišo ya teori ka ga di-GNN, kudukudu ka lefelong la go hlopha node yeo e hlokometšwego ka seripagare moo go ithekga gare ga datha go fapanago kudu le dika tše dingwe tša go ithuta ka motšhene [25]. Ka setting ye, pakane ke go leverage dikamano, bjalo ka ge di thopilwe ke sebopego sa kerafo, gare ga datha le sete ye nnyane ya di-node tše di swailwego go bolela e sa le pele ka dileibole tša di-node tše di šetšego. Bontši bja dithuto tša teori tše di lego gona tša di-GNN di lebišitšwe go kgokagano magareng ga mokgwa wa go fetiša molaetša wa di-GNN le teko ya isomorphism ya Weisfeiler-Lehman [19], ka nepo ya go kwešiša bokgoni bja di-GNN bja go fapantšha dibopego tše di fapanego tša kerafo ka dikemedi tše di ithutilwego, tšeo di tsebjago bjalo ka maatla a go bontšha a di-GNN. Ka go hlohleletšwa ke dithuto tša go hlagiša, go dumelwa ka tlwaelo gore go oketša temogo ya topology go hola gohle gomme dinyakišišo tše ntši di lebišitše tlhokomelo go kgontšha di-GNN go boloka dithoto tše ntši tša sebopego ka boemedi bjo bo ithutilwego [29, 33, 48].
Le ge go le bjalo, ge di-GNN di thoma go ithekga kudu ka le go ba le kwelobohloko (go lemoga) ka sebopego sa kerafo bjalo ka tsenyo, di ka bontšha ditiragatšo tša kakaretšo tše di fapanego go ya go dihlopha tše nnyane tše itšego tša sebopego (dihlopha tše nnyane tša datha tše di fapanego tšeo di hlophišitšwego ka go swana ga sebopego le sete ya tlwaetšo) ka gare ga datha. The quantification ya GNN generalization ho pholletsa le fapaneng sebopeho subgroups e bitsoa sebopeho subgroup kakaretso [25]. Go naganelwa mo go bjalo go bohlokwa kudu tirišong le tlhabollong ya GNN. Ka mohlala, ka gare ga dinetweke tša tirišano ya proteine le diproteine, dihlopha tše tše nnyane tša sebopego di be di ka emela dilo tše di raraganego tša dimolekule tše di fapanego, tša tutuetša go nepagala ga dipolelelopele tša tirišano. Ka mo go swanago, go kwešiša ka moo temošo ya topology ya di-GNN e tutuetšago kakaretšo go bohlokwa ge go hlangwa maano a go tšea mehlala bakeng sa tlwaetšo. Tekanyo yeo tshepedišo ya kakaretšo ya di-GNN e tutuetšwago ke dikarolo tše itšego tša sebopego sa datha ya kerafo e bohlokwa kudu go tšeeng sephetho ka sebopego sa disete tša data tša tlwaetšo. Go sa šetšwe bohlokwa bja yona, kwešišo ya kamano magareng ga temogo ya topology ya di-GNN le kakaretšo ya yona ya sehlopha se senyenyane sa sebopego e sa hlaelela. Go feta fao, go hlaola temogo ya topology ya di-GNN go hlola tlhohlo, kudukudu ge go lebelelwa gore didomene le mešomo ye e fapanego di ka etiša pele dikarolo tša sebopego tše di fapanego. Ka fao, tlhako ye e fetofetogago e a nyakega go sekaseka temogo ya topology ya di-GNN mabapi le dibopego tše di fapanego.
Go rarolla sekgoba se, mo pampiring ye, re šišinya tlhako ya padi yeo e theilwego godimo ga go tsenywa ga metric ye e akanyetšwago go ithuta kamano magareng ga kakaretšo ya sehlopha se senyenyane sa sebopego le temogo ya topology ya di-GNN ka gare ga maemo a go hlopha ga node yeo e hlokometšwego ka seripagare. Tlhako ye e šišintšwego e dumelela nyakišišo ya kakaretšo ya dihlopha tše nnyane tša sebopego sa di-GNN mabapi le dihlopha tše nnyane tša sebopego tše di fapanego. Ka go lebanya, meneelo ye megolo ya mošomo wo e akareditšwe ka tsela ye e latelago.
1. Re šišinya padi, tlhako ya sebopego-agnostic re šomiša go tsenywa ga metric ye e akanyetšwago go hlahloba tirišano magareng ga kakaretšo ya sehlopha se senyenyane sa sebopego sa GNNs le temogo ya topology. Tlhako ye e na le mahlakore a mantši, e amogela dikelo tša sebopego tše di fapafapanego go swana le bokgole bja tsela ye kopana kudu, gomme e nyaka fela tekanyo ya sebopego ye e swanetšego. Bonolo bja yona bja go akanyetša mabaka a bohlokwa bo dira gore e šome le go akaretšwa go maemo a mantši.
2. Ka tshekatsheko ya semmušo ka gare ga tlhako ya rena, re hloma kgokagano ye e kwagalago magareng ga temogo ya topology ya GNN le tshepedišo ya bona ya kakaretšo (Theorem 1). Re bontšha gape gore le ge temošo ya topology ye e kaonafetšego e godiša go hlagiša ga GNN, e ka feletša ka tshepedišo ya kakaretšo ye e sa lekalekanego, ya rata dihlopha tše nnyane tšeo di swanago kudu ka sebopego le sete ya tlwaetšo (Theorem 2). Thepa ye bjalo ya sebopego e ka ba kotsi (go hlola ditaba tša go hloka toka) goba ya ba le mohola (go tsebiša diphetho tša tlhamo) go ya ka seemo. Se se hlohla tumelo ye e atilego ya gore temogo ye e oketšegilego ya topology ka gohle e hola di-GNN [29, 33, 48], se gatelela bohlokwa bja go ela hloko kamano magareng ga temogo ya topology le tshepedišo ya kakaretšo.
3. Re netefatša tlhako ya rena ka nyakišišo ya mohlala ka ga sekgala sa tsela ye kopana kudu, re tšweletša go šoma ga yona le kamano ya yona. Dipoelo di tiišetša dikhwetšo tša rena tša teori, di bontšha gore di-GNN tšeo di nago le temogo ye e phagamego ya bokgole bja tsela ye kopana di phala ka go hlopha dihlopha tša vertex kgauswi le sete ya tlwaetšo. Go feta fao, re bontšha ka fao dikhwetšo tša rena di ka dirišwago go fokotša bothata bja go thoma ka go tonya mo go ithuteng ka mafolofolo ke kerafo [11,15], re tšweletša ditlamorago tše di šomago tša tlhako ya rena le dipoelo.
Pampiri ye e ka fase ga laesense ya CC BY 4.0 DEED.