Gephi suomeksi

Tässä osiossa esittelen Gephin perusteet suomeksi. Ilmaisen ohjelman lisäksi tarvitset ajan tasalla olevan Javan. Esimerkit pohjaavat Martin Grandjeanin erinomaiseen englanninkieliseen tutoriaaliin mutta sitä on kääntämisen lisäksi päivitetty vastaamaan Gephin versiota 0.9.2. Esimerkkitiedostot voi ladata englanninkieliseltä sivulta. Aivan alkeista olen tehnyt videon.

Käynnistä Gephi ja valitse New Project. Valitse näkymä Data Laboratory ja sitten klikkaa Import Spreadsheet. Lataa tiedosto Grandjean_Nodes 1. Varmista, että asetukset ovat kuten kuvassa 1 (Separator: semicolon, Import as: Nodes table):

Kuvakaappaus  Gephin tiedoston tuontiasetuksista

Valitse seuraava. Tämä asetusten osa on tärkeä, koska välillä Gephi tunnistaa tuotujen tietojen muodon oikein niiden otsikoista, mutta välillä ei. Tässä esimerkissä on erityisen tärkeää tarkistaa, että Latitude ja Longitude (pituus- ja leveyspiirit) ovat muotoa ”Double”, ei ”Integer”. (Yksinkertaisesti, nämä ovat erilaisia tapoja, joilla numeroita ilmaistaan. Jos haluat ymmärtää tarkemmin, ks. esim. http://uc-r.github.io/integer_double/.)

Seuraavassa näkymässä kannattaa valita ”Append to existing workspace”.

Tuo seuraavaksi tiedosto Grandjean_Edges1.csv samalla tavalla. Tarkista, että Separator on ”Semicolon” ja Import As ”Edges table”. Viimeisessä ruudussa ”Append to existing workspace”.

Yksimoodisen verkoston visualisoiminen

Yksimoodinen tarkoittaa, että linkit kulkevat kahden samanlaisen solmutyypin välillä. Tässä esimerkissä solmut ovat ihmisiä, jotka lähettävät toisilleen kirjeitä.

Solmujen koko

Aloitetaan antamalla solmuille koko niiden asteen (yhteyksien määrän, degree) mukaan. Tämä tapahtuu Appearance-ikkunassa. Muista valita Ranking sekä ympyröistä koostuva kokotyökalu:

Kuvakkaappaus Gephin Appearance-ikkunasta

Voit itse kokeilla, millaisilla asetuksilla graafi alkaa näyttää paremmalta. Esimerkissä on käytetty minimikokoa 10 ja maksimikokoa 100. Tässä vaiheessa voit myös nollata graafin värit (harmaasävyillä solmut erottuvat selvemmin). Painike, harmaa neliö, löytyy graafin vasemmasta alareunasta:

Kuvakaappaus Gephin väriasetusten nollaamisesta

Graafin visuaalinen laajentaminen

Seuraavaksi laajennetaan näkymää niin, että solmut alkavat erottua toisistaan. Kokeillaan ensimmäisenä Fruchterman Reingold -layoutia seuraavilla arvoilla:

Area 20.000
Gravity 10.0
Speed 10.0

Tällä visualisoinnilla ”painovoima” sijoittelee solmut uusin paikkoihin (osa vetää toisiaan puoleensa ja karkottaa toisia). Eräänlaisia ”yhteisöjä” alkaa jo huomata. Anna algoritmin jatkaa kunnes se pysähtyy tai melkein pysähtyy. Keskitä graafi tarvittaessa suurennuslasilla.

Kokeillaan seuraavaksi, minkänäköinen graafista tulee Force Atlas 2 -layoutilla. Tämä layout erottelee ryhmiä vielä enemmän toisistaan ja antaa myös tilaa suuremmille solmuille. Tämän layoutin asetukset vaikuttavat ulkoasuun suuresti, mutta kokeile aluksi seuraavilla arvoilla:

Prevent Overlap valitse
Scaling 50

Näillä asetuksilla voit jo ehkä huomata, että verkostosta erottuu 5-6 ”yhteisöä” (communities).

Painotettu asteluku

Annetaan solmuille seuraavaksi uusia ominaisuuksia, joiden mukaan niitä voidaan luokitella ja ryhmitellä. Avaa Data Laboratory, valitse Edges Table ja järjestä linkit painon (Weight) mukaan: Klikkaa saraketta Weight, kunnes suurin luku on ylimpänä. Tästä näet, mikä on suurin linkkipaino. Tämä on aineiston kokoajan tekemä määritelmä sille, mitkä yhteydet ovat tärkeämpiä, ”painavampia”, kuin toiset. Tässä tilanteessa emme tiedä, millä perusteella tämä painotus on tehty, mutta sillä on vaikutusta siihen, miten graafia visualisoimme ja tulkitsemme.

Palaa Overview-näkymään ja etsi Statistics-välilehti. Laske Average Weighted Degree valitsemalla ”Run”:

Kuvakaappaus Gephin Statistics-ikkunasta

Kun astearvot on laskettu, Gephi tarjoaa uusia atribuutteja graafin värittämiseen. Mene taas Appearance-ikkunaan, valitse väripaletti ja Ranking. Valitse kriteeriksi Weighted In-Degree (painotettu tuontiaste). Kannattaa valita pienille solmuille tumma väri ja suurille (joilla paljon linkkejä) vaalea. Tämä parantaa pienten solmujen näkyvyyttä. Voit muuttaa väriä pienestä valintaruudusta, ja täältä voit myös kääntää värien voimakkuuden toisin päin (Invert). Sävyn alla olevia pieniä kolmioita siirtämällä muutat painotusta (esimerkiksi korostat pientä joukkoa hyvin tärkeitä solmuja).

Kuvakaappaus Gephi-graafista, joka on väritetty solmun asteen mukaan

Graafissa on nyt suuremmalla koolla sellaiset solmut, jotka joko saavat tai lähettävät paljon kirjeitä ja väri kuvastaa vastaanotettuja kirjeitä (vaalea väri=paljon vastaanotettuja kirjeitä).

Seuraavaksi voit laittaa solmujen nimiöt (labels) näkyviin. Oletuksena teksti tulee sarakkeesta, jonka otsikko on Label, mutta Configure-kohdasta voi myös vaihtaa nimiöksi jonkun muun tiedon:

Kuvakaappaus Gephin nimiöiden konfiguroinnista

Laske nyt graafin modulaarisuus. Löydät sen Statistics-ikkunasta. Laita resoluutioksi 1.0. Kun vielä vaihdat Appearance-paneelin Partition-pudotusvalikosta värivalinnaksi Modularity Class, näkyvissä pitäisi olla 7 yhteisöä.

Katsotaan seuraavaksi, miten löydämme ”välittäjiä” (broker) tai ”siltoja” (bridges). Nämä ovat nimityksiä solmulle, joka yhdistää sellaisia graafin osia, jotka eivät muuten olisi yhteydessä toisiinsa. Yksinkertainen esimerkki sillasta on verkosto, jossa A, B ja C tuntevat kaikki toisensa ja E, F ja G tuntevat toisensa (tällaisia ryhmiä kutsutaan klikeiksi, cliques). D, joka tuntee C:n ja E:n on silta näiden kahden ryhmän välillä:

Esimerkkikuva verkoston "sillasta"/"välittäjästä", jossa kirjaimet a-g yhdistyvät toisiinsa.

Karttanäkymä

Asetellaan lopuksi solmut karttapisteiden mukaan. Tätä tarkoitusta varten tarvitse GeoLayout-pluginin. Jos se ei ole ladattuna, löydät sen Tools->Plugins->Available Plugins->GeoLayout->valitse ja asenna.

Mene siis Layout-paneeliin ja valitse Geo Layout. Tässäkin oma silmä on paras asiantuntija mutta kokeillaan seuraavilla arvoilla:

Scale 20 000
Varmista, että Latitude ja Longitude osoittavat oikeisiin kenttiin (ts. latitude ja longitude pudotusvalikossa).
Projection Mercator
Levitä vielä lopuksi graafia Noverlap-layoutia käyttämällä. Tämä estää solmujen asettumisen toistensa päälle.

Seuraavaksi voisi olla mielenkiintoista vaihtaa solmun nimiön konfiguraatioksi paikkakunta, jolloin saadaan näkyviin, millä paikkakunnilla solmut sijaitsevat. Jos veisimme graafimme karttaohjelmaan, saisimme paikkakuntien nimet itse kartasta. Tällaisten karttojen tekeminen onnistuu esimerkiksi kuvankäsittelyohjelmilla, kuten Inkscape, sekä Google Mapsilla ja Google Earthilla. Kaikissa on hieman erilaiset toiminnallisuudet. Graafimme näyttää nyt suunnilleen tältä:

Graafikuva verkostosta, joka on aseteltu karttapisteiden mukaan

Nyt voit värittää graafisi vielä uudelleen. Esimerkiksi värittämällä Modularity-luokan mukaan huomaisimme, että ”yhteisöjä” syntyy maantieteellisesti lähekkäin olevista paikoista.