Kaksimoodisesta yksimoodiseksi

Kaksi- tai monimoodinen verkosto (bi- tai multimode network) tai graafi on sellainen, jossa on useampia erityyppisiä solmuja ja/tai linkkejä. Tässä esimerkissä meillä on ihmisiä ja komiteoita. Harjoitustiedosto on ladattavissa Martin Grandjeanin englanninkielisestä tutoriaalista.

Jos teit ensin Gephin perustoiminnot -tutoriaalin, aloita tätä varten uusi projekti. Voit joko (tallentaa ja) sulkea edellisen tai valita Workspace->New. Tästä ominaisuudesta on hyötyä, jos haluat vertailla kahta verkostoa, sillä Gephi ei osaa avata kahta tiedostoa rinnakkain. Lataa uuteen projektiisi Grandjeanin Dataset 2 Nodes ja Edges. Solmutaulussa on hyvä tarkistaa, että sarakkeen ”Cat” tyyppi on String.

Aloitetaan taas muuttamalla solmun kokoa asteluvun perusteella. Laita kokovaihteluksi 10-50. Kaksimoodisessa verkostossa koon määrääminen asteluvun perusteella ei ole niin merkittävää, koska esimerkiksi tässä tapauksessa komiteoilla on väistämättä enemmän linkkejä kuin yksilöillä. Kokoa muuttamalla saamme kuitenkin käsityksen näiden kahden eri tyypin sijainnista. Toinen vaihtoehto on värittää solmut tyypin (tässä graafissa Cat) mukaan:

Kuvakaappaus Gephin graafista, jossa solmut väritetty tyypin mukaan

Paranna vielä luettavuutta Force Atlas 2 -layoutilla. Muista valita Prevent Overlap ja laita Scaling-arvoksi 50.0.

Laitetaan vielä nimiöt (labels) näkyviin. Vaikka käyttäisimme Label Adjust -layoutia lisäksi, graafi on nyt aika sotkuinen. Yksi tapa siistiä sitä on poistaa nimiöt ihmisiltä ja jättää näkyviin vain komiteat (jos oletetaan, että haluamme tällä hetkellä enemmän tutkia komiteoita).

Kopioidaan koko tämä graafi uuteen työtilaan, jotta voimme palata tähän vielä. Helpoimmin se tapahtuu käyttämällä neliövalintatyökalua. Ympäröi koko graafi – niin kauan kuin pidät hiiren napin pohjassa, valittu alue näkyy sinisenä mutta kun päästät napista, väri palaa valkoiseksi. Solmut on silti valittu. Klikkaa graafin keskellä oikealla napilla->Copy to->New Workspace. Tarkista, että solmuja ja linkkejä on uudessakin työtilassa oikea määrä. Jos uutta työtilaa ei tule näkyviin Overview-tekstin alapuolelle, kokeile käynnistää ohjelma uudelleen.

Kuvakaappaus graafin kopioimisesta uuteen Gephi-työtilaan

Nyt voimme mennä kummassa tahansa työtilassa Data Laboratoryyn. Valitaan (”mustataan”) kaikki solmut, joiden nimiössä on ”name”. Valitaan oikealla napilla Edit ja tyhjennetään kenttä Label. Vastaavasti voisimme tässä esimerkiksi antaa uuden kategorian kaikille: kirjoita cat-kenttään vaikkapa ihminen. Sulje tämä ruutu ja huomaat, että Label-sarake on tyhjentynyt kaikilta, joiden Id/Label sisälsi sanan name. Mihin sitten hävisi se Cat-kenttä? Näkymän oikeassa reunassa on pieni hehkulamppu, sitä klikkaamalla saat näkyviin kaikki tallennetut tiedot solmuista. Kerralla näytettävien sarakkeiden määrä on rajallinen joten joskus täytyy osa piilottaa, jos taustadataa eli ”atribuutteja” on paljon.

Nyt voit palata Overview-näkymään ja laittaa nimiöt näkyviin, tai jos ne olivat jo näkyvissä, graafin pitäisi nyt olla siistimmän näköinen.

Tästä graafista on aika helppo silmämääräisestikin todeta, että Committee 3 on solmuista suurin, eli siinä on eniten jäseniä. Mutta kuinka monta? Painotetun asteluvun laskemista olemme jo kokeilleet. Hieman epäloogisesti yksittäisen solmun asteluku löytyy toiminnolla Average Degree. Tässä graafissa se on 2,582 eli jokaisella solmulla on n. 2,5 linkkiä. Tässä pitää tietysti huomioida, että osa solmuista on yksilöitä ja osa komiteoita. Yksilöillä linkkejä on todennäköisesti vähemmän kuin komitealla. Jos äsken Data Laboratoryssa valitsit kaikki sarakkeet näkyviin, voit sieltä käydä tarkistamassa asteluvut. Committee 3:lla on 24 linkkiä eli jäsentä. Toinen vaihtoehto yksittäisen solmun asteluvun tarkistamiseen on käyttää ”nuoli+kysymysmerkki”-työkalua Overview-välilehdellä ja klikata haluttua solmua.

Koska tämä graafi on suuntaamaton, emme pysty silmämääräisesti helposti selvittämään, kenellä yksilöistä on eniten jäsenyyksiä. Data Laboratoryssa voimme kuitenkin selata Degree-saraketta niin pitkälle, että löydämme kategoriaan ”ihminen” kuuluvan rivin. Jos Degree on järjestetty suurimmasta pienimpään, löydämme nopeasti henkilön name1, jolla on 4 jäsenyyttä. Kun nyt kuitenkin piilotimme ihmisten nimiöt (tai entä jos meillä olisi 1000 ihmistä), niin miten löydämme tämän name1:n?

Ensimmäinen vaihtoehto on edelleen Data Laboratoryssa klikata oikealla napilla tämän name1:n kohdalla ja valita ”Select on Overview”. Kun nyt siirrymme Overview-välilehteen, graafi on zoomattu niin lähelle, että tämä name1 korostuu. Kun zoomaamme vähän taakse päin, näemme, että hän on jäsenenä komiteoissa 1, 2, 3 ja 7.

Toinen hyödyllinen toiminto on tarkastella yksittäisen solmun yhteyksiä. Tässä tutustumme ensimmäistä kertaa filttereihin (Filters). Valitaan Topology->Ego Network. Rahdataan Ego Network alempaan Queries-ikkunaan ja kirjoitetaan halutun solmun ID Node ID-kenttään. Laitetaan kokeeksi vaikka name1. Klikkaa OK, älä vielä muuta Depth-asetusta, valitse Filter.

Saat tulokseksi name1:n suorat yhteydet. Paina nyt Stop ja muuta Depth-asetusta kohtaan 2. Nyt näet kaikkien niiden komiteoiden jäsenet, joissa name1 on jäsenenä.

Kuvakaappaus Gephin "Ego Network" -suodattimesta

Kaksimoodisesta yksimoodiseksi

Monissa tilanteissa haluamme nimenomaan tutkia graafia kaksi- tai useampimoodisena. Joskus olisi kuitenkin kiinnostavaa nähdä myös yksimoodinen verkosto ja juuri suuntaamattomalla graafilla voimme muokata kaksimoodisesta yksimoodisen. Tätä toimintoa varten kannattaa ottaa käyttöön se työtila, jossa myös ihmisillä on nimiötiedot.

Tätä varten tarvitaan MultiMode Networks Projection -plugin. Jos et ladannut sitä Gephin asennuksen yhteydessä, hae se nyt Tools->Plugins-valikosta.

Nyt siis ”heijastamme” komiteat jäseniin: jos kahdella jäsenellä on linkki samaan komiteaan, syntyy uusi linkki näiden jäsenten välille. Samalla komitean solmu katoaa. Valitse Load Attributes ja atribuutti-tyypiksi cat. Lisäksi matriisi kuten kuvassa (Member-Institution/Institution-Member). Valitse Remove Edges ja Remove Nodes (tämä poistaa komiteat ja niiden linkit) ja valitse Run. [Laittamalla matriisin toisin päin syntyisi verkosto, jossa komiteat, joilla on yhteisiä jäseniä, ovat linkittyneenä toisiinsa. Tämäkin voi olla hedelmällinen tarkastelutapa, kun halutaan esimerkiksi tietää, minkälaiset komiteat, tai vaikkapa yritykset, keräävät samoja jäseniä/työntekijöitä.]

Kuvakaappaus Gephin MultiMode Networks Projection -työkalun asetuksista

Lasketaan taas verkoston halkaisija, jotta pääsemme etsimään välittäjiä. Väritä taas Ranking-valikosta Betweenness Centrality-kriteerillä. Tällaisessa harvemmassa verkostossa värillä on vähemmän väliä; myös vaaleammat ja pienemmät solmut erottuvat. Omassa esimerkissäni kuitenkin käänsin (invert) värit, eli vaalea väri tarkoittaa korkeaa välillisyyttä.

Toisin kuin aiemmissa graafeissa, tässä yllättäen sama henkilö, name1, jolla on eniten linkkejä, on myös tärkein välittäjä. Tämä johtuu siitä, että name1 kuuluu useisiin suuriin komiteoihin, eli tuntee paljon ihmisiä, mutta lisäksi komiteat vaikuttavat koostuvat hyvin heterogeenisesta joukosta jäseniä, eli hänellä on yhteyksiä moneen eri suuntaan. Tällainen tieto voi kiinnostaa esimerkiksi, jos halutaan selvittää, kenen kautta tieto kulkee.

Siisti vielä graafin ilmettä Force Atlas 2 -layoutilla. Prevent overlap ja Scaling 20.

Kuvastakin näet, että osa linkeistä on huomattavasti vahvempia kuin toiset. Tämä tarkoittaa, että nämä henkilöt yhdistyvät toisiinsa useamman kuin yhden komitean kautta. Data Laboratoryn Edges-välilehdeltä pääset näkemään linkkipainot.

Tällainen verkosto soveltuu hyvin ”LinkedIn”-analyysiin: Kuka kuuluu verkostooni? Keitä muita ihmisiä voin tavoittaa heidän kauttaan (eli mitkä ovat yhteyksieni yhteydet)?

Valitse vasemmalta pieni ”maalipurkki”. Asetukset voit valita mielesi mukaan, mutta itse laitan yleensä värin intensiteetiksi 100%. Varsinkin suuremmissa verkostoissa se helpottaa valittujen solmujen löytämistä. Voit halutessasi antaa kaikille solmuille ensin harmaan värin, tai valita jonkun riittävän suuren kontrastin suhteessa edellisiin asetuksiin.

Valitse sitten mikä tahansa solmu. Itse valitsin tämän syrjässä olevan ja pienen. Ota ensin kriteeriksi ”neighbors of neighbors” eli tähän solmuun linkittyvien solmujen yhteydet (tässä vihreä) ja klikkaa valitsemaasi solmua. Vaihda sitten väriä ja asetukseksi neighbor, eli solmun suorat yhteydet ja klikkaa taas solmuasi. Lopuksi vaihda vielä väriä ja valitse asetukseksi none ja klikkaa solmuasi.

Kuvakaappaus Gephin "naapuri"-työkalusta

Näemme, että vaikka solmu on syrjässä ja sillä ei ole hirveästi suoria yhteyksiä, sillä on yhden askeleen yhteys lähes kaikkiin verkoston solmuihin harmaita lukuunottamatta.

Kokeile myös ”lentokonetyökalua”. Tämä visualisoi lyhimmän reitin kahden valitun solmun välillä.

Graafin tallentaminen kuvana 

iimeiseksi katsomme, miten voimme tallentaa graafimme kuvana.

Mene Preview-välilehdelle ja klikkaa ensimmäisenä Refresh. Graafi tulee näkyviin. Se on tässä vaiheessa yleensä varsin taiteellisen näköinen ilman nimiöitä ja kaarevine linkkeineen. Vaikka kaarevat linkit tietyllä tavalla ovat viehättäviä, vaihdetaan ensimmäisenä suoriin linkkeihin eli Edges-kohdassa ruksi pois Curved-sanan perästä. Tavallaan tämä on makuasia mutta yleensä akateemisemmissa kuvissa näkee suoria linkkejä.

Muitakin toimintoja voit kokeilla makusi mukaan. Joidenkin mielestä linkkien Opacity-arvoa muuttamalla eri elementtien erottuvuus paranee, voit esimerkiksi kokeilla tähän 70. Nimiöt saat näkyviin Node Labels kohdasta, jossa voit myös kokeilla, mikä fonttikoko on riittävän suuri. Proportional size suhteuttaa tekstin koon solmun kokoon.

Joskus kaikki halutut piirteet eivät säädöistä huolimatta tule esiin (muistathan painaa Refresh joka välissä!). Silloin kannattaa säätää Manage renderers-välilehteä. Järkevä järjestys saattaa vähän vaihdella mutta itse laitan yleensä Default Node Labels ylimmäksi. Eri vaihtoehtoja siirretään sinisistä nuolista.

Lopuksi voit tallentaa kuvan Export SVG/PDF/PNG -painikkeesta. PNG on yleensä huonolaatuisempi kuva mutta jos et tarvitse suurta ja tarkkaa kuvaa, se riittää moniin tarkoituksiin. Jos SVG:nä tallennettu kuva aukeaa ilman solmuja, käy Tools->Plugins -valikosta poistamassa käytöstä Polygon Shaped Nodes, jos se on asennettuna.