Pagine
27 maggio 2012
Social network: starne lontani potrebbe non bastare
Da quando internet ha trasformato il nostro mondo in una enorme rete con nodi interconnessi in maniera indissolubile, gli studiosi di reti - e sono tanti nel mondo - si sono ritrovati a disposizione un'enorme mole di dati da analizzare e tutta completamente gratis. Un fenomeno noto delle rete è che riescono a descrivere anche chi alla rete non appartiene direttamente, ma è in altri modi collegato ad altri membri attivi della rete stessa. In altre parole, analizzando le zone d'ombra, i buchi della rete, è possibile estrapolare delle conclusioni sui nodi mancanti.
Su PLoSONE, una rivista scientifica open access, è apparso nello scorso mese di aprile un lavoro di analisi eseguito da un gruppo di studiosi dell'università di Heidelberg dal titolo decisamente evocativo: Uno più uno fa tre (almeno nei social network).
L'idea è proprio quella che cercavamo di spiegare nell'introduzione, vedere se è possibile istruire un software in modo da analizzare le relazioni tra i membri di un social network e capire se è possibile capire qualcosa di chi nella rete non c'è. Infatti, non essere iscritto a Facebook o Twitter, non significa essere totalmente estranei a quel mondo: quando un neofita si registra, gli viene suggerito di caricare la propria rubrica di contatti email per trovare amici più velocemente. Facciamo un esempio. Anna non vuole iscriversi a Facebook perché teme che le sue ideologie politiche, o la sua religiosità, le preferenze sessuali o semplicemente la squadra del cuore, possano essere motivo di discriminazione. Bruno e Carlo, i suoi fratelli, invece non sono per nulla preoccupati e dopo essersi iscritti hanno caricato tutta la loro rubrica, tra cui ovviamente anche l'indirizzo email di Anna. Se tra i conoscenti, amici, colleghi di Anna ci sono molti iscritti alla rete sociale, allora il suo indirizzo comparirà più volte tra quelli dei non iscritti e un occhio attento potrebbe fare delle considerazioni.
Analizzando le preferenze dei suoi amici, è possibile ricavare i gusti anche di Anna. Per esempio, se il suo indirizzo è presente nella rubrica di 10 persone che sono iscritte a gruppi di discussione su attività subacquee, 5 sul nuoto e solo 1 appassionato di alpinismo è plausibile immaginare che Anna prediliga il mare alla montagna. Ma non finisce qui. Infatti, Davide, il fidanzato di Anna, è anch'esso anfi-facebook, ma a sua insaputa il suo indirizzo email viene caricato più volte da suoi amici e da quelli in comune con Anna. Il risultato è che le "ombre" di Anna, ovvero le relazioni non presenti su Facebook, possono in qualche modo andare a sovrapporsi a quelle di Davide, rivelandoci un'interazione tra non membri!
Non c'è garanzia di successo, ma si può fare una previsione con una certa probabilità.
L'algoritmo di machine learning
L'esempio di Anna e Davide è facile, perché noi siamo partiti dal risultato finale e siamo risaliti alle ombre mancanti e le abbiamo intersecate. Fare il contrario non è così facile e richiede un occhio estremamente allenato nel vedere i "buchi" e nel fiutare le correlazioni. Analizzare queste reti è decisamente troppo dispendioso per un umano o una squadra, per i computer potrebbe essere un compito fattibile, ma bisogna insegnarli a farlo. Questo è il cuore dello studio tedesco che ha preso i dati di social network reali e costruito un vettore con 15 componenti per ciascuno dei non-membri da analizzare. Le componenti di questo vettore vengono calcolate in base alle relazioni con altri membri e, permettetemi il tecnicismo matematico, se il prodotto scalare tra due vettori di non-membri è sopra una certa soglia, allora tra i due c'è una possibile relazione.
Come prima cosa serve fare un po' di allenamento, non solo per insegnare al computer come lavorare, ma anche stimare i pesi delle varie tipologie di relazioni (amicizie, appartenenza a gruppi, frequenza dei contatti...). L'allenamento è stato effettuato prendendo un sottoinsieme ristretto del campione di utenti reso disponibile da cinque università americane e in questa fase si sono usate le informazioni reali dei non membri. Poi si è passati al lavoro vero e proprio, in cui l'algoritmo è stato applicato all'intero campione e sono state fatte le previsioni che poi si è andati a verificare. Sì perché questo per il momento è solo un esercizio accademico e i non-membri si sono resi disponibili a dare le loro generalità in modo da poter verificare l'accuratezza delle previsioni.
I risultati sono stati abbastanza interessanti con un accuratezza di predizione relativamente alta (il discorso su come questa è valutata è piuttosto complesso da venir riassunto in poche righe), ma l'effetto evidente è che su un non-membro è circondato da una larga maggioranza di membri, allora la sua personalità può più facilmente essere delineata. E tutto questo semplicemente avendo a disposizione l'indirizzo email dei non membri; l'estrapolazione sarebbe infinitamente più accurata se dei non membri si conoscessero altre informazioni, tipo età, educazione eccetera. Immaginate per esempio se Facebook chiedesse ai neo-membri: Invita i tuoi compagni di scuola, sceglili dall'elenco dei tuoi contatti.
Uomo avvisato...
Chiunque può lasciare commenti su questo blog, ammesso che vengano rispettate due regole fondamentali: la buona educazione e il rispetto per gli altri.
Per commentare potete utilizzare diversi modi di autenticazione, da Google a Facebook e Twitter se non volete farvi un account su Disqus che resta sempre la nostra scelta consigliata.
Potete utilizzare tag HTML <b>, <i> e <a> per mettere in grassetto, in corsivo il testo ed inserire link ipertestuali come spiegato in questo tutorial. Per aggiungere un'immagine potete trascinarla dal vostro pc sopra lo spazio commenti.
A questo indirizzo trovate indicazioni su come ricevere notifiche via email sui nuovi commenti pubblicati.
6 commenti:
Chiunque può lasciare commenti su questo blog, ammesso che vengano rispettate due regole fondamentali: la buona educazione e il rispetto per gli altri.
Per commentare potete utilizzare diversi modi di autenticazione, da Google a Facebook e Twitter se non volete farvi un account su Disqus che resta sempre la nostra scelta consigliata.
Potete utilizzare tag HTML <b>, <i> e <a> per mettere in grassetto, in corsivo il testo ed inserire link ipertestuali come spiegato in questo tutorial. Per aggiungere un'immagine potete trascinarla dal vostro pc sopra lo spazio commenti.
A questo indirizzo trovate indicazioni su come ricevere notifiche via email sui nuovi commenti pubblicati.
ed è anche peggio di così! Nel momento in cui clicco sul bottone mi piace, sono consapevole di voler esporre la mia preferenza, quindi in un certo senso sono io che decido cosa far vedere agli altri. Ma pensa ai vari "Suggerisci ad un amico" in cui spedisci all'indirizzo email di qualcuno il link. Se tu ritieni che a lui può interessare, c'è un buon motivo di credere che in effetti gli interessi e così è la sua "privacy" ad essere violata.
RispondiEliminagiusto per tranquillizzarvi, io non so nemmeno come fare a vedere chi ha cliccato mi piace sui nostri bottoni e visto che in genere non abbiamo articoli altamente virali, starei sul sicuro!
Sono consapevole della tua buona fede.
RispondiEliminaNaturalmente non è così per disqus, twitter e co, che vivono di dati.
Praticamente è diventata la nuova frontiera del marketing personalizzato e puntato al singolo individuo
RispondiEliminaE' anche perché a volte le persone dimenticano dove sono.
RispondiEliminaPoche regole essenziali:
- mettere sempre solo quello che si vuole rendere noto, sapendo che puo' finire nelle mani di chiunque e usato in ogni modo,
- non mettere mai informazioni che riguardano altri, soprattutto a loro insaputa (se banalmente non carico l'email di Anna e non si fanno ricerche incrociate con l'anagrafe, per esempio, nessuno puo' inferire dati su di lei).
In ogni caso, come diceva toto , fra carte di credito, telepass, telecamere e soprattutto telefoni cellulari si possono ricavare molte più informazioni, senza neanche il passaggio di iscriversi volontariamente su FB e affini.
non credo che il problema sia tu, nel senso di quella comunità di utenti smaliziati che purtroppo sono solo una piccola percentuale. Mi riferisco a tutti quelli che cliccando alla velocità della luce e senza leggere i messaggi procedono nelle registrazioni... :)
RispondiEliminae là è questione di "educazione", se non addirittura di riflettere prima di fare ;-)
RispondiEliminaPurtroppo spesso... PEBKAC.