Informatica per script kiddies 3 – Il deep web, il dark web e quelle robe lì

Di nuovo il terzo mercoledì! Trovate qui tutti gli articoli della rubrica.

Ultimamente, complice il periodo particolarmente esposto al complottismo, si sta parlando spesso di dark web, e davvero non mi aspettavo che questo articolo, già programmato, cadesse così a proposito.

Volevo parlare infatti di questa cosa, tanto apparentemente oscura e misteriosa quanto in realtà assai semplice.

Il web

Intanto circoscriviamo un po’ il web, giusto per avere una definizione comune da cui partire. Questa parte sarà noiosissima per chi kiddie non lo è più (e forse può saltarla a piè pari).

Il web non è Internet, ma un servizio che gira su Internet: si tratta di una rete di risorse rese disponibili su internet attraverso pagine che contengono link ad altre pagine, i cosiddetti siti web. Tutto il resto delle cose che girano su Internet, dai videogiochi alla posta alle chat non-web, non sono web, pur girando su Internet.

I motori di ricerca

Il web, già dai primi tempi, è una roba disordinatissima. Si crea un sito e lo si piazza lì, coi suoi link ad altri siti, ma se nessuno sa il suo indirizzo è un casino trovarlo.

Questa cosa si è inizialmente risolta con due strumenti presto rivelatisi insufficienti: i portali e le directory. I primi erano siti più noti di altri (vuoi perché famosi, vuoi perché il provider te li forzava come home page), dai quali si potevano raggiungere altri siti selezionati. Le seconde erano delle pagine categorizzate per argomenti e sottoargomenti, contenenti link ai siti che se ne occupavano. Era uno strano mondo, ma non era così male, del resto Internet era piccino.

Qualcuno, a un certo punto, ha cominciato a realizzare dei software che, a partire da una pagina (per esempio un portale o una directory) navigavano in automatico tutto quello che trovavano, e classificavano le pagine per parole chiave: nascevano gli spider. I database di parole chiave e pagine così generati potevano essere esplorati con un nuovo strumento, i motori di ricerca.

Le profondità

Gli spider navigano i link che trovano. Se nessun altro sito linka una certa pagina web, quella pagina sarà nascosta agli spider. Lo stesso succede se due o più pagine si linkano tra loro, senza che ci sia alcun link da siti noti allo spider.

In questo modo si creano delle isole nel web irraggiungibili da motori di ricerca. Queste isole vengono chiamate deep web.

Del deep web fanno parte anche tutte le cose irraggiungibili dagli spider per motivi meno tecnici. I contenuti multimediali non indicizzabili perché lo spider non sa vederli/ascoltarli (per ora……), le cose protette da login come i vostri file su cloud o il vostro profilo social privato, le cose generate “al volo” in base a input degli utenti, le cose deliberatamente rimosse dai motori di ricerca da parte di chi le crea (è possibile chiedere allo spider di non entrare) e le cose bandite dai motori di ricerca stessi.

Insomma, il deep web non è niente di particolarmente misterioso, e ci passiamo un sacco di tempo dentro, ad esempio quando navighiamo nei social.

Del deep web, poi, fa parte anche il dark web, e qui le cose si fanno più interessanti.

Le oscurità

Il dark web è un oggetto del tutto analogo al web, ma tenuto in qualche maniera rigidamente separato dal web vero e proprio, da cui non è possibile linkarlo direttamente se il visitatore non possiede strumenti specifici per navigarlo.

In genere, i sistemi per creare dark web funzionano attraverso sottoreti di Internet rese private e irraggiungibili da sistemi VPN o proxy (a rigore, pure i portali intranet aziendali sono a tutti gli effetti dei dark web), o girano su reti che non sono Internet. Tali sottoreti o reti sono comunemente definite darknet.

Il motivo principale per cui i dark web esistono è fornire un livello di riservatezza diverso da quello che Internet permette al web.

Questo significa, sì, che ci si possono fare cose criminali con meno possibilità di essere individuati (come persone, intendo). Non è però l’unico uso (anzi), e soprattutto le condotte PESANTEMENTE criminali (non il sitarello torrent, insomma) vengono indagate dalle forze dell’ordine esattamente come nel resto del web, e non è poco comune che si arrivi a degli arresti.

I più noti e grandi siti criminali su darknet, infatti, appartengono al passato. L’Operation Onymous, un’operazione euroamericana di Polizia, chiuse molti siti tra cui Silk Road, famosissimo mercato di merci illegali (purché non servissero a danneggiare terzi: sì droga, no armi), l’Operation Darknet dell’FBI chiuse un intero sistema di hosting su darket che ospitava, tra le altre cose, siti con materiale pedopornografico, e le operazioni Pacifier e Torpedo fecero lo stesso con siti dello stesso tipo.

Insomma, le darknet sono sicure, ma nulla impedisce a forze di Polizia molto ben motivate di mostrarsi più furbe di chi le sfrutta per cose particolarmente dannose.

Tor

Il sistema darknet sicuramente più famoso è Tor. Un po’ perché è facilissimo da usare e fa sentire tutti un po’ hacker, un po’ perché – soprattutto per la facilità d’uso – le cose importanti sono tutte lì, e un po’ perché ha un logo davvero carino, dai.

Tor, il cui nome è la sigla di The Onion Router, “il router a cipolla”, è un sistema basato sui proxy, nato per rendere più privata possibile, con strumenti semplici, la navigazione.

Ogni utente Tor deve creare (con un software apposito, distribuito anche assieme a un browser che lo usa direttamente) un “nodo”, che viene aggiunto alla darknet.

Quando un utente vuole raggiungere una risorsa, anche sul web vero e proprio (che so, Reddit), invece di mandare la richiesta al sito di destinazione la manda al proprio nodo Tor.

Il nodo contatta un po’ di altri nodi, e scambia con loro una chiave di cifratura. Poi cifra la richiesta con la chiave di un nodo, e ci scrive sopra il suo indirizzo. Poi, ancora, cifra la richiesta con la chiave di un altro nodo, e ci scrive sopra l’indirizzo, e via così fino all’ultimo nodo, a cui invia il pacchetto.

Il nodo che riceve, toglierà il suo strato di cifratura, leggerà l’indirizzo del nodo successivo, e glie lo invierà. Il nodo successivo farà lo stesso, fino ad arrivare al pacchetto nudo, che sarà inoltrato a destinazione.

In questo modo, nessun nodo verrà a sapere contemporaneamente origine e destinazione del pacchetto, e nessun nodo (tranne l’ultimo, se la connessione non è https).

Il sistema, di base, nasce con lo scopo di navigare il normalissimo web complicando molto, se non rendendo praticamente impossibile (a meno, ad esempio, di fingerprinting del browser), il tracciamento.

Un nodo, però, può anche ospitare esso stesso un server web (vengono detti hidden services), che ha tipicamente come indirizzo la sua firma crittografica seguita dal dominio di primo livello .onion. In questo modo, la connessione è incapsulata in uno strato di cifratura fino alla destinazione finale, di cui peraltro è ignota la posizione su Internet, proteggendo tanto il visitatore quanto chi ospita il servizio.

In questo modo, sulla darknet Tor, si crea un vero e proprio dark web, separato dal web vero e proprio e deep, perché non indicizzato dai normali motori di ricerca. Come è piuttosto facile accedere come client alla rete Tor, è assai facile per chiunque sappia tirare su un webserver collegarlo alla rete Tor.

Tor ha alcuni problemi, tra cui la lentezza dovuta all’eventuale lentezza di connessione dei nodi della rete, e ha avuto alcune vulnerabilità (che vengono scoperte anche da progetti supportati dal progetto Tor stesso, e spesso risolte), ma resta molto utilizzato e sufficientemente sicuro. Esistono alternative basate su approcci simili.

Qualche nota sul resto

Esistono darknet basate su approcci molto diversi, di cui parlo velocemente perché purtroppo me ne intendo relativamente poco, se qualcuno vuole approfondire nei commenti è benvenuto. Diverse di queste non riguardano neanche soltanto il web, ma sono dei sistemi molto più generali e che si applicano a diversi altri servizi di Internet.

Freenet, ad esempio, è una rete peer-to-peer che utilizza un suo protocollo di trasmissione per distribuire le informazioni contenute nella rete stessa su tutti i nodi che ne fanno parte. In sostanza è una Internet parallela costruita utilizzando la normale Internet come impalcatura per far passare tutt’altro. Le informazioni si raggiungono via HTTP come sul web, ma non è possibile accedere al web tramite Freenet: si vedono solo le informazioni presenti nella rete stessa, che non serve quindi a rendere più anonima la propria normale navigazione. Le informazioni passano da un nodo all’altro senza che alcun nodo sappia il reale destinatario, né il mittente, né l’informazione completa, che potrebbe essere spezzettata in più nodi e con ognuno che ne consegna una parte.

Su un concept analogo si basa I2P, una rete utilizzata soprattutto per lo scambio di file, molto diffusa perché spesso inclusa nei programmi per scaricare torrent.

Conclusioni

Insomma, il deep web non è nulla di speciale e lo utilizziamo molto spesso. Il dark web, invece, suona un po’ più misterioso, e spero di aver tolto un po’ di patina di mistero. Nonostante venga talvolta usato per cose poco legali, è in realtà assai utile, sia per proteggere un minimo le proprie sessioni di navigazione. Inoltre, è ampiamente utilizzato da paesi con libertà ristrette per informarsi e comunicare con il mondo esterno.

Ah, il New York Times ci fa sapere che non sembra sia possibile affittare sicari su deep web.