Deep Web - O lado sombrio da internet

em 09/09/2012


Meus caros Atormentados, convido vocês a me acompanharem a um "mergulho", na parte sombria da internet. Vamos descobrir alguns segredos podres dessa nossa companheira. Sejam bem vindo a Deep Web, ou Dark Web.

A internet pode ser considerada um verdadeiro oceano de informações, cultura e entretenimento. E, para navegar neste oceano e ter acesso a tudo o que ele é capaz de oferecer, nos tornamos reféns dos chamados motores de busca (search engines); mais precisamente, do mais famoso deles, o Google.

Porém, ao contrário do que muitos pensam e por razões que fogem ao conhecimento da maior parte dos internautas, o Google, e outros mecanismos de busca populares, não são capazes de lhe mostrar exatamente tudo o que existe na rede mundial de computadores.

Na verdade, mecanismos como o Google, o Bing e o Yahoo são capazes de lhe mostrar apenas o que há na superfície deste oceano, ou seja, uma parte muito pequena do que realmente é a Internet.

Para se ter uma ideia melhor do quão superficial é sua experiência na Web ao utilizar um desses mecanismos de busca, vamos apresentar um dado realmente impressionante: um estudo feito pela Universidade da Califórnia no ano de 2001, estimou que toda a Internet apresentada pelos mecanismos de busca corresponde a bem menos de 1% do tamanho real. A conclusão é que a "internet invisível" é entre 400 e 550 vezes maior do que estes mecanismos nos fazem crer.

A falta de indexação de todo este conteúdo nos motores de busca populares ocorre por inúmeras razões:

Determinação do dono do conteúdo: existem algumas 'metatags' (tipo de instrução HTML) que podem ser usadas no cabeçalho de um site para instruir os mecanismos de busca a não indexar seu conteúdo, tornando-os, desta forma, inacessíveis ao grande público.

Violação de algum termo de indexação: os mecanismos de busca podem deixar de indexar um site se o mesmo infringir algumas de suas regras. Por exemplo, um sitemap1 mal feito.

Dificuldade de acesso ao conteúdo dinâmico: A maior parte das informações da Web estão enterradas muito abaixo das páginas geradas de maneira dinâmica. Motores de busca tradicionais criam seus índices rastreando páginas de "superfície". Para serem descobertas, as páginas devem ser estáticas e ligadas a outras páginas. Motores de busca tradicionais não conseguem "ver" ou recuperar este conteúdo já que, tecnicamente, não existem até que sejam criados dinamicamente conforme o resultado de uma pesquisa específica. Ou seja, indexadores de mecanismo tradicionais não podem sondar abaixo da superfície.

Efeito "publicidade": Com o intuito de "melhorar" a exibição de publicidade, os desenvolvedores dos motores de busca mais populares têm investido pesadamente na personalização dos resultados. Para tanto, são usados diversos artifícios: desde simples cookies de sessão até associação com serviços de e-mail e redes sociais que, literalmente, lêem suas mensagens em busca de palavras que possam ser relacionadas a propaganda personalizada.

A ideia é tentar, a todo custo, identificar seus hábitos de uso para poder exibir a publicidade que melhor se encaixa em seu perfil pessoal.

Para se ter uma ideia de como estão as coisas hoje em dia, duas pessoas distintas que fazem uso assíduo de redes sociais, costumam fazer determinados tipos de pesquisa com frequência, nunca apagam cookies do navegador e, principalmente, permanecem logadas com nome de usuário e senha a estes mecanismos e seus respectivos servidores de e-mail, certamente não receberão o mesmo resultado de pesquisa para um termo qualquer que for digitado. Ou seja, o mecanismo de busca não estará exibindo, como inicialmente você poderia imaginar, todos os resultados para seu termo de busca, mas sim os resultados que ele "entende que sejam os melhores para você"! Isso faz com que boa parte dos resultados para sua pesquisa permaneçam inacessíveis.


Conteúdo "Proibido": Muitos sites são automaticamente ignorados ou 'desindexados' pelos mecanismos por apresentarem conteúdo ofensivo ou potencialmente perigoso. Nesta categoria, encaixam-se redes criminosas de todos os tipos como sites de terroristas, de nazistas, de pedófilos e de incentivo a violência por discriminação. Sites de hackers, crackers e de compartilhamento de malwares de todos os tipos também encontram-se abaixo da superfície da internet visível. Sites com conteúdo hediondo, como muitos sites nazistas, de sociedades satânicas e de diversos tipos de bizarrices como zoofilia, necrofilia e snuff também fazem parte do conteúdo "inacessível".

Na verdade, a Deep Web é um território "perigoso", onde o risco de contaminar-se com um vírus ou ter o computador invadido por hackers e crackers é muito maior. Além disso, boa parte do conteúdo está encriptado, o que requer ferramentas diferentes para acessá-lo. Por isso, navegadores comuns irão restringir automaticamente determinados tipos de conteúdo ou simplesmente não vão carregá-los pois, em sua maioria, estão repletos de miniaplicativos e add-ons que visam "garantir" sua segurança: filtros anti-phishing, anti-popup, níveis de segurança por zona, etc...

Sendo assim, a melhor forma de começar a desbravar este território inóspito é esquecer a forma tradicional de acesso, fugindo de ferramentas populares e se precavendo ao máximo!

Utilizar uma máquina virtual, ao invés dos recursos nativos do seu computador, é uma boa ideia. Assim, se algo acontecer, basta deletar a máquina virtual e nada de importante será perdido. Tudo de ruim que puder vir a ocorrer (infecção por vírus, invasão por rootkit, etc, só irá contaminar a máquina virtual). Outra vantagem de se recorrer às máquinas virtuais é que você não vai ficar paranóico com instalação e configuração de programas antivírus, firewalls, anti-spywares, etc... Afinal de contas, fazendo desta forma, tudo o que é importante vai ficar inacessível e bem longe do alcance dos perigos do mundo Deep.

O que você precisa para "mergulhar"

A navegação anônima é a sua principal ferramenta para desbravar o conteúdo da Deep Web. A primeira razão para navegar desta forma é que fica um pouco mais difícil para hackers e sites com conteúdo nocivo efetuarem um ataque direto contra seu computador. A segunda razão é que, dependendo do que você for visitar, existe a possibilidade de você ser redirecionado para sites com conteúdo criminoso. Portanto, navegar sem a proteção do anonimato, pode colocá-lo na mira de organizações de investigação criminal de todo o mundo.

Existem inúmeras ferramentas que podem ser instaladas em seu computador para a navegação anônima. Porém, uma das melhores é o Tor.

O Tor (https://www.torproject.org/) é, na verdade, uma rede de computadores que visa prover anonimato através de túneis HTTP e roteadores que funcionam a partir de máquinas de usuários comuns conectadas à internet e que rodam uma versão servidor da aplicação.

Para navegar dentro desta rede, é necessário a instalação da versão cliente do programa para que seja criado um proxy que se conecta a ela. Feito isso, navegadores e programas que se conectam à internet (Internet Explorer, Emule, Bittorrent, etc.) devem ser configurados para usar um servidor do tipo "proxy socks 5" com endereço de destino no próprio computador, ou seja, IP 127.0.0.1. Em sua maioria, programas que fazem uso da internet possuem abas de configuração onde é possível fazer este tipo de modificação.

A partir de então, o Tor roteia todo o tráfego da conexão do cliente através dos túneis da rede até o destino desejado. Desta forma, se o usuário visitar um site do tipo http:\\meuip.com.br (que serve para identificar seu IP na internet), vai receber uma resposta diferente do IP real do computador. O IP apresentado será, no caso, o endereço IP do nó Tor por onde o tráfego de rede "saiu" para acessar o conteúdo da "rede convencional".

A rede Tor possui uma topologia bastante caótica e você não tem como saber qual IP será destinado a sua navegação ou a que parte do mundo tal IP pertence.

Além disso, existe um tipo de domínio com extensão ".onion" que é acessível apenas pelos clientes Tor. Aliás, foi a partir dos sites ".onion" que nasceu a expressão "Deep Web". Tentar acessar tais sites por um navegador comum irá resultar em erro.

Links para sites da Deep Web são parecidos com estes:

(The Hidden Wiki - Contém toneladas de informações sobre sites Tor)

(Motor de busca para sites Deep Web)

(Pesquisa em diretório dentro da Internet profunda)

(Tormail, gratuito para envio de mensagens anônimas) 

(Mensagens instantâneas anônimas)

(Core .onion, pesquisa em diretório)

Existem sites na Deep Web (".onion") que abordam os mais variados tipos de assunto: desde treinamento de guerrilha e armamentos até lojas virtuais de drogas e outros itens ilegais. O conteúdo é vasto, chocante e, muitas vezes, indigesto! Por razões "óbvias", exibimos apenas os links acima para que você possa iniciar sua jornada.

Outras fontes interessantes

Deixando um pouco de lado o conteúdo "sombrio", apresentamos algumas fontes interessantes que podem levá-lo além do que o Google é capaz de lhe mostrar. Com estes mecanismos, a "água vai até a cintura".

1. DeepPeep: Serviço idealizado para gerar resultados não captados por motores de busca comuns. Ainda em fase beta, portanto, pode apresentar problemas.

2. MetaCrawler: Exibe, em sua tela de resultados, uma pesquisa conjunta em vários mecanismos de busca tradicionais. A vantagem é que você não fica limitado aos resultados de pesquisa personalizados que mencionamos anteriormente, além, é claro, de receber muito mais informação por termo digitado.

3. Oth.net: Motor de busca especializado em procurar por arquivos em servidores FTP do mundo todo. Tem, literalmente, de tudo.

4. Duck Duck Go: Para quem leva teoria da conspiração a sério e torce o nariz para utilizar serviços de empresas como Google, Yahoo e Microsoft, o Duck Duck Go é uma boa alternativa para ser usado como mecanismo de busca principal.

5. InfoMine: Motor de busca desenvolvido por um grupo de bibliotecas Norte Americanas, dentre elas a da Universidade da California e da Universidade de Detroit. Lá você encontra muita informação interessante, como periódicos eletrônicos, livros, boletins, listas de discussão, catálogos de bibliotecas on-line, artigos, diretórios de cientistas e pesquisadores, etc.

6. The Virtual Library: É considerado um dos mais antigos catálogos da Web. Foi desenvolvido por alunos de Tim Berners-Lee, o próprio criador da Web. A caixa de pesquisa funciona como um motor de busca tradicional. Divirta-se!

7. Complete Planet: Um dos melhores buscadores não-populares. Nele, você encontra uma variedade realmente grande de assuntos que vão desde comidas e bebidas até assuntos militares.

8. Infoplease: Um buscador para enciclopédias, almanaques, atlas e biografias em geral


Quando amanhecer, você já será um de nós...


3 comentários:

  1. "O lado sombrio da internet" nossa saudosa comunidade !!! saudosa nem tanto porque ela ainda existe , é o orkut que não existe mais

    ResponderExcluir
  2. Junto com a matéria das bonecas humanas, essa matéria foi a que mais me causou calafrios. A internet é algo tão oculto quanto as sombras em que Lovecraft escondia seus monstros. Parabéns pelo blog!

    ResponderExcluir
  3. Vou dar uma passadinha rapida na deep web vamo ver oq encontro la ahahah ;$ ass:sinistra anonimarsss

    ResponderExcluir

Topo