Dado que la mayoría de usuarios accedemos a la información únicamente a través de los buscadores, principalmente a través de Google, se ha llegado a hacer una separación entre la llamada Web visible o superficial y la Web profunda.
Esto se debe a que los buscadores no tienen acceso a todo el contenido de la Red y como los usuarios accedemos a la información a través de ellos, nos quedamos con esos resultados, son los "visibles". A modo de símil, es como decir que si no tienes perfil en Facebook, no existes en Internet. Pues aquí,
si no apareces en Google, no existes en la Red.
En algunos casos, la información no puede ser indexada por los robots de los buscadores; en otros casos, son los autores los que no quieren que aparezcan.
Vamos a ver algunos puntos a favor de los buscadores:
- - no se requiere login
- - son gratuitos
- - url fijas
Estos factores hacen que sean muy cómodos de usar y quizás por eso se ha estandarizado su uso sin explorar otras alternativas o indagar más en la Red (profunda).
En contra:
- - no incluye bases de datos, ni catálogos, ni url dinámicas
- - los buscadores limitan el número máximo de resultados
Por ello no nos muestran todos los resultados y quizás, la página que contiene la información que necesitamos en un momento determinado.
Sherman y Price distinguen cuatro tipos de contenidos invisibles:
- - la web opaca: por diversos motivos no pueden ser indexados por los robots
- - la web privada: se excluyen deliberadamente
- - la web propietaria: es necesario registrarse para acceder al contenido
- - la web realmente invisible: no pueden ser indexadas por limitaciones técnicas de los buscadores.
Afortunadamente, algunos buscadores tradicionales han incorporado funciones que nos permiten acercarnos a la Web invisible, por ejemplo a través de la búsqueda por tipo de archivo de Google.
