¿Alguna vez has necesitado saber quién es el propietario de una página web?
Ya sea porque no han añadido ningún método de contacto en la web, o porque quieren ocultar su identidad, en ocasiones nos encontramos con la dificultad de saber a quién pertenece un sito web.
En esta guía te voy a contar que pasos seguir para identificar al titular de una web.
Revisión manual de la web
Lo primero es hacer una revisión manual de la web.
Puede que la consulta al Whois esté oculta pero tengan visibles datos personales, tanto en la sección «Aviso Legal», «Política de Cookies», «Condiciones del Servicio» o en alguna sección de contacto o de venta de algún producto.
Consulta a bases de datos con Whois
El segundo lugar donde se suele buscar la propiedad de una web o dominio es haciendo una consulta a la base de datos donde se registran mediante una consulta Whois.
Para hacer este tipo de consulta podemos utilizar alguna de las webs online que existen para ello. Como por ejemplo https://whois.icann.org.
Tenemos que tener en cuenta la extensión del dominio. Por ejemplo si es un .es debemos hacer la consulta en una base de datos específica Nic.es.
En ocasiones los dominios tienen cambios en la base de datos, por cambios de titular u otro motivo. Si queremos ver el historial de estos cambios podemos usar servicios como los de Domainbigdata, Whoisology o Whoxy. Otro servicio, que parece ser muy bueno, aunque de pago es Domaintools.
(Actualización: 12/06/2018) Con la llegada del nuevo RGPD las cosas han cambiado, y las consultas Whois a las bases de datos de titulares de dominios ya no muestran mucha información sobre datos personales, por lo que las cosas se complican para identificar a los titulares de las páginas web. Aun así te dejo algunos servicios para ver los históricos, y alguno de pago, que creo que será como terminaremos obteniendo esta información, pagando.
Código de estadísticas
Los que tenemos web conocemos Google Analitycs. Es el sistema de estadísticas de Google que solemos usar el 90% de los webmasters.
Para poder usar este sistema, hay que añadir un código en la web (puedes ver un ejemplo aquí). Este código es visible en el código fuente.
El código que es diferente para cada web es uno similar a este: UA-0000000-6.
Si buscamos ese código con buscadores específicos, podemos llegar a encontrar webs que son del mismo propietario.
Algunos de estos buscadores son:
Buscar en metadatos con Foca
FOCA (Fingerprinting Organizations with Collected Archives) es una herramienta que se utiliza para encontrar metadatos e información oculta en los documentos. FOCA se encarga de descargar y analizar estos documentos de una web.
Los documentos que puede analizar son de Microsoft Office, Open Office, o ficheros PDF, así como ficheros de Adobe InDesign, o svg.
Para ello utiliza Google, Bing y DuckDuckGo. Existe la posibilidad de añadir ficheros locales para extraer la información EXIF de imágenes.
Antes de descargar el fichero realiza un análisis completo de la información descubierta a través de la URL.
Caché de buscadores genéricos
Los buscadores, aunque no indexan el contenido de las webs, solo añaden la dirección a su indice, si guardan la última versión visita por el buscador en su caché.
Podemos utilizar esta versión cacheada para comprobar si existe información antigua, que en la versión no cacheada ha sido eliminada.
Te dejo una guía para acceder a la versión cacheada de una web en Google
Y un artículo de cómo funciona Google.
Archivo web
Si necesitamos comprobar una versión mas antigua de la web en cuestión, existen algunos servicios en Internet que almacenan un histórico de todas las webs de Internet.
Esto es útil si queremos recuperar contenido eliminado, o si queremos comprobar si en versiones anteriores tenía alguna información de contacto visible.
Algunos de estos servicios son:
Buscar enlaces en otras webs
Utilizando a nuestro maravilloso Google, podemos averiguar desde que páginas web enlazan la web que estamos investigando.
¿Para qué sirve esto?
Consultando estas webs podemos comprobar si son del mismo propietario, o si hacen referencia a algún tipo de información que nos pueda ser de utilidad.
Este es el operador booleano que tenemos que usar en Google para hacer esta búsqueda: link:dominio.com (Ejemplo)
Actualización (06/06/2018): el operador link:, según mis pruebas, no funciona, o al menos no del todo. Para buscar enlaces en otras webs puedes usar esta herramienta online https://moz.com/link-explorer.
Contenido oculto
Es muy posible que parte de la web no sea visible a los usuarios que navegan por ella.
A veces el administrador de la web no hace visible todo el contenido, pero este si es indexado por los buscadores, y en otras ocasiones, el administrador oculta el contenido a los usuarios y además bloquea que los buscadores indexen dicho contenido porque no quiere que este sea público o por una razón de optimización para buscadores (SEO).
Si quieres saber más de cómo funciona Google, puedes leer mi artículo OSINT con Google.
En el primero de los casos podemos hacer una búsqueda en Google con el siguiente operador (Búsqueda), el resultado nos mostrará todas las páginas de ese sitio web que Google tiene indexadas.
En el segundo lugar tendríamos que comprobar el archivo robots.txt, para ello tendríamos que escribir en la barra de direcciones nombrededominio.com/robots.txt, y buscar que directorios se encuentran bloqueados para que no los indexen los buscadores.
La instrucción que tenemos que buscar es la siguiente:
Disallow: /directorio-oculto/
Ahora podemos comprobar uno a uno los directorios o páginas que se encuentran bloqueadas y que puedan contener información de interés.
Espero que esta guía te ayude, tanto a tu investigación, como a proteger tu privacidad
Si tienes alguna duda, utiliza los comentarios para planteármela. Ya sabes que me encanta compartir información valiosa contigo.
Y recuerda que aquí en Ciberpatrulla puedes encontrar mucha más información útil, como por ejemplo:
- Artículos sobre herramientas para la ciberseguridad y la investigación online.
- MASTERCLASS GRATUITA en la que aprenderás a extraer y verificar información de Internet.
Como decía Sherlock Holmes: ya conoces mis métodos, ahora aplícalos. 😉