¿Sabes utilizar bien Google?
Seguro que piensas que sí, que no es algo tan difícil. Escribes las palabras en el cuadro de búsqueda, pulsas enter y arreglado. Aparecen un montón de resultados.
Y la verdad es que eso está muy bien si lo que quieres es quedarte únicamente en la superficie. Sin embargo, como investigador vas a tener que rascar más para encontrar la información necesaria para tu trabajo.
Por desgracia, si no sabes usar Google correctamente acabarás llegando a algún punto muerto y bloqueándote.
Después de muchas horas de investigación a mi espalda trabajando codo con codo con Google, he aprendido a usarlo de una forma más profesional. Puedo filtrar mejor los resultados para encontrar información más específica y así ir más rápido. Y hoy… te voy a explicar exactamente cómo hacer lo mismo a través de las búsquedas avanzadas en Google.
¿Estás preparado? Pues empezamos.
👉 Cómo hacer una búsqueda avanzada en Google
Que Google se haya convertido en el buscador más utilizado del planeta no es casualidad. Tanto su algoritmo como sus arañas (si no te suenan estos términos échale un ojo a este post) logran procesar continuamente toda la información de la Red, lo que le permite encontrar prácticamente cualquier cosa.
Ahora bien.
Si lo que quieres es saber cómo cocinar un bizcocho de chocolate, es fácil. Pon en el buscador «receta de bizcocho con chocolate» y tendrás cientos de webs con recetas. Perfecto.
Pero si lo que necesitas es profundizar en un tema en concreto para avanzar en tu investigación, esta búsqueda básica se te va a quedar corta. Es ahí cuando te conviene sacarle el máximo partido a Google.
Y para eso, solo tienes que aplicar los trucos y consejos avanzados que te expongo a continuación.
✅ 1. Cómo buscar en Google (modo básico)
Empecemos por el principio. Por obvio que te pueda parecer a priori, no está de más conocer a fondo al rey de los buscadores.
Aquí tienes las formas más sencillas y habituales de buscar en Google:
- Búsqueda básica: si los bizcochos no son lo tuyo prueba a buscar «hotel barato en Santiago«. Obtendrás multitud de resultados con información relevante. O «vuelos a Argentina en agosto«, lo mismo. Los resultados se centrarán en aportarte la información más útil.
- Búsquedas por voz: para buscar información sin necesidad de teclear (puede que sepas pronunciar el nombre de alguien o una ciudad, pero no cómo se escribe exactamente), tan solo tienes que seleccionar el símbolo con el micrófono de Google
y decir tu búsqueda.
- Sé más preciso: cuando escribas las palabras de tu búsqueda en el cuadro de Google, intenta utilizar palabras que tengan más posibilidades de aparecer en la Red. Por ejemplo, en lugar de «necesito aprender sobre OSINT» utiliza «OSINT para principiantes«. Es más probable que esto último aparezca en más webs especializadas.
- Dale una patada al diccionario: no es que quiera incitarte a escribir mal, pero es que a Google le da igual si escribes las palabras correctamente con sus acentos o con sus mayúsculas. El buscador encontrará resultados igual, tanto si pones «Rolling Stones» como si pones «rolling stones«.
- Búsquedas rápidas: puedes obtener información de manera rápida en determinadas búsquedas porque el buscador te va a responder sin necesidad de que entres en ninguna página. Por ejemplo, si pones «tiempo Valencia«, Google automáticamente te dirá el tiempo que hace en esa ciudad. Si pones «100 rupias a euros«, también te mostrará un convertidor con cuánto sale el cambio. Si necesitas una definición, puedes poner «definición OSINT « (que por cierto, si todavía no tienes muy claro qué es, puedes leer en este post el significado de OSINT).
Esta es la forma básica de utilizar Google. A partir de aquí la cosa se complica, así que si te estás iniciando en el tema, tal vez te convenga leer este post sobre cómo buscar en Google antes de seguir.
Y si estás cómodo y te sientes con ganas, prepárate que seguimos con más consejos de búsqueda avanzada.
✅ 2. Cómo buscar imágenes en Google
De la misma manera que puedes buscar sitios webs con información relevante a través de Google, también puedes buscar imágenes.
Esto puede resultarte muy útil si estás buscando a una persona en concreto y necesitas conocer mejor su aspecto, o para ver fotografías de una ciudad a la que vas a viajar.
Para hacerlo tan solo tienes que clicar en la pestaña de Imágenes de Google y hacer tu búsqueda. Y lo mejor es que cada imagen que aparezca como resultado estará enlazada a una web con la que puedes obtener más información todavía.
✅ 3. Cómo buscar por imágenes
Aquí, la búsqueda es a la inversa. Es decir, puedes utilizar una imagen para obtener resultados e información derivados de esta.
Por ejemplo: si utilizas una imagen de «La Rendición de Breda» de Velázquez, obtienes información sobre este pintor e imágenes derivadas, posiblemente otros cuadros suyos.
Para realizar este proceso, solo tienes que seguir estos sencillos pasos:
- Ve a Google Imágenes.
- Haz clic en Buscar por imagen
.
- Haz clic en Subir una imagen
Seleccionar archivo o Examinar.
- Selecciona una imagen del ordenador.
Fíjate.
Ahora, haz clic en «Abrir» o «Seleccionar». 👇👇👇
Si necesitas ampliar más la información sobre este proceso, puedes hacerlo aquí.
✅ 4. Búsqueda avanzada de sitios web
Para hacer una búsqueda más precisa y exhaustiva, Google te ofrece un formulario en el que te pide más detalles. Es muy intuitivo y fácil de usar.
Basta con rellenar los campos en blanco (con una descripción al lado y un ejemplo para ayudarte) y realizar la búsqueda. 👇👇👇
Para utilizar este formulario solo tienes que clicar aquí ➡️ Búsqueda avanzada.
✅ 5. Filtrar los resultados de búsqueda
Al realizar una búsqueda en Google puedes filtrar y personalizar los resultados.
Esto puede serte muy útil para afinar más el tiro y encontrar información más adecuada. Por ejemplo, puedes buscar información que haya sido publicada en los últimos meses o en la última semana, en un idioma concreto, etc.
Para hacerlo, es suficiente con seguir estos pasos:
- Abre Google en tu navegador y debajo del cuadro de búsqueda, haz clic en el tipo de resultado que quieras ver (como «Imágenes» o «Noticias»).
- Para ver más opciones, haz clic en «Más».
- Si quieres ver más filtros (resultados de las últimas horas, días o semanas, por idioma, etc.), haz clic en «Herramientas».
- El sistema determinará qué herramientas mostrarte según la búsqueda que hayas realizado y los filtros que hayas aplicado, por lo que no siempre verás todas las opciones.
Si quieres ampliar la información sobre cómo filtrar los resultados de búsqueda, visita este tutorial de Google.
👉 Búsqueda avanzada en Google: todo lo que necesitas saber del buscador más potente
Conocer los entresijos de Google es todo un arte, a veces desesperante, pero siempre útil para investigadores como tú o como yo.
Por eso, voy a explicarte cómo funciona este buscador (de forma sencilla) para que puedas mejorar tu proceso de búsqueda y tus resultados sean mucho más certeros.
Es verdad que te toca invertir unos minutos en leer este post, pero a cambio te prometo que ahorrarás tiempo y esfuerzo en tus búsquedas.
Vamos allá.
✅ 1. ¿Qué contenido indexa Google?
Antes que nada, debes saber que la indexación es el proceso que hacen los bots de Google para añadir una web a su índice de resultados, y posicionarla en función de su contenido.
No voy a meterme en el jardín del SEO y el posicionamiento, estamos aquí para aprender a investigar. Sin embargo, es importante que comprendas que para que tú encuentres una web en concreto, debe estar indexada antes por Google. Si no lo está es que la web no existe o que no permite que los bots de Google la rastreen.
Pero Google no solo indexa páginas webs. En los resultados de la búsqueda que hagas te va a mostrar principalmente urls a archivos web, es decir:
- .html.
- .php.
- .asp.
Aún así, Google es capaz de indexar todo tipo de archivos a su índice.
Es importante que tengas esto en cuenta para hacer búsquedas específicas de determinados archivos. Como, por ejemplo:
- Un archivo en .doc.
- Un archivo en .pdf.
Con el operador filetype (un operador es un código que facilita las búsquedas avanzadas en Google, pero si quieres saber más en este post te explico todo lo que necesitas saber sobre los operadores), puedes hacer que solo se muestren resultados de un tipo de archivo concreto en la Búsqueda de Google.
Por ejemplo, si introduces “filetype:doc Madrid”, solo verás archivos DOC que contengan el término «Madrid».
Estos son los tipos de archivo que Google es capaz de indexar en su índice:
- Adobe Flash (.swf).
- Formato de documento portátil de Adobe (.pdf).
- PostScript de Adobe (.ps).
- Formato web de diseño de Autodesk (.dwf).
- Google Earth (.kml, .kmz).
- Formato de intercambio GPS (.gpx).
- Hancom Hanword (.hwp).
- HTML (.htm, .html y otras extensiones de archivos).
- Microsoft Excel (.xls, .xlsx).
- Microsoft PowerPoint (.ppt, .pptx).
- Microsoft Word (.doc, .docx).
- Presentaciones de OpenOffice (.odp).
- Hojas de cálculo de OpenOffice (.ods).
- Texto de OpenOffice (.odt).
- Formato de texto enriquecido (.rtf).
- Gráficos vectoriales escalables (.svg).
- TeX/LaTeX (.tex).
- Formato de texto (.txt, .text y otras extensiones de archivos), incluido el código fuente de los lenguajes de programación habituales:
- Código fuente básico (.bas).
- Código fuente C/C++ (.c, .cc, .cpp, .cxx, .h, .hpp).
- Código fuente C# (.cs).
- Código fuente Java (.java).
- Código fuente Perl (.pl).
- Código fuente Python (.py).
- Lenguaje de marcas inalámbrico (.wml, .wap).
- Lenguaje de marca extensible XML (.xml).
Puede que todo esto de la indexación y el tipo de archivo te abrume un poco; tranquilo, es normal, sobre todo si es la primera vez que lees sobre ello. No te agobies. Guarda este artículo en favoritos y cuando necesites algo más específico lo revisas, ahora con que te quedes con la idea principal es suficiente.
✅ 2. ¿Qué contenido no puede indexar Google?
Aunque Google hace todo lo posible porque la mayoría de información de la Red aparezca en su índice, hay cosas que se le escapan (eso sí, cada vez son menos cosas).
¿A qué me refiero?
A que Google no es capaz de indexar el contenido de servicios que estén protegidos por contraseñas o que sean privados. Por ejemplo:
- Emails.
- Servicios de almacenamiento como Dropbox, OneDrive, etc.
- Perfiles en redes sociales que tengan restringido el acceso.
Y menos mal.
Así nuestra privacidad en el mundo online es un poco más segura. Aunque tampoco es para confiarnos, pues con servicios como Gmail, Drive, Google+ o Android… Google cada vez tiene mayor acceso a nuestros datos personales.
Consejo: si quieres saber si una contraseña o un email aparecen en alguna base de datos comprometida, aquí te explico cómo puedes hacerlo con HAVEIBEENPWNED.
✅ 3. ¿Cómo impedir que Google indexe un contenido?
Como te decía un poco más arriba, es posible que el propietario de un sitio web no quiera que Google indexe su web o blog. Quizá te preguntes: «¿pero por qué iba alguien a no querer aparecer en Google?».
Pueden existir varios motivos por los que un propietario de un sitio web no quiera que su contenido aparezca en el índice de Google. Algunos casos son:
- Ocultar datos personales o sensibles.
- Esconder contenido irrelevante.
- Ocultar secciones sensibles del sitio.
- Técnicas de optimización SEO On page.
No todo lo que Google muestra de una web es el total del contenido existente de esta. Puede haber más contenido oculto en Google, pero accesible si navegamos por dicho sitio web.
¿Cómo se le da la orden a Google de que no indexe un contenido? Existen dos formas de hacerlo:
- Mediante el archivo robots.txt.
- Mediante las metaetiqueta “robots”.
No voy a profundizar en cómo implementarlo, porque si no este post se haría muy largo. Sin embargo, sí quiero explicarte brevemente cómo funciona el archivo robots.txt para que puedas saber si el propietario de una web ha decidido ocultar urls de su sitio online.
Para ello, lo primero que tienes que hacer es añadir el nombre de este archivo a la url del dominio que te interese (por ejemplo: https://nombrededominio.com/robots.txt). Prueba con cualquier dominio y me cuentas en los comentarios cómo ha ido.
Accediendo al archivo robots.txt e interpretándolo, puedes encontrar contenido que Google no muestra, pero que sí existe. Solo tienes que abrir el archivo y fijarte en las siguientes órdenes:
- User-agent:* si aparece esta orden, se está haciendo referencia a todos los buscadores. Es decir, que las órdenes del archivo robot.txt se aplican a todos los buscadores, además de Google.
- Disallow: /wp-admin/ si aparece este comando, sabrás que se ha dado la orden de que los buscadores no indexen todo el contenido que hay dentro del directorio /wp-admin/.
- Allow: /index.html en este caso sucede al contrario, pues se está dando la orden de que los buscadores indexen un contenido específico.
Puede que parezca un poco enrevesado, pero una vez lo hagas un par de veces verás que es muy sencillo, y te puede ser muy útil para encontrar información relevante que en una primera búsqueda no ha aparecido en Google.
Con todo, si tienes alguna duda siempre puedes preguntarme lo que quieras en los comentarios. Será un placer ayudarte.
✅ 4. ¿Qué es la caché de Google y cómo puedes utilizarla en tu favor?
La caché de Google es muy importante para investigadores como nosotros.
Se trata del número de veces que Google rastrea una web en un periodo de tiempo concreto, para guardar una copia de seguridad de esta página en sus servidores. Es decir, que Google guarda una versión en su caché de todas las urls que indexa.
Esto te permite tener acceso a una copia de dicha url con unos días de antigüedad. Es realmente útil, ya que si accediendo a la url original no encuentras lo que estás buscando, tal vez en una versión más antigua el contenido deseado sí aparezca.
Puedes acceder a la caché de Google de dos formas distintas:
- Mediante la pestaña que aparece al lado derecho del resultado de búsqueda.
- Mediante un operador, escribe “cache:” delante de la dirección del sitio web.
Y cuando veas el resultado de la caché de Google , ahí aparecerá la fecha en la que el buscador indexó dicho contenido. 👇👇👇
Con este truco de búsqueda avanzada podrás encontrar información en versiones antiguas de una web. Tal vez así logres obtener contenido relevante que ha desaparecido de la versión más actual.
✅ 5. ¿Cómo utilizar el posicionamiento y la penalización en Google para obtener información?
¿Te has parado a pensar cuál es el criterio que usa Google para mostrarte un resultado y no otro?
Google utiliza un algoritmo de calificación del contenido que muestra resultados basados en la relevancia. Es decir, que intenta que el contenido sea lo más relevante posible en relación a lo que estás buscando.
En ocasiones, webs importantes para tu búsqueda no van a salir en las primeras posiciones. Esto puede deberse a varios motivos:
- Porque sea una web nueva y Google aún no haya decidido que merece aparecer en los primeros resultados. Vamos, porque le falta autoridad.
- También puede ser porque dicha web haya sufrido una penalización de Google por no cumplir con sus directrices y la haya mandado al fondo de los resultados.
Está muy extendida la creencia de que las webs que aparecen a partir de la tercera página de Google es como si no existieran, porque nadie pasa de esa página.
Pero ahí es donde brilla nuestro ingenio como investigadores. Tú y yo no podemos quedarnos únicamente en la tercera página de resultados porque lo que buscamos tal vez se encuentre en páginas posteriores. Sería absurdo perder la oportunidad de ampliar nuestros datos por no pasar de la tercera, ¿verdad?
Solo con escarbar un poco más profundo, te aseguro que encontrarás muchos más datos de los que imaginas.
✅ 6. Acotar búsquedas en Google
Si quieres obtener unos resultados más precisos en tus búsquedas, puedes incluir símbolos o palabras que te permitan acotar la información.
Google admite algunos operadores booleanos (sin meternos demasiado en la terminología, estos operadores son códigos que facilitan y orientan la búsqueda hacia un tipo de resultados concreto) para hacer búsquedas acotadas sobre el tema que te interesa.
Importante: en la sección de este blog Herramientas OSINT tienes un bloque llamado Google Hacking donde hay ejemplos directos, y puedes servirte de ellos.
De momento, voy a darte una lista con las técnicas más habituales de búsqueda para que puedas ponerlas en práctica ya mismo. A la hora de escribirlas ten en cuenta que Google ignora los signos de puntuación si no forman parte de un operador de búsqueda, así como los espacios.
Dicho esto, aquí tienes los operadores más habituales:
- Buscar por red social: escribe @ delante de la red social en la que quieras buscar. Por ejemplo, @facebook.
- Buscar por precio: escribe € delante de una cifra. Por ejemplo, coches €3000.
- Buscar por hashtag: escribe # delante de una palabra. Por ejemplo, #hashtag.
- Excluir palabras de la búsqueda: escribe – delante de la palabra que quieras excluir de la búsqueda. Por ejemplo, gato grande -rueda.
- Buscar una concordancia exacta: escribe la palabra o la frase que quieras entre comillas. Por ejemplo, «blog sobre OSINT».
- Buscar mediante comodines o términos desconocidos: escribe * en la palabra o en la frase donde quieras ver qué términos te localiza Google. Por ejemplo, «el * más caro de Madrid».
- Limitar la búsqueda a un intervalo de números: escribe .. entre dos números. Por ejemplo, coche €5000..€10000.
- Combinar búsquedas: escribe «OR» entre las consultas de búsqueda. Por ejemplo, dirección OR domicilio.
- Buscar en un sitio concreto: escribe «site:» delante del sitio o del dominio en el que quieras buscar. Por ejemplo, site:ciberpatrulla.com o site:madrid.es.
- Buscar en sitios web similares: escribe «related:» delante de una dirección web que ya conozcas. Por ejemplo, related:ciberpatrulla.com.
- Obtener información sobre un sitio web: escribe «info:» delante de la dirección del sitio web.
Si quieres saber más sobre estos operadores y cómo utilizarlos, aquí te dejo un artículo muy completo donde te explico todas estas cuestiones.
✅ 7. Buscar en modo incógnito
Google tiene acceso a muchísimos datos, por lo que está constantemente guardando información de todo lo que haces en su buscador.
Seguro que te ha pasado alguna vez eso de buscar un producto por la Red (una zapatillas por ejemplo), y después encontrar una y otra vez anuncios personalizados sobre zapatillas.
Si necesitas que los resultados de las búsquedas sean lo más naturales posible, es conveniente que las realices en modo incógnito. Para hacerlo, solo tienes que pulsar en la pestaña de configuración de tu navegador (suele estar a la izquierda del todo) y seleccionar modo incógnito.
Se abrirá esta ventana (en este caso, en Chrome). 👇👇👇
Y ya podrás buscar sin que la base de datos de tu historial influya en los resultados. Eso sí, revisa que no estés conectado a ninguna cuenta de Google mientras navegas.
✅ 8. Alertas de Google
Google dispone de un servicio de alertas llamado Google Alerts.
Este servicio consiste en enviarte un email cada vez que se encuentren resultados nuevos sobre un tema que tú le especifiques. Por ejemplo, puedes usarlo para que te avise cuando aparezca en Google:
- Tu nombre y apellidos.
- Teléfono.
- DNI.
- Los datos de otra persona.
- O cualquier dato que se te ocurra.
Muy útil para saber si hay algo nuevo con lo que ampliar tu investigación.
✅ 9. Google Trends
Otro servicio interesante de Google es Google Trends.
Con este servicio se puede extraer información de la tendencia que tiene determinada búsqueda. Por ejemplo: si quieres saber qué tendencia tiene en Google la búsqueda «Spiderman», puedes acceder y ver si se ha buscado mucho estos días.
Como puedes observar en la gráfica, existe un pico importante de búsquedas en una fecha determinada, que coincide con el estreno de la nueva película del superhéroe.
Si aplicas esta fórmula a ciudades en fechas concretas o a términos que te interesen, puedes llegar a obtener algunas conclusiones sobre determinados hechos o abrir nuevas vías de investigación.
👉 Aprende a buscar en Google de forma avanzada para que no se te escape nada
Como ves, Google es una herramienta muy valiosa a la hora de trabajar con una metodología OSINT (investigación de fuentes abiertas) y así ampliar los recursos de tus investigaciones.
Espero que con esta visión general del Rey de Internet que te he preparado puedas lograr que tus búsquedas sean más fructíferas. Ha sido un artículo largo e intenso, así que si tienes alguna pregunta o sugerencia no dudes en utilizar los comentarios. Seguro que tu opinión aporta valor a este artículo.
Y recuerda que si quieres adentrarte en el mundo de OSINT, ➡️ puedes acceder a mi MASTERCLASS GRATUITA en la que aprenderás a extraer y verificar información de Internet para encontrar más pruebas en tus investigaciones.
Como decía Sherlock Holmes: ya conoces mis métodos, ahora aplícalos. 😉
Referencias:
How to Use Google Advanced Search Tricks
Google Tricks That Will Change the Way You Search
Top 26 Advanced Google Search Tips, Tricks and Techniques
How to Make Use of Google’s Advanced Search Features for Better Search Results
5 comentarios en «Cómo realizar búsquedas avanzadas en Google para encontrar antes datos más específicos»
Muchas gracias por el contenido muy interesante de este post.
Quiero por favor saber donde puedo encontrar estos ordenes:
•User-agent:*.
•Disallow: /wp-admin/
•Allow: /index.html
NB: he entrado al archive de un site web utilizando : Wayback Machine.
Hola Nour, imagino que esas ordenes las has obtenido del archivo robots.txt de un sitio web, verdad?
Esas ordenes estan o no, en el archivo robots.txt, Si como te dice arriba Julian tu accedes, por ejemplo, a https://nombrededominio.com/robots.txt,, ahi te encontradas unas ordenes o comandos. Esos comandos fue lo que explico Julian. Por ejemplo, en teoria, si le dices al bot de google, con tu archivo robots.txt, mediante el comando disallow, que no indexe esa parte de la pagina, pues no la indexa. Como dije en teoria, dado que google y su bot(araña) hacen lo que les sale de las narices. Si deseas bloquearlo lo mejor es con el atributo NOINDEX. Te lo explican mejor en https://moz.com/learn/seo/robotstxt
En resumidas cuentas la orden de User-agent sale siempre dado que es para los buscadores, las otras dos salen o no, y muchas veces se utilizan para indexar o no otras partes de la pagina. Hay mas ordenes o parametros en el archivo robots.txt
Hola Julian
Con lo de indexar el contenido en google, en el apartado de robots.txt. hice la prueba con lo de https://nombrededominio.com/robots.txt, y en nombrededominio lo sustitui por un diario de noticias online. Me encuentro con varias URLs que estan, en teoria deshabilitadas(Disallow). Digo en teoria, dado que al ir a buscar esas paginas te encuentras con la notificacion de «pagina no encontrada», pero si pude acceder a una pagina,aunque estaba deshabilitada.
Hola Rogelio
Lo que hace el operador Disallow es decirle a Google que no añada esa página a su índice. Luego la página puede existir o no, eso es independiente.
No sé si me he explicado bien.