Hablar de transmisión de información en lo que a internet respecta es un tema, cuanto menos, complejo. Vamos a tomar por caso un usuario que entra a una página de internet, que busca algo, y la página misma, que ofrece una respuesta. A su vez, esa misma página debe “comunicarse” con los motores de búsqueda para posicionar orgánicamente en su indexación. Siguiendo con el ejemplo, es bueno saber que, mientras más información le otorgue el sitio al motor de búsqueda, mejor se entenderán entre ellos. Y es allí cuando aparecen los datos estructurados.
En sí, el SEO, más allá de cumplir la función de determinar el posicionamiento orgánico en buscadores, llega para presentarse como una suerte de mediador. Esto es así porque, más allá de los protocolos existentes en el mundo de la informática, existen otro tipo de comunicaciones que deben establecerse entre las partes que se encuentran para transmitir información.
De esta manera podemos también comenzar a hablar del lenguaje. Sea cual sea el idioma en cuestión, existen reglas que son comunes y generales. Sujeto y predicado, estructura sintáctica y semántica, etcétera. A los efectos, diremos que cada lenguaje de programación tiene su propia filosofía, y también sus propias reglas (nuevamente, sintácticas y semánticas). Es necesario aclarar antes de que comiences a leer este artículo que el HTML no es un lenguaje de programación. No obstante, sigue siendo un lenguaje: Hypertext Markup Language, en inglés, significa Lenguaje de Marcado de Hipertexto.
SEO, Google y comunicaciones
Anteriormente dijimos que, a los efectos de cumplir con la optimización para motores de búsqueda, el SEO, a fin de cuentas, puede entenderse como una suerte de mediador entre un sitio web y el motor que lo presente en sus páginas de resultados. Para poder hacerlo, debe “verificar” que el sitio cumpla con ciertas reglas preestablecidas. Y aquí entra en juego un punto interesante: si bien estamos hablando de quizás el algoritmo más grande del mundo, Google interpreta según sus reglas, pero no entiende más allá de lo que se le cuenta.
La frase puede sonar un tanto engañosa, vamos a explicar por qué. Al momento de indexar un sitio web, con todo el trabajo de SEO realizado, Google interpretará todo lo que se le ha presentado y, en función a ello, determinará en su SERP la posición que le corresponda al sitio en cuestión. Ahora bien, si además de cumplir con las especificaciones técnicas que hacen al SEO tradicional, al HTML de la página se le agregan los datos estructurados (también conocidos como datos enriquecidos, o featured snippets), no sólo que la comunicación sitio web – Google mejorará, sino que, muy probablemente, el sitio será premiado con posiciones más altas y con algunos atributos visuales agregados en su presentación.
¿Qué son los datos estructurados?
Si continuamos hablando de comunicación según las reglas del lenguaje, podremos inmiscuirnos en el mundo de la semántica y definir a los datos estructurados, dentro de la órbita del SEO, como los adjetivos. Asimismo notaremos que, a los efectos del aditamento de este tipo de datos apuntando al posicionamiento orgánico, sintáctica y semántica deberán confluir. Para ello, primero debemos entender a la función sintáctica del HTML simplemente como la forma en que las etiquetas se presentan al navegador (con su apertura y cierre y respetando el orden de los comandos).
De esta manera, los datos estructurados abjetivarán no a las etiquetas, sino al contenido en general de la página web en cuestión. Por eso mismo es que también se los conoce como “datos enriquecidos”. En síntesis, porque su función es enriquecer todo aquello que la web está mostrando, ya sea con videos, rankings, rating, duraciones, videos, pasos a seguir, etcétera. ¿Y de qué manera lo logran? Presentándolos visualmente en los SERPS.
Datos estructurados y el marcado Schema
A los fines de enriquecer el contenido de la página web a indexar en los motores de búsqueda, los datos estructurados se presentan como la opción más conocida y utilizada en el mundo del SEO. Es así que, para poder lograrlo, fue necesaria una estandarización de código, de forma tal que para cada tipo de contenido, existiera un tipo de dato estructurado factible de integrar.
Desde luego, la tarea se tornó verdaderamente imposible puesto que los objetivos de los sitios web creados eran muchísimos. Y, además, se requirió establecer ciertas directrices por parte de Google para llevar a cabo este trabajo. Visto que los objetivos a los que apuntaban los sitios web eran innumerables, no solo que no alcanzó con ello, sino que los usuarios comenzaron a “hacer abuso” de los datos estructurados.
Decimos hacer abuso entre comillas puesto que, tomando por ejemplo un sitio web que se dedicaba a publicar recetas de cocina, integraba los tipos de datos estructurados aplicables a tal fin, pero los combinaba con los tipos de datos de restaurante, o de video, o de blog, etcétera.
Funcionamiento del marcado Schema
Una vez se hubo solucionado este cabo suelto desde la perspectiva del marcado Schema, las condiciones de utilización de los featured snippets, por decirlo de alguna manera, se relajaron. Desde entonces, entre más información se le agregara al sitio (recordemos, desde la perspectiva Schema), más fácil sería el trabajo para los motores de búsqueda, y mejor sería el posicionamiento de los sitios web en cuestión.
La utilización de este tipo de datos se volvió tan importante para Google, que desde el año 2017 se la comenzó a considerar como uno de los factores esenciales de posicionamiento orgánico, al punto tal de incurrir en penalizaciones por parte del motor de búsqueda hacia los sitios que no los utilizaran.
Simplemente fue cuestión de tomar en cuenta dos instrucciones técnicas: el ingreso del formato y las condiciones de acceso. Respectivamente, las indicaciones fueron las siguientes:
- Ingreso de formato de datos estructurados: el marcado de páginas, desde entonces, debería realizarse a través de los formatos JSON-LD, de microdatos, o RDFa.
- Condiciones de acceso: se debían eliminar los métodos de control de acceso tales como robots.txt, la etiqueta noindex o cualquier otro mecanismo.
Datos estructurados y directrices de calidad
Aunque parezca imposible de creer, a Google le resulta bastante complicado entender (vía automatización) cuándo un sitio web cumple a rajatabla con las directrices establecidas. Tal vez de allí se desprenda la decisión de penalizar fuertemente en el posicionamiento a los sitios que las incumplan. De hecho, la penalización puede ir un poco más allá, de tal forma que posiblemente los datos estructurados agregados no se muestren nunca o que, por ejemplo, se los califique como spam.
En rigor, las directrices de calidad responden a siete factores:
- Contenido
- Relevancia
- Exhaustividad
- Ubicación
- Especificidad
- Imágenes
- Varios elementos por página
Directrices de datos estructurados: contenido
Google siempre priorizará los sitios con contenido original, de calidad y relevante. Es por ello que esta es la primera de las siete directrices a tomar en cuenta por el motor de búsqueda. A los efectos de que la relevancia del posicionamiento desde la perspectiva de los datos estructurados sea superior, el contenido debe cumplir con las características recién mencionadas, y también con algunas atenientes a la cuestión técnica.
Uno de estos puntos tiene que ver con el contenido que los usuarios pueden ver. Pongamos un caso práctico: si en el marcado JSON-LD se integra al autor, el HTML debe permitir que su nombre se muestre en alguna ubicación.
Tampoco debe marcarse con datos estructurados contenido que sea engañoso, que pueda provocar daños a terceros, que no se relacione con el contenido principal de la página, o que participe de actividades ilegales según la legislación del país del sitio web en cuestión.
Directrices de datos estructurados: relevancia
Este punto es sumamente claro y específico. Simplemente hay que tener cuidado con que los datos estructurados marcados en el sitio sean la representación fiel, sino exacta, del contenido de la página en cuestión.
Por ejemplo: si tu sitio web es de recetas de cocina pero declaras datos estructurados relacionados con diseño de calzado, incurrirás en penalización.
Directrices de datos estructurados: exhaustividad
Cuantas más propiedades referidas a los tipos de datos elegidos sumes, siempre será mejor. Inclusive, tu sitio puede llegar a ser penalizado si las propiedades obligatorias del tipo de dato seleccionado no están incluídas.
Directrices de datos estructurados: ubicación
Este punto es particularmente interesante. Debes tener en cuenta que cada página del sitio tiene una función específica. Debido a ello, los datos integrados deben enriquecer solo a la página de la que se ocupen (salvo, lógicamente, que la documentación indique lo contrario).
Del mismo modo, debes tener cuidado con las páginas duplicadas. Los datos estructurados deben estar en todas, no solamente en la que incluya la etiqueta canonical
Directrices de datos estructurados: especificidad
De acuerdo a la información añadida en el marcado Schema (para interiorizarte puedes revisar su sitio web), debes tener en cuenta que el tipo de marcado debe ser lo más específico posible. Esto incluye tanto a los nombres de las propiedades como a los tipos de datos.
Directrices de datos estructurados: imágenes
En este caso hay que tener en cuenta dos cuestiones. Por un lado, que la imagen seleccionada para enriquecer el contenido mostrado en el motor de búsqueda, sí o sí debe estar íntimamente ligada con el contenido de la página (recuerda las directrices de relevancia).
Del mismo modo, debes tener en cuenta que la URL de la imagen debe poder ser rastreada e indexada por Google. Caso contrario, el motor de búsqueda no la encontrará y, desde luego, tampoco la mostrará.
Directrices de datos estructurados: varios elementos por página
Este punto, a decir verdad, no solo refiere a que haya más de un elemento el cual pueda ser enriquecido, sino a que haya varios elementos de diferentes tipos. Es así que, como recordarás, lo ideal siempre va a ser añadir la mayor cantidad de datos posibles, siempre respetando la especificidad de cada uno.
En ese sentido, Google encuentra dos vías alternativas para reconocer elementos de distintos tipos: ya sea como elementos anidados o como elementos independientes.
De esta manera, es posible que en el SERP encontremos una página en posición cero con datos estructurados que refieran tanto a BreacrumbList (indicandole al usuario cómo se llegó hasta esa página), a la imagen de una receta de cocina, con la lista de ingredientes que la componen, y con el autor de la misma.
Enriquecer las páginas web que compongan un sitio es una de las maneras más eficaces para establecer una estrategia de posicionamiento orgánico en buscadores. Para ello, desde luego, es imprescindible conocer tanto de programación web como, justamente, de SEO. La tarea puede parecer ardua, pero ¡no te preocupes! En Growth Hackers Club estamos dispuestos a ayudarte a conseguirlo. Contáctanos ahora, vamos a darte una asesoría complementamente gratuita.