LDA y SEO (II): un poco de mi gozo en un pozo

Actualización al post anterior sobre LDA y SEO: el responsable de la herramienta en SEOmoz admite un error importante en sus cálculos y reconoce abiertamente que ahora mismo lo único que prueba LDA es que Google utiliza clusters y que la optimización de contenido es relevante, pero retira su afirmación de que Google concede tanta importancia a la optimización de contenidos como a la keyword en el nombre de dominio o a la diversidad de dominios desde los que te enlazan.

Una pena, pero es lo que hay. Esto pincha bastante mis expectativas: todo el mundo puede equivocarse, pero resumiendo lo que ha pasado, SEOmoz dijo que la optimización de contenidos se estaba infravalorando porque para Google era muy importante y ahora la vuelve a poner en donde estaba, muy por debajo de los enlaces. En fin, a mí me sigue divirtiendo mucho más planear una buena estrategia de contenido y optimizar contenido para conseguir visitas y que estas conviertan que buscar enlaces. Aunque de todo hago, claro, que para eso me pagan.

LDA y SEO: la optimización de contenidos nunca ha dejado de ser importante

Aunque todo el mundo está hablando de Google Instant estos últimos días, a mí me ha llamado mucho más la atención la nueva herramienta de SEOmoz, LDA (Latent Dirichlet Allocation). Esta herramienta, aún en fase muy inicial, permite conocer el grado de correlación entre un texto (o una página web) y una frase de búsqueda. ¿En qué se diferencia esto de la infame keyword density o de la práctica de moda que consiste en utilizar los términos que ofrece Google como búsquedas relacionadas en la rueda de búsquedas para incluirlos en la página que queremos optimizar? Y la segunda pregunta: ¿qué lleva a SEOmoz a decir que muy probablemente la incidencia del contenido de un sitio en la forma en que este sitio posiciona se está infravalorando, y mucho?

Pues la diferencia es que esta herramienta se basa en topic modelling, es decir, clusters de palabras, que permiten identificar de qué tema trata un documento. Al introducir un texto o una URL en esta herramienta y comprobar su grado de correlación con una query, nos dará un porcentaje, y ese porcentaje no se basa en el número de veces en que la frase de búsqueda está repetida en el texto o página web, ni tampoco en la cantidad de sinónimos de la query que se incluyen, sino en la inclusión de otros términos que permiten definir con la menor duda posible que ese es el tema de la página, y no otro.

O sea, insisto, no basta con incluir búsquedas relacionadas de la rueda de búsquedas, hablamos de escribir con la intención de dejarle claro al buscador que esa página que está indexando es relevante para un concepto sin asomo de duda. En SEOmoz ponen un ejemplo de Star Trek, pero yo voy a poner uno del Barça. Si Google encuentra una página que incluye las palabras “fútbol”, “liga”, “deportes” y “Barcelona” puede que esa página hable del FC Barcelona, pero también podría hablar del Espanyol, ¿verdad? Pero si esa página incluye también las palabras “Messi”, “Rosell” o “Laporta”, Google lo va a tener más claro.

Y dicho esto, ¿por qué en SEOmoz dicen que creen que se está infravalorando el poder de los contenidos en los sitios web a la hora de posicionar? Bueno, como es sabido por diversas pruebas y tests de cierta fiabilidad, parece demostrado que, por ejemplo, tener la palabra clave en el nombre de dominio y tener enlaces desde una gran diversidad de dominios son elementos mucho más importantes para posicionar que cualquier elemento de optimización on-page, incluido el title, la URL, los encabezados, etc. Bien, pues tras analizar más de 10.000 resultados de búsqueda en SEOmoz han encontrado una altísima correlación entre un alto porcentaje de LDA y unos altos rankings para la palabra clave en cuestión. Y esa correlación les parece casi tan importante como las dos mencionadas anteriormente, la de la keyword en el nombre de dominio y la diversidad de dominios en los enlaces. Atentos, porque eso querría decir que un alto LDA (una optimización del contenido de una página) puede ser más importante que un Title.

¿Qué conclusiones podemos sacar de esto? Ojo, aquí quiero precisar que desde SEOmoz insisten en que su tesis no está demostrada y que hay que cogerla con pinzas. Hay correlación entre su LDA y los rankings de Google, pero correlación no significa causalidad: mejorar el LDA de tu página no te hará mejorar en rankings de forma segura; entre otras cosas, porque lo que parece demostrado es que Google utiliza clusters de palabras y corpus, pero con toda probabilidad tendrán diferencias con los utilizados por SEOmoz. Aun así, profesionalmente no puedo alegrarme más: sé que los enlaces son importantes, pero en los últimos años se ha hablado tanto de ellos que en muchas ocasiones el cliente solo quiere enlaces, y se olvida de mejorar su texto, lo que no ayuda a hacerles comprender la importancia de la estrategia de contenido. Y por otra parte, es un nuevo campo de experimentación: haz búsquedas de los sectores en los que tienes clientes, y comprueba el LDA de los que están en las primeras posiciones con el de tu cliente. Obviamente estamos hablando de SEO, no olvides tener en cuenta otros factores como los enlaces, pero si compruebas que hay mucha similitud en factores como backlinks y title y ves mucha diferencia en el porcentaje de LDA, creo que será muy buena idea entrar a mirar con lupa los textos de la competencia.

En fin, aunque me he enrollado bastante para lo que es habitual, creo que el tema lo merece. En cualquier caso podéis ver el Whiteboard Friday de SEOmoz dedicado al LDA y SEO.