Los representantes de Google han observado varias veces en los últimos años que observan más de 200 señales de clasificación para clasificar páginas en respuesta a una consulta. El algoritmo Ranknet de Microsoft se ha observado en al menos un documento técnico de Microsoft para considerar más de 540 señales más o menos al clasificar las páginas.
Esas señales pueden incluir cosas como el uso de términos o frases de la consulta dentro del contenido de la página en sí, la posición en las páginas donde se ubican esos términos, el uso de esos términos en el texto de anclaje en los enlaces que apuntan a la página, el uso de los términos en diferentes contenedores HTML (elemento de título, encabezado, etc.). Además de esos tipos de señales de clasificación en la página, los motores de búsqueda también pueden buscar análisis de enlaces y un puntaje de probabilidad basado en la calidad y cantidad de enlaces que apuntan a una página, así como una relevancia basada en el hipertexto utilizado por aquellos Enlaces.
Pero, incluso después de considerar estas señales de clasificación, los motores de búsqueda también pueden considerar una gama muy amplia de filtros o métodos de clasificación. He enumerado algunos de ellos a continuación, pero encuentro un buen número más en patentes y documentos de los motores de búsqueda.
1. Puede que se haya determinado que la consulta es de navegación, y Google puede haber determinado que la página superior es el destino previsto de la consulta
- Permití que un dominio que compré a través de GoDaddy expire Ahora lo quiero de vuelta. ¿Qué tengo que hacer?
- ¿Por qué no soy importante en la clase de música?
- Tengo 25 años, soy dueño de mi propia casa, tengo autos, incluido un BMW / Range Rover y gano $ 2 millones al año. La gente me molesta. ¿Cómo respondo?
- Estoy solicitando la entrada Express canadiense. Tengo 426 puntos. ¿Cuáles son mis posibilidades?
- Soy nuevo en el anime. El anime japonés consiste en matar niños y también algunas escenas de adultos entre niños. ¿No es ilegal?
2. La página fue impulsada en base a búsquedas previas y otras actividades rastreadas del buscador (personalización).
3. Los resultados pueden haberse reorganizado en función de los vínculos entre los primeros n (10, 100, 1000) resultados (interconectividad local).
4. Resultados ordenados según un país preferido del buscador.
5. Resultados ordenados según el idioma preferido del buscador
6. La búsqueda evidencia implícita o explícitamente una intención geográfica, y la ubicación del buscador puede forzar la inclusión de algunos resultados y alterar el orden de otros.
7. Los datos históricos pueden influir en las clasificaciones, como la antigüedad de los documentos, la antigüedad de los enlaces a esos documentos, la antigüedad de los dominios de donde provienen los vínculos a esos documentos.
8. Resultados reordenados en función de una intención comercial identificada en la consulta (compra xxxxx).
9. Los resultados se reordenaron en función de una intención de navegación identificada en la consulta (cómo xxxxxx).
10. Reorganización basada en la facilidad de uso móvil
11. Reordenación de resultados basados en datos implícitos de comportamiento del usuario, como clics, tiempo de permanencia y otras actividades.
12. Reorganización de resultados para evitar material redundante (la consulta merece diversidad)
13. Las consultas expandidas y adyacentes se agregaron a la consulta original en función de los datos de la sesión de consulta tomados de los archivos de registro de consultas de búsqueda.
14. Resultados reorganizados basados en anotaciones / etiquetas de fuentes externas, como archivos de contexto agregados de los motores de búsqueda personalizados de Google (rango de confianza de Google).
15. Resultados reordenados según la relevancia personalizada del texto de anclaje
16. Resultados reordenados en base a PageRank personalizado
17. Resultados reordenados basados en tendencias / negocios (la consulta merece frescura)
18. Resultados ordenados por una combinación de endosos de la comunidad y peso de enlaces enmendados por la confianza de los enlaces (Dual TrustRank de Yahoo)
19. Reorganización de los resultados en función del tráfico y la actividad web en tiempo real o casi en tiempo real.
20. Observar “instancias” de datos creados a partir de la interacción de usuarios, consultas y datos para volver a analizar los resultados de búsqueda para usuarios con intereses similares.
21. La clasificación de los primeros n (10, 100, 1000) resultados se basa en la cantidad de frases “buenas” o “significativas” que coexisten dentro del conjunto de resultados, con mayor peso dado a las páginas con más de esas frases.
22. El peso del enlace apunta a páginas que difieren según la ubicación de los enlaces en las páginas, la relevancia del texto de anclaje a la página en la que aparece, el tamaño y el color del texto de anclaje y otras características de “Persona que practica surf razonable”.
23. Personalización de resultados basados en consultas relacionadas anteriores
24. Se da más importancia a las palabras dentro de un área de contenido principal de una página (Segmentación de página basada en la visión)
25. PageRank ponderado de manera diferente según el segmento de una página dentro de la cual se ubica un enlace (Clasificación de página de nivel de bloque).