Lenguaje inferido
Nuestros informes de idioma inferido analizan el título y la metadescripción de un sitio web. Si esa cadena de texto tiene más de 30 caracteres, intentaremos inferir el idioma a partir de ella.
Si tiene más de 10 caracteres y contiene bloques de caracteres Unicode de Hangul, Katakana, etc., también los caracterizaremos.
Inferir un idioma es diferente de nuestro seguimiento de idioma basado en tecnología que busca atributos técnicos en el código. En cambio, esto analiza el contenido de texto real del sitio, ya que hemos descubierto que a veces faltan códigos de idioma y, a veces, están configurados incorrectamente.
Nuestro seguimiento de idioma inferido también sufre inconsistencias: un idioma puede identificarse como serbio cuando en realidad es ruso, por ejemplo, pero es una suposición basada en el contenido del sitio y se puede utilizar para ayudar a identificar sitios en regiones específicas.