Предполагаемый язык Наши предполагаемые отчеты о языке рассматривают заголовок и метаописание веб-сайта. Если эта строка текста длиннее 30 символов, мы попытаемся вывести язык из нее.Если она длиннее 10 символов и содержит блоки символов Unicode из хангыля, катаканы и т. д., мы также охарактеризуем их.Вывод языка отличается от нашего технологического отслеживания языка, которое ищет технические атрибуты в коде. Вместо этого он рассматривает фактическое текстовое содержимое сайта, поскольку мы обнаружили, что языковые коды иногда отсутствуют, а иногда установлены неправильно.Наше предполагаемое отслеживание языка также страдает от несоответствий, язык может быть идентифицирован как сербский, когда на самом деле это русский, например, но это лучшее предположение на основе содержимого сайта и может использоваться для помощи в идентификации сайтов в определенных регионах.