Abgeleitete Sprache Unsere Berichte zu abgeleiteten Sprachen untersuchen den Titel und die Meta-Beschreibung einer Website. Wenn diese Textzeichenfolge länger als 30 Zeichen ist, versuchen wir, daraus die Sprache abzuleiten.Wenn sie länger als 10 Zeichen ist und Unicode-Zeichenblöcke aus Hangul, Katakana usw. enthält, charakterisieren wir diese ebenfalls.Das Ableiten einer Sprache unterscheidet sich von unserer technologiebasierten Sprachverfolgung, die nach technischen Attributen im Code sucht. Stattdessen untersucht diese den tatsächlichen Textinhalt der Site, da wir festgestellt haben, dass Sprachcodes manchmal fehlen und manchmal falsch eingestellt sind.Unsere abgeleitete Sprachverfolgung leidet auch unter Inkonsistenzen. Eine Sprache könnte beispielsweise als Serbisch identifiziert werden, obwohl es sich eigentlich um Russisch handelt. Dies ist jedoch eine bestmögliche Schätzung basierend auf dem Site-Inhalt und kann zur Identifizierung von Sites in bestimmten Regionen verwendet werden.