基于机器学习的报告 Netflix、亚马逊和许多其他公司都使用“推荐引擎”。您可能已经看到过,当您在亚马逊上购买东西时,它通常会向您推荐其他产品。如果您看过 Netflix,它还会推荐电视节目和电影。我们将相同的流程应用于整个互联网的高级技术使用情况。这让我们能够根据具有类似网站(按高级技术使用情况)的网站正在做什么来预测网站可能会考虑使用哪些技术。工作原理对于每个花费大量技术的网站,我们都会找到匹配的技术我们使用交叉量来确定该网站对其推荐的权重。因此,如果一个网站匹配很多技术,那么该网站未使用的任何高级技术都会比匹配较少高级技术时更受推荐在此示例中,Overstock 对 Arup 提出了建议,反之亦然。建议的权重不是那么强,因为它们匹配的技术交叉相当低(大多数高级技术不共享)。为什么我们不使用像矩阵分解这样的真正的 AI 模型来做到这一点? 我们尝试过,但数据集结果非常差,而且 AI 模型使用了我们无法控制或真正了解它们作用的“神奇数字”。一个很好的例子是MatrixFactorizationTrainer 代码在这里,有一个参考“为了获得更好的结果,请使用以下内容”,然后是两个变量,但没有解释为什么它们会产生更好的结果。 我们使用的算法有一个非常清晰的方法,我们了解它是如何实现的以及它为什么有效。它真的有效吗?是的,我们认为是这样 - 例如,Magento Enterprise 的“未来客户”通常已经使用“Magento”作为一种技术。我们没有告诉系统这两种技术是相关的,或者 Magento Enterprise 客户会从 Magento 开始。推荐 API 端点是的,您可以通过提供 JSON 和 XML 响应的 API 端点访问数据 - https://api.builtwith.com/recommendations-api。创建自己的模型您需要使用 BuiltWith Datasets 获取基础数据以构建自己的模型。