他们会仔细分析每一张图片

评估相关性取决于对图像内容的理解。他们使用“传统”信号:

  • Alt 标签
  • 标题标签
  • 文件名
  • 传奇
  • 图片周围的文字内容

但事实证明,相关性最强的信号是通过机器学习分析来了解图像真正显示的内容。

机器学习的进步

正如 Fabrice Canel 在本系列第 2 集中指出的那样,微软(和谷歌)在深度学习应用方面取得的进步是指数级的,他们的算法正在以惊人的速度改进。

据 Merchant 介绍,特别是对于图像行业来说,过去三年代表着真正的腾飞。 Bing 理解图像周围内容以了解上下文的能力有所提高,但其分析图像本身并理解其内容的能力也得到了提高。

为了建立一个机器学习系统来分析和理解图像的内容,他们从一组易于识别的事物开始,并获得了大量可靠的数据(正确标记的图像)。名人面孔、名胜、动物、花朵……汤姆汉克斯、埃菲尔铁塔、德国牧羊犬、玫瑰肯定都是三年前为学习而设计的这套教材的一部分。

 

 

他们逐渐将这一技术扩展到标记不太清楚的图像集

并加入对图像中特定元素的识别……以至于它 韩国电报数据 们现在可以非常微妙。

让我们回到 Meenaz Merchant 使用的例子:机器现在可以理解地平线的图像是一座城市。但还可以进一步问:具体是哪个城市? (这里:旧金山)。甚至更进一步:图像是从某个角度拍摄的(例如,从恶魔岛拍摄的旧金山天际线)。

 

 

这个结果显示了该分析的可靠性。虽然不是 100%……但比 3 年前好多了!

作为用户,我们使用这些功能,并开始认为它们是理所当然的、是“正常的”,然而,作为营销人员,我们往往会试图作弊,忘记这些机器变得多么智能。

现在,让我们更进一步阐述这一点:准确分析图 基本并主要关注 像内容的能力呈指数级增长。这意味着他们逐渐减少对传统信号的依赖。例如,alt标签不再像以前那样具有指示作用,甚至如果机器确信已经正确识别了图像所显示的内容,那么图像周围的文本内容也会变得相对多余。

我一直认为用他们的算法处理图像需要花费财务成本

因此出于财务原因,他们无法分析收集到的每张图像。

伪造的 !

商人说他们绝对会分析每一张图片并识别其所表达的内容。这意味着他们在文件名、alt 标签、标题、说明甚至图像周围的内容中看到的线索只能 短信列表 证实或澄清机器所理解的内容。

所以在这些方面作弊已经没有任何意义了。 Bing 会发现作弊行为并将其忽略。但还有更糟糕的事情:信任。以 alt 标签为例,Merchant 表示该算法将快速识别哪些网站是值得信赖的,并将历史信任参数应用于这些网站图像的排名。

 

 

滚动至顶部