淘宝是如何识别相似图片的?
发布时间:2015-03-18 09:52:05
今天,我就把这个淘宝是如何识别相似图片的原理给大家讲一下,如果您看明白了,自己就可以得出拿到新品标的方法,或者说是如何通过对图片的处理,避免掉被合并同款。
以上两个点:
1丶拿到新品标
2丶避免被合并同款
这两个点,如果在新品上架后能够做到的话,将对你的宝贝权重的提升有非常大的帮助。
在讲淘宝是如何识别相似图片的原理前,我们先来看下 图片搜索的功能,不知道大家是否已经知道这个功能了,目前有个网站叫 淘淘搜 这个网站
我把要搜索的图片上传好,然后选择搜索上衣,
马上这个搜索就帮我把相同的宝贝找到了
对于淘宝,现在你去搜索,也都会看到搜索结果中,会有“找同款”和“找相似”的功能,如图:
那么他们实现的原理是什么呢??
首先大家要明白,搜索引擎有个算法叫做“信息指纹算法”,这个算法的作用就是对每张图片生成一个"信息指纹"(fingerprint)字符串,然后比较不同图片的指纹,结果越接近,就说明图片越相似。
图像比较的原理 (参考资料)
最简单来讲如何比较两张图像是否相似,就是重叠比较。所谓重叠比较就是将两张图片叠加起来,然后看他们有多少是相似的。重叠在实现上最简单的做法是逐像素 进行比较,之后我们就可以知道这两张图到底有多少是不一样的。逐点比较需要计算图像中的每个点,那么就可以通过首先将图像划分成很多小的单元格然后比较两 个图像子单元格差别是否大就可以知道图像差异是否大了。但是逐点比较是基于两张图像在位置上必须是对齐的,而其一旦在位置或者形状大小上有差异,逐点比较 必然会失败。
以此来看如何实现两张图像的比较我们必须找到图像中有共性的部分,它们共性就是我们所说的特征。特征是一些能反应图像特点的量,如果这些量对上了,我们便 可以猜测图像可能是相似的。一些图像当中常用的特征是图像有颜色信息,比如都是红色图像才有可能相似;如果一个红一个绿图像肯定相差十万八千里了。此外图 像当中可以利用的特征还有材质纹理信息,特征点信息。比如两张图像都有类似布料图案的信息(如豹纹)那么我们便能够把他们找出来。所谓的特征点信息是图像 当中有代表性比较特殊的点,这些点在尺度上和局部分布信息上都有其特别性,如果两张图像有相似的显着特征点,并且相似的局部点数量非常之大,那么便可以推 断图像是相类似的。
根据以上参考资料我们可以得出搜索引擎在进行相似图片比较的时候,重点要比较如下信息:
1丶图片的颜色信息
2丶图片的纹理信息
3丶图片形状结构信息
结合淘宝的搜索引擎的话,我们的宝贝要拿到新品标,同时要避免合并同款,有可能比较的信息更多一些,我们一起列举一下:
1丶图片的exfi信息
2丶图片URL信息
3丶图片的颜色信息
4丶图片的纹理信息
5丶图片形状结构信息
6丶宝贝的信息
那么我们知道这些点后我们应该怎么实际操作呢,比如:
1丶删除图片的exfi信息 (用光影魔术手)
2丶重新上传图片生成新的图片URL路径
3丶修改图片的背景色
4丶对图片的纹理进行修改
5丶对于图片的结构,可以采用先抠图,然后对宝贝的进行翻转等操作,或者改变角度等
6丶宝贝信息方面根据情况做一定的修改
7丶对详情页图片,进行重新切图,以及打乱原有详情页图片排列顺序等
8丶改变图片格式,将JPG保存为PNG
本文出自:http://www.shxuanming.net 转载请注明
宣名网络——让天下没有难做的电商!