最近有很多同学问我说,我已经拿到新品标了,但是过几天就没有了,其实这里面还有更多深层的原因的,今天,我就把这个淘宝是如何识别相似图片的原理给大家讲一下,如果您看明白了,自己就可以得出拿到新品标的方法,或者说是如何通过对图片的处理,避免掉被合并同款。【淘宝自然搜索模型解析】
以上两个点:
1、拿到新品标
2、避免被合并同款
这两个点,如果在新品上架后能够做到的话,将对你的宝贝权重的提升有非常大的帮助。
在讲淘宝是如何识别相似图片的原理前,我们先来看下图片搜索的功能,不知道大家是否已经知道这个功能了,目前有个网站叫淘淘搜这个网站
我把要搜索的图片上传好,然后选择搜索上衣,
马上这个搜索就帮我把相同的宝贝找到了
对于淘宝,现在你去搜索,也都会看到搜索结果中,会有“找同款”和“找相似”的功能,如图:
那么他们实现的原理是什么呢??
首先大家要明白,搜索引擎有个算法叫做“信息指纹算法”,这个算法的作用就是对每张图片生成一个"信息指纹"(fingerprint)字符串,然后比较不同图片的指纹,结果越接近,就说明图片越相似。
图像比较的原理(参考资料)
最简单来讲如何比较两张图像是否相似,就是重叠比较。所谓重叠比较就是将两张图片叠加起来,然后看他们有多少是相似的。重叠在实现上最简单的做法是逐像素进行比较,之后我们就可以知道这两张图到底有多少是不一样的。逐点比较需要计算图像中的每个点,那么就可以通过首先将图像划分成很多小的单元格然后比较两个图像子单元格差别是否大就可以知道图像差异是否大了。但是逐点比较是基于两张图像在位置上必须是对齐的,而其一旦在位置或者形状大小上有差异,逐点比较必然会失败。
以此来看如何实现两张图像的比较我们必须找到图像中有共性的部分,它们共性就是我们所说的特征。特征是一些能反应图像特点的量,如果这些量对上了,我们便可以猜测图像可能是相似的。一些图像当中常用的特征是图像有颜色信息,比如都是红色图像才有可能相似;如果一个红一个绿图像肯定相差十万八千里了。此外图像当中可以利用的特征还有材质纹理信息,特征点信息。比如两张图像都有类似布料图案的信息(如豹纹)那么我们便能够把他们找出来。所谓的特征点信息是图像当中有代表性比较特殊的点,这些点在尺度上和局部分布信息上都有其特别性,如果两张图像有相似的显著特征点,并且相似的局部点数量非常之大,那么便可以推断图像是相类似的。
根据以上参考资料我们可以得出搜索引擎在进行相似图片比较的时候,重点要比较如下信息:
1、图片的颜色信息
2、图片的纹理信息
3、图片形状结构信息
结合淘宝的搜索引擎的话,我们的宝贝要拿到新品标,同时要避免合并同款,有可能比较的信息更多一些,我们一起列举一下:
1、图片的exfi信息
2、图片URL信息
3、图片的颜色信息
4、图片的纹理信息
5、图片形状结构信息
6、宝贝的信息
那么我们知道这些点后我们应该怎么实际操作呢,比如:
1、删除图片的exfi信息(用光影魔术手)
2、重新上传图片生成新的图片URL路径
3、修改图片的背景色
4、对图片的纹理进行修改
5、对于图片的结构,可以采用先抠图,然后对宝贝的进行翻转等操作,或者改变角度等
6、宝贝信息方面根据情况做一定的修改
7、对详情页图片,进行重新切图,以及打乱原有详情页图片排列顺序等
8、改变图片格式,将JPG保存为PNG(文/小小)
【版权声明】行行出状元平台欢迎各方(自)媒体、机构转载、引用我们原创内容,但要严格注明来源:;同时,我们倡导尊重与保护知识产权,如发现本站内容存在版权问题,烦请提供版权疑问、身份证明、版权证明、联系方式等发邮件至service@hhczy.com,我们将及时沟通与处理。