大数据:预设特征 系统会自动把假货抓出来

1458190178106197

中国IDC圈3月18日报道:当你上网购物时,与你一起在购物网站上“逛”的,不仅仅是数以亿计的消费者,还有专门的知识产权保护管理团队,每天在网上巡逻举报侵权假冒商品。此外,还有“神秘买家”从天猫、京东商城、1号店、当当网、亚马逊等电商平台买样品,之后由权利人和第三方检测机构对商品真伪和质量进行鉴定和检测。

在线商品有数十亿量级,单靠人工打假犹如大海捞针。有了大数据,打假就好似有了“火眼金睛”。

精细筛查,先筛掉一些售假商家

假货从网店流入消费者手中,大数据能否防住售假网店入驻电商平台?

“依靠智能识别和庞大的商品样本数据库对交易对象进行精细筛查,能够在初期就筛掉一些售假商家。”阿里巴巴资深安全专家王彦说,淘宝针对卖家的实名审核已完全从账户认证过渡到了实人认证。目前有18道审核程序,还在逐步开发人脸和声纹特征数据库。

初步筛查商家之后,依然有店铺还在售卖假货。此时,在大数据日常打假中发挥作用的,是一套“语法语义分析引擎”。买到了假货,许多买家会在商品评论区留言、投诉。这些数据都会汇总在信息排查平台里,成为分析的对象。据阿里巴巴首席治理官郑俊芳介绍,该系统利用机器学习算法取代人工排查,已经完全实现全网数据监控和检索。

针对电子商务领域的大众消费品、安全类产品和网上投诉举报的焦点产品,2014年10月质检总局牵头搭建了电子商务产品质量监管服务平台,探索开展网上产品质量风险监测研究和试点。平台数据采集主要来自互联网上的电子商务产品质量舆情数据、国内各电商平台产生的质量数据、质监监管部门积累的内部数据以及消费者提供的有关电子商务产品质量的投诉举报数据等。截至目前,该平台已采集淘宝、天猫、京东、1号店等国内主流电商平台上的店铺信息298万条,产品信息4400万条。

预设特征,系统会自动把假货抓出来

进入购物网站搜索一款补充维生素的营养品,其产品参数一目了然。这对我们而言不过就是一串数字,但电商平台已经接入了国家监管部门对应的各类专业数据库,一旦发现药品与药品监管的基础数据信息有出入,系统会自动把它抓出来。

2015年12月,国家认监委开通“云桥”认证认可信息公共服务共享平台,向社会开放产品及企业认证信息、检验检测信息等服务。通过比对后,无3C认证的商品将被清理。该机制试运行近一个月,阿里巴巴已处理下架生活电器、手机等商品近3万件。

“有商品图片上印着‘奢华手包’‘瑞士名表’等,其标价却远远低于市场价。这些商家把正品官网的图进行了修改,但我们已经可以通过实时扫描图片中的局部商标,识别商品的品牌,判断该商品是不是假货。”郑俊芳介绍,阿里巴巴从2013年开始,逐步建立了图片侵权假货识别系统。发现疑似假货图片,可在30分钟内检索出淘宝上所有与此相似的图片,进而下架所有引用该类图片的商品。几年来,阿里巴巴收集了类似的图片100万张左右,每周发现疑似假货的数量在10万—20万件之间。

2015年1月,质检总局在杭州组建成立了全国电子商务产品质量信息共享联盟,阿里巴巴、京东、中国标准化协会、清华大学、中检集团等92家成员单位先后加入。通过信息共享联盟,质监部门可以向电商企业持续发送产品质量信息数据。

留下记录,就可以剥离出涉假信息

发退货、登陆IP、商品文字、图片描述、交易、消费者评价、维权、权利人投诉,甚至是社交媒体数据等多个维度和特征的数据,通过大数据处理平台和机器学习算法研究,均可以从中剥离出涉假信息。当一切都能被记录和对比分析时,售假者的行为就会被追踪,无处可藏。

“我们的数据团队正在优化各种假货模型,模型能够对数百万卖家进行实时评分,识别出具有售假风险的高危用户和售假团伙。”王彦说。

目前,一些电商正在建立卖家的售假信用体系数据库。当卖家历史记录达到危险值后,就会推送给客服作为处罚的判断依据。“商品被判断为‘疑似假货’之后,我们会通知商家下架删除该商品。”王彦说:商家可以自己举证来证明是真货。如果举证有效,那么店铺会被重启。