最近在研究电子商务和深度学习相结合的实务,在此基础上略有心得,先行记录下来,以备将来有机会实践。
1. 深度学习是什么
我们一听说深度学习,就觉得这玩意儿很高大上,除了特别有实力的公司,其他公司都玩不转,真的是这样吗?我不这样看,其实,如果了解了深度学习是什么,其实我们会发现,实践深度学习并将其应用在业务当中是很容易的。
首先,从咱们所熟知的深度学习场景开始。一般人都知道,深度学习离咱们最近的应用大约是在垃圾邮件处理和图像识别上。那么咱们就从图像识别来看看深度学习究竟是怎样工作的。
先从人开始,这跟深度学习其实没啥关系。下图是一张色盲测试卡,咱们去医院体检的时候经常会被要求看的:
图上显示的是什么?
是2。对,是2。不是色盲的人都能看出来,医院就是用这种方式来区分色盲和非色盲。
那么在识别出它是2的时候,咱们人脑做了些什么动作呢?
- 看到了很多的点点,嗯,都是圆点
- 这些圆点有两种颜色,红色和绿色
- 绿色组成了一个看起来像是2的形状,至于红色嘛,组成的形状不认识
- 那么,就是2好啦
好了,这就是人脑识别的过程。而如果用机器嘛,咱们用深度学习再模仿一遍就好了。
- 识别圆点,在这个例子当中,我们就假装每个圆点就是一个像素好了,这样就无需识别了,如果真要做圆点的识别,那么这个深度学习模型就要再多几层了
- 识别颜色,这个不难,每个圆点(像素)的设置都是在(0,0,0)到(255,255,255)之间的,关键是,由于在本例中情况很简单,只有红和绿两种颜色需要识别,所以机器需要分辨出什么是红,什么是绿,就像下图:
左边红,右边绿,但它们是渐变,所以机器要找出个临界值来,小于临界值的就是红,大于临界值的就是绿。
3.假装机器已经能够正确的区分每个像素是红是绿了,那么下面就分别将红色的像素排列成的形状与绿色的像素排列出的形状进行对比,结果发现红色的貌似和数字2的形状相匹配,绿色的啥都比配不出来
4.那么,就是2了,没跑了。愚蠢的人类,你说我猜的对不对啊?
以上,就是深度学习进行图像识别的简单的场景。我们会发现这么几个特征:
- 每一步骤其实都是比较简单的,只完成简单的动作
- 上一步骤的输出作为下一步骤的输入
- 每一步骤的关键在于临界值的确定,或者延伸一点说,就是算法的参数值的确定
- 每个步骤会有多个上层步骤,那么每个上层步骤所占权重的多少很重要
- 最终结果正不正确,还得人类说了算~~~
那么综合总结之后,用流程图画出来,大致就是这个样子的:
用一句话总结深度学习,就是:从原始数据出发,使用给定的多层算法和初始参数及初始权重,进行数据分析,并与标准结果相比对,寻找产生差距的因素,调整相关的参数及权重再进行新一轮的模拟,最终使得计算结果与实际结果总公差达到最小的运算过程。
2. 深度学习的模型构建
在深度学习的实践应用过程中,若需要将其结合到日常业务中去,则需要解决一个基本问题,即相关性网络模型的构建。
在我们日常的业务分析过程中,咱们常常会遇到这样的问题,就是我知道因素A和因素B之间有相关性关系,但不知道他们之间是如何影响的,是直接影响还是间接影响,如果是间接影响则是通过怎样的一个影响链条产生的影响。
以某典型的电子商务业务流程为例:
这是该电子商务APP上的两个截图,结合销售漏斗模型我们可以得到如下信息:
- 起降时间影响航班选择
- 航空公司影响航班选择
- 价格影响航班选择
- 是否有发票影响航班选择
- 起降航站楼影响航班选择
- 机型影响航班选择
- 航班展示排名影响航班选择
- 起降时间影响进入OTA页比率
- 航空公司影响进入OTA页比率
- 价格影响进入OTA页比率
- 是否有发票影响进入OTA页比率
- 起降航站楼影响进入OTA页比率
- 机型影响航班进入OTA页比率
- 航班展示排名进入OTA页比率
- 价格影响OTA选择
- 服务影响OTA选择
- 优惠影响OTA选择
- OTA排名影响OTA选择
- 进入OTA页比率影响OTA选择
- 进入OTA页比率影响下单率
- 起降时间影响下单率
- 价格影响下单率
- 服务影响下单率
- 优惠影响下单率
- OTA排名影响下单率
- ……
然后还有截图之外的,从销售漏斗了解的信息:
- 价格影响单票收入
- 单票收入影响单票利润
- 单票成本影响单票利润
- OTA选择影响单票收入
- OTA选择影响单票成本
- 单票利润影响总利润
- 票量影响总利润
- 下单率影响票量
- ……
从以上这些信息如何建立因素影响模型呢?我们可以画出关系影响矩阵:
将全部因素标上号,从1到N
- 起降时间
- 航空公司
- 价格
- 发票
- 起降航站楼
- 机型
- 航班展示排名
- 航班选择
- 进入OTA页比率
- 服务
- 优惠
- OTA排名
- OTA选择
- 下单率
- 单票收入
- 单票成本
- 单票利润
- 票量
- 总利润
使用这些编好号的因素建立行列矩阵:
然后在行和列的相交处填上0或者1,0代表不影响,1代表影响,而且是行影响列。自身当然会影响自身,所以行列数字相同的交叉处一定填1。从而可以得到类似下面的矩阵,当然下面的矩阵是尚未完成的样子:
对以上矩阵进行矩阵运算(可达集、前因集、共同集的运算),可以建立因素影响相关性的系统模型,从而建立起深度学习的多层算法结构,这里不再展开描述。
3. 深度学习与电子商务结合的方法论
在建立深度学习的多层算法结构,并对每一层的算法设定初始参数和比重,确立结果参照之后,就可以对模型进行训练了,在训练过程中,我们往往又会遇到另外一个问题,就是在已知差异的情况下,该如何调整参数和比重?
具体到电子商务行业中来,其实就是采用怎样的销售策略来提升最终的销售业绩的问题。
例如:在价和量的矛盾中,我们知道销售总额是 价格 x 销售量。那么什么情况下调价格,什么情况下上调价格呢?
针对深度学习模型中的不同层次,我们有不同的方法论来指导我们的参数及比重调整行为。
大体来讲,在电子商务销售过程中,有这么一些层面:
1. 价格层面:对于消费者而言,可能首要关注的是价格,而价格往往是比出来的,因此我们要考虑的主要有:
- 购买者(用户)的议价能力
- 替代品(或服务)的威胁
- 供货商(代理商)的议价能力
- 商品的供需关系
应用到电子商务的深度学习模型当中,实际上我们可以就以上方面再次增加一个新的算法层,分别对以上几个层面进行分析运算,并通过调整各自所占比重,从而确定最终的销售价格。
2. 排序层面:在电子商务平台上,由于多个供应商提供的产品较为同质,价格也不相上下,因此在展示上排名能否靠前也会成为一个重要的因素。因此,对这些处于竞争态势的代理商进行排序也会成为深度学习模型中影响最终销售业绩的一个关键影响点。这时,机器需要在学习过程中深入了解电子商务平台的排名算法,从而有效影响排名。
3. 展现层面:当今的产品各有其特点,某些特点能够很好的抓住用户的心理,从而成为很好的卖点,而有些则不能够。同时,用户的需求也是千差万别的,不同的购买者所关心的特点不同,也就是各自心里的"卖点"也是不一样的。在这种个性化的销售场景里,正是深度学习大展拳脚的好地方,它能够自动根据用户的喜好,针对性的展示用户真正关心的卖点。
4. 风险预防:拿前面举的机票行业为例,航班的延误或者取消是比较大的概率发生的,那么对于部分以抗风险性为卖点的机票产品而言,我们可以突出展示其规避损失的功能,取得风险概率和机票成本之间的平衡。
5. 优惠券:相比于直接低价的商品,如果加强优惠券的作用,虽然最终成交价一致,但增加了用户的沉没成本,效果往往会更好。
4. 深度学习与电子商务结合的场景
那么,在电子商务哪些场景下可以应用深度学习呢?从我自己的理解来看,我认为可以在一下场景充分发挥深度学习的作用:
- 产品的推荐:我个人认为依靠用户画像基于特征进行产品推荐已经过时,未来应当是基于用户行为的产品推荐,还拿前面某电商网站售卖机票的场景举例:如果用户是个人旅行他可能会比较倾向低价机票,但是如果他是因公出差的话,还会比较关注价格吗?其实不尽然。然而用户的倾向是可以在行为中识别出来的,如果一个用户在航班列表页选择航班的时候,他没有选择有最低价的那个航班意味着什么?他选择了某一个航班进入了OTA列表页,但是没有下单又返回了航班列表页这又意味着什么?他所选择的航班和没有选择的航班都有哪些异同点?进入又退出来的OTA页里的这些OTA又是哪些因素没能吸引到顾客?这些我们都需要通过深度学习来寻找用户的决策心理和决策模式,并及时的做出响应调整我们的销售策略。
- 关键影响因素的分析:在一个电子商务交易过程中,影响购买者做出最终决策的因素有很多,有些是关键影响因素,有些则不是。例如,我们会认为价格是一个关键影响因素,但这些大部分都是拍脑袋得来的,真的是这样吗?应用深度学习的模型自动构建能力和比重自动调整能力可以找到哪些是影响我们业务发展的真正关键因素。
- 价格的调整:商品价格究竟定价多少才是能够保证利益最大化的?这里面有很多因素要考虑,前面已经阐述过,我们要考虑客户的议价能力、供应商的议价能力、竞争对手的能力、供需的关系等等。这里正好是深度学习发挥作用的好地方。
- 业务计划的预测、监控、分配和调整:每个公司的业务都不是漫无目的的开展的,会做各种计划并按照计划进行,举个例子,年初确定要销售15亿,那么会将这15亿的销售任务分配到12个月,进而分配到每一天,然后监控每个月、每一天的实际销售情况,从而判断是否能够圆满完成,如果没能完成,则需要及时调整计划。显而易见,这些销售任务不是平均分配的,而应当根据实际销售情况来进行分配。因此,我们可以运用深度学习技术对业务计划进行监控和及时调整。
5. 深度学习与电子商务结合的产品设计
综合以上场景,以及电子商务企业中能够收集到的数据,我们大体可以设计出如下图所示的智能电子商务策略系统,通过大数据和AI来驱动智能化的业务决策:
这个策略系统主要包含如下功能:
1. 数据分析框架:深度学习的驱动力来自于数据,只有应用大量的数据进行训练,深度学习才能够充分发挥其能力。因此,数据分析框架负责对原始数据的收集、入库、切块和切片,并进行初步的统计分析。其产品结构如下图所示:
2. 深度学习框架:深度学习框架是基础结构部分的核心,驱动着整个智能化业务决策产品的运行,这是一个可扩展可配置的执行框架,按照一定的业务逻辑分析数据,执行业务调整,分析差距,调整参数和比重,并反复不断的进行学习,最终取得比较满意的结果。
3. 产品层面可分为两层:智能数据和智能运营。智能数据主要提供决策服务,通过预测、预警等方式提前预知业务运营过程中可能发生的情况,并向决策者提供在不同的决策环境下可能会出现的结果。
以业务预测为例,应用深度学习在电子商务业务智能数据产品中可以实现这样的效果:
某电子商务企业计划17年完成销售额253亿元,系统自动根据访问流量波动、漏斗率波动等情况拆分到每一天,并监控其实际执行情况。当一天时间过去时,发现原分配给今天的销售任务额没有完成,则系统会自动分析导致任务额没有完成的主要因素是什么,是宏观流量降低、还是因为某一层漏斗比率下降,如果下降则是什么因素导致,再未来的一段时间内该因素是否会继续持续,等等。并同时,将今天未完成的销售任务额分配至未来的时间内,并不是简单的堆到明天或者平均分配到未来若干天,而是根据预测的销售变化进行智能分配。换句话说,销售预测和销售计划是动态的,每天甚至每小时更新的。
4. 智能运营:智能运营是用户能够直接体会到的部分,将深度学习运用在电子商务智能运营中,可以完整跟踪用户的访问轨迹,从而判断用户的动机,基于用户动机而非仅仅基于用户特征向用户推荐合适的商品、设置合适的价格、展示合适的排序,等等。