【PPT+实录】携程酒店研发部BI经理潘鹏举:机器学习在OTA酒店服
模型上线的问题,如果线下模型基本上各个变量已经准备得差不多或者说也已经知道变量比较重要,建议是,直接快速上线,根据上线结果做模型二次调优,直接拿线上数据做模型,对模型效果进度是最直接,增加任何一个变量,线上线下都是不太一样,所以这一块也是会比较注重,而且这个迭代速度变得很快。 ??? 这是大概一个初步的模型上线架构。 ??? 其实这是很简单的图,学习的出来的模型,模型结构存储成一个文件,会写一些文档,比如模型用到了哪些变量,会有工程师把我们的变量算出来,然后有专门开发API接口的工程师进行上线。数据主要基于HBase,读文件,把常用的一些变量读取到Redis,SOA1直接调用,然后预测结果。 ??? 模型上线顺序。 ??? 先通过空跑实验,后校验通过,最后监控。监控非常重要。 ??? 再一个灰度上线。会布置两套SOA,一个是线上,一个是线下,如果做了新模型,同样复制一份跟线上完全一样,只是模型结果不太一样,模型调用一个是左边线上的结果,右边是线下的结果,根据log分析,新的模型效果跟现在线上比是好还是差的,如果是好的就可以直接上线。 ??? 数据校验,花的时间挺多。 ? (编辑:好传媒网) 【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容! |