专利名称:基于商圈划分的企业线下与线上多源数据整合方法
及装置
专利类型:发明专利发明人:谭继军,李阳,谢蓬莲申请号:CN202110287069.7申请日:20210317公开号:CN112783963A公开日:20210511
摘要:本发明公开了一种基于商圈划分的企业线下与线上多源数据整合方法,包括下述几个阶段:第一阶段:对线上的百万级样本数据进行商圈匹配,主要完成将大量的抓取样本放入特定商圈的工作,以便降低下一步匹配样本所在商场的计算量,提高匹配效率和精度;第二阶段:对各个1级商圈进行操作,将每个样本在某些商圈的可能性做出预测,并对可能的1.5级商圈进行排序匹配;第三阶段:分别就地址、商户名和门牌号综合计算相似性得分匹配。本发明将线上的企业数据与线下的经营实体对应,拓宽了企业信息的维度,通过程序化的方法,减轻了人工匹配的工作量;另外,本发明还提供一种基于商圈划分的企业线下与线上多源数据整合装置,便于实现多源数据的整合。
申请人:上海数喆数据科技有限公司
地址:200000 上海市杨浦区国和路60号(集中登记地)
国籍:CN
代理机构:成都嘉企源知识产权代理有限公司
代理人:何朝友
更多信息请下载全文后查看
因篇幅问题不能全部显示,请点此查看更多更全内容