您的当前位置:首页正文

大数据背景下个人信用评价体系构建

来源:个人技术集锦
总第137期 2017年第5期 现代工业经济和信息化 Modem Industrial Economy and Informationization Totl of137 aNo.5,2017 0 DOI:10.165254.cnki.14-1362/n.2017.05.44 大数据背景下个人信用评价体系构建 董媛香 ,程鑫z 太原030006; (1.山西财经大学管理科学与工程学院,山西2.山西财经大学信息管理学院,山西太原030006) 摘要:大数据背景下以三维度信用论为理论基础,构建了包括社交网络、互联网金融和在线行为数据的新型 个人信用评价指标体系。在此基础上,选择新型不确定数据分析工具软集合作为建立评价模型的理论基础。 关键词:大数据;个人信用评价;体系构建 中图分类号:F830 文献标识码:A 文章编号:2095—0748(2017)05-0106—03 引言 为等线上指标;其次,由于指标的多样性,信用评级 方法不能仅适用于结构化数据,也要可以处理诸如 随着《社会信用体系建设规划纲要(2014—2020 年)》和《关于做好个人征信业务准备工作的通知》的 颁布,我国个人信用行业迎来了发展的黄金时期。信 用将在社会经济生活中承担越来越重要的作用,拥 社交信息和行为数据的半结构化和非结构化数据, 同时还要有能力处理由于多源和快速变化导致的信 息冲突、历史数据少等现实问题。因此,本文将从大 数据背景下个人信用评价指标体系的构建和信用评 价模型的选择两方面进行探讨,构建大数据下合理 有效的信用评价体系。 1基于大数据的指标确定原则 有信用者可以获得机会、形成社会关系或达成信用 交易。信用正成为社会资源配置的新依据,改变了传 统经济仅仅依靠实物资本进行资源配置,促进缺乏 实物资本但是拥有信用资本的主体发展。 在互联网、云计算和无线传感器技术的发展下, 大数据时代,各种环境都会产生数据,但并非所 有数据都可应用于个人信用评价。在大数据背景下 个人信用评价指标应当遵循以下原则。 1.1有效性 大数据的低价值性决定了并非所有的数据都是 有用的。因此,在选取个人信用评价指标时,要注重 领域和方向,选择与个人信用评价相关性强的指标。 同时还要注重数据的可得性,即相关机构或者平台 我们进人了大数据时代。大数据技术可以收集海量 的、分散的、多元化的数据,从而对缺少信用记录的 长尾用户进行评价,使其可以获得贷款等金融服务, 从而实现普惠金融。2015年11月发布了《中共中央 关于制定国民经济和社会发展第十三个五年规划的 建议》,首次将大数据提升到国家战略高度。但是值 得关注的是,大数据具有规模性(Volume),多样性 (Variety),高速性(Velocity)和低价值性(Value)的 4V特征,也为传统个人信用评价体系带来了挑战。 首先,信用评级指标不只是传统个人身份特征和财 务指标,也包括互联网金融账户、公开社交、在线行 收稿日期:2017-03-01 可以根据自身业务收集到的个人信用行为的记录, 对于难以采集到的指标不应该列入其中。 1.2合法性 大数据背景下,获取数据越来越方便,借助移动 终端、摄像头、RFID和传感器等前端设备,可以轻易 收集到个人的行为数据、位置数据、交易数据和社交 数据等。但是,基于大数据的个人信用评价的指标选 取必须要在保护个人隐私以及信息安全的基础上谨 慎选取,必须符合我国法律确定的边界。 l-3客观性 基金项目:教育部人文社会科学研究项目“互联网环境下基于 多源数据的个人信用评价体系研究”(15YJC630016);山西省 哲学社会科学课题“互联网金融背景下的山西省信用体系建 设研究:征信模式及评估支持”;山西省哲学社会科学课题“互 联网环境下的‘诚信个人’评价研究”。 作者简介:董媛香(1985一),山西太原人,博士,讲师,研究方向: 信用评价理论与方法;程鑫(1988_),山西太原人,博士,讲师, 研究方向:信用评价理论与方法。 个人信用评价指标应当可以客观反映一个人的 信用历史和履约能力。在指标设计时,应当将指标进 行合理分解,尽可能避免主观性和模糊性。同时指标 2017年第5期 董媛香,程鑫:大数据背景下个人信用评价体系构建★ 要取之有据,指标之间要避免重复或者矛盾。 2基于大数据的指标体系构建 纳情况等指标。三维践约度,主要衡量个人在经济交 2015年中国人民银行印发《关于做好个人征信 业务准备工作的通知》中,芝麻信用管理有限公司、 腾讯征信有限公司、深圳前海征信中心股份有限公 司等八家机构获得首批个人征信拍照。八家机构由 于自身特点不同,其收集的个人信用数据的维度也 易活动中的行为,由契约关系约束,主要表现为电子 商务领域和互联网金融领域的履约情况。 本文以三维度信用论为理论基础,并结合相关文 献、理论及我国个人征信的实际情况综合分析,构建 大数据背景下个人信用评价指标体系,如表2所示。 表2大数据背景下个人信用评价指标 不尽相同,具体整理如表1[1]所示。 表1 八家征信机构的信用数据维度 征信机构 企业特点 信用数据 信用卡还贷款、网购、 芝麻信用 依托阿里集团 转账、理财、水电煤气 费、住址搬迁历史、社 交关系等 主要为社交网络数据, 腾讯征信 依托腾讯集团 如在线时长、好友、消 费、游戏等 全牌照的金融企业,依 保险、银行、投资等金 前海征信 托平安集团 融业务体系中收集相 关信用数据 老牌征信企业,几乎覆 个人基本信息、银行信 鹏元征信 盖深圳所有小贷公司 用信息、个人缴费信 息、个人资产信息等 老牌征信企业,联合众 个人基本信息、银行信 中诚征信 多P2P平台、小贷公 用信息、履约能力、行 司、电商平台 为数据和社交数据等 老牌征信企业,主要为 个人信用活跃度、履约 中智诚征信 反欺诈征信 能力、个人缴费信息、 个人资产信息等 服务人次高,覆盖 全国50万家便利店信 拉卡拉信用 范围广 水电费、网购数据等、 华道征信 最早的短彩信商务平 个人基本信息、运营商 台,积累大量用户 数据、公共事业单位数 据、公安司法数据等 学者们也从各个角度对大数据背景下个人信用 评价指标进行了研究。冯文芳和李春梅基于大数据 的信用评价需要通过多维度的信用信息的考察,不 仅包括现金流等财务指标,还包括地址信息、行为数 据、社交关系等半结构化、非结构化数据下的指标[2]。 张贺等从社交数据与个人还款意愿和能力之间的相 关性来研究社交数据在个人征信中的可靠性,由于 隐私问题、技术局限等问题,其可靠性还有待进一步 验证,但是随着模型以及数据结构的进一步完善,社 交数据具有巨大应用空间。孙璐和李广建通过文献 研究,从内容、功能、应用及场景等多维度,全面考察 评价指标,构建了一种互联网金融背景下多维度的 个人信用评价特征感知发现模型[3]。 吴晶妹从信用的内涵和实质角度,提出了三维 度信用论[4]。一维诚信度,主要衡量个人的信用意 愿,由个人的本性和素质决定,具体包括个人身份、 职业和社会关系等;二维合规度,主要衡量个人在社 会中的信任度,主要表现为个人社会行为的合规程 度,具体包括纳税情况、违法违规情况、公共费用缴 三维信用 一级指标 二级指标 职业、学历 工作年限、收入情况 身份特质 资产情况 贷款情况 透支金额 账号等级 诚信度 社交网络 获得“达人”或勋章称号情况 用户创造内容 好友评分 好友数量 社交关联用户 粉丝数量 所属群的用户情况 所建群的评分隋况 公共费用缴费情况 行为轨迹 违法违规情况 执照吊销情况 实名认证情况 合规度 被黑名次数 被屏蔽次数 社交网络 言论被删次数 被举报次数 举报实践严重程度 恶意退换货次数 成功交易比例 重复购买次数 用户评价内容 电子商务 产品好评率 服务态度好评率 纠纷占交易量的比例 践约度 保证金总数 违约次数 违约严重程度 信用等级 抵押担保情况 金融账户 违约天数 违约次数 违约本金 3基于大数据的信用评价模型 已有的信用评级模型很多,大致可以分为两大 类:统计分析和人工智能分析。其中,统计分析可以 具体划分为判别分析法和回归分析法;人工智能分 析可以具体划分为只包含一种模型的单一学习算法 与启发式算法结合的混合学习算法,包涵多个分类 模型的集成学习算法。 大数据背景下的信用数据同样也具有4V特 征。信用数据由于收集渠道多样以及在线数据的迅 现代工业经济和信息化 xdgyjjxxhx@163.com 第7卷 速变化,导致同一主体的某一指标数据往往具有冲 突性;由于在线信用数据近几年才逐步产生,针对某 并用于选择企业破产预测中的财务指标;Sienz[8]基于 三角区间2型模糊软集合构建多属性群决策模型。 4结语 信用主体的在线信用数据采集时间较短,导致历 史数据较少,同时指标也在不断增加和变化,数据呈 一大数据技术可以为缺少信用记录的长尾用户进 行评价,使其可以获得贷款等金融服务,从而实现普 现稀疏性;同时其不仅仅包括自身的财务数据,还包 括互联网交易、履约乃至社交关系等数据,涉及的指 标众多,数据结构复杂。传统的基于财务数据,利用 惠金融,但是大数据也为传统个人信用评价体系带 来了挑战,主要体现在指标和模型两个方面。本文基 于大数据背景,以三维度信用论为理论基础,构建了 包括社交网络、互联网金融、在线行为等数据的新型 个人信用评价指标体系,在此基础上分析了已有信 用评价方法已经不能适应新型指标体系,进而选择 了在大数据环境下具有应用潜能的软集合作为建立 评价模型的理论基础,希望为建立完善的个人信用 评价体系提供一些启示。 参考文献 统计分析或智能学习的信用评级方法,无法处理历 史数据较少,稀疏性较高,同时又具有动态、异构、多 源冲突特征的信用数据。 本文选择新的处理不确定、模糊及未定义数据 的数学工具软集合 作为个人信用评级模型的理论 基础。软集合具有如下几个特征,使其在大数据背景 下的信用评价中具有较大应用潜能。第一,软集合可 以克服诸如概率论、模糊集理论、直觉模糊集理论、 区间数学、Vague集以及粗糙集等传统处理不确定 数据方法中参数化工具不足的缺陷,因此可以有效 分析具有冲突性和稀疏性的信用数据。第二,软集合 是集合论的一个分支,其运算法则建立在集合运算 基础上,更加适合对存储在数据库中的数据进行分 析。第三,软集合对论域中的对象类型以及对象的描 述形式没有限制,不仅可以分析结构化数据也可以 分析半结构化和非结构化数据。第四,软集合可以直 [1] 张赞,肖羽,朱南.社交数据在个人征信中的可靠性初探【J].上海 金融,2016(3):50—54. [2] 冯文芳,李春梅.互联网+时代大数据征信体系建设探讨[J】. 征信,2o15(1O):36—38. [3] 孙璐,李广建.多维个人信用评价特征感知模型的研究[J】.图书 馆情报工作,2015(11):96—138. [4] 吴晶妹,从信用的内涵与构成看大数据征信[J].首都师范大学学 报,2015,227(6):66—72. [5]D.Motodtsov.Soft set theory—Fistr results[J】.Computers& Mathematics with Applications,1999,37(4/5):19-31. 接建立近似模型快速求解。由于在大数据的环境下, 数据价值随着时间推移迅速递减,所以分析的精确 性不再是数据分析的最主要指标,很多情况下分析 方法需要在处理的实时眭和精确性之间取得一个平 [6] Z.Xiao,W.J.Chen.A Partner Selection Method Based on Risk Evaluation Using Fuzzy Soft Sot Theory in Supply Chain【C]// Modeling Risk Management in Sustainable Construction.Berlin: Springer,201 1:19-27. [7] W.Xu,Z.Xiao,X.Dang,D.L.Yang,X.L.Yang.Financila ratio selcteion for business failure prediction using soft set theory『J】. 衡。因此软集合比传统方法具有更好的鲁棒性和更 低的时间空间复杂度。 软集合理论已经在违约预测、风险评估和群决 策等领域取得了丰富的应用成果。Xiao和Chen[。] 运用模糊软集合构建了风险评估模型;Xu等 提出 了一种结合了logistic回归的软集合参数约简方法, Knowledge-Based Systems,2014(63):59—67. [8] J.Sienz.Multi attirbute group decision making based on trapezoidal interval type-2 fuzzy soft sets Preface[J1.Applid Matehematical Modelling,2017,41(9):683. (编辑:贾娟) Construction of Personal Credit Evaluation System under the Background of Big Data Dong Yuanxiang ,Cheng Xin2 (1.School of Management Science and Engineering-Shanxi University of Finance and Economics,Taiyuan Shanxi 030006;2.School of Information Management。Shanxi University of Finance and Economics, Taiyuan Shanxi 030006) Abstract:Based on the three—dimensional theory of credit under the background of big data,a new personal credit evaluation index system including social network,Internet finance and onhne behavior data is constructed.On this basis,we choose the new uncertain data analysis tool soft set aft the theoretical basis for the establishment of evaluation mode1. Key words:big data;personal credit evaluation;system construction 

因篇幅问题不能全部显示,请点此查看更多更全内容