产品特色
内容简介
关键词:大数据,征信系统,数据挖掘,数据架构,信用风险管理
《征信与大数据》的主要内容分为征信商业模式和大数据在征信领域的应用两大部分。
随着近年来国内征信相关法规的出台,国内市场化的征信业开始起步,建设热情高涨,社会需求旺盛,资本市场热捧、大量互联网公司涌入。但是由于起步晚,国内金融、经济和法制环境配套并不完善,所以国内征信业发展过程虽然遇到空前的机会,但是目前还存在短时间内难以解决的瓶颈。相比而言,在欧美发达国家,征信有一百多年的历史,随着信息技术的发展,已经到了一定的专业高度。因此针对国内目前刚起步的市场化征信机构所面临的问题和挑战,本书剖析国外成熟的知名征信机构的发展历程,商业模式和未来趋势,提取对中国征信业建设的启示和有益的经验,希望能够给混乱而有蓬勃发展的中国市场化征信提供借鉴。
大数据目前也是国内外的热点话题,政府、厂商、金融机构、互联网等多方面非常关注和投入,国家层面更是发布了大数据行动纲领。但是大数据热的背后却缺少有切实落地的生动案例。征信业作为数据为核心资产的金融服务子行业,是金融大数据应用的很好的场景。每一次数据技术的进步都会带来征信业务的飞跃,从数据自动处理技术、数据库技术到数据挖掘技术等。大数据技术作为先进的信息技术的集成者,未来对征信的提升也不可限量。从传统的征信机构到新兴的高科技大数据公司都从不同角度、不同的环节,纷纷尝试利用大数据技术解决征信领域的问题,提升产品和服务。同时大数据技术在征信领域的应用不仅可以处理微观信用风险,而且还可以支持宏观的金融系统性风险管理、消费市场预测和重大金融决策等。本书将介绍国内外大数据技术在征信领域全新的应用,深入分析具体而又丰富的实用案例,希望给未来中国征信建设提供技术参考。
《征信与大数据》最后还将介绍全球征信业的新趋势。本书还将对在复杂而生动的中国社会场景下开展征信业务,提出一些建议和未来展望。例如,一方面国内市场经济环境和法制相对落后,另外一方面现代信息技术又普遍应用,如何利用技术的后发优势来建设征信;又如,我们虽然有着良好的“君子之言,信而有征”的文化传统,但又面临改革开放之后商业领域的信用普遍缺失而带来的的巨大经济损失,如何来重塑“守信激励、失信惩戒”的信用体系。
作者简介
刘新海:现任某国有大型金融机构副研究员,同时也是北京大学智能金融研究中心兼职研究员。比利时鲁汶大学获得电子工程博士。中国人民银行金融研究所博士后。主要的研究方向:征信、信用风险管理、数据挖掘和金融大数据。刘新海博士曾在布鲁塞尔的互联网公司Attentio和金融分析公司Vadis从事过咨询和数据分析工作。曾经在数据挖掘国际期刊IEEE TKDE和人工智能国际期刊IEEE PAMI发表学术文章。在国内工作期间参与征信和金融数据挖掘多个应用项目,其中主持国家自然科学基金等国家ji研究项目三项。刘新海博士还是财新网专栏作家。
目录
前 言 // IX
绪 论 // XI
第一篇
征信机构:市场经济的风险信息服务商
01 美国征信业的前世今生
美国征信业概述 // 005
美国个人征信发展史 // 006
美国个人征信体系的框架 // 010
征信的法律和监管 // 013
个人信用报告 // 015
发展中的美国征信业 // 019
02 益博睿:横跨欧美,全球最大
益博睿的发展历史 // 023
益博睿的商业模式 // 029
数据资源和分析能力 // 035
03 艾克飞:百年老店,技术领先
艾克飞的基本概况 // 039
艾克飞的历史 // 041
艾克飞商业模式分析 // 042
04 环联:家族企业,姗姗上市
环联概况与历史 // 053
环联的商业模式 // 058
环联的未来之路 // 066
05 服务垂直领域的专业性征信机构
专业征信机构概述 // 075
服务于不同的消费生活场景 // 078
代表性的专业征信机构 // 079
传统征信机构和专业征信机构交互 // 087
06 蓬勃发展的新兴征信服务公司
Credit karma 的互联网征信服务 // 095
Credit Karma 的商业模式分析 // 099
Credit Karma 的竞争对手 // 102
对中国个人征信业的启示 // 104
07 企业征信巨头邓白氏:诞生了四位美国总统
企业/ 商业征信 // 109
邓白氏基本概况 // 111
邓白氏发展历程 // 112
邓白氏的商业模式 // 116
邓白氏公司的业务保障——DUNSRight 数据质量管理流程 // 123
邓白氏在国内关于侵犯个人隐私的事件回顾 // 124
第二篇
信用评估:大数据技术的应用场景
08 全球个人征信机构的大数据征信技术
数据处理:匹配连接和下一代技术 // 135
数据挖掘和分析:释放大数据价值 // 137
数据服务:多元化产品与个性化良好体验的服务 // 139
09 信用评分60 年
信用评分:信用报告的数字化解读 // 146
信用评分的历史 // 147
信用评分的应用 // 151
信用评分的类型 // 154
信用评分模型的原理 // 157
信用评分的缺陷 // 159
10 国外信用评分新进展
信用评分最新趋势 // 167
可替代信用评分 // 169
11 一切数据皆信用的ZestFinance
背景知识 // 179
ZestFinance 简介 // 180
传统信用评估方法的缺陷 // 181
ZestFinance 的基本商业理念 // 185
ZestFinance 大数据信用评估的技术分析 // 188
ZestFinance 的最新动态 // 194
对中国征信业的启示 // 195
12 运用大数据做P2P 信用风险评估的Upstart
面向大学毕业生消费者服务的P2P // 201
商业模式:基于未来潜力的大数据信用评估 // 202
智能数据管理和分析技术 // 204
在线信贷的激烈竞争 // 206
对互联网金融的启示 // 207
13 扎根于新兴市场的EFL:看人品,放贷款
利用人品测试放贷款的故事 // 214
来自哈佛的高科技创业公司EFL // 215
EFL 进行信用评估的原理 // 217
对EFL 应用的讨论 // 220
类似的信用评估公司VisualDNA // 221
14 征信大数据对宏观金融决策的支持
宏观经济应用概述 // 227
担保圈风险简介 // 228
引入复杂网络技术分析我国担保圈问题 // 230
担保圈复杂网络技术分析的初步发现 // 233
担保圈风险管理的建议 // 242
征信大数据的进一步应用 // 243
15 电信大数据在征信领域中的应用研究
背景介绍 // 247
电信运营业务中的征信问题 // 248
电信大数据在金融征信中的应用 // 253
国内情况分析和政策建议 // 257
16 生物识别技术在征信领域的应用
基于生物特征的身份验证 // 261
指纹识别:乌干达的征信应用 // 263
声纹验证技术 // 264
声纹验证在征信领域的应用 // 266
声纹验证的机遇和挑战 // 268
第三编
征信模式:互联网时代的信息共享机制
17 全球个人征信业所面临的市场机遇
全球个人征信业的机遇 // 275
国内个人征信业的机遇 // 281
18 全球个人征信机构的挑战
信息安全和数据源 // 287
宏观经济形势和市场竞争 // 293
法律和监管的合规性 // 296
19 互联网时代的征信
征信应用岂止互联网金融 // 305
互联网经济下的征信 // 307
物联网中的征信问题 // 310
征信模式:互联网时代的信息共享机制 // 311
参考文献 // 313
精彩书摘
征信系统通过对消费者/企业信用活动及时、准确、全面的记录,以及通过信息共享减少了征信活动人力、物力、时间的消耗,不仅可以帮助信贷机构降低成本、管理风险、提高决策效率,还可以使消费者更好地享受金融服务,实现拓宽交易范围和优化商业环境的经济功能。因此,征信系统往往被视为一个国家经济和金融的基础设施之一。
在大数据场景下的信息经济时代,企业和个人消费者利用数据和分析来做更具信息量的决策、更有效的管理风险将是一个长期趋势。根据互联网数据中心2014年9月的报告,全球商业分析服务方面的花销在2014年达到3520亿美元,而且2014—2018年,年平均增长率将达到15%。因此,基于消费者风险和信息的服务将成为一个巨大并飞速发展的市场。
本章从国外和国内两个角度对个人征信业所面临的机遇进行简单分析,试图探究个人征信业的未来。
全球个人征信业的机遇
全球个人征信业可以分为欧美发达国家和新兴国家两个市场,在全球宏观经济环境和技术进步的影响下,大数据技术驱动、行业服务的需要、新兴市场信贷的发展、消费者信用管理和监管合规性这五个因素驱动了全球个人征信业继续蓬勃发展。
大数据技术驱动
征信机构的所有业务都是围绕着消费者数据展开的,任何数据技术的进步都会促进征信机构的升级换代,大数据技术更不例外。首先,随着大数据技术的发展,与消费者相关的新数据不断产生,相关应用快速增长。在海量、多样化的数据以更快的速度集成的同时,分析应用和解决方案的广度也在不断扩张。商业机构越来越需要依赖商业分析和大数据技术来帮助高效地处理数据。此外,非传统的结构化和非结构化数据在作为信用评估可替代数据方面的地位也越来越重要,智能手机和其他移动设备的兴起,产生了和消费者活动与位置相关的海量数据。因为,商业领域追求实时地获得对消费者更加精细的了解和更加综合的观测,因此对消费者数据和复杂分析方案的需求将持续增长。
其次,分析和技术上的进步将释放消费者数据的价值。数据搜集、存储和分析技术的不断进步将有助于在决策分析、数据挖掘和风险管理的更好应用方面发挥更大价值。近年来,数据库管理软件的发展、数据存储和处理成本的下降以及硬件成本下降和一些市场加入并使用“中心辐射型”(Hub & Spokes)模式降低了征信机构的启动成本。大数据技术使得商业机构拥有快速集成和分析数据的能力,它们更期待实时从信息提供商那里获得数据和分析服务,并完全整合它们工作流程的解决方案,这种趋势也将增加风险和信息服务行业(征信行业)的未来商业机会。
行业服务的需要
金融行业是征信机构的传统服务领域,随着行业的不断发展,新金融形态的出现对征信服务提出了新的需求。原有金融行业内部的垂直领域也需要更深入的风险和信息服务,而且和金融相邻的其他商业领域也出现了对风险和信息服务的要求。
银行信贷领域:新金融形态风险管理的需要、增加的监管资本、额外的合规性费用、遗留资产(Legacy Asset)的悬而未决等多重因素促使中小型企业和消费者从银行体系外借款,导致了新形态金融公司的出现,例如P2P借贷平台和在线资产负债表借贷者(Online Balance Sheet Lenders)积极地填补传统金融服务的空白地带。这些技术驱动型借贷平台利用的数据包括行为数据、交易数据、雇用和信用信息等,通过利用复杂的信用评估工具,提供快捷的授信方式。传统的金融服务公司也在增加数据和风险分析应用来满足监管要求,降低运用成本和更好地服务客户的需求。
保险:为应对消费者从多家保险商那里获得报价单进行比较来降低花销倾向,保险公司试图通过征信机构的风险和信息服务来提高风险评估和最初报价单的准确率。例如,保险公司希望用驾驶违章数据来揭露消费者驾驶行为的一些过失,这些过失能够影响在报价过程中的定价,基于这些数据获得的信息也使消费者会对他们需要付的额外费用有正确的认识。此外,征信机构的保险信息挖掘工具还提供优化账户管理、最大化催收以及无法支付损失的最小化服务。
医疗服务:消费者征信机构将信贷领域的成功经验延伸至医疗信息领域。由于肩负越来越多病人的付款责任、费用管理和合规性审查,医疗服务提供商也开始需要征信机构的服务,用数据和分析工具来更好地管理它
征信系统通过对消费者/企业信用活动及时、准确、全面的记录,以及通过信息共享减少了征信活动人力、物力、时间的消耗,不仅可以帮助信贷机构降低成本、管理风险、提高决策效率,还可以使消费者更好地享受金融服务,实现拓宽交易范围和优化商业环境的经济功能。因此,征信系统往往被视为一个国家经济和金融的基础设施之一。
在大数据场景下的信息经济时代,企业和个人消费者利用数据和分析来做更具信息量的决策、更有效的管理风险将是一个长期趋势。根据互联网数据中心2014年9月的报告,全球商业分析服务方面的花销在2014年达到3520亿美元,而且2014—2018年,年平均增长率将达到15%。因此,基于消费者风险和信息的服务将成为一个巨大并飞速发展的市场。
……
前言/序言
智控与未来:人工智能驱动的决策优化 本书导读: 在信息爆炸的时代,数据已成为驱动社会进步的核心动力。本书深入探讨了人工智能(AI)技术如何变革传统决策模式,实现前所未有的效率提升与精准控制。我们不再仅仅依赖经验和直觉,而是进入了一个以数据洞察为基石的智能决策新纪元。本书旨在为读者勾勒出AI在复杂系统管理、资源优化配置以及风险预测等前沿领域的宏伟蓝图。 第一部分:智能决策的基础架构与理论基石 第一章:从数据到洞察的桥梁——现代数据科学的演进 本章首先梳理了数据科学从传统统计学发展到深度学习的演变历程。重点阐述了大数据采集、清洗、存储和预处理的复杂技术栈,强调了数据质量对于后续模型构建的决定性作用。我们详细介绍了面向决策支持的数据模型构建流程,包括特征工程的艺术与科学,以及如何平衡模型的可解释性与预测精度。读者将了解到,高质量的数据是智能决策系统的“血液”,没有坚实的数据基础,任何复杂的算法都将是空中楼阁。 第二章:算法的进化:机器学习范式在决策中的应用 本章深入剖析了当前主流的机器学习算法,并重点聚焦其在决策优化中的具体应用场景。从经典的监督学习(如回归分析、分类决策树)到无监督学习(如聚类分析在市场细分中的应用),再到强化学习(RL)在动态环境下的策略优化。我们将详细介绍深度神经网络(DNN)如何处理高维、非线性数据,特别是卷积神经网络(CNN)和循环神经网络(RNN)在时间序列预测和模式识别中的突破性进展。此外,本章还会讨论迁移学习和主动学习,这些技术如何降低对海量标注数据的依赖,加速模型在特定业务场景的落地。 第三章:决策引擎的构建:系统集成与实时反馈回路 一个有效的智能决策系统不仅仅是算法的堆砌,更是一个精密的工程系统。本章聚焦于如何将训练好的模型部署到生产环境,构建高可用、低延迟的决策引擎。我们探讨了微服务架构在部署AI模型中的优势,以及模型版本控制和持续集成/持续部署(CI/CD)在维护系统稳定性和适应性中的关键作用。更重要的是,本章强调了“人类在环”(Human-in-the-Loop)的设计理念,即如何设计有效的反馈机制,让人工智能的建议与专家的领域知识相结合,形成人机协同的优化闭环。 第二部分:AI在关键领域的深度赋能 第四章:优化资源配置的艺术——供应链与运营管理中的智能调度 在瞬息万变的全球供应链中,决策的延迟往往意味着巨大的成本损失。本章展示了如何利用AI技术,特别是基于大规模优化模型(如混合整数规划与深度强化学习的结合),实现对库存、物流路径和生产进度的动态、实时优化。我们分析了需求预测的精度如何直接影响安全库存的设定,并探讨了如何利用生成对抗网络(GAN)模拟极端市场波动情景,进行鲁棒性测试和预案制定。 第五章:智能风控与反欺诈的前沿技术 金融、保险及电子商务等领域对风险的识别和控制有着极高的要求。本章侧重于利用图神经网络(GNN)分析复杂的交易关系网络,揭示隐藏的关联欺诈团伙。此外,我们还深入介绍了异常检测技术,包括基于自编码器(Autoencoder)和隔离森林(Isolation Forest)的方法,用于在海量正常交易数据中快速锁定高风险行为。本章将详细阐述如何平衡误报率与漏报率,构建既有效又合规的智能风控体系。 第六章:个性化体验的构建——营销与客户生命周期管理 在消费者主导的市场中,精准触达和个性化服务是提升竞争力的关键。本章探讨了如何利用深度学习模型(如深度推荐系统)分析用户行为序列,预测其购买意愿和生命周期价值(CLV)。我们详细介绍了A/B测试的自动化与智能优化,展示了AI如何驱动实时竞价(RTB)系统的出价策略,确保营销预算在最高效的渠道和时间点被使用。本书还讨论了对话式AI在提升客户服务效率和满意度方面的潜力。 第三部分:智能决策的伦理、治理与未来展望 第七章:透明度与公正性——AI决策的可解释性与偏见消除 随着AI决策权重的增加,对其“黑箱”特性的担忧日益突出。本章致力于探讨可解释性人工智能(XAI)的技术框架,如SHAP值、LIME等,它们如何帮助决策者理解模型的判断依据。更重要的是,本章严谨分析了数据和算法中可能潜藏的系统性偏见(Bias),并提出了量化偏见和进行公平性约束优化的实践方法,确保智能决策系统能够遵循社会伦理标准。 第八章:决策系统的韧性与安全加固 智能决策系统面临着来自恶意攻击的新型威胁,例如对抗性样本攻击(Adversarial Attacks),这些攻击旨在欺骗模型做出错误决策。本章详细介绍了针对AI模型的攻击类型、防御策略,包括对抗性训练和输入净化技术。此外,我们还讨论了模型漂移(Model Drift)的监测与自动重校准机制,以确保系统在面对不断变化的环境时,决策的有效性和稳健性得以长期维持。 第九章:通往通用智能决策的路径 本书的最后一部分展望了未来智能决策系统的发展方向。我们探讨了元学习(Meta-Learning)在快速适应新任务中的潜力,以及如何构建能够进行跨领域知识迁移的通用决策框架。此外,本书还深入分析了量子计算对未来优化算法可能带来的颠覆性影响,并总结了推动下一代智能决策系统从自动化走向自主化所需要解决的核心科学与工程难题。 结语: 《智控与未来》不仅是一本技术指南,更是一份面向未来的行动蓝图。它要求管理者和技术人员转变思维,将数据视为战略资产,将AI视为核心生产力,共同迎接一个由精准、高效和负责任的智能决策所驱动的新时代。