我们正置身于数字科技爆发式增长的时代。以计算机、社交网络、电子商务、移动通信为相互交织的多元载体,以“PB”(1024 TB)为单位的数字科技,将人类社会带入一个充满结构化和非结构化数据的新信息时代 See Viktor Mayer,Big Data: How we live, work and think (2013).。主流观点认为,这意味着数字科技和大数据时代来临。大数据、云计算、人工智能、区块链等数字技术在全球范围对证券市场和证券监管产生了重大影响。尽管这种影响的深度和广度现在尚难预测和评估,但毋庸置疑的是,证券业面临着百年未有的机遇和挑战。在区块链去中心化情景下,现有证券交易所、中央结算公司有可能被重组或迭代;在大数据信息挖掘技术条件下,现有发行申报制度、信息披露体系以及法定载体正在重构;在云计算、人工智能技术推动下,现有证券业务特别是经纪业务可能面临转型、重组压力,证券代理交易、投资顾问业务可能被机器人取代。更极端的是,在所有市场主体的行为、活动都纳入自动程序记录、监测、计算和判定后,可能需要考虑证券商、中介机构的传统职能是否需要重新界定。当然,在数字科技监管深度运用后,证券监管也面临从理念到机制的全新转变与发展。
一、大数据、云计算对证券市场及其监管的影响
早在1998年,SGI的首席科学家JohnRMasey提到了“大数据”一词。2008年,《自然》杂志发行了一期大数据专刊。2011年,《科学》杂志发行了一期类似专刊。研究机构Gartner将这一概念定义为:大数据是高容量、高速度和高多样性的信息资产,需要以高效、创新的信息处理形式,以增强洞察力和决策能力。 See Garner, Big Data Available at: https://wwwgartnercom/it-glossary/big-data/最后访问时间:2019年2月10日。库斯内茨基研究人员认为,“大数据”与“海量数据”具有相同含义,因其不一致、不可预测的组合,“不适合被标准数据管理技术所驯服”。 See Kusnetzky, Whats Big Data? (2010). Available at: http://wwwzdnetcom/blog/virtualizati-
on/what-is-bigdata/l708最后访问时间:2019年2月9日。Snijders认为,“大数据是一个松散定义的术语,用于描述庞大和很复杂,使用标准的统计软件会变得很难。麦肯锡全球研究所(McKinsey Global Institute)在一份报告中将大数据定义为“数据集,其大小超出了典型数据库软件工具捕获、存储、管理和分析的能力”。 See McKinsey Global Institute, Big data: The next frontier for innovation, competition, and productivity (2011). Available at: http:// wwwmckinseycom/insights/business next frontier for innovation 最后访问时间:2019年2月10日。虽然现有大数据定义并不相同,但都提到了“海量数据”,这是大数据的一个基本特征。正如大家所熟知的,麦肯锡、IBM、微软、IDC、甲骨文等,将“大数据”的特点描述为“4V”:体积、速度、多样性和价值。
“云计算”一词发端于美国,最早出现在2007年4月。自此以后,“云在短短两年内就成为‘计算’和‘软件’的同义词”。Buyya、Yeo和Venugopal的定义是:“云是一种并行和分布式系统,由互联和虚拟化计算机集合组成,这些计算机根据服务提供商之间协商确定的服务级别协议动态地提供和呈现为一个或多个统一的计算资源。” See Rajkumar Buyya, Chee Shin Yeo, Srikumar Venugopal, Market-oriented cloud computing: vision, hype, and reality for delivering IT services as computing utilities High Performance Computing and Communications, HPCC 'OS 10th IEEE International Conference on, 25-27 Sept 5-13 (2008).可见,云计算是一种新型的、基于互联网的商业计算模型,它将计算任务分配到由大量计算机组成的资源池中,使应用程序系统获取所需的计算能力、存储空间和信息服务。其特点是:可扩展性强、计算和存储能力强、自我修复、虚拟化、支持绿色计算等。尽管云计算只是提供计算机资源的一种不同方式,而不是一种新技术,但自诞生以来,它在提供信息和服务的方式上引发了一场革命。在云计算普及之前,网格计算和效用计算已经存在。Sys-Con Events,Inc的创始人兼主席Fuat Kircaali说,在计算机网络中,云计算涉及大量通过互联网等通信网络连接的计算机,类似于公用计算。在科学上,云计算是网络上分布式计算的同义词,意味着能够同时在多台连接的计算机上运行程序或应用程序 See Mariana Carroll, Paula Kotze, Alta van der Merwe, Securing Virtual and Cloud Environme-nts, Cloud Compuervice Science: Research and Innovations in the Service Economy (2012).,是由规模经济驱动的大规模分布式计算范式,通过互联网按需提供给外部客户 See Ian Foster, Yong Zhao, loan Raicu, Shiyong Lu, Cloud computing and grid computing 360-degree compared, Grid Computing Environments Workshop 6-7 (2008). 。为了适应云计算的未来应用程序以及保持在竞争中占据优势,从亚马逊到谷歌,从阿里、百度到腾讯的云服务提供商都在致力于构建数据中心。
证券业越来越认识到通过云计算对大数据进行分析和预测、进行数据挖掘的必要性、紧迫性和重大商业价值。数据挖掘(kdd)作为数据库中知识发现过程的分析步骤,是计算机科学的一个跨学科子领域,是人工智能、机器学习、统计和数据库系统的交叉点,涉及大型数据集中发现模式的计算过程,目前已广泛应用于电子商务、金融、医疗、政府管理以及证券业等各类业务领域。 See LiMa, Mingfeng Jiang Chances and Challenges Confronting Securities Industry and the Countermeasures in Big Data and Cloud Computing Era, The 9th International Conference on Computer Science & Education (ICCSE 2014) August 22-24, 177 (2014).随着数据挖掘在证券业应用的不断扩展,学术界从多个角度展开了相关研究,主要涉及股市收盘价与经济新闻、人际网络互动、投资组合模型分析等多个方面的关系,采用了集合分类、时间序列、布林格、指数分析等方法。但总体上看,目前这一领域的研究成果还很少,不能满足实际需要。 See Seker, SE, Mert, C, Al-Naami, K, Ayan, U Ensemble classification over stock market time series and economy news, Intelligence and Security Informatics (ISI) 272-273 (2013).
学者认为,采用SWOT分析(SWOT矩阵)方法可以观察到基于云计算的证券业大数据挖掘相较于传统方法具有显著优势。SWOT是20世纪80年代初由旧金山大学韦里希教授首次提出的,用于评估项目或商业风险中涉及的优势、劣势、机会和威胁,包括明确商业风险或项目的目标,并确定有利和不利于实现该目标的内外部因素。 See LiMa, Mingfeng Jiang Chances and Challenges Confronting Securities Industry and the Countermeasures in Big Data and Cloud Computing Era, The 9th International Conference on Computer Science & Education (ICCSE 2014) August 22-24, 178 (2014).专家认为,采用这种流行方法分析,基于云计算的证券业大数据挖掘的新机遇、新优势主要体现在:1具有更强大的处理功能,且成本低。借助它可以建立交易监控、用户偏好分析、潜在客户挖掘、市场风险预测等模块。以用户行为分析为例,大数据系统可以通过数据采集和行为分析,清楚地“告诉”我们客户的行为,从而帮助准确定位客户。基于云计算的大数据简化了软件应用、业务流程和访问服务,有效降低成本。证券市场日益丰富的投资品种、不断扩增加的交易规模,使得交易、清算、风险管理等中后台业务所需应对的数据规模快速扩张,引入大数据挖掘技术可以大幅提升工作效率。运用大数据技术搭建算法交易平台能够支持批量、高效地完成各种复杂交易指令,降低交易误差。2保持信息的完整性、客观性和一致性。大数据处理的技术架构分为三个主要处理阶段:数据采集和预处理-数据分析-数据解析,它比传统数据挖掘的手工数据提取更为客观。基于云计算的大数据挖掘保持了信息的完整性、客观性和一致性。比如,截止到2019年2月22日,我国在沪深证券交易所开立交易账户的单位、个人已达1480748亿, See http://financestockstarcom/finance/macrodata/gupiaokaihu_nhtm最后访问时间:2019年3月15日。形成从单一账户到全部投资者账户的巨量数据信息。数据类型不仅包含结构化数据,还包含巨大的“非结构化”和“半结构化”数据。传统的计算无法处理如此大而不规则的“非结构化数据”,只能通过先进的数学模型和人工设定的采样条件和范围进行分析处理。依靠基于云计算的信息存储、共享和挖掘技术,则可以有效处理这些巨大而快速发展的终端数据。3具有预测证券价格的成功概率。证券交易存在着许多不可预测的波动,通过基于云计算的大数据挖掘,可以通过分析一段时间内的股票价格波动,并将其与该股票提示上的客户检索信息、情绪等相结合,在一定程度上提高股票价格预测成功率。例如,2011年,英国Dergen资本市场对冲基金(Hedge Fund of Dergen Capital Markets)首次建立在4000万美元规模的社交网络基础上,利用Twitter的数据感知投资前的市场情绪。加州大学河滨分校在20世纪初发布一份研究报告,通过对Twitter消息的分析预测股票价格。目前,各种基于云计算的预测已经在市场流行。4有助于证券市场及时监测。信息的云计算作为一种前沿技术,集成了多种异构核心资源,形成了一个资源池 See Jun Wei, Big data help to predict the future of the securities industry, Financial electronic 32-34 (2013).,可以更快地获取有价值的信息,并在几秒钟内获得结果,这与传统的数据挖掘有很大的不同,基于云计算的大数据挖掘可以保证时间性和效率。以博世净选基金经理乐玛利用非公开信息进行股票异常交易案例为例,与传统的举报或相关曝光案例不同,该案例完全依靠信息技术进行检测,大数据系统在筛选后自动找到线索和交易信息的批量账户。这是大数据挖掘在证券异常交易监控中的成功应用。 See LiMa, Mingfeng Jiang Chances and Challenges Confronting Securities Industry and the Countermeasures in Big Data and Cloud Computing Era, The 9th International Conference on Computer Science & Education (ICCSE 2014) August 22-24, 180 (2014).中国工商银行正在与科技公司合作,运用智能风控技术及解决方案,协助完善大数据风控体系,降低欺诈风险,减少欺诈损失。
正因为大数据挖掘的这些优势,互联网科技公司正在向证券业渗透。7年前,维基百科就预测,2012年至2017年,大数据市场将以惊人的复合年增长率58%增长,达到五年内500亿美元。这表明众多公司决策层致力于推动大数据技术发展。 See LiMa, Mingfeng Jiang Chances and Challenges Confronting Securities Industry and the Countermeasures in Big Data and Cloud Computing Era, The 9th International Conference on Computer Science & Education (ICCSE 2014) August 22-24, 181 (2014).大数据挖掘需要大量的高科技IT人才提供技术支持和平台开发。信息产业将整个金融业联系在一起,逐渐成为大数据的聚集点。当大多数用户使用免费终端时,话语权会自动转移到互联网公司。随着金融业进入大数据时代,传统证券业面临的挑战是,与互联网科技公司相比,无论是机制还是技术,无论是人才还是管理,证券业都力不从心。因此,虽然证券机构在“实时数据”跟踪方面取得了巨大成就,但大数据在其他方面的应用仍然有限。高技术保密性和较少的实际案例使得大数据挖掘应用难以快速推广。传统的服务器很难适应复杂、海量的大数据,因此需要对服务器设备进行升级或更换,以增加存储、操作和可控性。必须建立新的大数据中心提高数据收集和存储能力。证券业必须与互联网等金融公司密切合作,甚至进行并购,寻求新的利润点和新的竞争方向。在中国,很多证券商面临借助大数据技术转型和发展的机会和压力,需要推动公司日常经营的数据化运营,推动公司业务智能化应用,建立一套基于大数据及相关技术的有效管控工具,借助于互联网科技公司的技术或外包服务提供大数据挖掘能力。
大数据、云计算在证券业的运用需要解决一些困难问题。1如何判断投资预测时的环境因素。大数据分析研究分为六个关键技术领域:结构化数据分析、文本数据分析、Web数据分析、多媒体数据分析、网络数据分析和移动数据分析。 See Min Chen, Shiwen Mao, Yunhao Liu Big Data: A Survey, Mobile Netw Appl 173-175 (2014).尽管大数据算法的精度依赖于技术的不断进步,但环境因素对结果的影响往往是大数据分析无法解决的,不考虑环境因素盲目依赖大数据可能会出现错误。特别是对于证券行业来说,环境因素不容忽视,投资环境、经济条件、政策变化,甚至人们的生活方式、消费习惯、购买行为都会对证券价格产生重大影响。2如何评估从大数据中挖掘出来的有效信息。由于大数据带来的信息混乱和数据类型变化,在数据存储和提取中可能会遇到困难。信息冗余和非结构化数据是大数据挖掘中遇到的主要问题。大量的信息使得服务器存储和后台处理在性能、可靠性和可管理性方面面临挑战,同时对有用信息的提取和转换也提出了更高的算法要求。此外,很难避免虚假信息,特别是在虚假信息传播速度更快、范围更广的公共平台上。当虚假信息多于真实信息时,大数据挖掘的结论可能会受到质疑。3如何应对“大数据傲慢”和算法的变化。谷歌曾经利用大数据来预测流感的趋势,它一开始成功了,但后来被证明是不可靠的。其中一位研究者大卫·拉泽说,解释这种现象有两个原因:“大数据傲慢”和算法的变化。换句话说,他们完全用大数据处理来取代传统的数据采集,而忽略了算法的变化,而算法的变化总是随着搜索引擎和内容的变化而变化的。动态环境使得大数据预测的准确性一直难以保证。一些学者认为,大数据只是从数据分析中得到结果和预测,会削弱事物之间的因果关系。因此,要防止把大数据神化,高估大数据预测的准确性。一定要记住大数据分析不等于完全正确的结论。4如何解决信息隐私、信息安全问题。大数据带来了信息披露的深度、广度和速度,从而引发了隐私和安全问题。 See Dengguo Feng, Min Zhang, Hao Li, Big data security and privacy protection, Journal of computer 246-259 (2014).证券业涉及范围广泛的商业交易,这种问题更加突出。一旦大数据服务器受到攻击,损失将是不可估量的,并且不可能得到补偿。因此,如何利用大数据,同时提高信息安全和隐私水平,是相关技术和立法中最重要的问题。
……