近日,国内领先的对冲基金公司「幻方」宣布,其新一代AI超级计算机“萤火一号”,已于2020年3月正式投入运行。 该服务器是由一个存储集群和一个计算集群组成。存储集群提供4.1Tbps读写带宽以及1.2PB容量。计算集群搭载1100张高端显卡,每秒可以进行1.84亿亿次浮点运算,相当于4万台个人电脑算力。 在全球著名对冲基金Two Sigma的主页上,公司介绍中写到,只有基于数据的、不断优化迭代的科学方法才是最好投资方式。他们使用42 PB(1PB=1000TB,1TB=1000GB)数据用于投资模型,涵盖了10000个以上的数据源,并使用33万个CPU以上的集群处理数据。 数字化时代 数字化时代,基于传统统计、计量的方法已无法处理如此大的数据量。而机器学习、深度学习的优势随着大数据、计算机处理能力的飞速发展逐渐展现出来。 数据驱动的量化策略,是指通过相关数据,直接识别金融市场的模式或规律,寻找投资机会,这一直是对冲基金主流的策略模式之一。在数字化时代,这类策略将越来越得到重视,而机器学习自然是这类策略主要的技术与方法之一。 全球每年数据增长表 数据近几十年都一直在指数级增长, 当5G全面普及,物联网中各样设备接入互联网,每年产生的数据还将几何式爆炸增长。 IDC预计,到2025年全球数据每年将达到163ZB。 随着石油的价格一降再降,将数据比作世界上最有价值的资源,已然没有任何疑问。 数据将使我们有机会改进我们的决策,在经济、社会中的作用将更加举足轻重。越来越多的公司使用这些数据用于企业自身决策,并为他们的客户提供更好的服务。那些能够充分利用数据为用户服务,解决问题的企业将会在新的竞争中脱颖而出。 在金融投资领域亦是如此,来自手机、社交媒体、物联网各式传感器的数据,将对金融投资机构的数据处理能力提出挑战。 能收集更大范围、更实时的数据,并有能力处理分析并发现新投资价值的机构,必将获得更强的竞争力。 数据是墙壁上的投影 信息是用来消除随机不确定性的东西。 —— 香农(Shannon) 柏拉图在《理想国》中有一个著名的比喻——洞穴之喻(Allegory of the Cave)。 设想在一个地穴中有一批囚徒,他们自小被锁链束缚,不能转头,只能看见面前洞壁上的影子。 在他们后上方有一堆火,有一条横贯洞穴的小道,沿小道筑有一堵矮墙,如同木偶戏的屏风。 人们扛着各种器具走过墙后的小道,而火光便把那些器物的影像投射到面前的洞壁上,囚徒自然地以为影子是惟一真实的事物。 |