美国VC使用什么数据分析工具?

简介:        长期以来,创业投资的方法被当做一门艺术在一个相对小的圈子内流传。富有经验的 VC 往往喜欢将自己的成功归因于这门艺术的历久弥新,而识人术又是这门艺术的重中之重。一个初创公司的团队 (team),还是产品 (product),抑或是市场 / 产品吸引力 (traction),都会被作为重要指标而影响每一个 VC 的投资决策。
0.jpg

       长期以来,创业投资的方法被当做一门艺术在一个相对小的圈子内流传。富有经验的 VC 往往喜欢将自己的成功归因于这门艺术的历久弥新,而识人术又是这门艺术的重中之重。一个初创公司的团队 (team),还是产品 (product),抑或是市场 / 产品吸引力 (traction),都会被作为重要指标而影响每一个 VC 的投资决策。

  对于一个初创公司而言 (尤其是尚处早期的团队 early-stage startup),除了有可能实际存在的产品外 (算上半成品及开发原型),剩下的指标都可以说是虚无缥缈。人们早已习惯了如此的筛选机制:投资人在乎的是感觉,看顺眼或许比产品概念更为受用。至于这套机制是否成功,则需另当别论:美国风投协会(National Venture Capital Association) 的一组数据显示,在 21 世纪的第一个十年内,美国创投业的总体回报率为负数。在这个大数据概念横行的时代,像创投业这样长期位于科技行业风口浪尖并且耳濡目染各种新科技的行业,要把数据分析结合进传统做法中的尝试也已是老调新弹。

  数据分析被广泛地应用于各行各业,尤其在金融业中。资产管理公司 (asset management) 和基金公司们早在数十年前便已大规模地应用数学理论来衡量公司投资产品的质量以及预测未来的市场表现。而与之一墙之隔、同属金融行业的 VC 公司们,使用数据分析来量化评估投资看起来也应该是一件理所应当的事。

  我们之前也数次讨论过数据分析对风投领域可能产生的影响和价值。以 Google Ventures 为代表,包括我们耳熟能详的 KPCB 和红杉资本 (Sequoia Capital) 在内的一众创投对数据分析投资的兴趣已经持续了好几年,而像 IronStone 这样的业界新人和 YC 这样的孵化器大佬也已投身其中,即使业界至今对于“计算机算法是否能够发现下一个乔布斯”这样的问题还未达成共识。纵使像 Google Ventures 这样背后有“数据公司”谷歌的全球最大数据库和云计算做靠山的高富帅,也尚未得到能够放之四海而皆准的标准公式,而如何更准确地量化团队的化学反应及产品的市场吸引力等等因素还是一个亟待解决的行业性问题。

  不过 Google Ventures 声称他们已经在数据分析上获取了相当的进展。他们拒绝公开成果,不过综合各方面信息看来,Google Ventures 的公式或许并没有想象得那么高深:他们通过分析运用诸如创业城市、团队平均年龄、过往创业经历这样的因素来考量每一个潜在的投资机会。不过 Mark Zuckerberg 在成立 Facebook 前只卖过产品原型而无创业经历,甚至 Google Ventures 的俩老板,Larry Page 和 Sergey Brin,如果要用这么一个算法来评测,估计也难以过关。Google Ventures 也颇有自知之明,看感觉 (intuition) 和看顺眼 (chemistry) 仍是他们在投资决策中颇为重要的考量因素。

  KPCB 和红杉这样的高级玩家也尝试过通过分析创业公司在 Twitter 上被提及次数,或者创业公司产品 App Store 排名这样的数据来分析一家创业公司的价值。而 IronStone,这家由William Hambrecht创立的被视为异类的创投,在数据分析上走得比同行们更远更快。根据一些已经公布的信息,他们声称一个创业公司的团队因素只会在他们的整个考量过程中占到 12%,即使团队和人员长期以来被传统创投视为最为重要的一项影响因素;而另外 20% 被分给了创业公司的其他各项指标,余下的 68% 则全部被市场因素占用:将要进入的市场的环境、公司的调整周期、市场的变化是否可被预期等等。

  目前已知的或公开声称正在或将要使用数量分析来投初创公司的主要机构包括上文提及的 Google Ventures、KPCB、Sequoia Capital、IronStone、Y Combinator,以及 500Startups、August Capital、Accel Partners、Andreessen Horowitz、Floodgate Fund、Greylock Partners、SVAngel 等等。其中,Accel Partners 专门拨出 1 亿美元作为大数据基金 (Big Data Fund),而 Greylock 已在使用其内部数据团队制作的专有数据分析工具。Google+、Facebook 和 Twitter 等社交网络是目前被作为数据采集的主要源头。

  传统的 VC 决策流程,可以大致划分为 5 个阶段:

  潜在的市场有多大?

  潜在的市场机会有多少?能从竞争对手处抢到多少市场份额?

  潜在的商业模型是什么?营收和利润能达到什么水平?

  保守估计,潜在的运营/产品成本有多少?通过这轮融资能够满足团队运营的周期?

  5至10年内是否会有潜在的退出机会或IPO机会?

  最重要的是大部分 VC 在拍板前,还会自问:我是否喜欢这个团队 / 这个团队是否值得投资?

  而在引入了数据分析之后,这个流程会受到什么样的影响?下图是我根据经验以及整理各个 VC 大佬们的文章后制作的一张图表,反映了美国的主流 VC 在不同投资阶段主要用到的有关数据分析的工具。

  

1.jpg


  举例来说,一家提倡数据分析投资并专注于早期投资 (early stage/seed stage) 的 VC 会在初期寻找投资目标时通过AngelListSeedsummit这样的初创公司数据库进行海选,之后利用CapLinked之类的流程管理平台建立联系关系网并设定一定的筛选投资流程。目前针对早期公司的量化评估还未出现什么靠谱的工具,不过有些 VC 会用一个叫YouNoodle的来搜集一个初创公司的竞争对手的信息,以此评估该团队的市场竞争力。OwnYourVenture则提供了一个平台,VC 和创业者可以在输入相关数据后得出几轮投资后的股权价值分配情况。而在某轮融资结束后,VC 可以自建数据库以跟踪所投公司的运营,也可以通过Startup Genome这样的平台来跟踪公司信息或当地创业市场。

  在此不得不重点介绍下CB InsightsPitchBook。CB Insights 作为一家有着金融行业背景的纽约初创数据公司,在集成行业数据和数据分析上做得相当出色,他们定期的行业数据分析报告为 VC 和其他相关媒体机构广为应用,而他们推出的不少可视化数据分析工具也颇有价值。PitchBook 也有着出色的可视化数据平台,但是他们的产品则针对各初创公司提供了更为具体的信息,丰富的 VC 数据库也为创业者和投资者们提供了检视各家 VC 具体信息的平台。当然,36Kr+数据库对于国内的 VC 和创业者们来说是一个很好的工具,我们也会不断改进完善我们的数据库、添加新的功能,以更好地服务国内的创业者和投资人们。

2.jpg
CB Insights的可视化数据库


3.jpg
PitchBook所提供的VC信息界面

  凭心而论,目前这种规模的数据分析或许无从谈及大数据,但是倘若将待分析的数据库规模扩大 10 倍,甚至 100 倍,大数据这样的技术就足以让极大地提高创投的反应速度,而至于结果的质量,或许需要一个相对长的时间来给我们答案。移动技术快速发展产生的大量数据则是一个很好的案例。都说移动技术的发展正在极大地改变每一个行业、甚至每一个人的生活,这一样可以用在创投界。大数据的时代才刚刚来临,而移动互联网和移动设备产生数据的能力和潜力是难以预估的,最好的例子便是在刚过去的双十一里,淘宝有15%的交易额来自移动端。对于想要掌握用户需求和习惯的创业者,以及希望发现有成长潜力的产品和创业者的 VC 们来说,这个时代或许会是一个前所未有的黄金时期。

  对 VC 来说,手头有了数据之后,问题就在如何有效地分析数据并量化评估标准。举例来说,一个房地产投资人可以用Case Shiller房价指数这样的量化指标来衡量当前的市场环境,用公开数据和政府文件来评估某家具体开发公司的运营状况;而专注于投资上市公司的投资者,简单的标普 500 指数和某家公司的市盈率就能勾画出一个投资机会的轮廓。对于 VC 和天使投资人来说,这样的画面在投初创公司的时候是难以想象的。VC 的尽职调查 (Due Diligence) 很多时候只能通过投资者的人际网交流和主观感受来完成,而不是像投行们那样甩出成摞的 Excel 和精美的尽职调查报告。纵使诸如 CB Insights、Crunchbase、AngelList 这样的数据平台的大量出现能够改变 VC 们以往那种缺乏数据的生活,但是如何选择数据、如何将数据转换成有用的信息,则是 VC 们的下一个难题。

原文发布时间为:2013-12-21


本文来自云栖社区合作伙伴“大数据文摘”,了解相关信息可以关注“BigDataDigest”微信公众号

相关实践学习
简单用户画像分析
本场景主要介绍基于海量日志数据进行简单用户画像分析为背景,如何通过使用DataWorks完成数据采集 、加工数据、配置数据质量监控和数据可视化展现等任务。
SaaS 模式云数据仓库必修课
本课程由阿里云开发者社区和阿里云大数据团队共同出品,是SaaS模式云原生数据仓库领导者MaxCompute核心课程。本课程由阿里云资深产品和技术专家们从概念到方法,从场景到实践,体系化的将阿里巴巴飞天大数据平台10多年的经过验证的方法与实践深入浅出的讲给开发者们。帮助大数据开发者快速了解并掌握SaaS模式的云原生的数据仓库,助力开发者学习了解先进的技术栈,并能在实际业务中敏捷的进行大数据分析,赋能企业业务。 通过本课程可以了解SaaS模式云原生数据仓库领导者MaxCompute核心功能及典型适用场景,可应用MaxCompute实现数仓搭建,快速进行大数据分析。适合大数据工程师、大数据分析师 大量数据需要处理、存储和管理,需要搭建数据仓库?学它! 没有足够人员和经验来运维大数据平台,不想自建IDC买机器,需要免运维的大数据平台?会SQL就等于会大数据?学它! 想知道大数据用得对不对,想用更少的钱得到持续演进的数仓能力?获得极致弹性的计算资源和更好的性能,以及持续保护数据安全的生产环境?学它! 想要获得灵活的分析能力,快速洞察数据规律特征?想要兼得数据湖的灵活性与数据仓库的成长性?学它! 出品人:阿里云大数据产品及研发团队专家 产品 MaxCompute 官网 https://www.aliyun.com/product/odps 
相关文章
|
4月前
|
JSON 数据挖掘 API
结合数据分析工具,深入挖掘淘宝API接口的商业价值
随着电子商务的蓬勃发展,淘宝作为国内领先的电商平台,不仅为消费者提供了便捷的购物环境,同时也为开发者和数据分析师提供了丰富的数据资源。通过有效地调用淘宝API接口获取商品详情,再结合数据分析工具进行深入的数据挖掘,可以为商家、市场分析师及研究人员等带来巨大的商业价值
|
5月前
|
数据采集 数据可视化 数据挖掘
2019 年排名前6的数据分析工具
2019 年排名前6的数据分析工具
|
4月前
|
数据可视化 数据挖掘 Java
提升代码质量与效率的利器——SonarQube静态代码分析工具从数据到洞察:探索Python数据分析与科学计算库
在现代软件开发中,保证代码质量是至关重要的。本文将介绍SonarQube静态代码分析工具的概念及其实践应用。通过使用SonarQube,开发团队可以及时发现和修复代码中的问题,提高代码质量,从而加速开发过程并减少后期维护成本。 在当今信息爆炸的时代,数据分析和科学计算成为了决策和创新的核心。本文将介绍Python中强大的数据分析与科学计算库,包括NumPy、Pandas和Matplotlib,帮助读者快速掌握这些工具的基本用法和应用场景。无论是数据处理、可视化还是统计分析,Python提供了丰富的功能和灵活性,使得数据分析变得更加简便高效。
|
4月前
|
数据挖掘 数据安全/隐私保护 Python
【Python数据分析】<数据分析工具>基于Excel的数据分析
【1月更文挑战第22天】【Python数据分析】<数据分析工具>基于Excel的数据分析
|
6月前
|
数据挖掘 Python
【Python】数据分析:结构化数分工具 Pandas | Series 与 DataFrame | 读取CSV文件数据
【Python】数据分析:结构化数分工具 Pandas | Series 与 DataFrame | 读取CSV文件数据
51 1
|
8天前
|
数据采集 数据可视化 数据挖掘
R语言与Python:比较两种数据分析工具
【4月更文挑战第25天】R语言和Python是目前最流行的两种数据分析工具。本文将对这两种工具进行比较,包括它们的历史、特点、应用场景、社区支持、学习资源、性能等方面,以帮助读者更好地了解和选择适合自己的数据分析工具。
|
14天前
|
机器学习/深度学习 数据挖掘 计算机视觉
python数据分析工具SciPy
【4月更文挑战第15天】SciPy是Python的开源库,用于数学、科学和工程计算,基于NumPy扩展了优化、线性代数、积分、插值、特殊函数、信号处理、图像处理和常微分方程求解等功能。它包含优化、线性代数、积分、信号和图像处理等多个模块。通过SciPy,可以方便地执行各种科学计算任务。例如,计算高斯分布的PDF,需要结合NumPy使用。要安装SciPy,可以使用`pip install scipy`命令。这个库极大地丰富了Python在科学计算领域的应用。
13 1
|
15天前
|
数据可视化 数据挖掘 Python
Python中数据分析工具Matplotlib
【4月更文挑战第14天】Matplotlib是Python的数据可视化库,能生成多种图表,如折线图、柱状图等。以下是一个绘制简单折线图的代码示例: ```python import matplotlib.pyplot as plt x = [1, 2, 3, 4, 5] y = [2, 4, 6, 8, 10] plt.figure() plt.plot(x, y) plt.title('简单折线图') plt.xlabel('X轴') plt.ylabel('Y轴') plt.show() ```
13 1
|
15天前
|
数据采集 SQL 数据可视化
Python数据分析工具Pandas
【4月更文挑战第14天】Pandas是Python的数据分析库,提供Series和DataFrame数据结构,用于高效处理标记数据。它支持从多种数据源加载数据,包括CSV、Excel和SQL。功能包括数据清洗(处理缺失值、异常值)、数据操作(切片、过滤、分组)、时间序列分析及与Matplotlib等库集成进行数据可视化。其高性能底层基于NumPy,适合大型数据集处理。通过加载数据、清洗、分析和可视化,Pandas简化了数据分析流程。广泛的学习资源使其成为数据分析初学者的理想选择。
15 1
|
2月前
|
SQL 机器学习/深度学习 NoSQL
常用的数据分析方法和工具有哪些?
随着大数据时代的到来,数据分析也逐渐成为了各企业、组织以及个人的必要技能之一。但是数据分析在进行过程中,我们往往会遇到各种各样的问题,比如面对不同类型的数据,如何进行有效的分析?今天和大家分享一些常见的数据分析方法和工具,希望对大家有所帮助。