本文由iCDO(互联网数据官)翻译志愿者原创翻译。翻译:董梁
(原文为19个数据源,但因为其中两个网站链接失效,故删除。)
Kyle的注释: 数据是分享洞察、支持创意和发现意外趋势的有效方法。许多人回避使用数据,觉得数据似乎难以处理和收集。Ritika Puri的这篇文章为您提供了丰富、易于理解和便于访问的数据源。
对于内容营销来说,数据是非常强大的工具。统计数据可以用来支持您所做的陈述,图表可用作可视化内容并吸引受众。几乎所有最受欢迎的信息图都基于数据和统计来传达信息。在阅读本文时,请记录下那些对您的内容营销有用的数据源。
对于任何使用信息图、数据和统计优化内容的人来说,这是一个很棒的文章。
我们面临的最大挑战之一是我们的观点、看法往往局限于直接经验。这就是需要使用数据的地方:展示我们“眼睛”看不到的死角。数据是我们走出舒适区并挑战自我假设的最佳方法之一。
然而,我们在互联网上遇到的大多数数据往往不够客观。通常,“有私心”的营销人员以可信的调查为幌子发布公关研究。由于代表性不足的样本、零有效性测试,和最小可靠度等指标的问题可能会造成研究结果混淆视听。
不要让糟糕的数据拖累一个超棒的营销活动。(查看微博http://ctt.ec/0kwU2)
仔细选择您的数据源,注意检索信息的关键词/条件。无论您是否正在检查,遵循数据来源将引导您通向正确的方向:
- 一个新的商业风险投资市场
- 研究有用的基于数据的内容
- 创建信息图
1.The U.S. Census
如果您想要查询人口统计数据,先来看看美国人口普查(U.S.Census)吧。多年来,营销研究公司使用这些数据来回答关于商店位置、人口模式增长、就业、通勤时间、教育等问题。如果您想了解某个特定消费群体或地理位置的情况,美国人口普查(U.S.Census)网站一定不容错过。您甚至可以使用像ArcGIS这样的工具在地图上验证普查数据,其权威性如同您通过“纽约时报”看到的效果那样。
2.Pew Center
(http://www.pewresearch.org/topics/)
多年来,皮尤中心(Pew Center) 一直在进行和发布有关政治、健康、收入、社会价值观、社交媒体和在线消费者行为的调查。例如,当您正在围绕数字鸿沟的变化寻找详尽的宏观层面的趋势时,就去查找这些报告和数据集。这些信息将为您提供宏观层面的美国消费者行为的社会趋势。请在您的博客文章、投资者报告、白皮书和信息图表中使用此数据源。
3.Think With Google
(https://www.thinkwithgoogle.com/tools/)
如果您需要一些演示文稿的基准或者想要分析广告行业的趋势,请查看Google研究工具的汇总。这些信息可以帮助您了解消费者的在线行为,以及在哪里购买您品牌的产品或服务。它可能为创业者提供产生营销活动创意(例如针对移动端或YouTube使用)的关键信息。您甚至可以使用Google的工具来创建演示所用的信息图表。
4.Factual
Factual拥有来自世界各地超过6500万个位置的数据。通过Factual,您将获得的是一个提供位置信息的货真价实的大数据集。您可以使用这些数据来支持产品开发、研究或广告营销活动。虽然Factual的数据是付费产品,但潜在用户可以申请免费的API密钥。您可以使用此数据对那些业务相关的位置进行研究。
5.美国政府数据Data.gov
如果您正在查找美国政府的数据,先看看这里吧。该平台拥有多种格式的海量数据集。您可以浏览与消费者、健康、商业、气候、制造甚至农业主题相关的数据。企业可以将此数据源用于一般性行业研究。
6.国际政治和社会研究联盟 ICPSR
(https://www.icpsr.umich.edu/)
国际政治和社会研究联盟(ICPSR)收录了来自760多所大学、政府机构和其他机构的政治和社会研究数据。数据库中有8000多项调查研究,但请务必仔细检查许可条款,以确保数据集可供商业使用。要访问ICPSR的数据,您需要成为其中一个参与机构的成员。请联系您的大学校友办公室以确认您是否符合资格。
7.可编程网Programmable Web
(http://www.programmableweb.com/)
想要查找API?可以在这里查看关于API的几乎各种使用案例的目录。从旅游到社交媒体、体育,赌博,食物,财务和音乐,您都可以通过浏览本网站找到所需的API。不过请注意,您需要使用API provider检查每个列表。因为,可编程网(ProgrammableWeb)上的API列表可能已经过期。另外,您可能使用免费权限导致访问受限。如果您想要高级功能,则可能需要付费访问。这个资源能够帮助创业者找到能够更快速完成商务计划的API。
8.纽约时报The New York Times
(http://developer.nytimes.com/docs)
如果您想要查找与内容有关的数据,“纽约时报”(American New York Times)有一个API,可以访问1851年以来的文章。您可以检索与书籍、竞选经费、社区评论、地理位置甚至活动列表相关的信息。这些数据对于基于内容的研究特别有用。
9.谷歌公共数据浏览器 Google Public Data Explorer
(http://www.google.com/publicdata/directory)
如果您正在查找与全球人口趋势相关的数据,请使用Google’sPublic Data Explorer开始您的搜索吧。您可以在这里浏览很多关于世界发展指数和经济数据的数据源,比如欧盟统计局(Eurostat),德国联邦统计局(Destatis),爱尔兰中央统计局(Central Statistics Office ofIreland)和世界银行(TheWorld Bank)。该资源对需要查寻国家级数据的任何人都有帮助。
10.Webscraper.io
Webscraper.io本身不是数据集。它是一个Web插件,您可以使用它抓取相关网站并创建自己的数据集。使用免费的Chrome扩展程序,您可以通过CSV获取想要导出的数据。无需手动收集数据,推荐使用这个资源。
11.LendingClub
(https://www.lendingclub.com/info/download-data.action)
LendingClub持续收集贷款市场的的公共数据集。您可以通过浏览被拒绝的贷款申请和进行中的贷款申请,了解人们需要的贷款类型和原因。这些数据可能有助于一般行业研究,甚至还有助于内容营销。
12.Yahoo! Webscope
(http://webscope.sandbox.yahoo.com/index.php)
雅虎实验室为非商业用途提供一个“科学有用”的数据库。您可以研究与语言、社交媒体行为、计算机系统和图像有关的信息。所有数据集已经过审查,符合雅虎的数据保护标准,包括对隐私的严格控制。此数据仅用于个人学习,请不要在商业上使用。
13.Public Datasets on AWS
(http://aws.amazon.com/public-data-sets/)
云端存储提供商拥有许多可免费访问的公共数据集。受欢迎的公共数据集(publicdata sets)包括中等分辨率卫星图像、NASANEX、网络爬行数据和人类遗传变异的详细图谱的集合。如果您使用其中的任何数据集,请注意查看每个数据源的条款和条件。
14.Reddit Datasets
(http://www.reddit.com/r/datasets/new/)
如果您正在寻找研究报告,请试试Reddit社区中的数据集合吧。您可以根据最新、最热、上升或有争议等多个维度筛选数据集。这些数据集包括澳大利亚的酒精饮料、德克萨斯州的饮水资料和开放的网络爬虫等,推荐使用该资源来监测和发现可能与业务相关的数据集。
15.Complete Hacker News History
(https://github.com/arnauddri/hn)
该项目包含有关顶级故事、队列、提交内容、活跃用户,字数和业力的相关信息。您可以使用此数据来了解全球创业社区中受欢迎的内容类型。创业者可以利用这一资源来确定公关机会,并分析流行的内容类型。
16.Quandl
该平台提供了从比特币接受度到商品、市场、货币、汽油和金属等各种主题的免费数据。虽然许多数据集可免费提供,但公司通过向niche来源提供有偿访问来获利。该资源有助于对特定行业感兴趣的创业者。
17.Datahub
(http://datahub.io/organization)
该资源汇聚了来自世界各地的数据源,由开放知识基金会(Open Knowledge Foundation)提供支持。从开放的考古学到药物使用数据,您将能够找到随机的信息收集。但是,该网站浏览体验不太好,许多数据集描述都是模糊的。请将您的搜索限制到一组非常具体的信息。
结语
如果您想要查询具体的相关业务数据,查看自己内部的客户数据集是最好不过了。请负责工程或数据科学的同事帮助您检索所需信息,以应对业务上的挑战。无论您在哪里采购数据,那些背景信息都至关重要,请确保仔细检查您考虑使用的每个资源的方法和使用权。