1. 首页
  2. 文章
  3. 兼职

做数据项目有一个不可避免的问题:如果没有数据怎么办?

编辑简介:做数据项目有一个不可避免的问题:如果没有数据怎么办?聪明的女人很难做饭,没有大米,没有数据,可以建造,可以找到,可以收集。本文的作者分享了四个技巧,我希望它,让我们来看看。
做数据项目有一个不可避免的问题:如果没有数据怎么办?
在做数据项目、解决业务问题、深入研究数据应用的过程中,我们通常遇到的最大问题是没有数据、数据和数据。
特别是在数据应用方面,不仅没有数据已经成为我们的困难,而且数据量也是困难之一。这个问题一直困扰着我,即使因为这个问题,我也经常被领导嘲笑什么也做不了,我不能说,左右困难,想想这一天真的很痛苦,聪明的女人没有米饭做饭!
所以我想到了很多妥协的解决方案,下面是我解决这些问题的小方法,与大家分享。
一、制造数据,先有再优。
如果我们有时会遇到一个刚刚建立起来的业务,我们将来还没有时间收集更多的数据,或者只有很少的数据,甚至根本没有数据,这种方法也可以首先使用,即根据业务逻辑模拟数据。
diyi步是获取业务数据库的表格结构。表格结构是数据表的基础,可以理解为Excel表格中表格的标题。表格结构提供业务内容的字段、数据类型和数据格式。根据表格结构构构建的数据更符合业务逻辑。如果业务中有多张表格,您还需要获得表格的相关性,即ER图。
退一万步,如果我们连表结构都拿不到,那就尽量拿到建表的SQL脚本,然后根据SQL脚本制作自己的表结构,这样制作出来的数据精度就会降低到更高的水平。无论如何,在知道会遇到什么问题之前,先采取行动。
第二步是开始制造数据。现在市场上有很多制造数据的工具。在产品经理协调技术合作伙伴制造数据所需的东西后,他们可以开始制造数据。有时制造的数据会有很大的偏差,然后手动调整制造的数据。
利用这种方法,首先制作符合业务需要的数据,并尝试用这些数据来解决问题。如果差异相对较大,则继续优化产生的数据,直到根据经验和测试比较估计的误差值减少。先有再好!
2、向内部团队求助,帮助做一些小工作。
如果我们制作的模拟数据很难说服领导,那就制作一些相当真实的业务数据吧。
以我做过的一个案例为例。
我们想应用景区流监测的应用,我去找了很多景区客流的图片,然后一个接一个,给算法团队做数据集。但仅仅依靠我,如果算法团队使用足够的数据,估计会累得吐血。
熟悉内幕的合作伙伴可能知道,有专门的数据供应公司外包这部分工作,或者经常发布一些兼职工作,成熟的数据标记人员每天可以看到超过1万张图片,所以如果有50人参与标记,两天可以标记超过100万张图片。
但令人尴尬的是,我们没有钱去找那么多外包合作伙伴。所以我启动了我们团队的UI、技术和算法工程师来完成这项工作。虽然我们不像成熟的标记员那样每天有10000张图片,但标记的数据集暂时足够了。当然,作为一名产品经理,我不能让别人白白工作。我还拿出了产品经理的利器:请喝奶茶!
三、利用搜商借用外部数据。
我不知道每个人都听说过搜索商这个词。当我diyi次听到这个词时,我突然觉得除了情商和智商,搜索商对产品经理也很重要。现在是信息爆炸的时代。你可以找到你想要的任何信息。
有很多方法可以得到数据,随便百度搜索就会发现各种类型的数据共享网站。
这里有三种数据共享平台!
1.免费科研数据共享平台。
1)CCF科研数据库。
CCF研究数据库主要是收集世界各地其他计算机方向研究团队提供的免费数据,简单翻译数据描述,然后免费提供给中国学者。任何学者都不太可能知道这么多的数据来源,更不用说有精力非常规范地整理这些数据,使搜索和下载非常快速和高效。
因此,CCF做了大多数人不愿或不能做的艰苦工作,通过服务需要数据的用户收取会员服务费。
2)国资平台-国信优易。
国信优益数据有限公司是由国家信息中心发起的混合所有制公司,主要希望利用国家拥有的数据,以数据资源和技术创新为动力,帮助国家大数据创新创业的发展。
3)数据堂。
事实上,数据厅以前是CCF的数据供应商,后来成立了一家专注于互联网综合数据服务的公司。对它感兴趣的朋友可以了解一下。
2.开放xx数据平台。
如果CCF研究数据库收集来自世界各地的数据,许多数据可能不符合中国的市场环境,也可能有许多虚假数据。那么,xx开放的数据具有很大的可信度和可用性。
现阶段,地方政务数字化建设如火如荼,沉淀了大量数据,都是婴儿疙瘩,xx也希望这些婴儿能发挥作用。
有各种各样的交易所。包括:贵阳大数据交易所、上海数据交易中心、浙江大数据交易中心、华中大数据交易平台
有许多成熟的xx数据开放平台。从作者接触的项目来看,各地都在加快这样一个平台的建设。如果你去百度搜索,会有很多。
做数据项目有一个不可避免的问题:如果没有数据怎么办?
3.全国流通数据目录平台。
如果xx开放的数据不够,那么数据类型就太社会化了,需要一些商业数据。这还不错,所以有一种产品叫做国家流通数据目录平台来解决这个问题。
这样的平台就像我们买衣服一样,把数据作为商品出售。企业或个人可以在不违法的前提下,在这个平台上销售或购买他们需要的数据。
这样的平台有:京东万象、数据星河、数据宝、阿里云数据市场、百度APIStore、数据淘、海洋数据服务平台…
更多的平台,可以百度,有心,总会找到的!
四、数据收集巧妙。
著名的红牛公司之前因为一句口号红牛给你一双翅膀而被起诉作弊。喝酒后,他们没有长出翅膀要求赔偿。最后,红牛公司与消费者达成和解协议,同意赔偿。
协议内容同意向2002年1月1日至2014年10月3日在美国购买红牛饮料的所有人支付赔偿。他们不需要提供发票。他们只需下载申请表并填写信息即可获得赔偿。赔偿总额为1300万,每个人能获得的赔偿总额除以人数。这类似于我们玩的支付宝五福。淘宝双11分20亿红包活动。可以想象,每个人都分不了多少钱。
当时,美国人蜂拥而至,在5天内获得了400多万申请表,留下了用户姓名、性别、银行卡号、年龄、电子邮件等数据。
就这样,红牛企业只用3美元就巧妙地获得了大量的消费者信息,而且绝对真实。
虽然我没有使用过这种方法,但红牛收集数据的想法仍然值得学习!
以上是我总结的解决无数据问题的小方法,可以制造,可以找到,可以收集,简而言之,一句谚语:活人还能被尿窒息!我希望它对你有用!

本文来自投稿,不代表立场,如若转载,请注明出处:http://www.ishiyama-honda.com/2047/