最近一直在讲数据产品的基础概念,我发现可以把这些基础概念进行串讲了。
今天,我就来重点讲讲:标签、维度、指标。
在开始讲之前,我想定个调:抽象的词,再怎么用文字解释也解释不清,我也无意构建对这些词的标准化的定义。
希望读者朋友们能跟我一样,借用费曼学习法,构建对这些抽象概念的理解。
如果觉得文章有用的话,欢迎点赞、在看、转发,让更多的人看到。(本文也引用了上篇文章的内容,如有巧合,纯属故意,帮你回顾下)
—1—什么是标签?标签,是为了描述事物、区分事物的某种缩略代指。
我们日常表达里,经常说的一个词是:贴标签。生动又形象,有一种贴便签纸、或者给某个人贴纸条的感觉。比如,做完核酸检测,小朋友往自己身上贴一个冰墩墩的卡通标签。人人都可以创标签。比如,每个人都可以用文字描述自己看到下面这两段话的感受:我家门口有两棵树,一棵是枣树,另一棵也是枣树。
情况就是这么个情况,具体什么情况,还是要相关部门介入去了解实际情况。
诸如「废话文学」、「没营养」等等,而这些描述性的内容,都可以用来打标签。再比如,产品经理回老家,如何给非互联网人的亲戚介绍自己呢?
你可以这么介绍:我们这些小经理,完全不管人只负责做事儿,搞互联网的起了这么个名儿也就是为了好听,天天加班干活,跟厂里其他普通员工一样的。
「不管人」、「只负责做事儿」、「为了好听」、「天天加班」、「跟厂里其他普通员工一样」,就可以提炼出来几个标签,给自己贴上。
标签比较具体,比较随意标签也是用来做区分和描述的,标签可以随意、很散装,可以很有创意性,也可以很有特异性,可以很长,也可以很短。「不出远门过五一」、「来拍照了」这些个标签放一起,就很有代表性了。其实,任何描述性的文本,都可以作为标签。它可以是成语,也可以是词语,也可以是不完整的句子。只不过,为了简洁性、易读性、传播性,我们通常会用更加短小精悍的文字来描述一类东西,观点更鲜明,更有穿透性。甚至也可以是形象、图片、符号,也能是标签。一个笑脸、一个红心、一个太阳就能代表很多很多,一图胜千言。当然,每个人都有自己的解读。另外提前说一句,标签和维度值的概念重叠度比较高。—2—什么是维度大家常说,物以类聚人以群分。
一个自然而然的逻辑是:先有物和人,再有类和群。
面对新事物,人类最自然的反应是将其描述出来,或者代指。对应到标签和维度上的话,一般来说,都是先打标签,再分类。
比如,印第安人的由来,其实哥伦布团队以为他们到了印度,然后用了这么个很像的词去命名的。印第安人称呼自己,大概也是印第安语的「俺们、咱们」,他们称呼哥伦布,可能也是老外。
我们习惯性会对事物进行打标签,但是当我们碰到了太多的新种类的东西,打的标签太多之后,这个时候要继续区分,就要整理和归总,就得要有「类」和「群」了。
维度是什么呢?简单理解就是上文的「类」和「群」。建立维度,其实是归纳归类,继续做了一层抽象。
最简单的维度,是二元的:是/否。比如,测过核酸/没测过核酸。
维度是灵活变通的,可以持续细化,不同维度可以相互组合的。
为了讲清楚维度,我不得不再引入一个相关的词,粒度。
粒度,其实就是描述事物、事情过程的细致程度。
为了更细粒度的分类描述,我们可以利用更多不同的前后缀修饰词创建新的维度。
就拿测核酸这个事情来举例。
假如一开始只区分是否测过核酸,后来病毒持续演进,抗疫成了持久战,后来开始区分时间:近0天、近7天、近天是否测过核酸。
后续为了更加精细化防控,再加上来小区的维度,那就变成:A小区近7天是否测过核酸、B小区近天是否测过核酸。
维度之间也可以合并和归总。
正向可以,反之亦然,我们也可以将细粒度的维度合并成更粗的维度。
如果一开始就高瞻远瞩,基于现实情况,设定了较为贴切的粒度,将统计的维度设置为近N天、小区、是否测核酸。
后续抗疫效果显著,粒度不需要再那么细,只需要按照月份、城市进行统计的时候,这些维度也可以归总:月份、城市、是否测过核酸。
维度的下钻和上卷
按照很多文章的说法,这个两个模块叫做维度的下钻和上卷。
但是,下钻和上卷比较抽象,我比较建议大家通过实际例子来构建自己的理解。
其实可以看到,维度和粒度之间相互影响、相互解释:维度越多,粒度越细。
为了方便,也可以将常见的特别细粒度的维度组合,合并成一个新的维度进行统称。
任何维度的设定,以及维度的下钻和上卷,都是基于我们想了解什么粒度的信息。
——什么是指标我们日常生活里,会听到很多的故事。有的故事很丰富,很精确,而有的故事,则很模糊,很朦胧。
丰富、精确,其实描述层面是模糊和朦胧的。
一个事情到底多好多赖,要基于某个标准或者数据进行明确的衡量、确定的度量(度量也是一个常见的词哈)。
指标,是为了客观量化某些事物,一般用数据表示。
比如下属给老板汇报:老板,这个季度我们的用户增长率很高,达到了%!老板反问,具体多少人呢?下属答曰:从到!
有了用数据描述的指标,这种一般性描述就真的很精确了,反映客观事实了。
—4—差别和联系维度和标签的差别,之前说过了,可以看这篇文章:数据产品经理必看知识:标签和维度
这篇文章重点讨论维度、标签和指标之间的联系和差别。
差别是:维度、标签用于分类,指标用于量化。
联系是:维度、标签和指标需要一起出现、共同描述客观事物和过程。
如果只有光光的指标,什么维度和标签都没有,那读者可以脑补维度,或者自动认为是认知范围里面的全部。
比如,北京奥运会总人数是人。
大家就会疑问了:哪届奥运会?这个总人数指的是什么人?运动员还是开幕式演职人员?
而下面这个就比较清晰了:
北京冬奥会中国代表团总人数为87人,其中运动员人,教练员、领队、科医人员等运动队工作人员人,团部工作人员47人
(标黄的是指标,下划线部分是标签或者维度值)。
—5—为什么会出现标签为什么会出现标签?
有时候数据很简单,穷举很容易。
比如,冬奥会奖牌榜上(金牌)前三名分别是:挪威队(16枚)、德国(12枚)、中国(9枚)。
但有时候,数据很多,且大家不想知道全部的细节。比如,只