「模型」这个词可以说是和闭环、赋能、产业互联网、打法、去中心化等并列近年热门(huibao)词汇了。词汇本无措,是人们用错了地方才让词汇背了锅,今天我们来聊下「模型」这个词的意思、使用现状和错误示范~
01什么是模型(Model)
按照wiki的定义,模型是指对于某个实际问题或客观事物、规律进行抽象后的一种形式化表达方式
这里要划的重点是:抽象!模型是可以简化人们的认知成本,有助于人们拨开庞杂细节和迷雾,理解客观事物的。
比如说我们看这个胖橘猫,可以每个爱撸猫的盆友都觉得自家的橘猫天下最美、独一无二,但是在一个对猫无感的人眼中,橘猫的各种特点就集合为两个词:橘色、胖,于是如果让这个人画一个橘猫(「建模」),TA有可能画了一个类似加菲猫的喵~(这就引出后面会说的话题,引入不完全或者错误的特征变量会导致模型的解释度不高)。
模型这个词英文叫model,和中文中模特也是一个意思,其实很好理解,再回想模型的定义——对于某个实际问题或客观事物、规律进行抽象后的一种形式化表达方式。
模特的身材大概率符合传统美学,可以很好的展示衣物的特质,是不是就可以对客观事物(衣服)可以进行抽象化表达了,人们的注意力可以放在衣服上(解释为什么很多模特走秀时不笑)。
我觉得一个好模特应该是可以为不同风格品牌走秀的,比如我很喜欢的大表姐刘雯,可以走大牌秀,本土的品牌例如Dazzle、鄂尔多斯、运动品牌Puma也驾驭的很好。
左dazzle右维密
02模型和建模听起来高深啊,是不是我八辈子都学不会啊!
不,你会!而且从小学开始解一元一次方程就会!
曾经我也以为建模很难,但其实我们都接触过,建模这个概念不难理解,但是如何用模型来解释、预测客观世界的复杂难题就另说了。
建模就是建立数学模型(modeling)简单理解呢就是小学应用题列方程/公式的过程,把客观抽象为符号表述。我们看下面计算基础代谢率的例子,基础代谢率可以简化理解成如下:
y=ax1+bx2+cx3+d的函数其中:y是要计算的基础代谢率,是因变量(dependentvariable)x1、x2、x3是自变量(independentvariable/argument),分别代表体重、身高、年龄a、b、c是系数(parameter)a=9.6说明体重每涨一公斤,基础代谢率上升9.6d是常数项
在我研究生上的统计建模课上,我们组最后的finalproject作用应用了课上学的因子、聚类、决策树模型和逻辑回归模型,选题是预测休克概率。
我记得因变量有各种血压、血糖等医学指标,分析和后面的presentation做的还满好的,得到了老师的邮件表扬。
刚刚讲到了建模、参数、因变量、自变量等基本概念,现在讲讲什么才是一个好的模型呢?
我们本文的技术顾问小斐如是说:
理解好问题,找到合适的方法,有些固定的场景比如推荐,那就主要是算法里面的问题,要最优和计算效率,还有数据一定要有充分的数据才能做好模型!数据决定模型的上限,算法决定模型的下限。
我们来理解一下,除了数据,其实我觉得建模也是很需要想象力和敏感度的,比如去做假设,基础代谢率是不是还跟其他变量有关:头发长短、手指长度、眼睛大小等等(别怀疑,我在一本正经的胡说八道,举个例子)所以模型也是要不断迭代跟进才能更好的拟合已有数据(训练数据)和做预测的~
为什么数据建模师会戏称自己会调参侠呢?
因为模型需要迭代,通过训练数据调整模型参数,使模型对于数据的拟合程度提高~
通过这个案例,可以看出模型的作用有:
抽象简化:有一些现实中的过程,比较复杂,难以理解或预测。我们设法对其做一些简化,抽象成一个数学能够处理的模型,比如基础代谢率的计算。描述/预测:抽象成模型后,处理这个模型可以进行预测,或者对已有的现象提出机理上的解释。模型会帮助解释一个系统,研究不同组成部分的影响,以及对行为做出预测。好模型不一定很复杂,根据奥卡姆剃刀原理,相同解释度的情况下,选择越简单的模型越好。
03是不是只有数学模型啊?怎么老板让我做各种看不懂的英文字母的模型分析啊!!
不得不说模型这个词有被滥用的趋势,不是整几个英文单词,弄个缩写就可以叫做模型的,SxxxBxxx不能叫SB模型,SB最多是个缩写。
但是在社会科学中,确实有商业分析模型、认知模型和思维模型等等,回归定义,建模的本质在于抽象,即将你