CMU数据科学家为你揭开长胖的奥秘 | 数据留心

作者:Sylvia    编辑:Anya

前情提要 👀

现在的年轻人越来越注意自己的身材,会经常光顾健身房、吃减肥餐,可你知道对身材的关注要从娃娃抓起吗?你知道小时候的体型与未来息息相关吗?本期小性感就带大家跟随卡内基梅隆大学、剑桥大学数据科学家的脚步,看如何用成长曲线判断孩子们的超重或肥胖,又如何利用线性回归模型找到预测未来肥胖倾向的因素。

“五月不减肥,六月徒伤悲”,又是一年五月,爱美的妹子们纷纷加入减肥大军,为能塞进去年的裙子而奋斗着。

目前国际上普遍采用身体质量指数(BMI)来衡量人体的胖瘦程度以及是否健康。

下图是成年人的BMI标准,根据上方第二行找到自己对应的体重数,再根据左侧第二列找到自己对应身高数,就可以确定BMI指数属于哪一区间了,如果在绿色范围内则说明你很优秀哦~

△成年人身体质量指数BMI标准表

然而与此同时,有一群小胖墩正在全家的呵护中大快朵颐,家长们恨不能把世间最美味的食物都给他们,认为小孩子胖胖的才惹人疼爱,殊不知却为他们带来了超重甚至肥胖的危险。肉肉一旦沾上身就很难被甩掉,将会为成年后的他们带来许多烦恼。本期小性感将带大家关注这一常常被忽视的问题——儿童肥胖,看大数据如何预测长肉趋势,向肥胖说NO还要从娃娃抓起。

△正在努力抢救身材的小胖们

儿童肥胖问题不容小觑,它不仅对儿童的身体发育十分不利,更是会影响他们成年之后的健康;而这一问题在我国更是有恶化的趋势——仅仅是从1985到2014年这30年时间,我国学龄儿童超重与肥胖总人数由615万人增至3496万人,超重率、肥胖率也都大幅提高。从下面的变化趋势图中可以直观地感受问题的恶化。

同样,在美国,肥胖已经成为公共健康领域的主要问题之一。科学家们预测,按照现在的发展趋势,到2030年美国将有接近一半的成年人面临肥胖的困扰。认识到这一问题的严峻性,来自卡内基梅隆大学、剑桥大学和埃森哲公司的四位数据科学家携手芝加哥北岸大学医疗卫生体系(NorthShore)合作完成这一项目,希望通过数据分析技术帮助人们通过早期干预措施来防止青少年乃至成年时期的肥胖问题。

△本次研究的分析思路导图

 怎样算是“肥胖”?

要预防肥胖,首先要知道肥胖的标准是什么。数据科学家们参照了美国疾病控制与预防中心(CDC)的成长曲线图:

△ 美国男孩体重随年龄增长曲线图

这个图主要反映的是美国男孩体重随年龄而变化的趋势,以图中的红点为例,该点代表一个体重为70磅的8岁男孩,他的数据落在了90%这条百分位曲线上,意味着他比90%的同龄人重一些。从图上可以看出,早年男孩们的体重差距很小,而到了后期差距却越来越大。儿科医生会定期检查记录孩子的身高和体重,绘制出成长曲线图,并通过百分位线与其他同龄人对比,判断孩子是否超重。根据CDC的儿童肥胖标准,超过85%百分位线就可以被认定为超重,而超过95%百分位线则是肥胖。

NorthShore的科学家采用了电子病历系统(EMR),使用23000名儿童过去6年的身高和体重数据,绘制了一张类似的年龄与BMI的关系图,并将CDC的数据用虚线加入到图表中进行比较。

△  NorthShore 18岁以下男性病人的BMI曲线(实线)与CDC样本线(虚线)的比较图

上面就是NorthShore绘制的图表。从上图可以发现,NorthShore的85%曲线(天蓝色实线)与CDC的95%曲线(肥胖线,深蓝色虚线)基本重合,说明有15%的男生肥胖;NorthShore的75%曲线(绿色实线)与CDC 的85%曲线(超重线,天蓝色虚线)基本重合,意味着有10%的男生超重。

NorthShore曲线明显高于CDC曲线可能的原因有两个,一是NorthShore男生的脂肪含量高于全国的同龄人,二是CDC的样本曲线是根据90年代男生的体型数据得出的,而随着生活水平不断提高,孩子们发育也更加迅速,CDC曲线已不再适合作为衡量标准。

 一朝胖则终身胖吗?

经过前面的初步分析后,数据科学家产生了疑问:小时候胖的人会一直胖下去吗?如何由他们目前的体重预测将来肥胖的可能性呢?

△三位5岁超重患者的成长曲线图

从三个儿童扩展开来,研究人员选出所有体重超过85%(即BMI大于17.3)的五岁男孩,并将他们未来三年的体重变化与NorthShore的其他孩子比较。发现其中有64%的男孩会继续保持超重或肥胖,但另外的36%会逐渐恢复健康身材。

△NorthShore所有五岁超重患者未来三年的体重变化趋势图

 脂肪:“我还会再回来的!”

下面问题又增加了难度,由于脂肪反弹(Adiposity Rebound)这一身体现象的存在,很多小时候肥胖的患者会在较长一段时间后才再次长胖,所以幼时体重并不是一个很好的判断未来肥胖与否的指标。但研究发现,早期的脂肪反弹与成年后的肥胖有关,所以数据科学家们想要继续探究脂肪反弹对预测肥胖的帮助。于是他们分析了孩子们出现脂肪反弹的年龄,即下图中BMI曲线斜率由负变正的顶点。第一、二幅图没有出现脂肪反弹现象,第三幅图显示脂肪反弹的年龄为5.7岁。

△脂肪反弹年龄示意图

科学家们用同样的方法对4248名五岁小患者重复做上面的分析,有1035名患者存在脂肪反弹现象,但他们出现的年龄却各不相同,大部分集中在5-6岁,但也有一部分在2-4岁就出现了反弹,比预想中早很多。

△脂肪反弹年龄分布直方图

那么知道脂肪反弹的时间后,该如何预测未来肥胖的可能性呢?

从下面的散点图中可以看出脂肪反弹发生的年龄与童年结束时的BMI指数是有关系的,脂肪反弹越早,未来的BMI指数越高。图中蓝色虚线表示超重,绝大部分落在这条虚线之上的点对应的脂肪反弹年龄都在6岁以下。

△童年结束时的BMI随脂肪反弹时间变化的趋势图

为了更准确地分析二者关系,研究人员建立了线性回归模型,由图中绿线表示,并用R^2来衡量回归方程在多大程度上解释了因变量的变化。R^2值越接近于1,说明自变量与因变量的线性关系越强,即线性方程中自变量对因变量的解释能力越强。图中线性方程的R^2为0.32,说明有32%的未来肥胖可以由脂肪反弹的时间来解释。

用同样的方法分析原始的BMI与童年结束时的BMI间的关系,得出R^2为0.37。如果同时研究上述两变量——脂肪反弹时间与原始BMI值对未来肥胖的影响,R^2可以达到0.65,说明同时使用这两个因素来预测未来肥胖会更加准确。

根据上面的结论,儿科医生在判断小患者超重或肥胖可能时的依据就更加充分可靠了!他们可以将患者小时候的BMI指数和脂肪反弹时间综合考虑,发现异常及时告知患者的父母,尽可能帮小患者避免肉肉缠身。

后记

当今社会十分重视个人的身材管理和健康管理。去年曾有这样一条新闻:“上海某著名小学招新生要面试家长,要看家长的身材,肥胖的不要。”有人表示支持,认为教育孩子最好的方法是做孩子的榜样,如果家长高度自律,注意饮食和运动,那么他们对下一代的教育也会更有保证。将来,家长们可以在数据分析技术的帮助下更加了解孩子的体型变化,引导孩子养成健康的生活方式。关心疼爱孩子不代表放任和溺爱,爱他就陪他多运动吧!

素材传送门

https://dssg.uchicago.edu/2013/12/06/northshore-mining-medical-data-to-tackle-the-obesity-crisis/

新来的你,快戳图片认识一下我们吧

上周我们的数据驱动小栏目分享了

「选择合适的特征变量来预测犯罪案件发生区域」

如果你也对数据科学和公益的结合能产生的巨大能量感到好奇,

就请多多关注我们现感的推文哟,期待你加入进来一起做炫酷的事。

(0)

相关推荐