应包老师要求,在天河二号上进行CAM5的强可扩展性测试。进行一个节点测试的时候发现积分速度才2.7yr/day,着实吓了一大跳。CAM4可是12.7yr啊,速度还赶不上CAM4的1/4??!!换其他计算节点后还是这个速度,看起来CAM5的计算量增加的不是一点半点啊。最后测试结果如下,基本只有CAM4四分之一的速度。
晚上看NCAR Tutorial的时候看到了几张图,从上到下分别是CAM5的物理过程,CAM4和CAM5的积分步流程。可以看到CAM5各个物理过程之间也存在通信(这才合理嘛!)。再加上辐射方案的改进,计算时间也大增,据包庆老师说辐射计算时间占到总计算时间的一半以上。CAM5会这么慢其实也合情合理吧。
早起公交,早饭。饭后去家乐福买了香皂和纸巾,发现把杯子丢在了宿舍,于是又买了一瓶水。
到所里发现办公室没有开门,没钥匙。发短信问国魁师兄什么时间过来。没回。便先去了611孟军师兄的办公室小坐。九点多下来一次还是没人,好在十点钟有报告。
报告内容:http://www.lasg.ac.cn/xsbg/2014/7/q1c61fkk14.htm。前两天杨老板发消息说中大八月份的一个报告便是这个。
Prof. Wang没有讲数学细节,依然听不懂。大概内容是通过最大熵增原理去计算地表能量收支,可以理解为一个模型或者说通用方法。信息熵的观点引入到地学研究的一个成功范例。前面讲和Bulk Transfer Model的对比,一般陆面模式的Bulk Transfer Model缺点倒是记得清楚:1.计算过程中能量缺乏守恒性,2.存在梯度计算,测量误差很大,3.风速的不确定性,粗糙度的难以测量,4.一阶闭合本身就是近似,精确度有限。
Model的数学基础有四点:1.贝叶斯概率论;2.信息熵;3.最大熵原理;4.最大熵增原理
讲了一个简单的并联电路求分流的例子,大家都知道用欧姆定律。从最大熵原理的角度进行解析的话,系统会使得总的热耗散最小(why?),方程很好列,乘上个拉格朗日算子就解出来了。虽然我不知道怎么解……
计算地面能量收支的过程基本类似:物理上,无非就是净辐射进来,感热潜热出去;冰面雪面水面冠层适当进行一些调整。根据这个物理情景构造热耗散函数,乘拉格朗日算子,如法炮制。解出来的结果是Prof. Wang Highlight的。参数就是热惯量,潜热的惯量又正比于感热的惯量,不知怎么又把方程的自由度限制了一下,发现只和入射净辐射、Ts和比湿有关。优点很明显,没有风速了,不用粗糙度了,也不用梯度了,pia的一下把测量中最困难的几个量给扔了,帅呆!
最后拿这个model算了些东西,和观测对比,貌似日变化之类还是能对上的,强度差的挺大。又和NCEP提供的资料对比,发现两者差的更大了,但是NCEP的潜热通量看上去是觉得不对,六七八月南半球日极值到了500W,换算成蒸发有6-7mm,而且南半球的潜热通量要比北半球高;Prof. Wang的Model是整个反过来的,从直观上想一下,貌似还是应该北半球夏季蒸发多一点,潜热通量大一些吧。
听完报告回办公室发现有人来了,放下包吃饭。吃完饭回来打算给办公室的师兄师姐分好丽友,刚刚拿出来,包庆老师就来找我。叫到他办公室,说有没有查邮件啊,我说没。说清华有个薛老师也是移植CESM有些问题,你和他交流下等等,他是做计算机出身的,基本超级计算领域清华应该是国内的top1了,可以学习啊云云。我说好好好。包老师办公室不大,也不小。有长沙发,开放式的办公桌,桌上应该是Mac Pro。其他地方没细看,应该有一部打印机。办公椅看上去非常舒服,整个人都可以陷进去一般,虽然包老师坐着,但给人一种埋在沙发里躺着的感觉,这么工作起来还是挺惬意的。以后我也搞这么个椅子,再适当运动运动。就不用总担心颈椎腰椎了。后来三点多钟到走廊走了走,恰巧包老师端着杯子上来,说三楼有现磨咖啡豆,你喝不喝咖啡,免费的,我们所已经共产主义了哈哈哈~包老师确实是很能干,也很会干的人,前途无量啊。
下午准备晚上找何编聊的内容,张方案的源文件接近四千行代码,搜索cape十几二十个结果,看上去完全没头绪。反正文件锁定了,晚上再问问吧。对何编的试验设计还是有疑问,做了ppt备注。晚上一并去问问。
下午吃过饭回来,发现门又锁了。从六点半直等到八点半,本来还想再过一遍ppt,结果师兄回来开门之前何编老师就打电话让我过去了。两个多小时等待期间背了背托福单词,又跑到四十号楼转了一圈参观。四十号楼和科研楼是连体的,在楼内直接可以走过去。发现人很少,走廊又没有窗户,很封闭的感觉,晚上还有些恐怖。开门后拿了电脑就去找何编,从科研楼509到40#楼711,路挺绕。
问明白了试验设计,方案,何老师的基本思路还是希望我能把每个积分步中的物理过程调用的顺序搞清楚,接口搞明白,之后再往Ttendency上加这个Heating的强迫项,不是直接改张方案这么简单,shallow convection和large-scale 里面也有Q啊,不是说直接在张方案里注入就行。又解释了一番A那篇文章的试验设计。其实很多地方还是和我想的比较类似的,从物理合理的角度出发,方法可以自己确定,Annual Cycle这类信号肯定是会去掉的,作者没必要说那么详细。想来想去,还是自己读的太少。很多方法和技术的运用,基本是约定俗成的,看到response差不多了,也就应该明白怎么操作的了,没必要细究(或者说不细究也就明白了)。说到做Model的苦与乐。技术活居多,门槛高,动手要勤快,Paper不好发,但真正钻进去才是窥探物理本质,才有意思。对我来说,coding本身就是很有挑战性满足支配欲的事情嘛~更何况深入的是物理而不是回归来合成去看到似是而非的现象就扯所谓的本质。“为赋新词强说愁”。说到做model的好处,也很明显,本身门槛就高,做的人少,所以一旦有人会,那便很抢手,吃香。突然想到了前段时间flash编程突然大受欢迎,因为互联网发展,网页游戏繁荣,而会flash编程的人又太少,所以瞬间此类人才价格疯涨。不知道目前怎么样了,估计应该昙花一现吧,前端不是html5+css3的天下了么,毕竟IT新陈代谢太快了。又太久没关注了啊~
说道这里,瞬间有些不太美好的感觉。做model会不会也昙花一现呢?风险高的几点就在于,首先气象这个领域出路太狭窄,太专太封闭;其次,而仅仅做model又很难从一般科研人员堆paper的路子爬上去,因此一旦气象科研的路数变了,或者整个领域出现了因宏观政策性调整等不确定因素造成的坍缩,做model的人很难将已经深入的专业知识转移到其他领域,从而威胁到个人及家庭的底层生存需求。
话说回来,毕竟能做model能做技术活的人肯定要有较好的计算机、网络以及Linux等基础,动手能力自然不差。所以明确的路子还是支起一行副业,而且是与专业相关的比较靠谱。开网店、投资期货、炒股等基础投入大、风险高而且经验几乎没有,没有一定资本前还是暂且不作考虑。当然首先还是要踏踏实实地积累好本专业基础知识,试着发paper;同时继续保持对IT行业的高敏感度及热情,了解整个业界动向,不断学习新技术积累建站搭站、硬件及操作系统维护、网页编程、网站管理经验,拓展渠道试着去接手一些外包项目,多结交技术型人才,拓展信息源。大致能够理清三条线吧:1.夯实基础,深入数值模式;2.广泛涉猎,提好科学问题,paper发好、发多;3.保持对本专业及IT行业的热情,终身学习,试着发展相关副业。
在天河二号上,想在bash中根据申请的节点数自动计算核心数,其实就是一个n= N*24这样简单的计算,但是bash中的变量是没有数据类型的,所以还是查了下资料才解决。很简单,用中括号,中括号包含的数学式子是可以被shell识别的。主要中括号最外面还要$展开一下,否则下例echo时会返回“100+200”
例子:
[root@localhost ~]# cat test.sh #!/bin/bash var1=100 var2=200 var3=$[$var1+$var2] echo $var3 [root@localhost ~]# sh test.sh
300
参考资料:http://www.baidu.com/link?url=GwzHXLxzHdFb549J1fGR5gcyoRlCuW48q6LH7yRqmbSfGYrFITZ6pIXMy-bJ3yImnZ6XPBBjL3wKt6xer1Fvqq