中华文化在西方价值盛行的当下女性择偶选择中的重要作用分析 ——周易与文化论文

  :在西方价值当道的当今社会,“资本”是两性问题的主要矛盾,网红当道、刚柔混杂、巨婴盛行、西式哲学霸屏,当热搜上从来只有流量明星的时候,而祖辈却有着共同的模范。从一个有前瞻性和有历史观的角度来讲,中国立场历代的阵痛期过后都能引向一个众人崇拜文化的稳定期,而今便是两个阶段的转折点。身为一个女性,当如何能把选择男性这件事变得更高雅,更具传承性?当中华文化经历了先破而后立时,我们应该向传统文化取经。

关键词:两性选择 中华文化 择偶 西方价值

李零:《周易》是本什么样的书_历史频道_新浪网

文化是什么?“刚柔交错,天文也。文明以止,人文也。观乎天文,以察时变。观乎人文,以化成天下”,在那最原始而古老的智慧精英的言语里,我们都能看出人与野蛮人最大的区别,就是人能顺应天文即自然,又葆有男刚女柔的人性。在古代中国的框架下,文化是关于人的一套思想行为人性,这种思维模式根生在每一个中国人脑子里,在两性择偶、阴阳结合的过程中,除了车房票这种“普世价值”的“资本”,我们仍应皈依根之所在。反观现世,大伙们沉浸在外力下趋利避害的怪圈中无法自拔。

郭敬明的《小时代》中讲述了一个这样的故事:女主角出身平凡却以外踏入“上流社会”,在经历嘲讽后她没有像童话故事里那样奋起反抗,而是适应了这个拜金社会,小说本无宏伟叙事或人性剖析,却在发表后迅速升温,或许原因就在于它深深地刺痛了国人敏感的神经。

几十年前的“大时代”里国家社会人民都有着共同的宏伟目标、恢弘的叙事格局,随着大时代的中介,网络媒体对社会阴暗的大规模披露,西方后现代主义思潮的引入,对于没有钱权的凡人来说,愈发感到自身的渺小和对自我存在的迷茫,身份迷失的焦虑,使之把一生的赌注下到能让自己享尽荣华富贵的公子。对比车房票的实在和踏实,有知识的人被曲解为忽悠人,但他们可能是十足的潜力股,在中华古籍中,真有对男性几个高质量的选角标准。但为何我说未来的中国人一定会更加崇拜那些有文化的人?因为中国历史上的才子哪一个不是“腹有诗书气自华”。文官武将皆受用。辛弃疾的“满江红,怒发冲冠凭栏处。”不知道还以为是一个文绉绉的柔弱男子,却是一个戍边的将士。最下贱的渣男徐志摩,靠一点风花雪月就能倾倒众生,更别提现世的扇扇子胖子还是写文章赛车手了。说到中华文化,丈母娘是继承中华文化当中汉字“家”的由来最直接也最世俗实在的一派。三千多年前仓颉造字的时候就知道家是由“”房子和“豕”野猪,也就是钱,她们事必门当户对,事必一房一名一证。拥有文化的人,能自然而然地产生大格局,博大胸怀,不卑不亢,对此间种种在阅后思考过后释然。一个有文化的人,他做事一定分得清轻重缓急,优先劣后。他对爱他的人一定会包容呵护。对不爱他的人一定会动之以情、晓之以理。他的斗争方式一定是有理、有据、有节,而不是成为仇恨的发起方,向宿舍里投毒。面对丈母娘的连番“轰炸”,绝不会因为没有票而放弃对阴阳结合喜悦的追求。绝对不会做软弱的一方,成为巨婴放任自己父母的冷酷无情,一定不会酿成孕妇跳楼案这种惨案。人的纠纷结起于利益、权力,终于胜者的欢笑、败者的遗憾。

听闻此间种种,究其本质是中华文化的再传承问题。古代从老庄开始至清朝陨灭的天人合一,德行合一,“一陰一陽之謂道,繼之者善也,成之者性也。”究其人生的意义,莫不是一种万物苍生阴阳合而万物生的“道可道,非常道”。中国人受困苦的时间久了,有种出人头地的向往,而西方作为最开始用船坚炮利打开国门的那个怪物,使我华夏儿女对其趋之若鹜。从“世界真大,我想出去看看”到“国外的月亮就是圆”,从而放弃“落叶归根”。说话满腔:“人生下来就一定有原罪,人生的意义就是在赎罪,直到世界末日那天可以得到救赎”。言必称民国时期的鲁迅破后没有完成文化的再立。历史与文化是紧密结合的,文化的断层就是历史的裂缝。当今而立之年的男子,家须与国结合在一起,一个阳刚的男人,不能离于梦境而陷于梦境,落成个沉睡的民族,没有冲破桎梏的觉悟,也竟只是困顿与迷离中的颉颃。

拥有文化的人,能对现世的种种乱象针砭时弊,并淡然面对追本溯源。他知道:“纲举目张,执本末从”。他懂得望眼欲穿而不说破,却也能看懂那些超越时代的领军者。如今的娱乐圈,娘炮当道,日韩文化当道,殊不知是一种日韩化妆品公司和娱乐产业的洗脑手段,先鼓吹化妆的人,无论男女都会显得高级,再以高价卖出。再者说男星网红直播卖唱的,在古代叫伶人,属于比下九流还低的伶人。他们才是真正值得被同情的人。现世社会的主要矛盾是修齐治平,而非哗众取宠,引来一帮娱乐至死的乌合之众。无论昂贵的化妆品还是反串服装在古人看来都是身外之物。苏轼在《宝绘堂记》中说:“君子可以寓意于物,不可留意于物。”若是欣赏风景只能局限于风景本身,终只能浅尝辄止,而不能体察深韵。女生男生貌似都不能免俗。但真正灵魂的交融,还得精神上的阴阳结合。无尽的泡沫铺陈排序,阻挡了心灵的星空布景,创造了一个富丽堂皇的假象。

拥有文化的人,必拥有道德。文化的最高境界是修身齐家治国平天下。穷则独善其身,达则兼济天下;而非穷则报复社会,达则肉林酒池。“君子居其室,出其言,善則千里之外應之,況其邇者乎,居其室,出其言不善,則千里之外違之。”说的是一个君子的内外一致。往生活的琐事里讲,他绝不会拉良家女子下水,但一定会劝风尘女子上岸。往高层建筑衍生,他必然会为了实现人生的意义不断提高自己的修为。他必然满腔热血,先天下之忧而忧,后天下之乐而乐,深知天下兴亡,匹夫有责。林语堂在《吾国与吾民》中畅谈国人的怯懦,借用西方的国族的概念去唤醒更多的兴亡匹夫。与有家国情怀的人相处,虽少了点事故的情趣,却多了份崇高的可爱。

当然,这个世界上有很多否认中华文化存在的意义。鲁迅指出了文化的劣根性,但这种否认不是否认中华文化本身,而是敲醒当时的中华名族。从现实意义上来说,谈及男女之间关系,一定不是盲目的攫取西哲的养分从而忘记了自己的起源。作为中国人,或许很难理解斯宾诺莎的泛神论思想:宇宙的一切就是神本身,也很难理解康德的:事物本身与人所看到的事物是不同的,人永远无法确知事物的真正面貌。抑或是黑格尔的绝对精神:它是宇宙万物的内在本质和核心,万物知识它的外在表现。在寻求叔本华的作为意志和表象的世界,进入了他的虚无主义之后才匍匐着知道:意志是世界的本质。尼采又说,上帝死了,人的本质是强力意志。又试图理解罗素的逻辑学,弗洛伊德的精神分析学,荣格的分析心理学,柏拉图的爱情咖啡馆,斯宾格勒的《西方的没落》,哈贝马斯的马克思公共领域学说,施特劳斯的钢琴曲。这些虽然有的自相矛盾,但都能在一脉相承的中华道儒法学说中找到对应的说法。一个有文化的人,一定有对自己生活着的这片土地的文化自信。唯心的巫术和唯物的哲学或者第二哲学物理似乎是那么的格格不入,两者结合,或者相互借鉴,亦能擦出别样的爱情火花。

参考文献:

1.杜新會,《周易与婚姻》,华夏出版社2009年版。

2.刘大钧,《周易概论》,上海古籍出版社1999年版。

3.孔子等人,《周易》,商务印书馆1988年版。

4.凯伦·阿姆斯特朗,《轴心时代:人类伟大宗教传统的开端》,海南出版社 2010年版。

5.林语堂,《吾国与吾民》陕西师范大学出版社2006年版。

6.苏轼,《苏轼文集》,岳麓书社2000年版。

7.林语堂,《苏东坡传》,陕西师范大学出版社2006年版。

8.黑格尔,《自然哲学》商务印书馆1980年版。

9.张汝伦,《德国哲学十论》复旦大学出版社2004年版

My introspect from food for thought by mentors

I inspect the the major quality first I met those who have great progress in their Ph.D. period and in their tenure track is the persistent energy. They seems to have endless insights and devotion to one specific idea and broad idea through the thorough world. That accounts for the philosophy of the point and the plane. Like the round pegs in the square holes, we never shows satisfaction with the current worlds' poor knowledge over no matter an engineering problem or a mathematical problem.
Continue reading "My introspect from food for thought by mentors"

ISC 21回顾

实名羡慕过往的同学能去德国🇩🇪,我已经long long time 没有行万里路了,可影响我们在线上给予对宝座一定的冲击。

The HPC competition is all about hacking. Just like Neo (The hacker) dodging the bullets.

对于国内,德国,以及美国的比赛,我大致了解了三个区域对科研的态度。国内的情况之前已经描述过了,鉴于最近参加的ASSIST上科大选角大赛储存分场,我觉得中国真正做事的科研人员是承包国家项目的,其实强如陆游游也是如此,不过没有工业界做上层建筑,真的做出来的 filesys 都是玩具。德国这20天左右的调试和report,code challenge的代码质量简直💩。由此我觉得科研实习及学习还是得去万物之源——美国。年底的SC21进决赛了,我也在培养下一任队长了。(ASC22加油。

  • 性能测试
    • HPCC (10 pts)移植GPU
    • HPCG (10 pts)
    • HPL (10 pts,单独评奖)
  • 传统 HPC 题
    • gpaw (分子模拟,10pts)
    • MetaHipMer 2 (宏基因组测序,10pts)
    • WRF(气象推断,10pts)
    • lammps(蛋白质模拟,10pts)
  • Code Challenge (10pts)
    • 对 wrf 和 gpaw 的 mpi_alltoallv 推断前端、以及(,10pts)

现场面试(10pts)

超算介绍

在刚开始拿到机器的时候我想笑,因为Niagara(在加拿大🇨🇦多伦多大学,意思是那个落差最大的瀑布)的配置和我在jump面试维护的几乎一样,从文件系统到scheduler。大概大前年我们ASC拿第二名是因为对两倍数据集的使用。还有当时志强对那个训练模型的熟悉,这次运气大致也到了我们上面。Niagara 登陆节点7个skx, CentOS7, Intel(R) Xeon(R) Gold 5115 CPU @ 2.40GHz,全是100GBps的IB卡,debug节点可以申1小时,和登陆节点配置是Intel(R) Xeon(R) Gold 6248 CPU @ 2.50GHz,compute节点在nia1000左右可能可以申请到cascade lake。(所谓无痛提升性能。) 文件系统是gpfs和module放的用户态cvmfs。NSCC(National SuperComputing Centre)是新加坡大学联盟+ASTAR研究所的超算集群,就比较寒酸了,4个被很多人拷文件的登陆节点broadwell 2690-v3,CentOS6,IB卡是100Bps,主要是为了文件系统。但由于我我有NUS的好朋友(前同事)拿到了他的回校工具,这样我们就无痛多了4个登陆节点,但是交的队列是一样的。normal队列和登陆节点一样,而dgx是假的dgx,是16G的显存不说,nvlink也无。不过CPU稍稍好一点点,v3变v4。内卷之坡县尽如此,都不如我校校内的机器,终于知道我前老板为什么要回上海了。

还有说一下pbs和slurm,讲真,前者一点也不安全,其实就是一个后台程序在维护一套bash脚本,勉强维护住了,不过后者有商业版可以买,也做了很多cgroup的隔离,可sg机器上并没有,所以稍稍hack一下可以运行的时间还是可以的。同时也可以qsub -I一个交互干任何你想干的东西,(注意ip地址是ib卡的,qsub控制都是板载千兆口。)而在Niagara所有的openrun 和资源都是被控制住的。在进入的时候,ib卡就不能用于mpirun的host,这一点非常坑。

两个超算集群都有很好的GPFS,但是NSCC的scratch没有flock,导致不能用spack.总之POSIX是个对读写都需要加🔒的协议,GPFS并没有做到这一点。

Benchmark

HPL

虽然每次都觉着这是跑分,可这次真不一样。我们本来以为这是dgx就可以靠nvlink 这个topology搞点事情。可惜只能搞CPU的affinity了,我们用taskset 搞了这个😄。

虽然性能提升是个玄学,不过有总比没好。

HPCG

这次还需要在cpu上跑,从官网上搞了个xhpcg_skx,没想到在tuning的时候到了cascadelake,后来我们每次跑都指定那个节点。

HPCC

以前比赛从来没有过这么老的东西去跑benchmark,这是一个最后commit 13年的东西,有HPL,FFT等7个小case,主流benchmark都不用这玩意了,可能欧洲人比较念旧吧。我们调了一版本CuBLAS编译的HPL和CuFFT变异的FFTW。性能是直线上升。

MHM2

我们拿到这个题目的时候,觉得这个赛题我们可以改很多,我还为此分配了两个同学去研读代码,不过松辉和候补同学拿这个项目直接成了他们的并行计算project可还行。可我忘了作者,LBLL,berkeley 和能源部的大神写的,怎么可能会需要我们去魔改他的代码。失策失策。论文里的种种,cuckoo hashing,k-mer,DHT,都是貌似可以改的东西。可惜他们已经survive了TB级别ACGT的测试,工程师已经写的够充分了。不过upcxx(一个并行编程范式)有挺多小问题的。当时并行计算并没有涉及到GASNET并行模型,其实就是global_ptrlocal_ptr的那些东西,这个并行模型比较适合DHT,特别是TB级别的数据。

我们最先发现的是RPC他写的很慢,profiling完以后的结果告诉我中间传输过程太多,可没啥可以改代码的,都是libverbs点对点通信。

作为尝试,我们尝试了upcxx 的后端,可以是libverbs 也可是Intel MPI,Niagara上面装的rdma-core是rpm装的而非mellanoax下下来编译的,这弄坏了挺多东西。所以我们关于libverbs都是在singularity里弄的。在configure正常的情况下,MPI和libverbs 性能差不多。在NSCC上,GasNet对内存有异常多的需求。这程序几乎有线性的scability。
\[
\begin{array}{l}
\begin{array}{l}
\text { Comm} & \text{Build } & \text { System CPU } & \text { User CPU } &\text{nodes}
\end{array}\\
\begin{array}{llrlll}
\hline \text { mpi } & \text { Release } & 37.36 & 02: 54.9 & 1: 35: 15 & 4 \\
\hline \text { mpi } & \text { Release } & 60.74 & 01: 37.4 & 1: 19: 27 & 2 \\
\hline \text { ibv } & \text { Release } & 37.27 & 02: 57.3 & 1: 36: 37 & 4 \\
\hline \text { ibv } & \text { Release } & 61.69 & 01: 36.6 & 1: 19: 33 & 2 \\
\text { ibv } & \text { Debug } & 112.3 & 03: 44.6 & 4: 54: 57 & 4 \\
\text { mpi } & \text { Debug } & 134.4 & 06: 11.6 & 5: 57: 13 & 4 \\
\text { mpi } & \text { Release } & 37.79 & 07: 31.1 & 1: 39: 17 & 4 \\
\text { mpi } & \text { Release } & 545.35 & 1: 18: 27 & 18: 15: 26 & 4 \\
\text { mpi } & \text { Release } & 104.88 & 02: 54.6 & 1: 08: 33 & 1
\end{array}
\end{array}
\]

接下来就是调k-mer中的k了,这个非常有用,但是会减少精度。添加一个k就是增加他计算队列的长度,大致比原来的慢\(\frac17\).所以我们干的一件事就是分析精度缺失和k的关系。让其保持在一个合理的范围内。

DHT是并行计算课上讲过的那种,过一段时间会对在圈上的下一个节点加一次update。更新数据的过程是先write only(write barrier),在同时读和写,最后是read only(read barrier)。其bottleneck在于能否利用这个特性让其更快。(然而提出锅的人并咩有解决这个问题。DHT 的优化就是把那个圈变成其他结构,可似乎networkIO已经是bound了,逃。File System 上他们想用raid 去做这件事。

GPAW

我们在这题上失利了,因为code challenge部分有这块的alltoallv的优化,可是只有一个case真正调用了gpaw,做这个的宇昊由于我的编译原理作业没有花太多时间,导致没有发现问题。

这应用换个elpa库就能很快很快。

LAMMPS

对lammp s这么成熟的蛋白质应用来说,我觉得其应该很稳定,可事实并不是这样。我们在当中找到了各种segfault,尤其是intel package,一个intel 架构师写的加速lammps性能的库。

这么一个类,几乎所有的half neighbor 的计算都要用到
同时在跑ipm学到一个奇怪的LD_PRELOAD顺序问题。

WRF(Wolf)

又是一个天气应用,当时我们SC20的失利很大程度上就是那个 fortran 的 segfault 11,之前的解决方案是unlimit -s。据Harry说就是我们踩坑不够多,不停的换小版本编译,如果都不行才说明不是编译器的问题。我们这次在Niagara上是所有小版本都加了,结果还是不行。在比赛结束没几天的时候,在翻阅了WRF的官方部署ppt后,我们发现是一个KMP_STACKSIZE=20480000000的问题(由于intelifort维护的main程序需要对所有进程的状态进行描述,超过4KB就烫烫烫烫了);在Niagara上还有个奇怪的坑,mpi是完全由slurm的srun控制的,你写的mpirun -np 160在集群上也会被换成srun -ntask $SLURM_NTASK -cpus-per-rank $SLURM_CPUS_PER_TASK -bind-by core导致每个node的core并不是你mpirun写的核心,而是你predefined的,这需要你ssh上去,而你也不能开交互spawn mpi task,因为mpirun走不了ib卡。所以在slurm脚本最前面定义一下就好了。这些坑真的只能在文档中体现,后人才不需要重新踩。现在fortran都要出2021了,时代变了,我的jump trading前老板最喜欢的还是F77,泪目。

说下我们做的task和优化:(给我们的testcase居然是上海。)第一个是题目要求的分析MPI和omp的比例对WRF的影响, 其次是AVX512和AVX2的比较。最后是我们加的一个N-N file write middleware。

首先是profiling结果,由于加上vtune以后更容易seg11,就算加了那几个环境变量也一样,那我们就骂intel ifort傻逼好吧。之后虽然有几个小testcase我们成功跑完了一次advisor 和hotspots。这里只放nvsight(闷骚绿)的结果。


大概解释下就是他会把数据向这样切

更少的MPI overhead就会得到最好的性能,所以我们写了一个bayesian 调参机。非常简单,但效果也不错。
image8
在AVX512和AVX2方面,我们发现AVX512有严重的降频。

之后我们加了个殷老师特技FileSys middleware,我也终于搞懂了fuse到底干了啥。so-called. transform N-1 I/O pattern to N-N
while maintaining the file abstraction

Code Challenge

简要来说就是英伟达工程师写了个垃圾go程序,用于前端显示他们内部调benchmark 的过程,尤其是mellanoax的hpcx提供的openmpi的osu,这是一个很吃alltoallv的东西。以及夹带gpr_copy的ompi的性能。总之,在和shenghao和jiajie讨论了一下后,我们一致认为这是坨💩。所以我的策略就是➕zlib和COO sparse matrix,后来他们upstream了。
前端我们改成json的api传输了,这样压力给了前端,不过我们用了蚂蚁的一个前端库,已经用wasm优化的很好了,我们只需要把他的md转成序列化的json。
给你们说一个笑话。

ISC SCC Final




不太正常的总结

感觉这次时间拉的过长,我和做WRF的厶元几乎为此付出了RA工作和后面的几场考试,没事,能work就行。时间长就导致最后大家其实差不多,不知道评奖的机制是什么,至少我从和THU 暨南 NTU SYSU pk的过程中学了很多很多。清华好像最后两天才开始做,我只能说他们可能对评奖并没有什么兴趣了,反正就是第一了,反正年底我们去不了美国了。就面不了基了。

然后又是一年奇怪的陪跑。感觉就是自己太菜了。

Reference

  1. E. Georganas et al., "Extreme Scale De Novo Metagenome Assembly," SC18: International Conference for High Performance Computing, Networking, Storage and Analysis, Dallas, TX, USA, 2018, pp. 122-13
  2. Hofmeyr, S., Egan, R., Georganas, E. et al. Terabase-scale metagenome coassembly with MetaHipMer. Sci Rep 10, 10689 (2020).

bilibili总部的见闻——中年油腻大叔的青年回忆录

主要是那天想吃肉了,也想一个人出去遛哒。回了趟杨浦区高中,骑去B站门口看小姐姐下班,五角场的二次元浓度也很高,最后在高中时代就很喜欢去溜达的复旦江湾和合生汇。

高中没什么可以回忆的,全是被同学草虐的回忆。

倒是我想对我自身的成才路径画上了个问号,即在智商严重缺失的情况下如何反败为胜。我是个反应和持久力都还不错的人,觉得学习上最大的问题是极度依赖记忆,而非认真的推导。

有关高考前作文是否是'文青和文青跨时空对话'?

余乃一介草民,最近要写文章,回顾以前的文章,有所感。高中时每每写及作文时,大概都添加了我对家庭,我对社会的看法。我出生在一个科技、理性,不逐利、仓廪实的家庭。当时的语言表达随常常词不达意。但却是时至今日我的人生哲学。

找到痛苦的幸福

周国平在复旦做了一场《生活的幸福》演讲,座次一位嘘声,自诩貌美有才,家庭美好,成绩优异,却无法得到幸福。

幸福不是一种没有痛苦的状态。

由于当时我挺喜欢这句话的。我讨厌这种秀优越感却实际上什么都不自知的人,但有时候自己却是这样的。我感激我的家庭给我带来的视野、高度。这使得当时我对很多“文青”嗤之以鼻。无所适从到想对他们口诛笔伐。我少了一种装逼的想法,同时有些自卑,因为我成绩就是不如同班同学,无论我多么努力。也许是能力不够吧,或者想要的太多。所以我内心还是非常自卑的,想通过“看不上别人”,来得到自身的慰藉。

我对这篇文章大体的想法是想写成与自己的对话。如果自己已经感受到世俗意义上的幸福了,是否应该皈依痛苦,再从痛苦中寻找自我的价值。

周国平这句话实际上也是一种放大性的解读。痛苦不是幸福的对立面。或许有时候进入痛苦也能得到幸福,不痛苦也可以幸福。这对很多文青来说就是他们的发挥空间了。比如这种痛苦可以是找寻西绪福斯般的“有痛苦却很幸福”,最终找到痛苦也很幸福。然后再辅以华丽的与评卷老师会心的想法。便可以得到不错的分数。

当时我刚从伯克利回来没多久,是一次高二上的月考。同时接触很多家里有钱,同时又很优秀,最后不乏申上伯克利计算机的一些同学,这种人的人物肖像就是口上说的都是满满的资源。所以我将这位同学带入了他们。他们其实很幸福,可以一天换一个女友。想象王思聪。我开始了我的骂战。我同时还想到了当时的“航母”,即通过每天网上学习学到3点的女生,最后考上了清华新亚书院。我说,不要那么为了幸福而痛苦。还有就是我的不作为的母亲和不作为的语文老师。若是母亲给力一点。若是语文老师给力一点。我会好走一点。

我引经据典,告诉他们所谓的“小有成就”在明清时的夜航船上就有很多自吹自擂最后落得自己“一无所知”的下场。得到四书五经的真传又如何?这种将八股奉为圭臬,陷于自己的舒适区的人,实则仅得到孔孟程朱的边角料,闹得只会对对联这种恶俗文青操作。没有真正意义上的创新 ,也即是把自己放在舒适区的结果。当时的中国没有进步,人均生产一直维持在低点千年的原因莫过于此。我们放弃了“科技”,而沉浸于古人的辉煌。

人需要痛苦,需要痛苦去圆满充实人生,从而造福社会。

我想说,人是要有家国情怀的。您那些幸福不过是屁民想的屁事。仓廪实则需关注民生,自己痛苦,谋求全社会的幸福。

一个聪明人最容易想完人生,感觉人生就那样,做好分内之事,何必痛苦呢?于是每天拘泥于自己的小确幸中,如“龙应台”之流,这是“平庸之恶”。那位学生应把自己的所谓的财力投入自己的“痛苦”,走出舒适圈。而不应像儒士一样没有眼光。它因转化为力量,造福人类。

两个例子,一正一反。古巴银行行长切格瓦拉和傻逼王思聪。

炮轰没有幸福的人,没有痛苦的人。

“人需寻得所爱。”乔帮主用这句话结束给“世界大脑”们的演讲,意在说明人总能找到属于自己的价值,为之痛,为之乐。这份痛是带有主观判断的。不能麻木盲从地痛苦下去,折磨自己很简单,但绝不能陷入琐事的痛苦,不能让片面庸俗的痛苦成为成就高水平幸福的绊脚石。史铁生一生“埋没”在病痛痛苦的极致中,却在地坛公园中给全中国人民在文革后以生命意义的慰藉。苏轼成长之路世人皆知,从青年到老年的跃变,从无法摆脱对时弊的束缚到无以伦比的胸襟。他突破了苦的边界,为百姓疾苦共舞。他的幸是 苦叠加的结果。相反万历朱翊钧倒在了臣子阴阳利益斗争的血泊和三征高丽的痛苦中,失了心智,未能续大明之幸,张居正之托,终享其乐。

我这段话想说的就是有意义的高层次痛苦能带来更高层面的幸福。

找到痛苦后的幸福,是一种磨砺,更是一种蜕变。人不能简单满足现有的条件,而更应想着如何转化条件为更高层面的幸福。高层次的幸福就是家国之幸。同时,幸福不是简单盲目的,而是要有判断与取舍。

我的人生哲学尽如此。从不断的痛苦和打击之下历练自己。我要学技术,会管人。有自信。把“家国之幸”作为己任,修身齐家治国平天下。我不会做我眼中的小人,我妈,我的高中语文老师,liujingwen,还有那帮留学生们。我会为自己的意义奋斗终身,为祖国健康工作50年。

说说这篇文章为啥是三类下卷,即得了44/70. 大致上是偏题了,而且用词朴素,没啥料。好像老师看上去没有同感,或者说根本懒得读。还有,周国平在哪里?

这是一个17岁的少年在仅剩30分钟完卷的内心独白。我不适合被动的学习。从这以后我都是很主动的,从本被父母拉着出国(我认为是一个叛逃者),到作为一个合格的高考生。我或许在当时就应该认识到差距,可我被自己外表自大,内心自卑的性格所麻痹,认为经过努力,一定能得到属于我的一片天地。可事实是,语文老师不理解我的心思。

我挺喜欢读当时的那些文青的,现在估计转市场?学法律?抑或学经济了。我人对他们嗤之以鼻。我认为那个时候的作文,在我们的语文老师的渲染下变成了一种文青交流的乐园。

我的人生阅历太少,当时的阅读也少,之后读了挺多东西的,但鲜少能总结成文字。也会写书评,但得不到赞赏。我很少会对自己能力提升无济于事的事多努力,大概我一开始就认定那些人写的东西不值一提了吧。

鸢(yuān)飞戾(lì)天者,望峰息心;经纶(lún)世务者,窥(kuī)谷忘反。——《与朱元思书》

GeekPie2020谜题项目-设计稿

须知

  1. 每个Stage最多包含5个页面;你需要描述每个网页的大致内容、包含的文件、上下级页面(无则写无);5个页面可以是并行的

  2. 每个Stage需要有2~5种已知通关方案,需要给出“过剩”的线索

  3. 如果使用了头脑风暴中的idea,请在[Meeting0]作相应的记号

  4. 一定要确保谜题逻辑上连贯; 请充分考虑开发实现难度。

  5. 请务必将此链接以及有关内容保密

Stage1 [Author: 张启煊|邱龙田]

Ø 页面

序号页面名称上级页面下级页面页面内容描述/包含文件描述
1-1宣传图/加入游戏wps8fjxMy
1-2加入游戏宣传图Stage2开启按钮恭喜你通过宣传图中的线索顺利来到了活动的注册页面;与此同时,我们也需要简单检验一下您的身份。1. 请为自己取一个ID[输入框]2. 我校信息学院、生命学院、物质学院的主题色分别是?[3*7=21种颜色选3]3. 我校的校训是?[输入框][提交]return[0]: 答案错误return[1-输入苟…]: 说错话是要负责任的呀!答案错误return[2-通过]: 恭喜你注册成功!Stage2的网址就在你的答案中
1-3Stage2开启按钮加入游戏Stage21.恭喜你达到了Stage1的终点!请给自己取一个ID让大家知晓…2. 一个按钮,点击则提示“不是时候”,除非他把系统时间设定为宣传图那一分钟
1-4
1-5

Ø 破解方案1:把时钟与鸽子嘴重合得到网址前缀;正确答出四道题,其中第四道题包含“不”“无”“没”或者什么都不写;根据颜色号码找到新的网址;将系统时间设置为宣传图那一分钟;开启Stage2

Stage2 [Author: 叶者|张龙文]

Ø 页面

序号页面名称上级页面下级页面页面内容描述/包含文件描述
2-1
2-2
2-3
2-4
2-5

Ø 破解方案1:

Ø 破解方案2: geekpie{Bridges_are_sacks._Is_there_anything_wrong_with_speaking_like_this!_Now,_tell_me.}

Ø 破解方案3: geekpie{It_would_be_nice_if_someone_like_me_disappeared.}

破解方案4: geekpie{symb0ls_ar3_jus7_symbo1s}

压缩包密码:3342613097+某管理员

Ø 破解方案5: geekpie{what_a_cruel_person} geekpie{Guomie_Nasai}

以下为Stage2草稿.jpg

题目顺序:

(1) -> (2) -> (5) -> (3) -> (4)

​ ----->-----/

(1) 3个(或多个)选择题 某一个的题干包括跳过两个字 只有点击跳过可以通关

破解方法 1 xjb点 2 查看网页源代码 [是不是太简单了]是的

(2) 拼图 文件名为也为flag分段 按拼图顺序 仿照https://github.com/ustclug/hackergame2018-writeups/tree/master/official/card 用上科大校徽做背景 题解记得credit

破解方法 1 拼图后输入图片内内容 2 拼图排序后输入文件名拼接内容

(3) 找不同 多个像素点的颜色区别 答案是一系列坐标(大概3~5个)图片为bmp

(4) zip file password: geekpie某管理员的qq号+昵称 答案"{}+某管理员".format(qq号)

(5) RGB to UTF-8 2份线索 图片使用bmp防止压缩损耗:

线索1:UTF-8解密后信息 -> 跳一关

线索2:略微不同颜色的文字描边 破解方式:ps 选择颜色 如下

wps93OTEN
wpsZtzCbV

Stage3 [Author: 井皓天|杨易为]

主页面:Stage 3 - 腾讯文档

Ø 页面

序号页面名称上级页面下级页面页面内容描述/包含文件描述
3-1失踪的快递/XXXXXX YYYYYYYY 53Z2湖北省武汉市某同学家。从得到一个快递号,没来的去取,上面的身份证号已经模糊,需要猜出才能取得快递。快递编号 → 投递城市 → 身份证前六位 → X某个 QQ 群里的「管理员」→ 生日 or 百度第一次删除Google是什么时候 → Y校验码可以枚举出 Z 的几个可能,要加上性别才能唯一确定(可以暴力)之后配合某种载体(快递订单图片,其上的时间转 UNIX 时间戳之后会被用到)引导到一个域名为 身份证号.xxxxxx.onion 的网站(自备洋葱)
3-2快递的秘密失踪的快递救人的药/门牌号里面有合同,指向另一个洋葱网站有个教务系统网站(每隔5s 换一次地址,指向救人的药/门牌号)下载得到一个ppt(离散题目)文件* 解压 pptx 可以跳到 3
3-3救人的药ACTG 转化学式转药的名称(瑞德西韦),还需要输入快递订单的时间(UNIX时间戳)
3-4罪魁祸首
3-5门牌号ACTG(维吉尼亚密码)转上科大门牌号+几点钟方向,在上科大地图中找到关键位置

/------->----\

(1)-> (2) -> (5) -> (3) -> (4)

​ ------------->----------/

以下是stage3的草稿

背景:湖北省武汉市某同学家

从得到一个快递号,没来的去取,上面的身份证号已经模糊,需要猜出才能取得快递。

给出一个身份证号

XXXXXX YYYYYYYY 53Z2

快递编号 → 投递城市 → 身份证前六位 → X

某个 QQ 群里的「管理员」→ 生日 or

百度第一次认识Google是什么时候 → Y

校验码可以枚举出 Z 的几个可能,要加上性别才能唯一确定(可以暴力)

之后配合某种载体(快递订单图片,其上的时间转 UNIX 时间戳之后会被用到)

引导到一个域名为 身份证号.xxxxxx.onion 的网站(自备洋葱)

百度地图上科大街景 https://j.map.baidu.com/85/05w

可以用的ACTG训练能用的药。

[Parallel Computing] Architecture

implicit parallelism - pipelinig

break up one instruction and execute pieces

different unit of cpu utilization
instruction fetch -> decode -> exec -> mem read -> write back
at most 5x with 5 stage pipeline

modern processors has 10-20 stages

if code branches, must guess how to full pipelines.

  1. branch misprediction requires flushing pipline.
  2. Typical code every 5 instructions.
    so prediction is important

implicit parallelism - Superscalar

  1. we can have 2 fetch unit each clock

    ((i)has fewer data dependencies (iii)should be rescheduled.)
    e.g.
    1000 1004 1008 100C
    --o---o---o---o
    -- |---/ ---|---/
    ---R1 ----- R2
    ----|-----/
  2. execution must respect data dependencies.

    To deal with data race, Use DAG to label them.
    Look ahead using CA to reorder the instruction set.
    ## implicit parallelism - VLIW(compile time)

memory performance

latency & bandwidth
speed & lanes

memory hierarchy

caching

locality

Temporal locality - small set of data accessed repeatedly
spacial locality - nearby pieces of data accessed together

e.g.

Matrix Multiplications have both temporal locality and spatial locality.
IMG_FAC796E5B556-1

performance

cache hit rate is the proportion of data accesses serviced from the cache.
e.g.

processor architectures

  1. a multiprocessor contains several cores communicating through memory.
  2. a multicore has several cores on a single die.
    1. each core is a complete processor, but runs simultaneously.
    2. they share L2/L3 cache.
    3. cheap to replicate CPU state.(registers, program counter, stack) (SMT)

GPGPU

1000+ core stream simultaneously.

Flynn's taxonomy

  • SISD conventional sequential processor.
  • SIMD single control unit for multiple processing unit
  • MISD uncommon
  • MIMD Distributed systems

SIMD

  • control unit fetches single instruction and broadcast it to processing units.
  • PEs each apply instruction to its own data item in synchrony.
    • e.g. adding two arrays.
    • very popular today.
      • dgemm, graphics and video, ML
      • cheap to implement, don't duplicate hardware for fetch.
      • Used in GPU(SIMT), avx, phi
      • 100s bits lanes -> 4-32 lanes

Instruction divergence

SIMD processors can perform different instructions.

Interconnection networks

  • built using links and switches
    • links are fixed connection between 2 processors.
    • switch connect set of processors on input ports with processors on output ports
  • static vs. dynamic
  • quadratic needed

shared memory architecture

all processors shared the same mems-pace.
Pros: easy to write program
Cons: limited scalability.
UMA vs. NUMA

Distributed memory architecture


combination of shared memory and non-shared memory.

Network of workstation(NOW)

connect workstations with networking.
e.g. Beowulf

Bus architecture.

all processors use mem on the same bus.
the bandwidth is the bottlenech.

Crossbar architecture.

switched network for higher end shared memory system.
allow all processors to communicate with all mem modules simultaneously. -nonblocking
Higher bandwidth

topology

multihop networks.
The combination of the bus and cross bar. flexibility between bandwidth and scalability.
feature:

  • Diameter
    • Distance between farthest pair of processors.
    • Gives worst case latency.
  • Bisection width. - fault tolerence
    • Minimum number of links to cut to partition the network into 3 equal halves.
    • Indicates bottlenecks.
    • links out bandwidth.
  • cost
    • the number of links.

1d topologies


meshes and tori



hypercube

advantage

  1. good algorithm to calculate the path(only change the number of different bit)
  2. Bisection can always be \(\frac{P}{2}\) so there's little bottleneck
  3. nodes do not have hierarchy (v.s. fat tree)

Shanghaitech GeekPie 2020 WarmUP CTF Game - G20G Stage 3 Doc

Stage 3

3-1 失踪的快递

湖北省武汉市某同学家。从得到一个快递号,没来的去取,上面的身份证号已经模糊,需要猜出才能取得快递。

快递编号 3102511818424 → X

百度第一次认识 Google 是什么时候 → Y

身份证号

TL;DR - 目前的选择是 42011620060523627X。

前六位

前六位为行政区域编码。

湖北武汉黄陂区

考虑到能自己少做一些就少做一些,目前看到快递单号 3102511818424 还可以:

3102511818424湖北武汉黄陂区420116

这个单号的优点是 直接用百度搜索 会提示“:( 抱歉,查询出错,请重试或点击快递公司官网地址进行查询。”,但实际上到韵达快递官网是能找到的。

日期部分

需要一个带有 年 月 日 的 日期。

百度第一次认识 Google 是什么时候
百度搜 Google最早结果 2001年6月30日20010631
百度第一次删除 Google 是什么时候

可能需要一些线索提示要去“百度百科”找答案

Google 词条编辑历史最早删除 2006-05-2320060523
其他方法

举例:

  • 询问黑板报得到答案

最后四位

数字都给出来,顺序要你自己猜。选择校验码为 X,则可以使用 627X。

3-2 快递的秘密

Onion 域名

blgpxymqjoo35curmvsldxejuq5vsyf5orutrfp25bdan223t62a3vad.onion/42011620010631726X 跳转到一个教务系统的登陆界面。需要输入自己的邮箱和与之匹配的用户名登陆。之后跳转到

查看课件

ppt隐写

改ppt为zip解压出藏在最后的网址和线索

3-3 救人的药

ppt给出线索跳转到jupyter hub 的登陆界面

网址 victoryang00.xyz:5006 用户名 jupyter1-6 密码 g20

每运行一步能得到一部分分数

最后在前端输入所有可能的总共化合物的碳原子比氢原子的比值的最小值(保留13位有效数字)得到分数

此步骤有mutex 锁(显卡只有一块,而训练会allocate全部显存),即一组在运行时,另一组无法进行,也是拉大时间差距的一关

答案是 0.8235294117647

3-4 电话号码

承接上回给出的线索,以下线索按时间顺序(每10分钟)给出,要求得到电话号码

位置提示1

https://j.map.baidu.com/f3/fGw 最接近球状物体的地方

位置提示2

https://j.map.baidu.com/a2/C_w 和上一张图同时存在的地方

位置提示3

上海微小卫星工程中心

答案是 (021)50735001

[Parallel Computing] cuda 默认流&非默认流 (异步流和可视化)分析


并发 cuda stream
默认流具有更高的优先级,在QuEST中默认流为Statevec_compactUnitaryKernel 函数,同时占用的gpu时间和运算重点都在此核函数上。

给定流中的操作会按序执行。

  1. 就不同非默认流中的操作而言,无法保证其会按彼此之间的任何特定顺序执行。
  2. 默认流会受到阻碍,并在其他所有流完成之后方可运行,但其亦会阻碍其他流的运行直至其自身已运行完毕。

定义非默认流,把cudaStream_t stream; 作为参数传递,让编译器自动完成默认流的创建和复制。
cudaMallocManagedcudaMemPrefetchAsync

更详细的内存管理:

  1. cudaMalloc GPU分配内存
  2. cudaMallocHost 把内存分配在cpu上

第三个杀手锏 cudaMemcpyAsync

HPL result after mending the OpenIB

================================================================================
HPLinpack 2.1  --  High-Performance Linpack benchmark  --   October 26, 2012
Written by A. Petitet and R. Clint Whaley,  Innovative Computing Laboratory, UTK
Modified by Piotr Luszczek, Innovative Computing Laboratory, UTK
Modified by Julien Langou, University of Colorado Denver
================================================================================

An explanation of the input/output parameters follows:
T/V    : Wall time / encoded variant.
N      : The order of the coefficient matrix A.
NB     : The partitioning blocking factor.
P      : The number of process rows.
Q      : The number of process columns.
Time   : Time in seconds to solve the linear system.
Gflops : Rate of execution for solving the linear system.

The following parameter values will be used:

N      :  178176   178176   178176
NB     :     384
PMAP   : Row-major process mapping
P      :       2
Q      :       4
PFACT  :    Left
NBMIN  :       2
NDIV   :       2
RFACT  :    Left
BCAST  :   2ring
DEPTH  :       0
SWAP   : Spread-roll (long)
L1     : no-transposed form
U      : transposed form
EQUIL  : yes
ALIGN  : 8 double precision words

--------------------------------------------------------------------------------

- The matrix A is randomly generated for each test.
- The following scaled residual check will be computed:
      ||Ax-b||_oo / ( eps * ( || x ||_oo * || A ||_oo + || b ||_oo ) * N )
- The relative machine precision (eps) is taken to be               1.110223e-16
- Computational tests pass if scaled residuals are less than                16.0

trsm_cutoff from environment variable 9000000
gpu_dgemm_split from environment variable 1.000
check_cpu_dgemm_perf from environment variable 0

        ******** TESTING SYSTEM PARAMETERS ********
        PARAM   [UNITS]         MIN     MAX     AVG
        -----   -------         ---     ---     ---
CPU :
        CPU_BW  [GB/s ]         17.0    17.5    17.3
        CPU_FP  [GFLPS]
                NB =   32         30      51      43
                NB =   64         69      74      71
                NB =  128         78     101      94
                NB =  256         98     116     112
                NB =  512        114     125     122
PCIE (NVLINK on IBM) :
        H2D_BW  [GB/s ]         10.9    11.0    10.9
        D2H_BW  [GB/s ]         12.0    12.3    12.2
        BID_BW  [GB/s ]         16.8    17.5    17.1
CPU_BW concurrent with BID_BW :
        CPU_BW  [GB/s ]         9.3     10.3    9.9
        BID_BW  [GB/s ]         10.4    10.9    10.6
GPU :
        GPU_BW  [GB/s ]         768     774     772
        GPU_FP  [GFLPS]
                NB =  128       5456    5497    5479
                NB =  256       6312    6346    6335
                NB =  384       6635    6785    6729
                NB =  512       6146    6566    6385
                NB =  640       6255    6765    6529
                NB =  768       6178    6677    6463
                NB =  896       6296    6887    6601
                NB = 1024       6318    6760    6497
NET :
        PROC COL NET_BW [MB/s ]
                     8 B           9      10      10
                    64 B          71      82      76
                   512 B         374     425     399
                     4 KB       1660    1738    1698
                    32 KB       2562    2603    2578
                   256 KB       2551    2566    2558
                  2048 KB       2521    2686    2564
                 16384 KB       2543    2549    2545
        NET_LAT [ us  ]         2.7     3.3     3.0

        PROC ROW NET_BW [MB/s ]
                     8 B          26      29      27
                    64 B         176     185     181
                   512 B         810     867     839
                     4 KB       3487    3547    3517
                    32 KB       4715    4938    4827
                   256 KB       10310   10896   10603
                  2048 KB       3793    3812    3802
                 16384 KB       3643    3754    3699
        NET_LAT [ us  ]         0.6     0.9     0.7

displaying Prog:%complete, N:columns, Time:seconds
iGF:instantaneous GF, GF:avg GF, GF_per: process GF


Per-Process Host Memory Estimate: 32.16 GB (MAX) 32.16 GB (MIN)

PCOL: 0 GPU_COLS: 44545 CPU_COLS: 0
PCOL: 1 GPU_COLS: 44545 CPU_COLS: 0
PCOL: 3 GPU_COLS: 44545 CPU_COLS: 0
PCOL: 2 GPU_COLS: 44545 CPU_COLS: 0
2020-02-16 03:09:22.935
 Prog= 1.93%    N_left= 177024  Time= 2.05      Time_left= 104.25       iGF= 35476.18   GF= 35476.18    iGF_per= 4434.52        GF_per= 4434.52
 Prog= 3.20%    N_left= 176256  Time= 3.03      Time_left= 91.75        iGF= 48776.89   GF= 39787.78    iGF_per= 6097.11        GF_per= 4973.47
 Prog= 4.46%    N_left= 175488  Time= 4.01      Time_left= 86.02        iGF= 48350.88   GF= 41884.18    iGF_per= 6043.86        GF_per= 5235.52
 Prog= 6.33%    N_left= 174336  Time= 5.52      Time_left= 81.68        iGF= 46884.70   GF= 43246.86    iGF_per= 5860.59        GF_per= 5405.86
 Prog= 7.56%    N_left= 173568  Time= 6.45      Time_left= 78.89        iGF= 49726.67   GF= 44185.60    iGF_per= 6215.83        GF_per= 5523.20
 Prog= 8.78%    N_left= 172800  Time= 7.47      Time_left= 77.63        iGF= 45087.65   GF= 44308.93    iGF_per= 5635.96        GF_per= 5538.62
 Prog= 10.59%   N_left= 171648  Time= 8.94      Time_left= 75.41        iGF= 46760.45   GF= 44709.92    iGF_per= 5845.06        GF_per= 5588.74
 Prog= 11.79%   N_left= 170880  Time= 9.85      Time_left= 73.67        iGF= 49499.57   GF= 45152.71    iGF_per= 6187.45        GF_per= 5644.09
 Prog= 12.97%   N_left= 170112  Time= 10.84     Time_left= 72.74        iGF= 44732.85   GF= 45114.06    iGF_per= 5591.61        GF_per= 5639.26
 Prog= 14.73%   N_left= 168960  Time= 12.20     Time_left= 70.60        iGF= 48990.39   GF= 45543.73    iGF_per= 6123.80        GF_per= 5692.97
 Prog= 15.89%   N_left= 168192  Time= 13.16     Time_left= 69.67        iGF= 45314.51   GF= 45526.95    iGF_per= 5664.31        GF_per= 5690.87
 Prog= 17.03%   N_left= 167424  Time= 14.06     Time_left= 68.48        iGF= 48046.22   GF= 45688.27    iGF_per= 6005.78        GF_per= 5711.03
 Prog= 18.73%   N_left= 166272  Time= 15.46     Time_left= 67.07        iGF= 45757.55   GF= 45694.55    iGF_per= 5719.69        GF_per= 5711.82
 Prog= 19.85%   N_left= 165504  Time= 16.43     Time_left= 66.33        iGF= 43464.21   GF= 45562.56    iGF_per= 5433.03        GF_per= 5695.32
 Prog= 20.97%   N_left= 164736  Time= 17.28     Time_left= 65.14        iGF= 49538.96   GF= 45757.11    iGF_per= 6192.37        GF_per= 5719.64
 Prog= 22.61%   N_left= 163584  Time= 18.67     Time_left= 63.88        iGF= 44748.96   GF= 45682.17    iGF_per= 5593.62        GF_per= 5710.27
 Prog= 23.70%   N_left= 162816  Time= 19.52     Time_left= 62.86        iGF= 47723.89   GF= 45771.82    iGF_per= 5965.49        GF_per= 5721.48
 Prog= 24.77%   N_left= 162048  Time= 20.46     Time_left= 62.13        iGF= 43350.60   GF= 45661.18    iGF_per= 5418.83        GF_per= 5707.65
 Prog= 26.36%   N_left= 160896  Time= 21.82     Time_left= 60.94        iGF= 44130.63   GF= 45565.69    iGF_per= 5516.33        GF_per= 5695.71
 Prog= 27.41%   N_left= 160128  Time= 22.62     Time_left= 59.90        iGF= 49145.98   GF= 45693.12    iGF_per= 6143.25        GF_per= 5711.64
 Prog= 28.45%   N_left= 159360  Time= 23.58     Time_left= 59.30        iGF= 40933.20   GF= 45499.84    iGF_per= 5116.65        GF_per= 5687.48
 Prog= 29.99%   N_left= 158208  Time= 24.78     Time_left= 57.83        iGF= 48574.61   GF= 45648.24    iGF_per= 6071.83        GF_per= 5706.03
 Prog= 31.01%   N_left= 157440  Time= 25.68     Time_left= 57.14        iGF= 42424.31   GF= 45535.02    iGF_per= 5303.04        GF_per= 5691.88
 Prog= 32.01%   N_left= 156672  Time= 26.47     Time_left= 56.22        iGF= 47689.89   GF= 45599.69    iGF_per= 5961.24        GF_per= 5699.96
 Prog= 33.50%   N_left= 155520  Time= 27.81     Time_left= 55.20        iGF= 42112.81   GF= 45432.53    iGF_per= 5264.10        GF_per= 5679.07
 Prog= 34.48%   N_left= 154752  Time= 28.66     Time_left= 54.45        iGF= 43461.57   GF= 45374.03    iGF_per= 5432.70        GF_per= 5671.75
 Prog= 35.45%   N_left= 153984  Time= 29.40     Time_left= 53.53        iGF= 49076.85   GF= 45467.95    iGF_per= 6134.61        GF_per= 5683.49
 Prog= 36.41%   N_left= 153216  Time= 30.33     Time_left= 52.97        iGF= 38942.69   GF= 45267.77    iGF_per= 4867.84        GF_per= 5658.47
 Prog= 37.84%   N_left= 152064  Time= 31.44     Time_left= 51.65        iGF= 48678.40   GF= 45387.41    iGF_per= 6084.80        GF_per= 5673.43
 Prog= 38.77%   N_left= 151296  Time= 32.32     Time_left= 51.03        iGF= 40203.99   GF= 45246.42    iGF_per= 5025.50        GF_per= 5655.80
 Prog= 39.70%   N_left= 150528  Time= 33.05     Time_left= 50.20        iGF= 47611.40   GF= 45299.00    iGF_per= 5951.43        GF_per= 5662.37
 Prog= 41.08%   N_left= 149376  Time= 34.29     Time_left= 49.19        iGF= 41721.17   GF= 45169.44    iGF_per= 5215.15        GF_per= 5646.18
 Prog= 41.98%   N_left= 148608  Time= 35.17     Time_left= 48.61        iGF= 38661.58   GF= 45006.27    iGF_per= 4832.70        GF_per= 5625.78
 Prog= 42.87%   N_left= 147840  Time= 35.86     Time_left= 47.78        iGF= 48952.92   GF= 45082.13    iGF_per= 6119.11        GF_per= 5635.27
 Prog= 44.20%   N_left= 146688  Time= 37.07     Time_left= 46.80        iGF= 41375.08   GF= 44961.37    iGF_per= 5171.89        GF_per= 5620.17
 Prog= 45.07%   N_left= 145920  Time= 37.79     Time_left= 46.06        iGF= 45648.36   GF= 44974.46    iGF_per= 5706.04        GF_per= 5621.81
 Prog= 45.93%   N_left= 145152  Time= 38.60     Time_left= 45.44        iGF= 40090.04   GF= 44871.78    iGF_per= 5011.25        GF_per= 5608.97
 Prog= 47.21%   N_left= 144000  Time= 39.82     Time_left= 44.52        iGF= 39552.58   GF= 44709.14    iGF_per= 4944.07        GF_per= 5588.64
 Prog= 48.05%   N_left= 143232  Time= 40.47     Time_left= 43.75        iGF= 49061.56   GF= 44778.59    iGF_per= 6132.69        GF_per= 5597.32
 Prog= 48.88%   N_left= 142464  Time= 41.31     Time_left= 43.20        iGF= 37191.35   GF= 44623.80    iGF_per= 4648.92        GF_per= 5577.98
 Prog= 50.11%   N_left= 141312  Time= 42.27     Time_left= 42.08        iGF= 48488.80   GF= 44711.28    iGF_per= 6061.10        GF_per= 5588.91
 Prog= 50.92%   N_left= 140544  Time= 43.06     Time_left= 41.50        iGF= 38233.96   GF= 44591.27    iGF_per= 4779.24        GF_per= 5573.91
 Prog= 51.72%   N_left= 139776  Time= 43.70     Time_left= 40.79        iGF= 47352.86   GF= 44631.53    iGF_per= 5919.11        GF_per= 5578.94
 Prog= 52.91%   N_left= 138624  Time= 44.84     Time_left= 39.92        iGF= 39078.20   GF= 44490.06    iGF_per= 4884.77        GF_per= 5561.26
 Prog= 53.68%   N_left= 137856  Time= 45.67     Time_left= 39.40        iGF= 35469.32   GF= 44326.60    iGF_per= 4433.67        GF_per= 5540.82
 Prog= 54.45%   N_left= 137088  Time= 46.27     Time_left= 38.70        iGF= 48835.00   GF= 44384.52    iGF_per= 6104.37        GF_per= 5548.07
 Prog= 55.59%   N_left= 135936  Time= 47.38     Time_left= 37.85        iGF= 38524.68   GF= 44246.68    iGF_per= 4815.59        GF_per= 5530.84
 Prog= 56.34%   N_left= 135168  Time= 47.98     Time_left= 37.18        iGF= 46924.35   GF= 44280.25    iGF_per= 5865.54        GF_per= 5535.03
 Prog= 57.08%   N_left= 134400  Time= 48.78     Time_left= 36.68        iGF= 34793.40   GF= 44124.28    iGF_per= 4349.17        GF_per= 5515.54
 Prog= 58.18%   N_left= 133248  Time= 49.88     Time_left= 35.86        iGF= 37458.72   GF= 43977.09    iGF_per= 4682.34        GF_per= 5497.14
 Prog= 58.89%   N_left= 132480  Time= 50.45     Time_left= 35.21        iGF= 48334.19   GF= 44025.55    iGF_per= 6041.77        GF_per= 5503.19
 Prog= 59.60%   N_left= 131712  Time= 51.24     Time_left= 34.73        iGF= 33628.72   GF= 43863.84    iGF_per= 4203.59        GF_per= 5482.98
 Prog= 60.31%   N_left= 130944  Time= 51.82     Time_left= 34.11        iGF= 45809.84   GF= 43885.56    iGF_per= 5726.23        GF_per= 5485.69
 Prog= 61.35%   N_left= 129792  Time= 52.86     Time_left= 33.31        iGF= 37783.38   GF= 43765.91    iGF_per= 4722.92        GF_per= 5470.74
 Prog= 62.03%   N_left= 129024  Time= 53.42     Time_left= 32.71        iGF= 45345.68   GF= 43782.68    iGF_per= 5668.21        GF_per= 5472.84
 Prog= 62.70%   N_left= 128256  Time= 54.15     Time_left= 32.21        iGF= 34954.61   GF= 43664.13    iGF_per= 4369.33        GF_per= 5458.02
 Prog= 63.70%   N_left= 127104  Time= 55.82     Time_left= 31.81        iGF= 22502.08   GF= 43031.33    iGF_per= 2812.76        GF_per= 5378.92
 Prog= 64.35%   N_left= 126336  Time= 56.67     Time_left= 31.39        iGF= 29211.49   GF= 42825.40    iGF_per= 3651.44        GF_per= 5353.18
 Prog= 65.00%   N_left= 125568  Time= 57.40     Time_left= 30.91        iGF= 33256.17   GF= 42703.25    iGF_per= 4157.02        GF_per= 5337.91
 Prog= 65.95%   N_left= 124416  Time= 58.21     Time_left= 30.05        iGF= 44190.67   GF= 42724.06    iGF_per= 5523.83        GF_per= 5340.51
 Prog= 66.58%   N_left= 123648  Time= 59.04     Time_left= 29.63        iGF= 28645.97   GF= 42527.36    iGF_per= 3580.75        GF_per= 5315.92
 Prog= 67.20%   N_left= 122880  Time= 59.54     Time_left= 29.07        iGF= 45998.47   GF= 42556.94    iGF_per= 5749.81        GF_per= 5319.62
 Prog= 68.11%   N_left= 121728  Time= 60.42     Time_left= 28.29        iGF= 39488.82   GF= 42512.62    iGF_per= 4936.10        GF_per= 5314.08
 Prog= 68.71%   N_left= 120960  Time= 61.07     Time_left= 27.81        iGF= 34586.02   GF= 42427.74    iGF_per= 4323.25        GF_per= 5303.47
 Prog= 69.30%   N_left= 120192  Time= 61.61     Time_left= 27.29        iGF= 41400.68   GF= 42418.75    iGF_per= 5175.09        GF_per= 5302.34
 Prog= 70.18%   N_left= 119040  Time= 62.86     Time_left= 26.71        iGF= 26402.30   GF= 42100.61    iGF_per= 3300.29        GF_per= 5262.58
 Prog= 70.75%   N_left= 118272  Time= 63.34     Time_left= 26.18        iGF= 45075.96   GF= 42123.15    iGF_per= 5634.50        GF_per= 5265.39
 Prog= 71.32%   N_left= 117504  Time= 64.14     Time_left= 25.80        iGF= 26608.65   GF= 41929.10    iGF_per= 3326.08        GF_per= 5241.14
 Prog= 72.15%   N_left= 116352  Time= 64.94     Time_left= 25.06        iGF= 39254.82   GF= 41896.06    iGF_per= 4906.85        GF_per= 5237.01
 Prog= 72.70%   N_left= 115584  Time= 65.45     Time_left= 24.57        iGF= 41171.51   GF= 41890.50    iGF_per= 5146.44        GF_per= 5236.31
 Prog= 73.24%   N_left= 114816  Time= 66.06     Time_left= 24.13        iGF= 33393.87   GF= 41811.98    iGF_per= 4174.23        GF_per= 5226.50
 Prog= 74.04%   N_left= 113664  Time= 66.79     Time_left= 23.42        iGF= 41230.05   GF= 41805.63    iGF_per= 5153.76        GF_per= 5225.70
 Prog= 74.56%   N_left= 112896  Time= 67.39     Time_left= 22.99        iGF= 32345.48   GF= 41720.09    iGF_per= 4043.19        GF_per= 5215.01
 Prog= 75.08%   N_left= 112128  Time= 67.91     Time_left= 22.54        iGF= 37707.11   GF= 41689.62    iGF_per= 4713.39        GF_per= 5211.20
 Prog= 75.84%   N_left= 110976  Time= 68.77     Time_left= 21.91        iGF= 33207.24   GF= 41583.13    iGF_per= 4150.90        GF_per= 5197.89
 Prog= 76.34%   N_left= 110208  Time= 69.40     Time_left= 21.51        iGF= 30057.75   GF= 41479.33    iGF_per= 3757.22        GF_per= 5184.92
 Prog= 76.83%   N_left= 109440  Time= 69.84     Time_left= 21.06        iGF= 42264.53   GF= 41484.26    iGF_per= 5283.07        GF_per= 5185.53
 Prog= 77.31%   N_left= 108672  Time= 71.08     Time_left= 20.86        iGF= 14652.32   GF= 41013.65    iGF_per= 1831.54        GF_per= 5126.71
 Prog= 78.03%   N_left= 107520  Time= 71.99     Time_left= 20.27        iGF= 29812.22   GF= 40873.13    iGF_per= 3726.53        GF_per= 5109.14
 Prog= 78.49%   N_left= 106752  Time= 72.71     Time_left= 19.92        iGF= 24299.69   GF= 40707.76    iGF_per= 3037.46        GF_per= 5088.47
 Prog= 78.95%   N_left= 105984  Time= 73.13     Time_left= 19.49        iGF= 41940.69   GF= 40714.74    iGF_per= 5242.59        GF_per= 5089.34
 Prog= 79.63%   N_left= 104832  Time= 73.95     Time_left= 18.91        iGF= 31090.48   GF= 40607.58    iGF_per= 3886.31        GF_per= 5075.95
 Prog= 80.08%   N_left= 104064  Time= 74.53     Time_left= 18.54        iGF= 28726.10   GF= 40514.59    iGF_per= 3590.76        GF_per= 5064.32
 Prog= 80.51%   N_left= 103296  Time= 74.98     Time_left= 18.15        iGF= 37150.07   GF= 40494.65    iGF_per= 4643.76        GF_per= 5061.83
 Prog= 81.16%   N_left= 102144  Time= 75.72     Time_left= 17.58        iGF= 32584.68   GF= 40416.72    iGF_per= 4073.08        GF_per= 5052.09
 Prog= 81.58%   N_left= 101376  Time= 76.20     Time_left= 17.20        iGF= 33444.77   GF= 40373.20    iGF_per= 4180.60        GF_per= 5046.65
 Prog= 82.00%   N_left= 100608  Time= 77.02     Time_left= 16.91        iGF= 19037.34   GF= 40145.25    iGF_per= 2379.67        GF_per= 5018.16
 Prog= 82.61%   N_left= 99456   Time= 77.77     Time_left= 16.37        iGF= 31036.06   GF= 40058.23    iGF_per= 3879.51        GF_per= 5007.28
 Prog= 83.01%   N_left= 98688   Time= 78.28     Time_left= 16.02        iGF= 29557.06   GF= 39989.80    iGF_per= 3694.63        GF_per= 4998.73
 Prog= 83.40%   N_left= 97920   Time= 78.75     Time_left= 15.67        iGF= 31521.92   GF= 39939.16    iGF_per= 3940.24        GF_per= 4992.40
 Prog= 83.98%   N_left= 96768   Time= 79.38     Time_left= 15.14        iGF= 34413.02   GF= 39895.00    iGF_per= 4301.63        GF_per= 4986.87
 Prog= 84.36%   N_left= 96000   Time= 79.89     Time_left= 14.81        iGF= 27780.50   GF= 39817.11    iGF_per= 3472.56        GF_per= 4977.14
 Prog= 84.73%   N_left= 95232   Time= 80.34     Time_left= 14.48        iGF= 31196.37   GF= 39768.82    iGF_per= 3899.55        GF_per= 4971.10
 Prog= 85.28%   N_left= 94080   Time= 81.14     Time_left= 14.01        iGF= 25847.14   GF= 39631.79    iGF_per= 3230.89        GF_per= 4953.97
 Prog= 85.64%   N_left= 93312   Time= 81.75     Time_left= 13.71        iGF= 22376.33   GF= 39504.58    iGF_per= 2797.04        GF_per= 4938.07
 Prog= 85.99%   N_left= 92544   Time= 82.14     Time_left= 13.38        iGF= 33941.78   GF= 39478.11    iGF_per= 4242.72        GF_per= 4934.76
 Prog= 86.50%   N_left= 91392   Time= 82.88     Time_left= 12.93        iGF= 26158.93   GF= 39358.40    iGF_per= 3269.87        GF_per= 4919.80
 Prog= 86.84%   N_left= 90624   Time= 83.22     Time_left= 12.61        iGF= 37628.00   GF= 39351.37    iGF_per= 4703.50        GF_per= 4918.92
 Prog= 87.17%   N_left= 89856   Time= 83.72     Time_left= 12.32        iGF= 24988.33   GF= 39265.49    iGF_per= 3123.54        GF_per= 4908.19
 Prog= 88.60%   N_left= 86400   Time= 85.50     Time_left= 11.00        iGF= 30110.08   GF= 39074.56    iGF_per= 3763.76        GF_per= 4884.32
 Prog= 90.05%   N_left= 82560   Time= 88.07     Time_left= 9.73 iGF= 21336.49   GF= 38557.09    iGF_per= 2667.06        GF_per= 4819.64
 Prog= 91.25%   N_left= 79104   Time= 90.30     Time_left= 8.66 iGF= 20259.09   GF= 38105.32    iGF_per= 2532.39        GF_per= 4763.17
 Prog= 92.35%   N_left= 75648   Time= 92.03     Time_left= 7.63 iGF= 23894.57   GF= 37837.86    iGF_per= 2986.82        GF_per= 4729.73
 Prog= 93.45%   N_left= 71808   Time= 94.32     Time_left= 6.61 iGF= 18238.09   GF= 37362.12    iGF_per= 2279.76        GF_per= 4670.26
 Prog= 94.35%   N_left= 68352   Time= 96.12     Time_left= 5.75 iGF= 18874.93   GF= 37016.15    iGF_per= 2359.37        GF_per= 4627.02
 Prog= 95.17%   N_left= 64896   Time= 97.55     Time_left= 4.95 iGF= 21433.84   GF= 36787.46    iGF_per= 2679.23        GF_per= 4598.43
 Prog= 95.90%   N_left= 61440   Time= 99.00     Time_left= 4.23 iGF= 19137.51   GF= 36530.45    iGF_per= 2392.19        GF_per= 4566.31
 Prog= 96.62%   N_left= 57600   Time= 100.51    Time_left= 3.51 iGF= 18001.20   GF= 36251.72    iGF_per= 2250.15        GF_per= 4531.46
 Prog= 97.19%   N_left= 54144   Time= 101.67    Time_left= 2.94 iGF= 18516.54   GF= 36048.39    iGF_per= 2314.57        GF_per= 4506.05
 Prog= 99.14%   N_left= 36480   Time= 106.77    Time_left= 0.92 iGF= 14414.00   GF= 35015.81    iGF_per= 1801.75        GF_per= 4376.98
 Prog= 99.89%   N_left= 18432   Time= 110.04    Time_left= 0.12 iGF=  8624.06   GF= 34231.83    iGF_per= 1078.01        GF_per= 4278.98
 Prog= 100.00%  N_left= 768     Time= 111.76    Time_left= 0.00 iGF=  2427.21   GF= 33742.39    iGF_per= 303.40         GF_per= 4217.80
2020-02-16 03:11:15.757
================================================================================
T/V                N    NB     P     Q               Time                 Gflops
--------------------------------------------------------------------------------
WR02L2L2      178176   384     2     4             112.82              3.342e+04
--------------------------------------------------------------------------------
||Ax-b||_oo/(eps*(||A||_oo*||x||_oo+||b||_oo)*N)=        0.0031046 ...... PASSED