我们现在似乎处在一种非常奇怪的状态,一方面是我们综合国力的发展,大家都觉得现在比历史上任何时期都接近中华民族的全面复兴,没有人认为我们处在衰退之中。

另一方面是最近的经济环境,想必大家都感受到了,到处是失业裁员,一片哀鸿遍野。看起来似乎问题很大。

这篇文章里我们就仔细讨论下当前的经济问题,我本来只是想简单的写一下自己的一些想法,按说不会有太长的篇幅。但这样会让很多对金融体系不熟悉的人产生费解,于是就不得不一步步的仔细解释一下各种各样的原理和机制,所以这篇文章就最终堆了两万多字。为了便于阅读,我把这些东西都分了章节部分。如果你非常熟悉这些理论原理,可以接跳过相应的部分。

使用生产率来衡量综合国力

首先我们探讨一下综合国力,一个国家的国力如何衡量是一个复杂的问题,现在大家主流的思路是去对比各国的GDP也就是国内生产总值。

然而GDP来衡量经济实力并不是完全正确的,主要有两个原因。一是各国之间的汇率有浮动,二是每个国家的物价不同。比如美国人民去剪一个头发可能需要花费40美元,也就是说大致两三百块人民币但是在中国剪一个头发很可能50块人民币就够了。所以简单的GDP总量并不能真正反映一个国家的真实能力。

于是经济学家们就提出来了购买力平价PPP综合考虑了不同国家的大部分常用物品的物价水平,能够更加真实的反应不同国家之间的货币购买力。

美国2022年的GDP25万亿左右,而我国则差不多是18万亿美元。但是要是按购买力平价来折算的话,我们的GDP就变成了30万亿左右的样子。这里要注意购买力平价折算后美国的GDP并没有变动,这是因为我们折算购买力是以美元为基准的。

所以要按照购买力平价来计算的话,我们的GDP总量已经是全世界第一了。但不要高兴的太早,这里说的是总量,论人均我们还是有不小差别,需要继续努力。

实际上即便是购买力评价折算后的GDP也不能精确的去衡量一个国家的真正实力。

我们做个简单的比喻,假如每个国家都是一个人的话,这时候大家玩儿一个游戏,把这每个人都随机单独流放一个荒岛上,谁会过得更好呢?

这时候衡量标准就变了,如果一个人想要在荒岛上过的更好,那就要比每个人的个人能力。比如玩家C吃苦耐劳,个人能力很强,干活效率非常高。他不停的造网捕鱼,种庄稼采摘水果,建房子,制造桌子,椅子,狩猎纺织,酿酒,造船。可想而知,他最终享有的物质水平和生活质量是非常高的。

玩家A则是另一番场景,他有些懒惰,能力不足,又经常抽烟身体不好,缺乏各种各样的技能,只能想方设法在树上找点儿野果吃。捕鱼的效率很低,只有鱼不小心跳到岸上,他才能上去抓那么一两个,大部分时间他都在睡觉发呆,饥一顿饱一顿。他的游戏结局应该非常凄惨。

真实的国家状态跟这个类比是很相似的。经济学上把一个国家生产制造各种各样物品的能力称为生产率productivity。在一个生产率高的国家,拥有大量受教育的高素质人才和高技能的工人,而且国民们勤奋,吃苦耐劳,努力生产。制造生产各种物资用品的效率水平都很高。

曾经二战前的美国是这个样子,现在的我们也是这个样子。强大的制造业实力,生产几乎能够供应全世界的物品。

另一方面,全球化的自由贸易会导致每个国家的GDP产出好像都是均等的样子,那是因为他们可以通过贸易来跟其他国家兑换各种各样的工业品,比如一个很贫穷的国家,他们有大量的耕地资源,于是就把种出来的粮食跟其他国家来交换各种各样的制成工业品,比如衣服家电汽车之类的,这些国家本身并不能生产这些物品,可是自由贸易却导致他们可以获得拥有这些物品,从而提高了他们的生活质量,造就了好像也很繁荣的假象。

可是如果一旦发生突然的变故,类似于全球每个国家都孤岛化。很快我们就能看出来,在那些没有生产能力的国家,他们的生活水平会迅速的退化。

所以生产率是衡量一个国家真实能力的更加有效的标准,这跟我们直觉上的综合国力的提升是基本一致的。从这一点上来衡量,我们国家几乎是当之无愧的世界第一了。

不过我们要清醒的看到,这里衡量的标准指的是经济实力,现在美国仍然在科技实力和军事实力方面领先我们。

尤其是高科技领域我们还是有所欠缺,我们目前更擅长大规模的把技术应用起来,产业化起来。但在新技术新领域的开拓和引领技术创新方面还有很多需要学习的。

总的来看,虽然有一些波折,大趋势是我们的综合国力不断的增强,民族接近复兴,这是好的一方面,我们要保持自信。

好了,一开始说这些的目的是在总体大趋势上先打打气,让我们先意识到好的一方面,以免觉得过于沮丧。下面我们就要开始讨论不那么乐观的一部分了。

单纯的逃避不去面对问题是不行的,我们要认真仔细的去找到问题,分析研究问题的本质,以及尝试如何去解决这些问题。

就像我们刚才讨论的GDP并不是一个很有用的衡量我们国家国力的标准。我们举个例子。

比如一个城市不停地造房子,比如他去年造了100所房子,但是今年造了120所房子,这一切都能计算到GDP里,那么这所城市的GDP就增长了20%。如果房价在这一年当中又涨了一些,那GDP的增长就更多了。

然而在这个过程中,这座城市的综合实力增加了吗?未必。因为真正的实力衡量是这座城市里建造这些房子的工人快速建造房子的能力,实际上如果完全没有任何资金,土地和原材料等方面的限制的话,可能这些工人每年能建造1000所房子。明年比今年多建几所房子,并不能说明这些工人的能力或者建造速度增强了,只是说明他们的产能输出多释放了一点。

可是比如说这些工人的技能提升了,能造一些很复杂以前造不出来的房子,这样我们就会认为他们的实力和竞争力变强了。

这样我们如果来看,比如第一年造了100所房子,第二年可能只造了30所房子。明面上的GDP好像还跌了,但是新造的30所房子,每一所的建筑水平都是一个非常高的,以前从未达到过的工程奇迹。这样来说,这座城市里面的人们的综合实力反而是提升了。他们只是没有简单的重复自己去造更多的房子而已。

我们国家现在已经从贫困里走了出来,而且产能也差不多大致满足了所有人的需求。剩下过多的重复自己并没有太大的意义。

也就是说现阶段我们只是简单的看GDP并没有太大的作用了,更多的标准是我们生产率的提升。也就是说科技或者创新方面不停的提升自己的能力显得就更为重要了。

实际上我们现在的状态和美国在二战前的状态非常相近,当时美国经济实力已经超过了欧洲,但还不是当时的全球科技中心。

是战争导致的大量移民和美国相对稳定繁荣的环境,才使得科技中心逐渐转移到了美国。

美国同样在上世纪30年代产生过一个大萧条,主要原因是我们所谓的资本主义产能过剩。他跟我们今天遇到的环境有一定的相似性

我们现在遇到的问题主要是盲目炒房导致的泡沫,但这只是一个导火索,更大的一个问题则是,大量的疯狂借贷导致无力偿还,进而有可能引发的一个系统性的金融崩溃。

其实产能过剩在10年前就有一定的苗头了,只是房地产疯狂的贷款,使得大量资金流到了市面上这些资金支撑了过去大量的购买力, 维持了本来很多行业表面上的繁荣。

这一切跟当年美国的大萧条时期的过剩产能类似, 在最初产能有点过剩之后,他们也是靠大量的借贷投资维持一定的购买力支撑了一些年的繁荣。有趣的是,这段时间里他们的工薪阶层也在拼命的加班,跟我们现在的状态非常相似。

然而依靠信贷支撑的繁荣不可能永远持续,最终导致了美国后来大规模的系统性金融崩溃,大量的人失业流落街头。

当时的美国人主要是在股市和消费上面加杠杆,而我们现主要是买房加杠杆,还有一部分地方政府大量的借贷杠杆。除了杠杆的性质不同,政府大量的超发货币,以及依赖信贷流出来的钱造成的购买力繁荣都是类似的。

我们现在回顾那段历史,没有人认为1930年的美国是他们国力的最低点,真实情况恰恰相反,那正是他们真正形成全球霸权的开端,可是明明一个拥有强大生产能力的经济体,国力蒸蒸日上,怎么在一夕之间就陷入大萧条呢?研究他们历史也许会给我们今天遇到的困境提供一些解决方案。

我们现在情况也比他们好很多,现在的银行制度比当时完善了更多,而且我们有一个强大的中央政府,拥有更多的操作工具和手段。

但最重要的一点是大部分中国人喜欢储蓄, 除了房子汽车以外,一般不会肆无忌惮的靠借贷去消费,这是跟当时的美国最大的不同。

银行和准备金率

所有这一切要先从银行说起。

假如有一个古代人穿越到了现代,那么他一定会对我们的银行机制感到比较好奇。因为他会发现,当人们把钱存到银行的时候,银行非但不收保管费,而且还付给存款的人一定的利息。这种赔本的买卖,他们为什么要做呢?

答案很简单,这个问题的核心就在于,银行同时还经营放贷的业务。贷款的利息和存款的利息是不一样的。比如存款利率可能是2%,当我们买房子申请贷款的时候利率很可能就是5%。这两个利率之间的差价就是银行获得的利润。

所以银行有足够的动机付给存款人利息。因为存款的人多了,那么他可以放出去的贷款量就多了。相应的他们赚的钱也就更多了。

这两个利率之间的差价就叫做净息差,差价越高,银行的利润率也就越高。

关于利息的本质,我们先放一放后面再讨论。现在先看一下另外一个非常重要的问题。

假设一开始有一家银行,它没有任何存款,这时候有一个人比如说A100块钱存到银行里。于是银行就有了100块的存款。然后又来一个人比如说B要贷款,于是银行就把这100块钱借出去给了他。

注意这时候银行的账户上的资金总额是0。这时候再来一个人,比如说C也要贷款,银行可能会对他说,对不起,我们现在没有钱可以借给你了。这很正常,造成不了什么问题。

可是这个时候假如说A突然有急事需要用钱,他跑去银行要把自己的那100块钱取出来,银行该怎么办呢?这就是一个非常大的问题了。

幸好我们真实的世界是比较复杂的,因为有大量的人去银行存钱,也有大量的人进行贷款。这中间出现像我们刚才说的A那样突然急需用钱中途把钱取出来的情况比较少。所以银行只需要预留出来一小部分钱应付这些人的需求就可以了。

比如我们假设现实世界中的一家银行有100亿的存款,他可能保留着10亿人民币来应付这些突发的取钱情况就好了,剩下90亿人民币全部都可以用来放贷。

那银行要保留多少钱来应付这些突发情况才是合理的呢?很多人可能认为随便差不多保留一部分就可以了,这似乎不是什么大不了的事情。

然而,在我们真正的真实经济世界中,这一笔保留着用来应付突发情况的钱,非常非常重要,它是很多问题的核心,几乎讨论所有的金融问题都绕不开它。

这时候你可能会问了,既然它是这么的重要,那么他应该有一个专门的名字吧。

没错,他的名字就叫准备金。我们更常用的一个词是准备金率。他是一个百分比,也就是银行需要保留存款的多大一部分来应付突发情况

比如准备金率是20%的话, 那么当银行有100亿的存款的时候,他至少要保留20亿的准备金。如果准备金率是10%的话,那么他保留10亿就可以了。

实际上这个准备金率是如此的重要,以至于国家一定要强制监管才行。它的数值由各国的央行来进行控制调整。每个银行都要按照国家的法定准备金率保留足够的钱存到中央银行的账户上。

可能大家经常都会在新闻里听到降息降准这些词汇,降准指就是调整降低这个准备金率。

其实银行还有一些其他手段来解决手头现金储备不足的问题,比如找其他人借。就像我们刚才说的当A去银行取钱的时候,银行没有足够的现金提供给他了, 那就可以找同行先借点儿。因为很可能另一家银行有充足的现金储备,只要给同行足够的利息,让他们有钱赚,为什么他们不借呢?

这是很正常的事情,在现实世界中也经常发生,由于这笔钱经常是同行之间应急进行的借款, 一般隔一天就还了, 所以他的利息有个专门的术语叫隔夜利率,或者叫银行同业拆借利率, 很可能你在新闻中看到过。

同样的,除了向同行来借钱,也可以找央行来借 找央行借的话,可以分为两种,一种是拿现有票据找央行贴现,另一种是直接找央行再贷款。后面我们会详细的讨论再贷款的细节。

同业拆借和贴现这些概念除非是金融行业的从业人士,对大部分人来说并不重要,我们没有必要深入的去讨论他了。

但准备金率却是非常非常的重要, 他会影响到我们经济的每一方面,我们下面就慢慢的展开来说。

还是回到前面的银行,现在我们假定准备金率为10%。这家银行一开始有100亿的存款,这时候他可以放出的贷款是90亿,现在假设有一大帮人要买房子,他们把这90亿全部都贷出去,然后每个人都买了自己的房子过上了快乐的生活

然而这90亿消失了吗?显然没有,这些钱流向了出售房子的那些人,我们假设是开发商吧。开发商赚到了这90亿,然后又把这些钱存到了之前的那家银行里。请仔细注意思考这一点,它很重要。因为这个过程无中生有凭空的创造增加了市面上流通的货币

现在我们看一下这家银行手头的存款,他拥有的所有的存款量是100+90=190亿。但是他拥有的现金并不是这样的。他拥有的现金是之前的剩下10亿的准备金,再加上这90亿新增的存款。一共是100亿。

那么现在银行又有多少钱可以接着放贷呢?按照10%的准备金率,这新增的90亿存款里边,他只需要保留9亿作为准备金,剩下的81亿人民币全部都可以作为贷款再放出去。

我们再按照前面说的,一些人又把这81亿贷出去,全部买成了房子,赚到钱的开发商又把这81亿全部存到了银行里。这时候银行的存款总量就变成了,100+90+81=271亿人民币。

我们接着前面的循环,这新增的81亿银行只要保留8.1亿人民币作为准备金,剩下的72.9亿人民币又可以全部贷出去。

可以看出来一些规律了,那就是每次新增加的存款量都是上一次的0.9倍。如此不停的往复存款贷款的循环,那么银行到最终会拥有多少的存款量呢?

为了便于计算,我们假设一开始银行有一块钱,按照0.1的准备金率,不停的重复这个放贷存款循环。则每一轮新增的的存款量依次是0.90.9的平方,立方。如此不停的加,我们可以得到下面银行最终存款量的公式

1+0.9+0.92+0.93+0.94……

很显然这是一个等比数列,还记得高中的数学知识吗?他的求和公式是

Image

n趋近于正无穷的时候,因为q<1, 所以q的n次方趋近于0。这个公式就变成了a1/(1-q),因为a1等于1,这个公式就简化成了

Image

在我们的公式中,q0.9,它的值就是10,我们可以更进一步的简化这个公式,因为1-q就是我们的准备金率,而且a1等于1,那么它的数值就是

Image

也就是准备金率的的倒数。

也就是说假如说存款准备金率是10%的话,银行一开始有100亿的存款,经过不停的放贷存款放贷存款的这个循环,到最终银行拥有的存款数量就是1000亿。也就是说一开始存款数量的十倍,也就是我们准备金率的倒数倍。

如果存款准备金率是20%的话,那么这个数字就会是五。也就是说银行最终会拥有500亿的存款。

这个存款准备金率的倒数,我们有个专有的名词称呼他,叫做货币乘数。其实这个名称更容易让我们理解。

也就是说假设一开始有100块存款,按照10%的准备金率,通过不停的借贷循环,总共能够释放出来的货币数量是最初货币数量的十倍。也就是说货币乘数是十。如果准备金率变成20%,相应的货币乘数也就变成了5,通过这个借贷循环能够释放出来的货币数量就只有最初存款数的五倍了。

现在你应该意识到存款准备金率的重要性了,他是我们所有杠杆的来源。换句话说,在过去的十几年里,他一直是我们货币增发或者说放水或者印钞票的最主要的工具。

事实上,在过去的从2015年到现在的近十年里,央行不停地降准从21%左右一直到今天的7%左右,也就是说货币乘数从5倍左右一直涨直到现在的将近15倍,等于市面的上货币总量翻了两倍。事实上真正的增量并没有这么简单,随着我们后面再仔细的分析,你就会看到其他的因素以及真正的增量。

下面这张图来自于央行官网,链接在这里

货币总量M2,金本位,以及我们的货币投放机制

下面我们就讨论一下我们国家的货币总量,以及货币是如何增发的。

市面上流通的货币总量用什么来衡量呢?我们假设是所有人的手头的钱加在一起,也就是说你拥有的所有存款,不管是手头的现金,还是活期存款还是定期存款。除了个人以外,另外一些公司,组织之类的法人机构或者政府机构,他们同样也能在银行设立账户,我们把普通人和这些实体看成是一样的,也就是说货币总量就是所有能在银行设立账户的实体的所有手头上钱的总和。

这个流通的货币总量我们有个专业的术语,叫做M2,想必大家都曾经看到过或者听说过。当然有M2就有M1M1一般指手头的现金加上活期存款,并不包括定期存款。我们暂且先忽略这些细节吧,姑且认为M2就是市面上的货币总量。

假设让我们回到刚解放的时候,事实上早期的钱是非常少的,那时候毕竟一穷二白,这时候政府发行人民币该印多少钞票呢?

当时国民党晚期的通货膨胀历历在目,这是他们政权崩溃的一个重要原因。

假如你穿越过去负责发行人民币,如何才能避免不随便乱印而保持币值稳定呢?

有一个非常简单的方法,那就是绑定白银或者黄金,假设这时候央行对解放区的人民发行货币,按照严格的汇率兑换,市面上谁有白银或者黄金,比如按照十块钱一克白银的方式严格的进行兑换,跟白银严格挂钩,这样就可以保持人民币的币值稳定。

实际上当人们拿着银子兑换成钞票的时候,钞票本质上就变成了一种方便携带的银子而已。我国历史上的钱庄发行的银票,是真实存在而且真正发挥过货币作用的。

那么政府怎么发行货币呢?只要兑换市面上的白银就行了,手里持有银子的人跑去找央行兑换,类似于去古代钱庄换成银票。央行吞进去白银,然后释放出人民币,这样整个人民币的投放过程就完成了。

实际上央行并不亲自下场去经营业务,而是搞一帮银行小弟们,市场上的每一个人跑去银行兑换,最后这些银行小弟们跑去找央行兑换就可以了。

不要小看这个制度,他非常重要,在人类历史上一直存在,实际上美国的央行美联储一直就是这么干的。所不同的是他们用的是黄金,把美元跟黄金严格的挂钩,当你手上有一些黄金的时候可以找美联储按照固定的兑换比率换成美元,而且如果需要的话,你随时可以用固定的兑换比率找美联储把手头的美元换成黄金。也就是说美联储就是一个巨大的银庄,他在发行类似银票的东西,美元某种程度上就意味着你在美联储的黄金的存托凭证。

这种制度叫做金本位,美国一直持续使用到了1975年,才放弃了这个制度,把美元跟黄金脱钩,不再严格的兑换。

甚至我们可以认为1975年之前的美元,跟我们国家历史上的银票是基本一样的,他们本质上是一种东西。

那我们最早的那一批人民币是如何发行的呢,是以黄金或者白银为标准来保证币值的吗? 实际上并不是,因为当时解放区一穷二白,并没有太多的黄金之类的储备。

早期解放区流行的各种各样的,不管是工资还是其他的计价标准,一般用的都是粮食比如小米之类的,比如说某干部的工资一个月发多少斤小米等等,这种制度可以被称作粮本位

最早的人民币发行就是以当时八路军手里握有的大量的粮食和棉布之类的物资作为后盾只要严格的保证最早的人民币可以按稳定的比率兑换粮食和布匹,那么就可以保证这个货币购买力的稳定性

我们建国初期是计划经济这时候货币的重要性就打了一定的折扣当时大量使用了粮票布票之类的作为兑换凭证,以至于早期的钱非常少,而且重要性也并不高。这段时期我们国家的货币政策也不是特别透明我们暂且先不关注他吧,现在我们从改革开放之后,关注人民币向市场上投放的历史。

我们国家开始慢慢富起来,就是从改革开放之后开始的,这个时候我们制造生产了大量的工业制成品卖到了国外,其他国家用他们自己的货币来购买我们的商品,我们统一认为都是美元吧。

假如当年你或者你爸开了一家工厂,比如制造家具卖到了美国,然后赚了大把大把的美元到手里,这时候怎么在国内花呢?

因为我们国内用的是人民币,大部分人都不知道美元是什么,即便知道也不好确认它是不是假钞票这时候你就要找人把美元换成人民币了,有人愿意用人民币给你换美元吗?

当然有,比如说有些工厂需要进口国外的机器,他们就需要用美元向外国人购买这些产品,就会用自己手头的人民币来跟你兑换。

正是因为有大量的人需要进行这些交易兑换操作,进而专门形成了一个外汇兑换交易的公开市场,你只要到这个公开的市场上进行买入或者卖出就可以了。

允许人们自由的公开进行兑换,就会产生一个随之而来的效应,那就是汇率是自由的浮动的,这跟买东西相互砍价是一样的。比如大家都要把人民币兑换成美元,那么相对而言美元就更贵了,而人民币就便宜了,比如大家经过协商决定用9块钱人民币兑换一美元。

另一方面如果有人大量的用美元换人民币的话,那么人民币就会升值,结果很有可能最终大家协商决定用6块钱人民币来兑一美元。

随着改革开放我们制造业不断的发展,大量的工业制成品被卖到了国外,随之而来的是大量的美元涌入到了我们国内,这时候就会出现一个问题,交易市场上大家手里都有大把大把的美元想换成人民币,而这时候人民币的拥有量又比较少,不可避免的人民币就会升值。

我们假设一种极端情况,比如说1人民币兑换一美元,这时候就会严格损害我们国家的贸易出口。比如美国人本来买个椅子要花70美元,我们在国内制造一个椅子,也是卖70人民币,按1:7的汇率,卖到美国的话,美国人只需要花10美元就能买到这把椅子,如果美元兑人民币汇率是1:1的话,那么美国人买这把椅子就要付出70美元,如果他们在国内本来就可以以这个价格买得到的话,为什么要买中国生产的呢?

所以改革开放时期我们面对大量美元涌入,人民币不断升值的时候,央行为了稳定汇率,就大量的在公开市场上买入美元。

这时候你拿着你或者你爸开的工厂赚到的美元,跑去公开市场上找人换人民币的时候,吆喝了一圈,发现大家都是拿着美元来换人民币的,几乎没有几个人愿意花人民币跟你换美元,当你们正好几个人围着一个手里握着人民币的人争相降价抢客户的时候,一个名叫央行的土豪突然出现了,价格非常公道,而且不管你手里有多少美元,他都能照单全收,给你换成人民币,你是不是感动的泪流满面?

实际上央行这个过程就是在印钞票,也就是我们所谓的放水。行购买美元所支付的人民币的钱从哪里来?很简单,因为货币都是他发行的,他只要在账本上记着多发了多少人民币就行了。我们前面用的比喻可能比较形象化,事实上这一切操作你只需要跑到银行柜台执行简单的结汇操作就能直接把手里的美元现汇换成人民币了。

当央行在公开市场上买入美元,然后吐出人民币,我们整个市场上的货币供应量就增加了。

这个过程很完美的解决了前面大量美元流入的问题,现在这些通过卖出工业制成品赚到的美元最终都流到了央行的账户上成为了央行的外汇储备。

那么央行在这个过程中总共印了多少钞票呢?很简单,我们看一下央行的外汇储备量就知道了。现在央行持有大致3万多亿美元的外汇储备,这也就大致意味着有20多万亿人民币被印出来流到了市场上。

20多万亿人民币最终都流入到了每一个辛勤劳动人的手上,无论是工厂老板还是工人,每个人都分到了一部分,这也是当年我们逐渐富起来的那个过程中,资金流动的一个生动的反映。

按照我们十几亿人来算的话,摊到每个人头上人均能有一两万块的样子。

我们可以认为这个增发的货币量就是赚的外国人的钱。它是以央行的外汇储备为担保的,央行随时都有能力把这些人民币兑换成相应的美元。实际上我们甚至可以认为这些美元就是外国人用黄金来购买我们的产品,我们基于这些黄金进行的一些相应的货币的发行,毕竟美元直到1975年才取消了金本位脱离了跟黄金的严格挂钩。基于全世界人民的统一认可,它一直保持着相对稳定的币值。

行记账的资产负债表的表格上,新增的资产美元相应的增加了,同样为了收购这些美元花出去的人民币而形成的负债也相应的增加。这时候表格上就记着3万多亿美元的外汇资产,20多万亿的人民币负债。

央行来说发生了什么了,什么都没发生,就是他资产负债表上的这两个数字变大了而已,换句话说就是表格数字扩张了,简称扩表,想必大家经常在新闻里看到央行扩表之类的词。扩表就是印钱。

基于现在的中美关系,以及美国逐渐衰落的趋势,央行持有美元并不是特别安全的选择了,所以最近我们可以看到,央行正在逐渐的用这些外汇储备在国际市场上购买黄金以规避风险。

实际上,通过在公开市场上购买美元的操作虽然能够投放人民币到市场上,但是这是一个很被动的过程。

因为我们要稳定汇率,等有美元进来的时候,央行要发人民币,但是当资金外流,也就是说大家都要用人民币换美元,这时候央行就不得不把手里的外汇储备释放出来,然后吞进去人民币了。只有这样才能尽可能的保证人民币汇率保持在一个相对固定的区间。

除了被动的通过外汇来增发回收人民币以外,央行还有一些其他的手段主动的向市场上投放基础货币,或者说印钞票放水。

其中最重要的一个手段就是,直接发放贷款给商业银行。还记得我们前面说过,A去取钱的时候银行因为没有足够的现金的情况吗?除了留够一定量的准备金,还可以找同行借,或者找央行再贴现和再贷款。

这些贷款类型各种各样,比如时间长短不同,抵押类型不同,或者有一些是专门面向特定行业的,所以就有了各种各样的专业的术语。比如SLF(常备借贷便利),MLF(中期借贷便利),PSL(抵押补充贷款),SLO(短期流动性调节工具), 等等很可能你在新闻上面看到过。

不用被这些各种各样不同的专业术语吓到,只要知道这都是央行给各个商业银行的贷款就行了。

这种投放货币的方式是在2013年左右以后才开始的。到现在一共大约投放了将近14万亿左右货币的样子。

对于国家是否在放水印钞票,我们要记住的一点是,要把央行和政府区分开。

政府并不能凭空的创造货币,如果他缺钱的话只能去借。比如发行国债面向社会去借钱,或者直接找商业银行进行贷款。

真正能创造货币的是央行,所以我们说的放水或者印钞票,最主要看的对象就是央行。

央行不管进行什么操作,只要他向外吐出了人民币,那就是在放水印钞票。相反,如果是他吞进去了人民币,也就是说不管市面上的钱通过什么方式最终流到了他的手里,那么他就是在减少市面上的货币供应量,就是在收缩。

比如政府发行国债就不会造成市面上的货币增发,因为他是在借钱,借完钱后再花出去,跟普通人借钱没有任何区别。这个过程并不牵扯到任何的货币增发和减少。

央行才是一切货币的源头。

我们看一个新闻,你搜索一下就可以找到。2022央行曾经中央财政上交结存利润超过一万亿实际上,这就是真正的放水印钞票。

而且这1万亿基础货币流通到市场上,也不是简单的字面意义上的一万亿,还记得我们前面说过的准备金率的货币乘数效应吗?按照现在7%左右的准备金率的话,这一万亿要是再加上不停的贷款,最终可以释放出来的真正的货币量则是14万亿。

一般来说,这种放水的方式用的不多,它在央行的资产负债表上体现为其他负债和政府存款之间的转移,但这笔钱毕竟流向了政府,只要被政府花出去,那就是真正的基础货币投放了。

我们要极力避免央行直接给现金到政府这种情况, 实际上央行也有规定,甚至不能直接下场购买国债。

比如上个月刚出来的消息,我们放开了央行在二级市场上购买国债的操作,这意味着什么呢?

比如说你花钱买了一个30年期的国债,但是可能只持有了几年,突然需要现金了,但是这个国债没有到期怎么办呢?最简单的办法是卖二手货,比如说把它卖给另外一个人,因为还有其他人想买国债,只是当时没有抢到,这就是所谓的二级市场上的买卖操作。

当央行可以在这个二级市场上公开的进行国债的买入和卖出操作的话,其实就是一个更加方便的投放和回收货币的渠道了,现在国外的很多国家一直都是主要在用这种方式来进行货币的投放和回收。

而且这种方式要比那一堆银行的再贷款SLF,MLF之类的要强得多,因为央行发放给商业银行的贷款这种投放货币的方式毕竟很难流通到市场上,只有当银行发放的贷款太多导致手头的现金流通性不足的时候,他才有去找央行进行这些操作的动力。

也就是说它需要有大量的人进行贷款操作,才能把这些货币释放出去,如果没有人进行贷款,商业银行手里有大把的钱,并没有动力再跑去找央行借钱了。

另外,央行在公开市场上买卖国债,更便于民众监督。毕竟MLF, SLO, PSL,SLO之类的这些东西看起来太不直观,很多人并不怎么理解,也不太关注。

长期来看,我们后面可能会逐渐废弃那一堆央行再贷款的骚操作,毕竟他们也是2013年左右才慢慢开始玩出来的花样,实际上过去的那十年,我们的经济就是脱实向虚的十年,那种方式更倾向于鼓励银行放出更多的贷款,鼓励更高的杠杆和债务。

在公开市场上购买国债,反而是更加公开透明,简单好用的货币投放调节方式。

央行购买国债,吐出来钱流向了市场就增加了货币供应, 当央行卖出国债, 就吞进去了现金, 减少了市场上的货币供应。

按照我们目前的国债规模11万亿左右的规模,以及未来可能增发的国债水平,这至少有几十万亿资金的蓄水池,央行的可操作空间非常大。

货币乘数的作用,以及如何有节制的投放货币

我们看一下下边这张图,这是我们国家市面上所有流通的钱,也就是m2货币总量的历年数据。可以看到它一直不停的疯狂增长,从1990年的1.5万亿左右一直增长到了现在的300万亿人民币左右

可以看出来,在2008年以后这个曲线的增速明显的加快了

我们再看一下央行的资产负债表,下面这个表格来自于央行官网,数据是2023年的,具体链接在这里

到2023年底,央行的资产负债表显示,总资产是456944.14亿元,差不多46万亿的样子

然而我们再看一下央行的外汇储备,实际上在十年前就稳定在了3万亿左右,甚至到现在还降了一点。 按照目前的汇率来算,大致有20多万亿的人民币,这同样可以再表格里看到,里面的外汇一项有22万亿左右,从23年初到年底基本没有太大变动。

另外最大的一项就是“对其他存款性公司债权”了,年底有差不多18万亿的样子,这个是什么东西呢?

它其实就是我们前面说的,央行通过借钱给商业银行投放的货币量,也就是那一堆SLF,MLF,PSL,SLO之类的乱七八糟的东西。

这也是过去十几年央行主要的货币投放手段。

可以看到,23年从年初到年底,这个数值一下增长了4万亿左右,也就是说,央行去年放水四万多亿!

这是非常恐怖的。如果按照14倍的货币乘数效应来说的话,那意味着可以释放出来56万亿的资金量

另外,2023年底我们的货币总量是46万亿的样子,我们再看一下,按现在准备金率是7%左右的样子,相应的货币乘数则是14,这意味着如果贷款的杠杆发挥到极致的话, 我们目前可以拥有的货币总量应该是46*14,也就是说大致有600多万亿人民币的样子。

然而我们现在真实的M2的流通量是300亿, 这意味着准备金率的杠杆并没有被发挥到极限,而是只发挥了一半的样子。

这意味着什么呢?这意味着如果一味地降低准备金率,意义并不大。

想要准备金率或者货币乘数100%的发挥它的作用。前提是人们要去银行疯狂的贷款,把银行所有能贷的钱全部贷出来。这样才能把货币乘数发挥到最大。

实际上我们再仔细看一下,2010 左右的时候的数据, 当时外汇储备就差不多有3万亿了, 折成人民币大致20万亿的样子,当时央行的总资产也就是基础货币差不多在25万亿左右的样子, 也就是说央行除了外汇之外发行的货币只有5万亿的样子。

然而当时的M2只有72万亿,大致是25万亿基础货币总量的不到3倍。而我们在2023年底大致是6倍多的样子,货币乘数在这些年从2.9增长到了6.5,说明大家变得越来越喜欢贷款了不仅仅是个人的房贷和车贷增加了,地方政府也开始大量的借贷,很多公司也是以举债度日。

另外我们再看一下从98年~15年左右,这十几年我们国家非但没有降低准备金率,因为出口导致美金的流入,进而导致的货币超发,国家还相应的提高了准备金率。准备金率从98年的8%左右一直提到了15年的20%左右。

然而这个过程中我们看上图的m2增量这些年总的货币量还是不停的在增长的,这说明早期中国人并不热衷于贷款,而是在经济逐渐发展的过程中,逐步逐步的释放出来的。

如果你注意留心一下自己当初身边发生的事情,在10年左右之前,大家并不是太热衷于讨论贷款的事情,只是后边这些年很多人才慢慢的适应了房贷,车贷的生活。贷款也成了我们生活的一部分了。

实际上也是在10年之后,我们的整个制造业就开始走下坡路,慢慢的不行了。这时候经济就逐渐的走向了以借贷为主的模式。房价高涨,于是开发商赚到了钱,又去银行贷款,建更多的房子。大家看到房价涨了更多的人涌进来炒房,于是更多的钱又被贷了出来。这些钱最终都留流到了市场上。

这些钱不管是购买房地产上下游的材料,还是扩张招更多的员工,再或者是炒房赚到钱的人们大手大脚的去消费,他们都在市场上疯狂的流通,流到了每一个角落。这时候钱是非常容易赚的,大家非常容易找到工作,于是整个国家都在盲目的乐观当中,人们赚到钱都跑去又买了房子。这形成一个互相激励的循环,房价被吵得越来越高。

另一个巨大的问题是,地方政府也开始搞各种各样的城投公司大量的借贷,修建各种各样的公共设施,建桥修路修地铁。这些建好的资产又重新抵押给银行贷出更多的钱,另一方面超高的房价又使得卖地让地方政府获得了大量的收入,进行更多的建设。

15年之后国家在一直不停的降低准备金率,并且开始使用SLF,MLF这些之类的操作来投放更多的基础货币。这意味银行有了更多用于借贷的资金,银行也为了更好的业绩一定程度上降低了审核门槛发放更多的贷款变相的鼓励了大家背负更多的债务,贷更多的钱。

所以我们看到这些货币总量飞快的增长,直到今天大致300万亿的样子。

当我们用制造业从国外赚来外汇并发行人民币的时候,泡沫并不严重。因为我们是拿了物品换了收入,这是真正的实体经济。

但后面通过借贷,通过准备金的货币乘数效应,大量的把资金释放到市场上的时候,这就形成了很严重的问题。因为这些钱大部分都是从银行里贷出来的,都是欠银行的债。

另一方面这些年不光是借贷,央行还超发了将近20万亿的额外的货币,这些钱并没有真实的黄金或者外汇作为抵押储备,是纯粹硬生生的增加出来的,某种程度上意味着滥发。

货币超发带来的最大的问题就是通货膨胀,这些年我们的物价上确实涨了一些,不过并不是特别严重。 如果我们后边对于货币的发放收敛一些的话,还是可以控制得住。

但现在各方面债务都很严重,就怕禁不住诱惑,不停地发超发货币用更多的钱去补已有的窟窿,如果一直不停下来的话,随着时间的堆积会形成非常大的问题。

当年国民党晚期货币超发导致的通货膨胀,我们一定要引以为戒。

在讨论债务问题之前,我们先研究一下通货膨胀。

从2010年到现在M2货币总量70万亿狂飙到现在的300万亿,足足涨了四五倍, 但物价感觉并没有涨这么多,就是说通胀和M2并不成正比,这到底是什么原因造成的呢?

下边的这些原因是我的猜测

 

  1. 中国人喜欢储蓄,这些流通到市面上的钱大部分都沉淀下来变成了存款,大家并没有疯狂的去购买各种各样的物品。我们看一下现金和活期存款总量M1,这个更能反应消费者手头准备花的钱, 从2010年到现在涨了2.6倍。
  2. 政府补贴了一部分成本,比如高铁和地铁是政府通过大量的财政补贴才能维持它相对低廉的票价,这些资产一直都在亏损。 最近我们可以看到因为政府预算缩紧,想方设法砍掉各种开支,高铁已经开始涨价了,很可能地铁将来也会涨价,类似的可能还有水电。
  3. 有一部分人承担了这个成本,并没有转嫁给消费者。一个产品到消费者手中之前有大量的上下游供应商, 各个链条的供应商们都相应的承担了一部分, 比如原材料价格上涨,它的供应商可能就会牺牲掉自己的一部分利润,只是小部分的涨一点,以免失去客户。再者比如工厂的生产生产成本也越来越高,但他们并没有贸然涨价, 而是某种程度上他们压减了自己的利润,让渡给了消费者。然而这一切都是不可持续的。 最近我们就看到了饮料方便面之类的都在涨价了。
  4. 通胀有一定的滞后性,价格传导需要时间。原材料可能在慢慢上涨,人力成本也在慢慢上涨。但这些涨价的决策可能是每隔一年或者两年才能做出。

 

对于第三条,还要客观地说一句,比如改革开放初期开工厂很赚钱,到现在大部分制造业工厂都基本不怎么赚钱。 把这些全部都归咎于简单的货币超发是不对的 通胀可能只占部分原因。

另外可能还有一定成分的激烈竞争导致生产过剩, 竞争的同行互相降价。

而且后来电子商务平台崛起,导致线下零售商的份额衰减,产品的销售不再地域化,大家都在统一的大平台上竞争,价格逐渐变得透明化,很快就把利润空间给压低。

 

最后我们再讨论一下既然超发货币有危害,那我们是不是完全不再新增任何投放呢?

这个也没有太大必要考虑一下纯粹的金本位,货币严格跟黄金挂钩。

市面上流通的黄金并不是一成不变的因为有金矿的存在黄金一直在不停的被开采当中。这表明市面上的钱是越来越多的,黄金不停的流向人们的手中。

另一方面人们在每天不停的生产过程中都产生了自己的劳动价值这意味着整个市面上的劳动增加了,所以相应的每个人的财富也在增加,所以有必要适度的增加一些货币供应量。

我们不妨再回到解放初的那种类似粮本位的状态,比如人民币跟粮食价格严格挂钩。现在大部分小麦或者水稻的收购价大致在一块多钱每斤左右的样子。只要能大致保持着这个价格不变,也就是说有大量的粮食储备,只要花一块钱就能买到固定的比如说一斤的粮食,这时候通胀问题就不会太大。不管其他物品怎么涨价,至少食物不会太涨价,这就可以保证大部分人能吃饱肚子,变相的就稳定了货币的购买力。

同时货币的发行也要节制,这也不妨参考每年我们粮食的产量。全国每年大致有1万亿多斤的粮食产出,我们也可以相应的每年就多投放1万亿人民币左右的新增额度,这些钱有后边的粮食可以兑换出来作为保证。

经济学的研究表明有节制的发放货币长期保持温和的通胀,更有利于经济的发展。

因为一个最理想的状态的社会情况就是大家每个人都赚越来越多的钱,物价相应的保持稳定。

正常来说当你赚钱的时候一定是有别人花了钱。假如整个市面上的货币总量是固定的。这就意味着有人赚钱就有人亏钱。

所以温和的缓慢的增加发行一些货币,就可以保证大家慢慢的都赚的越来越多,而不是让有一部分人觉得像是亏了钱的零和博弈 

我们当前的问题,以及债务会产生的影响

大量的债务会导致什么问题呢?

正常来讲,如果你把钱贷出来做生意并赚了钱,然后把这些贷款连同利息一起还回去了。这不会产生任何问题。

但是当你做生意赔钱了,还不上这笔钱的时候,问题就来了。对于个人来说成了老赖被限制各种各样的高消费,上征信黑名单。另一方面从银行的角度,如果这是个例,银行收不回来这笔贷款,这笔贷款就成了坏账。

对银行来说,少量的坏账问题并不大,因为他们有大量的利润可以用来填这些坏账的窟窿,也是说银行自己承担了这部分债务。

所以说银行一般都有一个风控部门,在每一笔贷款发出之前都会对相应的贷款人的还款能力进行风险评估。这样就可以把他们的坏账率控制在一个可以接受的水平,最终来保证银行可以盈利。

可是如果银行贷款的时候过于激进,没把控好风险,最终他们的坏账窟窿堵不上了,这时候就会出现严重的问题。

这种情况西方的历史上发生过这两年我们国家也正在发生,可以搜一下新闻,比如2022年就发生过很多起村镇银行无法正常取出存款的情况。

最终政府不得不对此进行兜底,为了维持社会的稳定,对这些银行进行破产重组,让一些经营利润比较好的商业银行接管,来保证存款至少能取出来。

如果大量的坏账产生,无数银行相继倒闭,就会形成非常严重的系统性金融问题。 当年美国的大萧条就是这种情况,银行开始倒闭,人们觉得自己的资金不再安全又跑去挤踏式地取款,这又加速了这个倒闭的过程,最终导致了整个金融系统的崩溃。大量的人失去工作,背负欠债无法偿还,导致流落街头,整个社会一夕之间从繁荣跌入贫困。

这一切的核心都起源于贷款所谓的万恶的资本主义的银行部分准备金制度, 我们前面已经讨论过了,正是这个只允许银行保留部分准备金导致货币可以无中生有的创造许多倍出来的机制,再加上认为工资永远会涨,盲目乐观的贷款导致的信贷无法偿还引起的。

归根结底,还是人性的贪婪。适度的贷款可以帮助经济繁荣,盲目的信贷扩张也会造成经济危机。我们也没有必要因噎废食,取消这个贷款机制。最重要的是要避免盲目的无节制的贷款。

那么,贷款和利息的本质是什么呢?

它的本质就是人们对未来增长和盈利的预期。之所以有人愿意贷款,愿意付给银行一定的利息,因为他知道如果贷出来这些钱,他可以赚更多的钱,所以他愿意支付这个额外的利息。

改革开放初期随便干点儿什么生意都可以赚钱这时候贷款是非常有益的所以无论是贷款利率还是存款利率都非常的高。

可是今天经济并不是太好,很难找到特别挣钱的路子。经过这么多年的发展,很多生活便利品大家都已经买的差不多了,只能在这些存量的物品以旧换新的过程中寻找机会。大部分公司的利润都很低,人们并没有贷款的动力。

要记住,利息是人们贷款意愿的反应。

实际上十年前制造业就已经衰退了。后边我们的贷款利率之所以能一直维持这么高,是因为大家都在炒房。

有人炒房赚到了钱,其他人觉得房价一直在涨,也想方设法的去贷出来款买房子想依靠炒房来赚钱,所以这一时期存贷款利息能维持这么高,是因为炒房导致的。

炒房远比制造业要危险的多,因为他不是真正的实体经济。其实那段时间很多人都看到了,一直在呼吁经济不能脱实向虚,国家也一直强调房住不炒。然而这一切都抵不住人性的贪婪。

炒房带来的另一个后果就是地方政府可以通过卖地获取大量的收入,同样这么多货币流通到市场上带动了各行各业的某种畸形的繁荣。大家一起都加入到了这个信贷的狂欢当中。

地方政府大量的修地铁,建各种各样的公共设施,这一切至少表面上都是政绩。

然后我们的央行也在不停的下调准备金率,这意味着货币乘数效应导致的资金大量的不停的被释放出来。

然而这一切都是建立在借贷的基础上的而借贷的钱始终都是要还的。

如果这些借出来的钱用到的项目是一个正向的可以盈利的,那一切都很好,因为这些钱可以慢慢的被还上,不会出什么问题。

现如今我们面临的一个无法回避的现实就是,是这些被借出来的钱大部分都流向了并不怎么盈利的业务上面

首先是大家都知道的房地产,早期其实还好,适宜的开发可以满足人们日益增长的住房需求。只是我们这个过程中大家都太激进了,不断的加杠杆,疯狂的建设堆产能,这个过程中,如果能像普通的商品一样通过大量的产能释放导致价格降低,大家都能买得起,就是一个皆大欢喜的场面了,普通人民群众的生活质量得到了提高,也没有太大的还款压力,等到开发商建房子建的太多,发现大家都不买了,无利可图,也就停止了建设。

然而不幸的是,在这个不断的疯狂扩建产能的过程中,房价非但没有下降,反而越涨越高,形成了巨大的泡沫。房地产开发商也在疯狂的借贷用来堆积更多的产能,他们赌的就是房价会一直涨下去,这样才能形成利润的正循环。

这个过程中地方政府也是利益群体,通过卖地获得大量的收入,以维持政府各方面的开支和基础设施投资。

我们都知道,房价不可能一直无限的上涨下去,总有一天泡沫会破裂,这个过程中越早干预越好。可惜这个过程中各种各样的事情都在不停的发生人性的贪婪导致了重要的决定无法顺利贯彻实施疫情又延续了几年,以至于拖到现在,泡沫被吹的很大,处理起来也更为棘手

如果仅仅是简单的房地产问题还好,可是我们现在面临的是整个的大量债务的危机,房地产只是引爆它的一个重要导火索,处理不好极有可能引发整个系统性的债务崩溃。

我们再看一下其他的各个部分,比如新能源电动汽车,这是真正的实体经济。

他面临的局面跟房地产也类似,很多公司涌入都在的不停的堆产能,导致大量的生产过剩,结果就是好像市面上的大部分车企基本都不盈利,甚至亏损。

竞争当然有利于提高产品的竞争力,有助于消费者,电动车跟房地产最大的不同就是,汽车的价钱会越降越低,而不像房子之前一直疯狂的上涨,他们也在更多的拼技术和体验所以这里泡沫就不是特别严重。车企实在无法盈利的话,也可以被其他公司收购,或者破产重组进而导致最终市面上剩下几家稳健的盈利企业

但是我们要意识到这些车企目前很可能也都背负着大量的贷款,如果无法盈利就没办法逐渐的把这些贷款还上,同样也会形成坏账。 不过他们的体量和贷款出来的额度跟房地产相比要小很多很多,这个淘汰赛过程形成的冲击影响也不大。

可是一个新能源汽车行业还好,我们现在面临的是各行各业,都是类似于这种情况,大部分都不怎么盈利,他们的借贷规模加在一起就非常的大了。

中国过往发展的模式就是,一些企业通过大量的贷款资金不停的堆产能,进而形成市场的垄断优势来挤掉竞争对手。这在传统的制造业和房地产商都已经发生过了,我们现在看到在新能源车企上这种情况也在发生。

这些问题的根源都在于,这一切生意模式的技术壁垒并不是很高。最终导致了大家都核心的竞争模式就集中在了资金壁垒,成本控制,产能和销售等上面,这是中国改革开放这么多年一直在走的路,然而现在我们发现它是不可持续的。

这些在大语言模型上我们也可以看到,gpt之后国内各大厂商全部都在堆产能,每一家都有自己的大模型。

到底什么是技术壁垒呢?看起来好像很难的技术大家好像都能搞定。其实问题的核心就在于人,因为现在大家发现只要有资本就可以用很高的价钱去挖竞争对手的人,把人挖过来技术问题也就解决了。

所以这就是心态上要转变的一个方向,我们不能一直的去卷已有的技术。如果这些资金被用来进行技术研发投入的创新,形成一种一直能引领行业前进的动力,远比重复性的堆产能要效率高的多。

同样研发并不是简单意味着纯技术方面仔细的琢磨改进改进产品结构,优化用户体验,甚至是包括售后服务等也都是非常重要的

而且这种细节的仔细研发打磨是真正核心的竞争力仅仅靠资本是学不来的,简单的挖人模仿只能永远是一个追随者。消费者本身也对坚持技术创新和改进体验的品牌有一个更加深刻的认同,这进一步提升了产品的销量和声誉。

监管部门也可以多关注一下那些疯狂依靠资本扩张的企业,避免他们依靠大量的金钱劣币驱逐良币,挤掉市场上本来用心优化产品体验和技术研发的企业。可以对他们进行适度的反垄断或者反不正当竞争调查。

从另一个角度来说,目前的债务问题导致很多企业的资金缩水甚至破产,也许是件好事。

因为我们现在发现当初那些依靠资本疯狂借贷快速扩张的企业,现在大部分都遇到了各种各样的问题, 反而是那些踏踏实实控制成本认真做事优化体验服务的公司,现在过得却很好,甚至引发很多人跑过去学习取经。 这是市场本身自动调节,对投机的人和真正做事的人进行相应的奖励和惩罚。

在一个自由的市场里,资本会自动的追逐利润,之前我们看到的房地产企业都跑过去造车,其实就是一个体现。 如果说市场上逐利的资本能够自动的寻找到盈利的行业和投资方向,那现在他们都不花钱进行投资,只能说明一点, 那就是盈利的行业实在是太少了,要么就是门槛太高,太难了。或者说大部分的简单物品需求已经被满足,产能已经过剩。

现在美国人说我们产能过剩,希望用出口来解决国内的问题,也并不是完全毫无意义的指责,我们要虚心的思考。虽然现在欧美和广大的发展中国家可能还需要大量的物品产能,我们发展出口可以解决一部分国内制造业产生的问题,但这只是仅仅把问题延后。就像我们把时钟往前拨回几年,大家购买力还没有完全被满足的时候的情况一样。另一方面欧美也在想办法增加关税和各种各样的市场进入壁垒,这些都是需要面对的问题。

现在我们需要的是企业进行技术创新和研发积累,而不是盲目的扩张产能。适度淘汰那些靠砸资金简单模仿的企业,有利于整个行业的发展进步。

但在这一切进行的同时,我们现在不得不面临大量债务可能产生的坏账,进而对整个国家的金融系统产生冲击的问题。

怎么处理债务问题

说实话,现在的债务问题确实很棘手。

首先要意识到现在房地产的问题,只是我们所有问题的一个导火索。根本的核心还在于大量的举债借贷,堆各种各样的很难产生盈利回报的产能导致的。

现在300万亿m2里边的,除去46万亿的基础货币,剩余的250万亿全部都是贷款。也就是说,这些都是债务。

根据网上找到的数据个人房贷大致占了40万亿左右的样子,这个规模并不太大,但是我们要注意到,之前有很多公司通过经营贷的方式把钱拿出去炒房了,这种隐晦的方式导致了具体的数值并不太好估算。

总的来说,企业和政府的债务应该占大头。特别是那些很难盈利的项目,极有可能产生大量的坏账。

由于房地产不再产生新的贷款了,于是我们就发现了,其实真正能够盈利的生意并不多,现在各行各业都不太好做,大家都倾向于低负债,找不到好的挣钱路子,就没有人愿意去贷款生产经营了。 现在更多的贷款应该还是大部分很难盈利的企业在不停的借新帐还旧账。

但是,就像我们一开始所说的,银行是靠贷款和存款的利息之间的差价,赚取营业利润的。

而全社会的钱目前全部都存在银行里,这些钱每天都会产生相应的利息。

可是银行能放出去的贷款只能是部分,而且这些贷款还有一部分坏账。 这意味着银行的盈利能力变低了,相应的维持支付更高利息的能力也变低了

我们现在的产能各方面似乎都稍微有些饱和了,这跟改革开放初期有巨大的需求差别很大。即便是有新技术的产生,人们有购买新产品的欲望,这个过程也是逐步释放出来的,不太可能像当初我们从一穷二白的农业社会直接过渡到现代化的工业社会的过程中需要的那么巨大的产能了。

目前所有的300万亿m2的存款总量,按照1.5%的年存款利息,每年银行至少要支付四五万亿的利息成本。

而且银行250万亿的贷款里边,有很大一部分人,都是在咬着牙,想方设法坚持去还。

比如好多人掏空六个钱包节衣缩食还房贷,甚至搞一堆信用卡来回刷。再比如现在很多地方政府只能想尽办法借新债还旧债,甚至很多就连本金都还不上,想方设法仅仅是为了能还上利息不至于违约。

我们按3%的贷款利息来算250万亿意味着每年有七八万亿的贷款收入,也就是说所有的银行加起来的收入,再减去四五万亿的存款利息成本,银行顶多也就只有三四万亿的利润。

然而我们目前市面上的债务只要一旦有超过三四万亿的坏账的产生,银行很快就会入不敷出。可能一两年还能想办法从已有的资金或者借钱去解决填补这个窟窿。

可是两三年甚至四五年呢?填不上窟窿银行就会倒闭,银行竞相倒闭就会引发严重的金融问题。

所以目前的一个办法就是把基准存款利率直接降为零

存款利息为0意味着300万亿的存款银行每年就不用去支付这四五万亿的利息成本了。或者少量的利息成本

因为银行是靠贷款利息和存款利息之间的差价来盈利的,存款利息降为零,只要维持稳定的净息差,就意味着贷款利息可以降到百分之1.5甚至更低。

贷款利息降低一半就意味着,那些大量背负债务的人每个月需要还的利息就减少了一半。

比如现在很多咬着牙还房贷的人们,他们每个月要还的房贷就可以直接减少一大笔钱,这对于很多在徘徊在断供边缘的人是一个非常大的利好,有助于减少坏账的产生。

坏账少了,银行发生风险的可能性就更低了。

我们再看一下地方政府的债务。每个月需要还的利息减少一半,意味着财政支出减少一半。这样可以极大的缓解因为没有土地出让金带来的财政危机。

举个例子,比如2022年北京地铁光利息就支付了差不多150亿,因为地铁自己不盈利,这一切都要依靠财政补贴。如果利息成本只有之前的一半,就意味着政府可以减少补贴75亿。

在所有250万亿的贷款里面,我们假设现在的年利率有百分之三点几吧,降低一半,假设是从3%降到1.5%,那就意味着每年有差不多4万亿的利息成本都能节省下来。而现在我们大量的增发货币和财政资金都被用到了填补这些利息的窟窿上了,借新债还旧债。

如果减少了这些利息成本,能够导致很多欠款还息成本大量降低,进而能逐渐的还上一些本金的话,就能逐渐的进入还款的正循环,逐渐的把欠债慢慢还上。而不是像我们古代所谓的利滚利利,越还欠的越多。

同样利率降低之后,对很多企业来说融资成本更低了,这样可以也适度的激活一些经济。

另一方面降低利率有可能导致部分人民币外流,进而导致人民币汇率的降低,只要我们国家适度的控制,这反而是有利的。因为汇率下降有助于提振出口,对很多徘徊在利润边缘的企业来说,同样能够产生一定的救济作用。

其实存款利息降了,某种程度上来说也是一种更加的公平,因为利息越高,那么你手里钱越多,每年产生的利息回报也就越高,也就是说对有钱人越有利。当利息降为零了,无论手头钱多少,大家的利息回报都是相同的了,这样就变得更加的公平。

现在银行已经开始自主的降低贷款和存款利息了这是市场化产生的自行调节。另一方面我们可以看到,最近发行的国债,大家都在疯狂的抢购,这种行为本身就说明了,大家都认为未来的利率会进一步降低,行动远比语言更能传达意图,特别是自己手里的钱,没有人会拿自己手里的钱开玩笑。

为了迎接即将来到的冲击,利息降的越早,降的越快越好。降的越早则意味着银行越有足够的利润储备来应对后边的债务和坏账问题。

另一个是准备金的问题,其实我们没必要再调低准备金率了。调低准备金率意味着鼓励更多的贷款,我们现在的情况是大家都不怎么愿意贷款了,而且贷款的目的对现在很多不盈利的企业来说,只不过是借新债还旧债,所以说效果并不好。

目前的银行的问题在于存款越来越多,但是贷款业务却不好做越来越少。这种情况下,他们手里的现金很可能比我的法定准备金额度要高很多。

所以目前在不影响整个社会资金量或者说M2相对稳定的情况下,不调整甚至适度的调高准备金率都是可以的。

另外一个就是投放基础货币需要谨慎,按照前面讨论的,尽量要有节制,比如每年1万亿

简单的大量投放货币放水并不能解决我们现在的问题,当年美国大萧条的时候,胡佛政府扩大信贷,补贴失业人口,加大公共投资,这只不过是延缓一段问题爆发时间,把泡沫吹的更大了而已,历史告诉我们这种行为会导致更大的萧条。

泡沫破裂的过程中,肯定会有适度的萧条,这种萧条是泡沫破裂过程中的正常表现,而且挤掉泡沫最终会带来更加健康的经济。我们只要想办法避免大量的人因为无法还得上房贷或者支付不了房租,又失去了工作,最终导致流落街头的这种情况。

我们比较好的一点,就是中国人更喜欢储蓄,有储蓄就意味着不至于流落街头。但现在我们仍然有一部分人是依靠举债度日,一旦他们无法还得上房贷,而且又失去了工作,极有可能变得无家可归。

美国街头那些搭帐篷露宿的人并不是真正的意义上的穷人,他们大部分都是以前的中产阶级或者上班族,因为失去了工作还不起房贷,从而导致无家可归的。 我们未来会不会出现这种情况不好说,但有很大的概率。

但是这些人并不是完全可怜无辜的人,因为其中大部分很可能是为了投机炒房才背负借款的,他们要为自己无节制的举债承担代价。国家可以某种程度上提供一些兜底的工作,类似于救助中心之类的机构,至少保证有一定居住的地方和食物,但不能让他们过得太好, 最好是几个人一起住的宿舍。这样才能让人产生出去找工作的动力和积极性。

我们还可以借鉴一下后来的罗斯福的一些政策,比如控制产能减少内卷加班,人们加班少了,玩的时间就多了,相应的消费也就增加了。要意识到现在很多加班都是无意义的产能上的竞争,是企业利润下滑导致的一种压榨性反应,本质是产能过剩。现阶段的加班并不能给我们带来更多的竞争力,反而是宽松的环境,更能促进人们的创造力。

再比如适度的干预一下就业,提供一些主流群体的就业机会,比如科技和文化等方向,甚至可以偏公益一些,并不一定非要盈利,主要是为了吸纳一些青年失业人群。

另外如果钱不够用,可以通过大量的发行国债来解决。因为国债是向社会上借钱,并不会造成货币增发,也就不会形成通货膨胀。

同样多发国债意味着多了一些资金回报率更高的投资渠道,在银行零利率的情况下,精明的投资机构很有可能把一些钱流向国外资金回报率比较高的国家,如果更多的国债可以选择,就会减少货币的外流,一定程度上稳定了人民币的汇率。

总的来说,大家抢着买超长期国债也是说明看好我们国家未来的发展前景。目前我们的房地产和债务问题在当前的国力面前并不是特别的严重,最重要的是如何稳定的尽量减少冲击的情况下处理这些债务问题。当然那些贪婪的人需要得到惩罚,没必要让国家为他们买单。这个过程中要尽量缓慢的一步一步的把这些问题释放出来,逐渐拆解掉,避免产生爆炸性的连锁反应。

 

最后再详细讨论一下失业的问题。 类似于当年美国的大萧条,我们可以借鉴一下当年他们推出的一些政策。

这篇文章实在是太长了,前后拉扯了几天,一不小心水了两万多字。而且感觉这个话题我同样也可能会水很多字,现在精力也有点不够,不如等后边有空了再单独写一篇吧。

 

最后的最后,需要说明的是,这篇文章只是一些个人的观点想法,我并非是专门的从业人员,很多看法未必准确,请带着自己的思考谨慎阅读,希望对你有所启发。

展开全文

这篇文章本来是写在上一篇的结尾的,因为实在是太长了,单独拆分了出来。

 

我们再讨论一下transformer模型的能力极限吧,chatGPT刚出来的时候,很多人都感觉到非常的惊艳,似乎聊天机器人很可能实现类似人类水平的智能,整个世界都似乎被震撼到了,引起了AI行业的狂热

然而这只是表象,我们这里仔细的观察讨论一下transformer最核心的原理技术然后再对他能力极限的做出一个判断和预测。

依照技术的进化路径我们先从词向量和RNN来说起。

什么是词向量或者说词嵌入呢?它的英文word embedding原理就是用若干个数字来表示一个字或者词。比如这个字我们用256个数字来表示比如(0.2,0.6,0.8,…..,0.7)为什么要这样干呢?因为用一串数字来表示它的话,就可以表达很多细微的概念和意思而且这些数字可以进行一些运算操作比如king在英语里表示国王women表示女人man表示男人那么我们进行一些数学运算比如king减去man再加上women会得到什么结果呢?没错跟我们的直觉是一样的得到的结果就是queen,也就是女王。这nlp领域里边非常著名的一个例子一般讲词向量都会用这个来举例。

实际上向量的核心思想就在于每一个词都用若干个更基础的原始概念来表示我们看到前面表示256个数字其实就是底层的256个概念每一个的权重

词向量是lstm还有transformer的基础他们的输入都是先把每个字或者单词映射成向量的数字序列。也就是模型里面的word embedding

最早nlp领域出现的是grulstm这些循环神经网络模型它们是为了解决机器翻译问题而提出的。

lstm最大的问题在于每次输入都是单独的虽然记忆单元能够捕获一定前面输入过字的语义很难完全理解获取整个上下文关系

举个例子,比如‘道’这个字,如果只是简单的进行词嵌入,比如用256个数字来表示它的意义,那么它的意义到底是什么呢?他有道路的意思,也有说话的意思,还有方法的意思。我们用一个简单的词嵌入向量是无法表达它的看下面几句话

大道至简

前面有一条小道

他说道:“我们应该回去。”

在这几句话里,每一个道字都有不同的含义,如果还想再复杂一点儿,我们可以看下这句话:

道可道,非常道。

对于我们正常的人来说,给一个词或者字问是什么意思,我们怎么回答呢?很可能我们会说它有好几个意思,我无法确定他到底是哪一个,但是如果你告诉我一个句子,包含了上下文,那我就能跟你说出来他确切的含义。

这就是lstm这种模型最大的问题,他的词嵌入是固定的,每次独立的输出很难获得完整的上下文,实际上也有方式来补救。ELMo模型,就是使用两个双向lstm获取动态的上下文信息,对不同语句中出现的相同词语会输出不同的embedding。

而且在lstm的翻译模型中,只有把编码器最终的输出跟解码器连接起来这样就失去了很多上下文关系attention机制就是在这种情况下提出来可以通过在前面的那篇文章里的例子对比就能发现加入Attention机制之后的效果改进实在是太大了

attention机制是如此的重要以至于一些人专门儿设计了一种架构并发表了一篇叫做attention is all you need的论文,提出的模型就是Transformer他们当初主要是为了解决机器翻译问题恐怕也没有想到这个模型会对整个nlp领域造成如此巨大的影响。前段时间的GTC大会老黄还专门邀请了这篇论文的几个作者一起进行对话讨论,并表示:“整个行业都对你们的这一成就心怀感激。”

我相信老黄这句话是发自肺腑本来一家卖游戏显卡的公司靠这个模型摇身一变成为一家人工智能公司过去一块儿显卡能卖1万块已经是顶天了现在一块儿同样架构核心加速卡直接就能卖到一二十万简直是赚翻天,感觉现在老黄都不怎么关注游戏玩家了很多人打游戏还在用好几年前1650

我们下边就研究一下Transformerattention机制仔细的看一下,对于输入的词向量序列,它是如何变换的。

假设输入的维度是n*d,首先把输入经过不同的线性层变换成三个不同的序列,分别是query,key和value,也就是qkv,然后对q乘以k的反置,得到一个nn的矩阵,然后用这个矩阵来乘以v得到输出,我们要注意一下这时候输出维度刚好又变成了n*d,折腾了一圈,输入的形状结构没有任何变化,但是每一个词向量的值却发生了变化,实际上就是这个过程,根据上下文相关性把每一个词变换成它应有的意思了,所以这个模型叫做transformer,还是非常形象的

事实上transformer是把词向量拆成几个小块单独计算attention最后综合一起最终的矩阵形状是一样的,叫做MultiHead Attention这么做主要是为了更好地把握每一个词下面单独的若干概念之间的联系,可以更精准地把控语义

事实上这个nn的矩阵,就是代表了句子里的每一个词和词之间相关性的联系,我们看一下下面这张图。(我懒得自己画图了,这张图片是直接网上找的,要是有侵权请联系我删掉。)

上面最后那个矩阵显示了the cat is on a chair这句话每个单词之间的对应联系权重。经过这个权重变换后的句子序列的每一个词向量,都是变换后根据上下文相关性生成,包含了具体确定的意义的概念组合。

所以说,Transformerattention机制真的非常重要,那篇论文的题目叫attention is all you need是非常贴切的

Transformer模型解决了这些上下文相关的语义,而且不基于时序,相比比lstm更易于训练和规模化扩展,直接风靡了整个业界。当初bert一经推出就在各大榜单上显示出非常优越的效果,更不用说后面大家都知道的chatGPT了现在nlp领域已经基本没什么人去关心lstm

从论文发表至今,六七年已经过去了,transformer仍然还是当之无愧的业界的统治者,我们看到的进步只不过是不停的搞更大的参数,更多的训练数据而已。当然也有架构上的一些优化改进,但这些都是边边角角了,并没有本质上整个结构性的改变。

实际上gpt并没有使用整个Transformer,而只是用了它的decoder解码器部分,为什么这样就工作的很好呢?很简单,这再一次说明了attention机制的重要性,解码器也不过是一些这样attention变换的堆叠,之所以有编码器,因为tranfromer最初提出的动机是想解决机器翻译的问题。实际上只是单独的简单的堆叠解码器就足够了,每一次变化都能获得上下文相关的语义的理解。只要训练数据足够大我们仅仅依赖于解码器就能实现翻译程序,比如把现代文放在前面,中间加一个特殊的标记来表示翻译符号,后边跟着文言文的输出,用大量这样的数据来训练就可以了。

对于大模型来说,当他训练的数据足够的多,翻译文言文甚至都可以直接当做聊天机器人的提问,比如在提示窗口里输入,把xxxxx这句话翻译成文言文,它就会给出相应的翻译输出。

所以我们为什么要花力气训练单独的翻译程序呢?直接训练一个特别优秀的大模型就能解决所有这些问题,根本不需要再单独的折腾了。

然而对于只是简单的推理过程,现在大模型都需要大量的算力,而且他还没并没有对这些翻译数据进行优化训练,所以训练专门特殊应用模型还是有一定价值和意义的。但是随着时间的推移,未来谁说的了呢?可能一二十年后算力这些都不是太大问题的话,我们的翻译程序可能也有很大的改进和不同。

我们再展望一下未来。Transformer统治了这么多年,是终极的模型吗?在很多表现上它都能给出足够好的结果,以至于让很多人觉得它似乎可能有一些智能的感觉。

然而直觉是并不可靠的,我们看看这个模型本身,有很多问题它都解决不了。

第一个是没有动态的存储。对于我们每一个思考的人类来说,如果我们告诉听到一件事,就会把这件事情给记在大脑里显然transformer模型并不拥有这些记忆。聊天机器人之所以能感觉到上下文,那是因为在回答下一次输入前,他把之前聊天框里之前所有的输入再重新跟新输入加在一起当做新一次的输入,这就给了我们以好像有上下文的假象,然而这都是trick。

而且整个attention机制加上一些其他的线性变换还有残值连接激活函数,所有这一切如果从数学角度来看,都只是一个个简单函数方程进行不停的嵌套,最终得到一个足够复杂的方程或者函数,这个函数可能有几亿几百亿个参数,然而它的本质只是一个函数映射或者方程,训练的过程就是拟合这些参数的过程。这个方程本身我们说它就有智能吗?

显然不是。

不过我们下结论也不要过于笃定,很多东西都不好说。我们可以对这个方程加一些简单的其他操作,从我的直觉上来看,似乎是有可能实现一定的类似人类的认知智能的。

首先是词向量,说实话,当我第一次接触词向量的时候,确实有眼前一亮的感觉。他解决了很多之前nlp领域头疼的问题。但是向量本身是固定的,只是用一组数字来描述一个概念。这些基础的每一个数字是什么呢?也许是这些概念里边更基础的概念,但向量的长度决定了这些基本概念就是这么多,而且是固定的。

我们人类大脑认知的情况并不是这样的,对于一个概念来说,他可能包含若干个子概念,而这些子概念可能每一个又包含另外的一些子概念。最重要的机制是,这些子概念是相互连接可能包含有各种各样的联系,概念与概念之间是一个树状或者是网状的结构,向量只是一个固定的若干个概念的组合,这跟我们人脑的认知结构差别还是非常大的。

而transformer无论怎样变换上层的上下文语义结构,它的认知的基础概念就是向量的维度这么多,而且这些基础概念都是独立的互不干涉的所以他不太可能达到人类的认知水平。

除此之外还有一个就是,我们除了本身包含的这些概念之外,还能对这些概念进行思考总结,生成新的概念,产生概念概念之间的联系。而transformer训练完了就是训练完了,他并没有新概念产生的机制,也就是说没有人类思考的过程。

况且对他来说一个概念是什么呢?对他来说只有词向量每一个基础的元概念,以及上层的这些概念组合形成的新的概念,当足够多的大量的数据来对应的时候,他似乎让我们觉得能理解很多我们人类所谓的一些概念,也许吧,如果他的参数足够多,那么可能能覆盖我们已知的一些概念和这些概念之间的联系,当参数越大,我们给他的数据也就是说这些概念之间的结构联系越多,他表现出来的效果看起来就会越好。

但是真正的人类智力的核心呢?显然他并不具备。人类真正的智力的核心是对这些已知的概念进行总结推理归纳,进而生成新的概念,或者把若干这些概念整理成几个精简的概念,这就是我们人类思考学习的过程。

所以说我们想要实现真正类人的智能的话,Transformer模型是不够的。我们一定要提出一个新的模型,这个模型能以我们思考的概念为基本元素,然后能动态的对概念进行归纳总结更新,而且还能生成新的概念结构。

整个训练的过程也要改,对于我们现有的大模型来说,训练好了参数就是固定下来了不会再改变了,但真的人类的认知过程并不是这样的,它是一个动态的过程,平时每天的对话,每天的看到听到的事物本身就是一个学习的过程,大脑也无时无刻也不停地对这些概念进行总结归纳。所以我们不能简单的直接给数据训练一种方式,它的使用过程中的输入都是一次新的认知或者训练过程,甚至每次推理的过程也要对已有概念进行总结提炼归纳,也就是说我们要引入一个思考的过程。

这样我们就把训练数据当成外部输入,输入之后这些数据在模型内部先存起来。包括其他后续的每次输入都是一样。另外我们在内部单独拆分出来一个过程,姑且把它称之为思考的过程吧,这个思考的过程就是对这些数据进行审视,建立内部概念连接的过程。

所以假设需要建立一个新的类人智能模型的话,并不是仅仅使用简单的训练来概括所有的学习过程。而是把整个训练过程拆分为输入,认知思考,和输出几个部分。每次输入都能引发内部的认知思考。没有输入的时候,模型本身也可以进行认知思考。

这个所谓的认知思考其实就是内部进行一个训练学习的过程,也就是前面说的对这些概念进行总结归纳或这生成新概念的一个过程。

我们再看一下transformer,如果从本身结构来看的话,他缺的另外一个东西就是动态的存储。就像我们前面说的,它并没有聊天的上下文,需要把所有历史的输入跟新的输入连在一起当成新的输入,才能产生上下文的相关性

但是我们刚才讨论的改进的新模型就不存在这个问题,对于已有概念进行总结归纳产生新概念的过程,其实就是生成新的存储。

所以说这个新的存储在我们的类人智能模型中怎么来表示呢?

一种方式是我们想办法怎么动态的扩展这个词向量,另一种办法是直接用一种新的架构或者模块。

这个具体怎么实现我还没有想清楚,当然如果真的想清楚了,那就是革命性的一种改进变革了。它肯定没有那么简单,或者说它很简单,只是我们还没有想到。不过毕竟现在这个行业全世界的聪明人都在一起想方设法改进,或者说尝试解决方案。未来谁又说的了呢,说不定有很大几率被我们找出来这种东西。

如果真的能找到这样一种架构的话,那我们确实才需要开始真的去担心,人类的高阶思维是否会被机器取代。然后这里边还有一些更复杂的哲学问题等着我们,它能产生出来自我意识吗?

至少目前看来我们需要走的路还有很远很远,这些都是杞人忧天了。

好了,讨论完这些技术性概念性的东西,我们再看一下应用方面。

说实话,现在大模型确实存在一定的泡沫。很多公司的估值都高的不太正常。至少在我看来他们实在是很难盈利。聊天机器人实际应用价值并不是太广泛,也许客服之类的它能解放一些人工,一些公司也愿意为他进行付费,但这个市场并不是特别大,要是想撑起来类似于openai这些公司千亿美元的市值,还是远远不够。

但另一方面,深度学习相关的技术是一个巨大的市场,我们不能简单的局限于大模型聊天机器人。比如现在另一个火热的扩散模型生成图片的,在各种艺术创作以及游戏当中其实是可以真的产生一些生产价值的,虽然目前还早吧,但随着不停的迭代改进,未来应用场景还是很广泛的。

另外就是在各行各业当中的应用了,特别是模式识别或者图像识别。比超市里对水果蔬菜进行打秤,对于人来说这其实是一个很累的过程,要仔细的去看是什么水果,然后选择相应的品类打出来价格贴上去。我前段时间就见过一种能动态识别水果的秤,当时我把水果放上去,它自动显示出来砂糖橘和蜜橘两种选项,这样打秤的员工只要简单的在里边选出来确定具体哪一种就可以了,可以大大减轻他们的工作量。这种东西虽然看起来不是很起眼,但却是一种实实在在的应用场景,产生了一个实实在在的商品。而且全世界那么多超市,需要的这种秤的数量其实也不算少,未必就比那些火热的聊天机器人的利润水平低。

类似的应用场景其实多了去了,这就是我们为什么提出来要进行人工智能+类似的概念,各行各业都有很多可以相结合的,特别是模式识别和图形图像相关的应用,可以解决或者减轻很多工作量,这是实打实的技术进步和改善。

再比如说yolo算法,它的作者后来宣布退出了开发,他自己说是因为这项技术被大量的使用在军事和隐私窥探等相关的领域,他不想做恶。先不讨论具体的价值观念吧,其实yolo算法本身是很实用的,技术无所谓好坏,只是看人们怎么使用它了。这算是另外一个话题了吧,我们先不在这里讨论了。

所以说深入学习相关的这些技术,即便是现在投资界存在一定的泡沫,技术本身也是实实在在的进步,不然美国也不会闲着没事儿来限制我们了。这些技术跟那些所谓的区块链元宇宙纯粹炒概念不一样,即便是泡沫也是投资于人类的技术研发,推动科技进步。更何况这些钱大部分都是市场上的自由资本,大家愿意搞泡沫,烧钱推动本来可能是科研相关领域的东西,来共同实现人类的技术进步,也不是什么坏事。

另外一个就是美国对我们的限制了,说实话算力上的限制确实挺让人烦的,但长远来看,十年二十年的维度上来讲的话,顶多也就是一时的阻挡,改变不了大势。况且对大部分真正有价值实用的那些模式识别和图形图像相关领域来说,对算力的要求并不是特别的强烈,这反而是一件好事。追求大模型,把大量的算力花在这上面,引领技术的进步,也许能得到一些很激动人心的结果,但实用价值并不高。

况且现在技术架构上大家都没有什么新的突破,算力不足如果能迫使我们想方设法去研究新的模型或者架构,也未必是件坏事。另外要是促使国内厂商硬件芯片方面进步那就更好

最后讨论一下国内的现状,很多人应该都能感觉的到,我们并不能算是技术的引领者,仔细观察一下可以发现,很多创新的思想和技术还是都发生在国外。我们刚刚开始发展起来,目前还是追随者的位置。但我们也可以发现其实很多人工智能领域重要的研究者都是华人,为什么他们在国内就没有能做出很好的成绩到了国外表现这么好呢?

这个问题很复杂了,我们应该看到欧美在引领人类技术进步方面已经积攒了好几百年了,吸引了全世界大量的优秀人才他们的大学相对的更有底蕴一些而且他们一直传承下来的科研以及交流合作沟通的整个理念体系都是需要大量的积累的。另外一个就是文化层面的或者说思想层面的,对于创新的一些无形中的整个氛围环境,这些都是他们几百年积累下来,在文化当中无意识的传承的,可能我们的汉语文化圈很难觉察得到对于受过大量教育和良好训练的华人来说,到了这个环境会不由自主的被他的文化给带进去形成正向的激励

对此我们并没有必要去妄自菲薄,也没有必要操之过急,随着时间的发展都会慢慢地改善。其实我们现在最需要适应的是要逐渐的从追随者的心态,变为技术引领者的心态只有心态上转变过去了,才能真正的引领技术的发展

然而引领者是很难的,因为毕竟我们已经吃过了很多追随者的红利。比如说GPS美国人搞出来就是从无到有,但我们再跟着做,其实已经知道这东西是可以实现的了,大部分核心技术也都透明了,它就是一个工程实现的问题,难度跟从头研发出来完全不是一个数量级的

我们的举国体制其实很适合作为追随者毕竟解决工程问题,只要投入人力物力这是我们的优势所以我们不用担心美国人抢先研发出来一种技术只要他们研究出来了,我们知道是可行的,慢慢捣鼓出来的。

从无到有的研发会花费大量的时间精力,经历各种各样的失败,而且还需要各种的机遇和灵感,不是简单地堆人力就可以出效果的。况且它还需要人敢于去想,敢于去尝试,敢于去干这并不是太符合我们整个民族的性格

但历史已经发展到今天这一地步,从人才储备以及整个历史趋势来看,我们的崛起和美国的衰落都是已经在不断地发生当中了也许有一天美利坚不再引领人类技术进步这个担子就不可避免的落到我们身上,我们要为此做好准备

实际上我们需要更主动的去尝试作为引领者首先的转变要在心态上当我们决定做引领者的时候,就会从技术引领者的角度来看各种问题,去做各种尝试。我们站立的角度和心态,就决定了我们做事的想法和方式。先从心态上进行转变,剩下的文化和积淀,随着时间慢慢地积累,一步一步都会得到改善

这些改善和进步又从另一方面能够更好地去影响我们的心态和自信这就是一个正向的循环我们现在正在外围不断地向这个圈子的内部靠近,现在可能觉得有点困难和不知所措,但我们走的越近就会觉得越舒服越来越能找到感觉

展开全文

最近因为产品上的一个想法,决定尝试下能否用transformer来实现。 于是专门抽出了块时间仔细的写写代码玩了一下。其实产品上想法的验证是一方面,最主要还是GPT之类的火了这么久,之前虽然简单地了解过背后的原理技术,心里总是想找个时间写代码跑跑训练小模型试试,几个原因叠加在一起吧,最近也是难得抽出来一大块时间,仔细地跑了一下。

俗话说得好,纸上得来终觉浅,绝知此事要躬行。只有自己真的尝试去实现了,才能更深刻的把握其中的原理细节,搞清楚为什么要这样设计,发现当中的细微精妙之处,才能更好的去扩展应用和改进。 我这段时间不停的写代码调试训练的过程中,大脑中不断地不自主的索引到这句话,感触颇深。

另一个方面,自从毕业以后,游戏和图形图像相关的技术搞得比较多一点,NLP之类的就基本没怎么搞过了,很多新技术都没有具体的去了解过,也是趁着这次机会详细的又深入学习研究了一遍。

整个过程差不多花了半个多月的时间,超出了我当初打算投入的时间不少,大部分都花在了研究一些技术的细节上面,需要阅读很多资料文章甚至论文才能彻底搞明白。不过回头评估一下,我其实是很开心的,并没有觉得时间被浪费掉,而是很强的获得感。

好了,下面进入正题。

既然是测试评估,那就要写一个程序来玩玩,什么样的程序呢? 因为transformer最早是被用来解决机器翻译问题的,所以我用来试水的代码也是一个翻译的程序,比如把汉语翻译成英语,这是很正常的想法,我也确实这么干了,使用大量的英语汉语对照翻译的句子来对这个模型进行训练,翻译的效果看起来还不错,可以看后面的几个测试输出。

然后,很自然的,我顺着就想,能否直接把汉语现在的白话文翻译成古代的文言文呢?这个也挺有趣的。

于是说干就干, 直接找了一堆古文和现代文对照翻译的语料库。 主要是一堆《史记》《汉书》之类的史书。都是类似下面这样的句子,有古文和现代的对照翻译。

古文

现代文

子能以燕伐齐,则寡人举国委子。

假如您能以燕国现有的力量讨伐齐国,那么,我愿把整个国家托付给您。

祸与福同,刑与德双。

灾祸和幸福同在,刑罚和赏赐相成。

其后诸侯共击楚,大破之,杀其将唐眛

在此之后,各诸侯国联合攻打楚国,大败楚军,杀死了楚国大将唐眛。

秦将章邯破杀项梁也,沛公与项羽引而东。

这时秦将章邯打败项梁的军队,杀死项梁,沛公与项羽率军东归。

禹曰: 予娶涂山,癸甲,生启予不子,以故能成水土功。

对这种人我决不听之任之。 禹说: 我娶涂山氏的女儿时,只经四天婚期就又去治水了,我的孩子启从生下来我未曾抚育过,所以才能使平治水土的工作取得成功。

 

整本史记,古文和现代文的对照大致有三万行左右,我用的数据并不是很精准,比如上面的对照翻译中,最后一个现代文,第一句对这种人我决不听之任之。”显然是错误的,应该删除掉,但是整个训练的语料是在是太大,全部去手动改不现实,毕竟是玩玩,凑合着用也不太影响。

不过既然都写代码训练了,处理加载语料的时候顺手统计打印了一下史记里面每个字出现的次数,下面这个表是前一百个频率最的字,按降序排列,每个字后面跟的数字是总共出现的次数。

1

55459

29482

13308

11163

8118

7612

7443

7338

9

6561

6411

6005

5470

5309

5083

4705

4670

17

4505

4191

3778

3335

3202

3149

3136

3062

25

2813

2788

2642

2453

使

2426

2397

2376

2324

33

2323

2284

2255

2214

2203

2189

2132

2106

41

2057

2052

2026

2025

2010

1985

1979

1908

49

1897

1888

1880

1879

1792

1744

1685

1632

57

1589

1578

1576

1574

1521

1514

1440

1423

65

1421

1406

1403

1399

1382

1335

1324

1313

73

1309

1281

1279

1273

1268

1268

1258

1256

81

1229

1213

1205

1191

1190

1181

1177

1176

89

1161

1144

1126

1120

1112

1100

1091

1078

 

之字出现的频率高是很正常的,但我没有想到王字出现的频率居然这么高。 整体来看,王侯将相出现的频率跟之乎者也差不多了。也难怪一代目会感叹说,二十四史写的都是帝王将相。 

至于代码实现上面,我写了好几个不同的翻译模型实现,一个是用lstm,另一个是lstm加attention机制,还有一个是gru+attention,最后一个是transformer的实现。 

使用transformer模型的代码总共有五六百行,我就不贴出来了,毕竟没几个人愿意看。就是一个经典的seq2seq模型,或者说encoder decoder程序,搞过机器翻译的应该很容易理解,自己动手写也不难。

先看看单纯lstm的输出,我只使用了一层并没有堆叠,训练数据量很少只有一万多行,而且很快就训练完了

下面是它的一些测试输出,,最后数字前面整个句子字数

这句话如果用古文来说,应该是什么意思呢? 20

侯如君,是言也?

——————————-

我要骑着马去外边。 9

行无欲辱。

——————————-

这个东西其实一点意思都没有。 14

若兵皆也,无后。

——————————-

你不要说话。 6

比听。

实际上单纯的lstm效果很差,它似乎简单的理解了一些语义,翻译有一点沾边的信息,但是还差的很远,不算像样的句子

然而lstm加上attention之后效果有一个非常明显提升,下面的例子可以看到句子明显靠谱可用

这句话如果用古文来说,应该是什么意思呢?20

即诚用古文法,何也乎?

——————————-

我要骑着马去外边。 9

引兵车党。

——————————-

这个东西其实一点意思都没有。 14

者诚相恐都不听。

——————————-

你不要说话。 6

论默 

所以说attention机制非常重要统一关联整个上下文

根据测试lstm感觉gru废话多一些可能是因为多了一个存储单元缘故理论上效果应该gru要好但是测试结果发现其实差不了多少可能是训练的数据量不够多到足以拉开差距吧

我只用了史记里面一部分的数据来训练,主要是因为lstm很难训练,它的时间复杂度会随着序列长度增加而线性的增加,所以我把token序列的长度限制在24,这样就裁剪掉了一半多的数据,另一个原因是我发现用CPU训练的速度比GPU还快,应该是因为他的序列是有线性的依赖关系,无法并行加速如果使用大量的数据的话,效果可能会好不少

关于lstm就说这么多吧,下面该我们讨论的主角transformer登场了 

transformer模型我的embedding大小是256,token序列长度36堆了两层encoder decoder总共参数9128201差不多一千万左右样子输入数据使用[史记,汉书,后汉书,三国志,魏书,晋书,北史,南史,周书,北齐书,宋书,南齐书,梁书,陈书,隋书,旧唐书,新唐书,宋史,元史,明史]等史书里面序列长度大于36的对照组剔除一共有360671对句子,古文加现代文的token数量加起来大致也在一千万左右对于模型来说数据量还是有点偏小不过大致差不多凑合了

在我的mac m2的mps设备上跑了几个晚上,几个测试的大致输出如下

这句话如果用古文来说,应该是什么意思呢? 20

greedy  若以古文意,何宜言?

beam  [‘‘, ‘‘, ‘‘, ‘‘, ‘‘]

苟用古文言,何宜意?

苟用古文意,何宜言?

苟用古文言,何宜言?

——————————-

我要骑着马去外边。 9

greedy  我骑出边外边外,我骑诮马乘边外,吾往往外。

beam  [‘‘, ‘‘, ‘‘, ‘‘, ‘‘]

我骑出边外边外,我骑诮马乘边外。

我骑出边外边外,我骑诮马乘边外,吾往外。

我骑出边外边外,我骑诮马乘边外,吾往去。

——————————-

你说,这个东西难不难呢? 12

greedy  汝不难,难乎?

beam  [‘‘, ‘‘, ‘‘, ‘‘, ‘‘]

汝不言难,难难乎?

汝不言难,难难乎? 

汝不言难,难遽言是,难难乎?

——————————-

这个东西其实一点意思都没有。 14

greedy  其无他意实者,皆东西无他意。

beam  [‘‘, ‘‘, ‘‘, ‘‘, ‘‘]

东西皆无他意实意者。

东西皆无他意实,不果。

东西皆无他意实,不果也。

——————————-

你不要说话。 6

greedy  汝勿言,毋言。毋言。

beam  [‘汝’, ‘毋’, ‘卿’, ‘尔’, ‘勿’]

汝勿言,勿言。

汝勿言,毋言。

汝勿言,毋言。毋言。

——————————-

我要睡觉了。 6

greedy  吾觉寐,我欲寐寐矣。

beam  [‘‘, ‘‘, ‘‘, ‘‘, ‘‘]

吾觉寐,我欲寐矣。

吾觉寐,我欲寐寐。

吾觉寐,我欲寐寐矣。

——————————-

时间过的很快。 7

greedy  寻过之日久,甚。

beam  [‘‘, ‘‘, ‘‘, ‘‘, ‘‘]

寻过之。

寻过期之。

寻过之日久。

——————————-

我昨天经过一个村庄,那里的人都很友善热情,我在那里吃了一顿饭。 31

greedy  昨日分顿庐,昨有所饮食,昨有所具十囚。

beam  [‘昨’, ‘臣’, ‘其’, ‘我’, ‘今’]

昨一饭之在藩庄昨,有善者,有所具。

昨一饭之在藩庄昨,有善具者,有所具。

昨一饭之在藩庄昨,有善具者,有所具者。

第一句话是输入,最后的数字是整个输入的字数,下边是输出的翻译。

实际上Transformer的解码器是一个字一个字输出的,一开始给一个开始的标记,他输出第一个字,然后再把这个开始标记加上输出的第一个字当成输入,继续迭代,它再输出第二个字,再把这三个当成输入,然后它会输出第三个字。如此往复循环,直到输出整个句子或者达到最大长度限制。

实际上输出的也并不是一个单独的字,而是所有字的每一个可能性概率,这就牵扯到一个选择的算法。通常有两种策略,一个是greedy贪心算法,也就是说每次都选择输出概率最大的那个字,最终组成一个句子。上面的输出前面写着greedy的就是这个算法。

另一种策略叫做beam search。他大致原理是选择若干个比如说前五个概率最大的字,然后每一个作为输入再生成下一个输出。如果直接展开搜索不加限制的话很容易形成指数爆炸,因为第一次是五个,第二次就是25,然后第三次就是125了。句子很长的话很容易就形成一个天文数字,所以需要进行一定的剪枝操作,在前五个的输出生成两个字的25个输出中选择连续概率最高的前五个,作为下一次输入,然后对于三个字再选择连续概率最高的前五个,这样不断的迭代下去,最终会得到概率最高的前五个句子的输出,这个算法对于树枝每次都进行裁剪,形成一个五个的束,所以叫Beam search。因为他的概率选择是基于整个句子的,一般来说效果要比单纯的greedy策略好一些

输出里边前面写着beam的就是这个算法实现。对于第一个字,我把前五个最大概率的字都打印出来了,就是后面中括号里面的。为了便于阅读最终的句子只打印出了前三个。

可以看到,已经大致能翻译出来不错的结果,比如对于第一句,“这句话如果用古文来说,应该是什么意思呢?”他的翻译效果看起来还不错。而且对于beam给出的几个最大概率的字,用每一个看起来都是一个可行的选择。‘若用古文言’, ‘苟用古文言’, ‘如用古文言’, ‘夫用古文言’, ‘诚用古文言’都是毫无违和感的。

但对于其他的一些句子,效果并不是特别好。特别是最后那句很长的句子他并没有真的完全get到整体的语义。

其实稍微思考一下就能发现改进空间还是非常大的。比如进行中文分词。因为我是直接把单独的汉字嵌入做词向量的,这样就会把很多词语给硬生生的拆分开。比如“东西”这个词,翻译成古文可能用“物”字来对应。但是如果是字符级别的直接训练,Transformer模型是难很建立一对应关系的,当然足够大的数据,有东西和物两个对照翻译的话是可以输出相应的效果。但是我的训练数据集显然偏小,而且这样大量的词语一一对应的情况非常少,因为东和西两个字作为指代方向在古文中大量的出现,所以训练的结果输出中很难把这两个字作为一个词当成整体来看待。

于是我尝试简单的进行一下分词试试,很快就发现这并不可行。汉字大致有几千个,但要是词的话至少也有好几万。,这样会直接导致embedding层扩大一二十倍。本来参数都有几百万了,训练数据输入都偏小,无法使得模型很好的拟合。做了分词之后一下子就飙到了好几千万,这在我本地电脑上训练成本实在是太高了,内存消耗和时间消耗都增大了一个量级。我甚至都产生了要买一块儿4090显卡的冲动,24g的显存加上70tflops左右的算力应该玩儿的比较舒服一点。

还有一个优化方式是对大量的词语古今对照做成一张表,对模型进行预训练,这样他就能更清楚的理解和翻译了,这张表很可能包含几万甚至十几万的对照翻译。我搜了下,好像有标注好的语料库,但并不是特别好找简单一下后就放弃了毕竟我只是玩玩。

另一个优化方式是,对encoder部分进行单独的训练,因为我们有大量的汉语现代文的语料,通过mask之类的模型就可以把编码器部分训练的足够的好,然后再用古文和现代文的对照训练最终的翻译模型,这样的效果应该会好很多。

正当我准备单独训练encoder的时候,突然意识到一件事情,那就是BERT。这不正是我准备要训练的东西吗

BERT是Google几年前发布的一个训练好的大模型,他并不是使用完整的transformer,而是仅仅使用了encoder的部分,这可是一个使用大量的数据和机器训练出来的一个经历过实践验证的大模型,我直接在他上面加个decoder就好了,这简直就是站在巨人的肩膀上,实在是太爽了!

实际上利用训练好的大模型对特殊的使用场景进行二次训练是非常正常的一个行为,甚至有个专门的术语叫做fine tuning,我们一般翻译成微调。

事实证明我过于乐观了,bert跟今天这些动辄几百亿参数的大模型比起来虽然相形见绌,但他好歹也是个大模型,在我本地机器上跑实在是太力不从心了。

bert训练好的汉语模型的并不是太多,我找到了一个最小的模型,堆了12层编码器,词向量的维度是768,输入序列有128token。我按照这个数据实现的decoder一下子就有了一两千万的参数量,这还是把层数砍到只有两层的情况下。

我一开始直接把bert的输出连接到decoder上,输入了一本史记进行训练,结果直接导致内存飙满,操作系统不停的进行内存和盘的swap,不到一个小时就写了一两个tb的数据量,我只能停止训练下去了,这么搞下去直接就把ssd写废了。

于是我想到了一个简单的优化策略,既然训练数据是固定的,那么bert的编码输出也是固定的,我直接预先把这些现代文的句子用bert输出后写到文件里,然后用这些输出单独的训练解码器,这样训练过程中就不用bert参与了,可以节省不少内存。

事实上这些数据量特别大,我只把史记,汉书和后汉书转换了一下,整个过程花了几个小时,pickle之后在磁盘上占了134g的大小

加载训练过程同样发现实在是太耗内存,经过尝试,我只使用了汉书的数据,裁剪过长的句子后只剩下3句子左右,才能全部加载到内存而且不进行大量swap

下边是bert+decoder训练后的输出beam search懒得单独实现一次了所以下面看到有一个None

这句话如果用古文来说,应该是什么意思呢?20

greedy何以古文?

None

——————————-

我要骑着马去外边。 9

greedy我当乘马。

None

——————————-

你说,这个东西难不难呢? 12

greedy君何用? 

None

——————————-

这个东西其实一点意思都没有。 14

greedy其来无意。

None

——————————-

你不要说话。 6

greedy君无言。

None

——————————-

我要睡觉了。 6

greedy臣敞寐矣。

None

——————————-

时间过的很快。 7

greedy日月骛速。

None

——————————-

今天和明天的区别。 9

greedy今、明之异也。 

None

——————————-

写一段话记录一下整个事情的经过。 16

greedy令言举事。 

None

——————————-

我昨天经过一个村庄,那里的人都很友善热情,我在那里吃了一顿饭。 31

greedy臣今日过邑,皆有友善。

None

bert的效果看起来更有潜力一些毕竟我只用了很少的数据,要是把大量的史书加载进来效果应该会更好,可惜我本地的电脑也只能到这个程度了,不过要是花费大量的时间慢慢优化应该也可以,我毕竟只是玩玩儿,实在是不愿意投入更多的时间精力了。

真的要想玩儿的非常开心,感觉至少要专业的a100或者h100了,然而这些卡买一块儿都至少要一二十万,更不要说英伟达对我们禁售了。 

整个过程大致就是这样吧,我花了大量的时间精力进去,整个过程当然玩儿的还是很开心的。虽然最后对于计算力的限制有点儿郁闷,但我觉得应该不仅仅是我自己遇到的问题即便国外那些大厂像openai或者facebook之类的同样有算力的焦虑他们的模型更大对算力的需求也更大,毕竟参数越多效果越好,facebook最近发布的llama3700亿个参数,在将近5万块儿h100上面进行训练,花了640万gpu小时,这些算力看起来是非常恐怖的,而且这远不是结束,整个业界还在谋划着更大的模型,更强的算力。

最后讨论一下transformer模型的达到效果极限。本来是放在这篇文章里一起写的后来发现太长,于是拆分了出去,成为了另外一篇单独发布了。

 

PS:另外附上transformer训练英文翻译成中文程序输出,我堆了两层,序列长度是16,一共有八百多万个参数,我使用了五万多行中英文对照翻译语料进行训练相对于参数来说训练数据实在是太少,并不能充分拟合

英文直接空格分词也没有stemming操作,因为最后一个标点跟挨着的词组合在一起导致词汇表大量增加,我直接把结尾的标点给删掉了,这可能导致比如之类疑问句不太识别。毕竟是玩玩,我太懒不想优化太细致

然而翻译的效果看起来文言文翻译好不少,我猜应该是因为测试数据都很短且中英文的语法对应比较简单。另外汉语本身有大量的一字多义造成的映射困难,每个字和词拆分的可能性太多 下面一些测试输出

i love sleeping 15

我爱睡觉。

——————————-

i love sleep 12

我爱睡觉。

——————————-

who are you 11

你是谁。

——————————-

you are stupid 14

你很笨蛋。

——————————-

it seems bad 12

看起来很糟糕。

——————————-

it seems not bad 16

看起来不错。

——————————-

what is the difference between seem and seems 45

“看来说,哪多点是点。”

——————————-

he goes to school 17

他上学。

——————————-

are you serious 15

你是认真的。

——————————-

are you hungry 14

你饿了。

——————————-

i am feeling good 17

我觉得好看。

——————————-

i am fine 9

我很好.

——————————-

call me when you get home 25

你什么时候给我回家。

——————————-

please let me know if you need my help 38

怎么办想都亲就了。

——————————-

what is your name 17

你叫什么名字。

——————————-

i want go back 14

我想回去。

——————————-

time to go 10

时间到了。

——————————-

展开全文

这两天有点感冒跟去年疫情放开后新冠感染很类似应该是流感或者再次感染吧。

从昨天开始喉咙就一直很痛晚上开始流鼻涕睡觉的时候发烧头疼晚上来回醒了好几次浑身都是汗第一次醒来做了个噩梦。

今天来头疼浑身酸痛无力什么都干不进去,于是我就在床上躺了一天一直在思考睡眠和做梦的一些问题这篇文章就是这些思考的一个简单记录。

先看看睡眠生物界的大部分动物都进化出来了这种机制。他的根本原因应该起源于我们的眼睛感光机制和地球形成的白天和黑夜等晚上看不见东西的时候,整个生物世界几乎都平静了下来这时候机体就可以进入某种修复状态如果把我们的身体看成一个精巧的机器人的话,那么晚上的时段就是在维修保养。

简单的维修保养只要躺在地上静坐不动就可以了我们为什么要失去自我意识,进入所谓的睡眠这种状态呢?实际上失去意识对很多动物来说是很危险的因为在这个过程中他们很可能遭到其他捕食性动物的攻击。

这很可能是我们大脑的运行机制导致的。假设我们大脑的神经元之间的突触间的递质不停的进行传递以及神经元上电位的流动变化一个复杂网络形成了某种电和化学反应的一个复杂的过程我们把这个过程产生的不停的思考的自我认为是意识的起源的话那么这个复杂的电和生物化学反应过程很有可能产生某种杂质或者说反应输出的垃圾副产物。

这些副产物很有可能无法在这个过程进行的当中清除掉必须关掉整个反应过程才能执行一些清理修复工作。这也许就是我们必须睡眠的原因我们看一些场景比如说在中午很累的情况下稍微打个盹儿就能恢复精神状态。这极有可能就是在自我意识关闭的那个短暂间隙,大脑执行了一些垃圾清理工作。

如果我们仔细的研究这些垃圾物质的产生机制以及大脑的代谢过程,很有可能发现一些大脑运行机制的起源以及对自我意识如何产生这个深刻的哲学问题提供更多的科学论证这需要医学和生物科学界更多的努力和投入我们现在的技术手段毕竟还有限。

我们再研究一下大脑的结构很多东西是特别复杂的我们举个例子来类比一下比如我们有一个简单的下棋程序,他可以下过人类的大部分选手我们做一个简单的机器人把这个程序放在他所谓的头部的大脑位置当然这个程序是在一块儿具有存储和执行单元的芯片上运行的我们模拟出来几个简单的机械的手可以在棋盘上进行操作,看起来是一个有点儿简单智能的机器人的样子。

如果这个机器人被某种外星人发现了,他们拆开这个机器人尝试研究这个机器人具有的一些简单的智能的来源于是就把他的大脑也就是所谓的芯片给拆解开研究里边的构造细节那么他们能够发现什么呢?

他们无非是看到一些各种各样的沟槽和掺杂构成的pn结形成那个所谓的晶体管和门电路罢了这些门电路构成了我们所谓的控制和存储单元通过精确的电流和时序来形成某种程序过程

但是对于不懂我们计算机基本原理的外星人来看,他们只看到电流在这些所谓的复杂的电路结构中流过就产生了看到的所谓的简单智能很难从电流本身去拆解还原出来我们整个程序和复杂系统的构造。

引用莱布尼茨的一段话很早以前看到的,我忘记原文出自哪里了大致意思是如果我们可以把人类的大脑放大,比如说就像一个磨坊的大小我们可以清楚的看到里边每一个细胞和神经元之间的连接构造这样我们可以从中看出来我们大脑思维的过程是如何产生的吗?或者说我们可以从中找到那个所谓自我意识或者心灵的那个东西吗?不是的,我们什么也看不出来。

也许我们可以尝试从另一个角度,也就是说从顶往下的角度来研究大脑的结构,也就是从我们自己的思维本身里的一些概念原理推理的过程进而尝试去研究我们大脑产生智慧的本质。同样是莱布尼茨他曾提出过构造一种通用的人类的语言不同于我们的汉语英语这种语言是非常精确的,每一个都对应我们大脑里的相应的概念。我们可以用这种语言进行精确的逻辑推演一些概念会被更基础的概念组成或者推理出来这就形成了我们整个人类的智慧体系甚至可以进行思考推理未来更复杂的东西。

然而我们多年的尝试表明这个语言是很难被创造出来的在某种程度上,它类似于我们现在所谓的形式逻辑的哲学分支或者更具体一点,它形成了我们现在所谓的谓词演算和数理逻辑的概念和学科,也算是现在人工智能的一个分支吧有兴趣可以研究一下。

讨论的有点儿发散了,我们再回到一开始的话题讨论一下做梦相关的东西吧。

我们为什么要做梦呢?以及大脑是如何产生梦境的各种机制呢?

也许做梦有一定的生理上的意义比如巩固大脑的某些功能或者强化记忆之类的又或者也许他就是生物进化过程中为了等待天亮而形成的一种避免过度无聊的机制。

有一种说法是做梦其实是早期生物在尝试对各种危险环境的复盘比如在梦境中尝试对其他生物的攻击进行有效的反抗或者逃跑类似一个虚拟的训练过程环境,不过这个说法可能还有待更多的科学验证

也可能梦境本身没有任何意义只是是生物进化过程中的一个副产物而已

我们再讨论一下梦境产生的机制。

实际上做梦的过程中,我们的自我意识已经是被运行起来的了跟深度睡眠不同这时候身体处于一种警戒状态很容易被周边环境的声音和震动惊醒。

做梦的过程跟现实过程的差别其实并不大我们可以很清晰的感受到自我的存在,并进行各种判断选择跟现实不同的只是梦里边输入输出是大脑模拟出来的比如我们的眼睛看到和耳朵听到这些所谓的输入这时候是被屏蔽掉的。我们在梦境里看到和听到的都是大脑模拟生成的假信号,同样我们的手和脚这些运动器官的输出也被屏蔽掉了,我们在梦里会生成一些身体的假象尝试运动的时候会看到这些运动输出被执行。

也许大脑里有某个功能单元我们姑且把它称作梦境生成器吧在做梦的时候他会接管我们身体的输入和输出随机的产生各种各样的梦境。

实际上这个功能单元可能并不复杂他生成梦境也不是通过自己本身产生的而是在梦境中我们的自我意识想到的一些东西或者念头这个梦境生成器这些念头里边随机的挑选一些概念想法然后从大脑里检索各种各样曾经有过的场景拼凑出来的一个梦境场景然后我们的意识思维根据这个梦境不停的去思考想象一些可能的新的想法念头这个生成器觉到这些想法念头进而拼凑生成新的一些梦境于是这个循环过程就不断的生成了连续的梦境。

因为这个生成器是根据我们在梦里大脑的想法随机拼凑合成的一个连续过程所以我们的梦有很多是非常不符合逻辑的但是他的场景都是很真实的从我们现实生活中选择拼凑生成的,当然有一些各种各样拼凑出来的奇怪的东西。

所谓“日有所思,夜有所梦”这个生成器就是根据我们的念头,从我们曾经见到过的各种场景中收集拼凑所以我们在梦里看到的大部分都是现实场景中曾经发生过的或者很久以前发生过的或者看到的自己没有意识到以及这个生成器通过各种拼凑组合形成的各种各样奇怪的生物和事物。

其实我们可以通过仔细的观察我们的梦境,然后去研究这个梦境生成器的原理机制的。这可以作为我们的医学或者心理学的一个课题有些人可能会不以为然,不认为这是什么值得研究的东西。然而所谓真正的科学就是凡事都去较真。真的去较真了,仔细的去推理研究发现很多东西的运行理论和机制可能都是很简单的。

好了基本上就这些了这篇文章就是简单的记录一下几个琐碎的想法可能看起来没那么连贯

展开全文

又到过年了,今年是农历龙年。龙这种传说中的生物,如今已经成为了我们中华民族的符号象征,今天我们来认真讨论一下的真正起源。

任何传说都基于一定的事实基础,我们的先人不太可能凭空创造一种神秘的生物,即便是神话,那也要有最初的事实基础内核原型,然后才能在上面进行各种演绎想象

一种说法是龙起源于蛇,它的形象是很像的。在我看来这种说法的可信度并不高。蛇是一种很普遍的生物,而且很招人讨厌,人类本能上厌恶这种生物,很难想象我们的祖先会敬畏崇拜它。

而且我们的祖先是见过蛇的,并给他取了一个叫做蛇的名字,那就说明它跟龙没有任何关系, 龙这个字的出现即便不比蛇早也不会比他晚, 这件事上是没有任何含混可言的, 即便是巨大的蛇,比如说蟒蛇我们的祖先也不认为他是龙并专门给他取了蟒这个名字。

而且无论怎么含糊,龙有爪子,这一点是确凿无疑的,这跟有本质的区别

还有另一种说法,就是龙起源于鳄鱼,后来华北平原的鳄鱼灭绝了就成为逐渐演化成后来的龙的形象了。这个说法看起来似乎有点道理,而且鳄鱼是是水生动物,比较契合。然而,古代鳄鱼是有明确记载的,它的名字叫鼍,鳄鱼皮被用来做鼓,诗经里有“鼍鼓逢逢”的记录。

我们的汉字是一种象形文字,透过几千年的历史,即便很多东西没有文字记录下来,我们单纯分析文字符号本身就可以找到一些蛛丝马迹。

比如刚才说到的鼍,这个字的字形本身就很像一只鳄鱼。我们再举一些其他例子看看。

当年在商周旁边的一些少数民族部落,每个部落都有一个符号文字来对他们,分别是东夷,西戎,南蛮,北狄。演化到了今天这些词已经被用来称作那些落后文明部落了,甚至用来贬义指代外部的敌人,比如蛮夷。晚清刚接触西方先进技术的时候就说,师夷长技以制夷,包含了一定程度的自大,又觉得对方好像更厉害一点,但嘴上却又不愿示弱。

夷这个字,甲骨文可以明显地看出是一个绑着绳子的箭矢,即便是现在的字的形态,也可以拆分为一个拿着弓的人,这个字很明显说明了东边的部落喜欢拿弓射箭。他们的战斗力并不是特别弱,比如当年商就是因为征东夷人而国力大损,西周崛起并取代了它,这就是我们都知道的武王伐纣的故事了。

狄这个字就更形象了,甲骨文是一个人一只狗,金文则是一堆火旁边一只狗,今天这个字也是火的旁边有一只狗,非常形象生动的描述了北方少数民族的特征。

蛮字是上面两边挂着丝,下边有一条蛇,这表明了南方少数民族的特点。

戎这个字是戈和十构成,代表了矛戈和盾牌,很有可能是说西北少数民族的战斗特点。不过这个字后边演化的意义比较多,指代战争征伐,还有戎车之说,这里我们先不讨论更多的细节了吧

这些字都很形象的表明了周边少数民族部落的特点。虽然今天有一些贬义吧,但周边这些少数民族在历史上多年的融合征战中,都已经成为了中华民族的一分子,我们今天大部人的基因里边很有可能都包含来自他们的一部分。

说这么多,只是为了表明汉字本身就包含了很多信息。另外还有一个就是每一个部落都会有一个他们自己的符号或者图腾,这在古代是为了互相之间的区分,甚至很有可能在没有文字的时候,他们就把这些符号画在自己部落的旗帜衣服甚至额头上都是有可能的,以便跟其他部落进行区分。

那么龙是不是也是这样一个被一支部落用来当作自己符号的一个标记呢?我们历史上的传说是当年黄帝统一各部落,然后合符釜山,从各部落的符号当中取出一部分放在一起构成了龙这个统一的符号。不过这毕竟只是传说,根据现在出土的各种各样的龙的形象,甚至6000多年7000多年前的都有,这很可能早于黄帝的时间。釜山合符的说法似乎还需要更多的考证,或许将来考古可能会有更多的发现吧。

,铺垫了这么多,该说一下我的猜测了。我认为龙很可能是起源于我们早期的部落对恐龙的崇拜。

今天恐龙在全世界到处都能发掘出来在早期的华夏大地上,恐龙骨架几乎可以肯定曾被我们的先民们发现他们一定会猜测这到底是什么动物,因为他们从来没有在狩猎当中见过这样的事物。这种巨大而又神秘的东西一定是很符合早期那些祭祀崇拜的,甚至发现这些恐龙骨架的那个部落把这个骨架当做他们的神明和图腾。

我们看一下甲骨文和金文的龙字,它上面那个王冠是人为后来加上去的应该是为了彰显这种生物无的地位。这个字的形象本身可以看到一个巨大的张着大嘴的头颅还有一个很长的脊椎骨这跟我们今天挖掘出来的恐龙化石是非常相似的特别是头部

再看一下考古的发现比如河南濮阳出土蚌壳龙,从照片上看简直跟恐龙就没有什么两样只是身子略微细长跟今天的龙的形象更像这很可能是古代人对恐龙的脊椎还原不够导致的或者说恐龙的肋骨化石没有那么明显,从而显得躯体略显瘦了一些。

甲骨文和金文里边存在龙这个字而且他的形象非常具体这说明这种生物不是凭空想象出来的。而是从现实当中取材先民们是见过某种东西而创造出来的龙这种形象而且这种生物在自然界并不存在。恐龙是很好的符合所有这些特点。

恐龙有爪子有巨大的头颅,而且巨大神秘很容易让我们祖先崇拜蛇是永远不具备这些特点的

我们前面说过了,我们的汉字是象形文字,每一个符号都有对应的图形和意义,很难想象我们的先民们会无中生有创造出来龙这样一个符号。

而且按照我们的文献记载传说中的龙还有各种不同的类型比如应龙就可以飞刚好对应恐龙之中的翼龙。古代人可能也发掘出来出过各种各样的不同类型的恐龙骨架才给出了不同类型的龙的传说。

另一个线索是龙和水的关联传说中龙是水神。这很可能源于古代洪水过后把巨大的恐龙骨架化石冲刷出来了或者人们从干枯的河道底部发现的恐龙骨架进而把这种神秘生物跟水联系在了一起。

比如,“伏羲王天下,龙马出河,遂则以画八卦”。这个所谓的龙马,很有可能就是在河里边的恐龙化石骨架,这样看来河图洛书的故事也不是完全没有事实根据的。

再看左传里的记载:

秋,龙见于绛郊。魏献子问于蔡墨曰:吾闻之,虫莫知于龙,以其不生得也。谓之知,信乎?。

这个记载的事实据很高子说龙从来没有被人活着到过这里可以推断出所谓的龙见于绛郊就是恐龙化石骨架可能性可信度几乎都有百分之八九十。这个记载可能是最靠谱的说法了,而且春秋时代很早,他们更接近龙的真相。 “虫莫知于龙,以其不生得也”,这句话应该也