最近因为产品上的一个想法,决定尝试下能否用transformer来实现。 于是专门抽出了块时间仔细的写写代码玩了一下。其实产品上想法的验证是一方面,最主要还是GPT之类的火了这么久,之前虽然简单地了解过背后的原理技术,心里总是想找个时间写代码跑跑训练小模型试试,几个原因叠加在一起吧,最近也是难得抽出来一大块时间,仔细地跑了一下。

俗话说得好,纸上得来终觉浅,绝知此事要躬行。只有自己真的尝试去实现了,才能更深刻的把握其中的原理细节,搞清楚为什么要这样设计,发现当中的细微精妙之处,才能更好的去扩展应用和改进。 我这段时间不停的写代码调试训练的过程中,大脑中不断地不自主的索引到这句话,感触颇深。

另一个方面,自从毕业以后,游戏和图形图像相关的技术搞得比较多一点,NLP之类的就基本没怎么搞过了,很多新技术都没有具体的去了解过,也是趁着这次机会详细的又深入学习研究了一遍。

整个过程差不多花了半个多月的时间,超出了我当初打算投入的时间不少,大部分都花在了研究一些技术的细节上面,需要阅读很多资料文章甚至论文才能彻底搞明白。不过回头评估一下,我其实是很开心的,并没有觉得时间被浪费掉,而是很强的获得感。

好了,下面进入正题。

既然是测试评估,那就要写一个程序来玩玩,什么样的程序呢? 因为transformer最早是被用来解决机器翻译问题的,所以我用来试水的代码也是一个翻译的程序,比如把汉语翻译成英语,这是很正常的想法,我也确实这么干了,使用大量的英语汉语对照翻译的句子来对这个模型进行训练,翻译的效果看起来还不错,可以看后面的几个测试输出。

然后,很自然的,我顺着就想,能否直接把汉语现在的白话文翻译成古代的文言文呢?这个也挺有趣的。

于是说干就干, 直接找了一堆古文和现代文对照翻译的语料库。 主要是一堆《史记》《汉书》之类的史书。都是类似下面这样的句子,有古文和现代的对照翻译。

古文

现代文

子能以燕伐齐,则寡人举国委子。

假如您能以燕国现有的力量讨伐齐国,那么,我愿把整个国家托付给您。

祸与福同,刑与德双。

灾祸和幸福同在,刑罚和赏赐相成。

其后诸侯共击楚,大破之,杀其将唐眛

在此之后,各诸侯国联合攻打楚国,大败楚军,杀死了楚国大将唐眛。

秦将章邯破杀项梁也,沛公与项羽引而东。

这时秦将章邯打败项梁的军队,杀死项梁,沛公与项羽率军东归。

禹曰: 予娶涂山,癸甲,生启予不子,以故能成水土功。

对这种人我决不听之任之。 禹说: 我娶涂山氏的女儿时,只经四天婚期就又去治水了,我的孩子启从生下来我未曾抚育过,所以才能使平治水土的工作取得成功。

 

整本史记,古文和现代文的对照大致有三万行左右,我用的数据并不是很精准,比如上面的对照翻译中,最后一个现代文,第一句对这种人我决不听之任之。”显然是错误的,应该删除掉,但是整个训练的语料是在是太大,全部去手动改不现实,毕竟是玩玩,凑合着用也不太影响。

不过既然都写代码训练了,处理加载语料的时候顺手统计打印了一下史记里面每个字出现的次数,下面这个表是前一百个频率最的字,按降序排列,每个字后面跟的数字是总共出现的次数。

1

55459

29482

13308

11163

8118

7612

7443

7338

9

6561

6411

6005

5470

5309

5083

4705

4670

17

4505

4191

3778

3335

3202

3149

3136

3062

25

2813

2788

2642

2453

使

2426

2397

2376

2324

33

2323

2284

2255

2214

2203

2189

2132

2106

41

2057

2052

2026

2025

2010

1985

1979

1908

49

1897

1888

1880

1879

1792

1744

1685

1632

57

1589

1578

1576

1574

1521

1514

1440

1423

65

1421

1406

1403

1399

1382

1335

1324

1313

73

1309

1281

1279

1273

1268

1268

1258

1256

81

1229

1213

1205

1191

1190

1181

1177

1176

89

1161

1144

1126

1120

1112

1100

1091

1078

 

之字出现的频率高是很正常的,但我没有想到王字出现的频率居然这么高。 整体来看,王侯将相出现的频率跟之乎者也差不多了。也难怪一代目会感叹说,二十四史写的都是帝王将相。 

至于代码实现上面,我写了好几个不同的翻译模型实现,一个是用lstm,另一个是lstm加attention机制,还有一个是gru+attention,最后一个是transformer的实现。 

使用transformer模型的代码总共有五六百行,我就不贴出来了,毕竟没几个人愿意看。就是一个经典的seq2seq模型,或者说encoder decoder程序,搞过机器翻译的应该很容易理解,自己动手写也不难。

先看看单纯lstm的输出,我只使用了一层并没有堆叠,训练数据量很少只有一万多行,而且很快就训练完了

下面是它的一些测试输出,,最后数字前面整个句子字数

这句话如果用古文来说,应该是什么意思呢? 20

侯如君,是言也?

——————————-

我要骑着马去外边。 9

行无欲辱。

——————————-

这个东西其实一点意思都没有。 14

若兵皆也,无后。

——————————-

你不要说话。 6

比听。

实际上单纯的lstm效果很差,它似乎简单的理解了一些语义,翻译有一点沾边的信息,但是还差的很远,不算像样的句子

然而lstm加上attention之后效果有一个非常明显提升,下面的例子可以看到句子明显靠谱可用

这句话如果用古文来说,应该是什么意思呢?20

即诚用古文法,何也乎?

——————————-

我要骑着马去外边。 9

引兵车党。

——————————-

这个东西其实一点意思都没有。 14

者诚相恐都不听。

——————————-

你不要说话。 6

论默 

所以说attention机制非常重要统一关联整个上下文

根据测试lstm感觉gru废话多一些可能是因为多了一个存储单元缘故理论上效果应该gru要好但是测试结果发现其实差不了多少可能是训练的数据量不够多到足以拉开差距吧

我只用了史记里面一部分的数据来训练,主要是因为lstm很难训练,它的时间复杂度会随着序列长度增加而线性的增加,所以我把token序列的长度限制在24,这样就裁剪掉了一半多的数据,另一个原因是我发现用CPU训练的速度比GPU还快,应该是因为他的序列是有线性的依赖关系,无法并行加速如果使用大量的数据的话,效果可能会好不少

关于lstm就说这么多吧,下面该我们讨论的主角transformer登场了 

transformer模型我的embedding大小是256,token序列长度36堆了两层encoder decoder总共参数9128201差不多一千万左右样子输入数据使用[史记,汉书,后汉书,三国志,魏书,晋书,北史,南史,周书,北齐书,宋书,南齐书,梁书,陈书,隋书,旧唐书,新唐书,宋史,元史,明史]等史书里面序列长度大于36的对照组剔除一共有360671对句子,古文加现代文的token数量加起来大致也在一千万左右对于模型来说数据量还是有点偏小不过大致差不多凑合了

在我的mac m2的mps设备上跑了几个晚上,几个测试的大致输出如下

这句话如果用古文来说,应该是什么意思呢? 20

greedy  若以古文意,何宜言?

beam  [‘‘, ‘‘, ‘‘, ‘‘, ‘‘]

苟用古文言,何宜意?

苟用古文意,何宜言?

苟用古文言,何宜言?

——————————-

我要骑着马去外边。 9

greedy  我骑出边外边外,我骑诮马乘边外,吾往往外。

beam  [‘‘, ‘‘, ‘‘, ‘‘, ‘‘]

我骑出边外边外,我骑诮马乘边外。

我骑出边外边外,我骑诮马乘边外,吾往外。

我骑出边外边外,我骑诮马乘边外,吾往去。

——————————-

你说,这个东西难不难呢? 12

greedy  汝不难,难乎?

beam  [‘‘, ‘‘, ‘‘, ‘‘, ‘‘]

汝不言难,难难乎?

汝不言难,难难乎? 

汝不言难,难遽言是,难难乎?

——————————-

这个东西其实一点意思都没有。 14

greedy  其无他意实者,皆东西无他意。

beam  [‘‘, ‘‘, ‘‘, ‘‘, ‘‘]

东西皆无他意实意者。

东西皆无他意实,不果。

东西皆无他意实,不果也。

——————————-

你不要说话。 6

greedy  汝勿言,毋言。毋言。

beam  [‘汝’, ‘毋’, ‘卿’, ‘尔’, ‘勿’]

汝勿言,勿言。

汝勿言,毋言。

汝勿言,毋言。毋言。

——————————-

我要睡觉了。 6

greedy  吾觉寐,我欲寐寐矣。

beam  [‘‘, ‘‘, ‘‘, ‘‘, ‘‘]

吾觉寐,我欲寐矣。

吾觉寐,我欲寐寐。

吾觉寐,我欲寐寐矣。

——————————-

时间过的很快。 7

greedy  寻过之日久,甚。

beam  [‘‘, ‘‘, ‘‘, ‘‘, ‘‘]

寻过之。

寻过期之。

寻过之日久。

——————————-

我昨天经过一个村庄,那里的人都很友善热情,我在那里吃了一顿饭。 31

greedy  昨日分顿庐,昨有所饮食,昨有所具十囚。

beam  [‘昨’, ‘臣’, ‘其’, ‘我’, ‘今’]

昨一饭之在藩庄昨,有善者,有所具。

昨一饭之在藩庄昨,有善具者,有所具。

昨一饭之在藩庄昨,有善具者,有所具者。

第一句话是输入,最后的数字是整个输入的字数,下边是输出的翻译。

实际上Transformer的解码器是一个字一个字输出的,一开始给一个开始的标记,他输出第一个字,然后再把这个开始标记加上输出的第一个字当成输入,继续迭代,它再输出第二个字,再把这三个当成输入,然后它会输出第三个字。如此往复循环,直到输出整个句子或者达到最大长度限制。

实际上输出的也并不是一个单独的字,而是所有字的每一个可能性概率,这就牵扯到一个选择的算法。通常有两种策略,一个是greedy贪心算法,也就是说每次都选择输出概率最大的那个字,最终组成一个句子。上面的输出前面写着greedy的就是这个算法。

另一种策略叫做beam search。他大致原理是选择若干个比如说前五个概率最大的字,然后每一个作为输入再生成下一个输出。如果直接展开搜索不加限制的话很容易形成指数爆炸,因为第一次是五个,第二次就是25,然后第三次就是125了。句子很长的话很容易就形成一个天文数字,所以需要进行一定的剪枝操作,在前五个的输出生成两个字的25个输出中选择连续概率最高的前五个,作为下一次输入,然后对于三个字再选择连续概率最高的前五个,这样不断的迭代下去,最终会得到概率最高的前五个句子的输出,这个算法对于树枝每次都进行裁剪,形成一个五个的束,所以叫Beam search。因为他的概率选择是基于整个句子的,一般来说效果要比单纯的greedy策略好一些

输出里边前面写着beam的就是这个算法实现。对于第一个字,我把前五个最大概率的字都打印出来了,就是后面中括号里面的。为了便于阅读最终的句子只打印出了前三个。

可以看到,已经大致能翻译出来不错的结果,比如对于第一句,“这句话如果用古文来说,应该是什么意思呢?”他的翻译效果看起来还不错。而且对于beam给出的几个最大概率的字,用每一个看起来都是一个可行的选择。‘若用古文言’, ‘苟用古文言’, ‘如用古文言’, ‘夫用古文言’, ‘诚用古文言’都是毫无违和感的。

但对于其他的一些句子,效果并不是特别好。特别是最后那句很长的句子他并没有真的完全get到整体的语义。

其实稍微思考一下就能发现改进空间还是非常大的。比如进行中文分词。因为我是直接把单独的汉字嵌入做词向量的,这样就会把很多词语给硬生生的拆分开。比如“东西”这个词,翻译成古文可能用“物”字来对应。但是如果是字符级别的直接训练,Transformer模型是难很建立一对应关系的,当然足够大的数据,有东西和物两个对照翻译的话是可以输出相应的效果。但是我的训练数据集显然偏小,而且这样大量的词语一一对应的情况非常少,因为东和西两个字作为指代方向在古文中大量的出现,所以训练的结果输出中很难把这两个字作为一个词当成整体来看待。

于是我尝试简单的进行一下分词试试,很快就发现这并不可行。汉字大致有几千个,但要是词的话至少也有好几万。,这样会直接导致embedding层扩大一二十倍。本来参数都有几百万了,训练数据输入都偏小,无法使得模型很好的拟合。做了分词之后一下子就飙到了好几千万,这在我本地电脑上训练成本实在是太高了,内存消耗和时间消耗都增大了一个量级。我甚至都产生了要买一块儿4090显卡的冲动,24g的显存加上70tflops左右的算力应该玩儿的比较舒服一点。

还有一个优化方式是对大量的词语古今对照做成一张表,对模型进行预训练,这样他就能更清楚的理解和翻译了,这张表很可能包含几万甚至十几万的对照翻译。我搜了下,好像有标注好的语料库,但并不是特别好找简单一下后就放弃了毕竟我只是玩玩。

另一个优化方式是,对encoder部分进行单独的训练,因为我们有大量的汉语现代文的语料,通过mask之类的模型就可以把编码器部分训练的足够的好,然后再用古文和现代文的对照训练最终的翻译模型,这样的效果应该会好很多。

正当我准备单独训练encoder的时候,突然意识到一件事情,那就是BERT。这不正是我准备要训练的东西吗

BERT是Google几年前发布的一个训练好的大模型,他并不是使用完整的transformer,而是仅仅使用了encoder的部分,这可是一个使用大量的数据和机器训练出来的一个经历过实践验证的大模型,我直接在他上面加个decoder就好了,这简直就是站在巨人的肩膀上,实在是太爽了!

实际上利用训练好的大模型对特殊的使用场景进行二次训练是非常正常的一个行为,甚至有个专门的术语叫做fine tuning,我们一般翻译成微调。

事实证明我过于乐观了,bert跟今天这些动辄几百亿参数的大模型比起来虽然相形见绌,但他好歹也是个大模型,在我本地机器上跑实在是太力不从心了。

bert训练好的汉语模型的并不是太多,我找到了一个最小的模型,堆了12层编码器,词向量的维度是768,输入序列有128token。我按照这个数据实现的decoder一下子就有了一两千万的参数量,这还是把层数砍到只有两层的情况下。

我一开始直接把bert的输出连接到decoder上,输入了一本史记进行训练,结果直接导致内存飙满,操作系统不停的进行内存和盘的swap,不到一个小时就写了一两个tb的数据量,我只能停止训练下去了,这么搞下去直接就把ssd写废了。

于是我想到了一个简单的优化策略,既然训练数据是固定的,那么bert的编码输出也是固定的,我直接预先把这些现代文的句子用bert输出后写到文件里,然后用这些输出单独的训练解码器,这样训练过程中就不用bert参与了,可以节省不少内存。

事实上这些数据量特别大,我只把史记,汉书和后汉书转换了一下,整个过程花了几个小时,pickle之后在磁盘上占了134g的大小

加载训练过程同样发现实在是太耗内存,经过尝试,我只使用了汉书的数据,裁剪过长的句子后只剩下3句子左右,才能全部加载到内存而且不进行大量swap

下边是bert+decoder训练后的输出beam search懒得单独实现一次了所以下面看到有一个None

这句话如果用古文来说,应该是什么意思呢?20

greedy何以古文?

None

——————————-

我要骑着马去外边。 9

greedy我当乘马。

None

——————————-

你说,这个东西难不难呢? 12

greedy君何用? 

None

——————————-

这个东西其实一点意思都没有。 14

greedy其来无意。

None

——————————-

你不要说话。 6

greedy君无言。

None

——————————-

我要睡觉了。 6

greedy臣敞寐矣。

None

——————————-

时间过的很快。 7

greedy日月骛速。

None

——————————-

今天和明天的区别。 9

greedy今、明之异也。 

None

——————————-

写一段话记录一下整个事情的经过。 16

greedy令言举事。 

None

——————————-

我昨天经过一个村庄,那里的人都很友善热情,我在那里吃了一顿饭。 31

greedy臣今日过邑,皆有友善。

None

bert的效果看起来更有潜力一些毕竟我只用了很少的数据,要是把大量的史书加载进来效果应该会更好,可惜我本地的电脑也只能到这个程度了,不过要是花费大量的时间慢慢优化应该也可以,我毕竟只是玩玩儿,实在是不愿意投入更多的时间精力了。

真的要想玩儿的非常开心,感觉至少要专业的a100或者h100了,然而这些卡买一块儿都至少要一二十万,更不要说英伟达对我们禁售了。 

整个过程大致就是这样吧,我花了大量的时间精力进去,整个过程当然玩儿的还是很开心的。虽然最后对于计算力的限制有点儿郁闷,但我觉得应该不仅仅是我自己遇到的问题即便国外那些大厂像openai或者facebook之类的同样有算力的焦虑他们的模型更大对算力的需求也更大,毕竟参数越多效果越好,facebook最近发布的llama3700亿个参数,在将近5万块儿h100上面进行训练,花了640万gpu小时,这些算力看起来是非常恐怖的,而且这远不是结束,整个业界还在谋划着更大的模型,更强的算力。

最后讨论一下transformer模型的达到效果极限。本来是放在这篇文章里一起写的后来发现太长,于是拆分了出去,成为了另外一篇单独发布了。

 

PS:另外附上transformer训练英文翻译成中文程序输出,我堆了两层,序列长度是16,一共有八百多万个参数,我使用了五万多行中英文对照翻译语料进行训练相对于参数来说训练数据实在是太少,并不能充分拟合

英文直接空格分词也没有stemming操作,因为最后一个标点跟挨着的词组合在一起导致词汇表大量增加,我直接把结尾的标点给删掉了,这可能导致比如之类疑问句不太识别。毕竟是玩玩,我太懒不想优化太细致

然而翻译的效果看起来文言文翻译好不少,我猜应该是因为测试数据都很短且中英文的语法对应比较简单。另外汉语本身有大量的一字多义造成的映射困难,每个字和词拆分的可能性太多 下面一些测试输出

i love sleeping 15

我爱睡觉。

——————————-

i love sleep 12

我爱睡觉。

——————————-

who are you 11

你是谁。

——————————-

you are stupid 14

你很笨蛋。

——————————-

it seems bad 12

看起来很糟糕。

——————————-

it seems not bad 16

看起来不错。

——————————-

what is the difference between seem and seems 45

“看来说,哪多点是点。”

——————————-

he goes to school 17

他上学。

——————————-

are you serious 15

你是认真的。

——————————-

are you hungry 14

你饿了。

——————————-

i am feeling good 17

我觉得好看。

——————————-

i am fine 9

我很好.

——————————-

call me when you get home 25

你什么时候给我回家。

——————————-

please let me know if you need my help 38

怎么办想都亲就了。

——————————-

what is your name 17

你叫什么名字。

——————————-

i want go back 14

我想回去。

——————————-

time to go 10

时间到了。

——————————-

展开全文

这篇文章的想法源于前段时间教九岁的小侄女打游戏时的一些观察很喜欢玩宝可梦,可能是游戏简单节奏轻松吧,最重要的是里边的小动物,看到可爱的就舍不得一定非要抓到。

看着打游戏的时候我就在思考,有没有可能在现实之中创造出来一种皮卡丘这样的生物呢?当然不是说拥有像游戏中那样的电系技能,而是我们构造出一种外观上长得跟皮卡丘几乎一模一样的可爱的小动物,如果能搞出来的话,当宠物卖一定是非常有市场的,小孩子几乎没有抵抗力。

现在宠物店一只狗大致能卖几千块,按这个价格,皮卡丘估计全球至少可以卖出上亿只,想象一下,这是一个多么巨大的市场。更何况前期要是出货少,价钱甚至都可以做到几十万

我们现在讨论一下,是否真的能人工创造出来这样一种生物呢?

先说答案,很有可能,而且可行性可操作性极高。

在遥远的过去,人类就已经开始通过杂交来产生一些优良物种比如通过马和驴来杂交生成骡子这充分说明了人类尝试改造我们这个世界上现有物种的强大意愿通过新的物种来使生活更便利美好

植物上,我们做的尝试就更多了比如说我们最早的赖以生存的谷物都是对自然环境不停的选择优化培育出来的

比如说小米吧,他最初就是由自然界中的狗尾巴草被我们华夏大地的先民们不停的优化选择培养出来的水稻也是我们一代代的不停的尝试和杂交改良的基因来提高产量

另外一个我们经常使嫁接技术,甚至可以在一棵树上结出好几种不同的水果

以上这些例子都说明了人类自身尝试对上帝创造的这个世界进行一些破解改良绕开生物本身的进化进程培育改进符合我们自身利益的物种实际上,这个过程本来就已经发生了成千上万年甚至十几万年

今天我们有了新的技术和手段甚至可以绕开生物本身的生殖系统,通过对某些基因片段的编辑删除增加来为现有生物添加或减少一些生理特征和功能这个技术源自于对一些细菌内部遗传物质上的一些叫做CRISPER的回文重复序列的研究发现了原核生物系统的一些免疫机制这个机制通过识别入侵物种的一些特殊的基因编码片段记录在这些回文序列里,进而合成一些切割蛋白,把侵入的病毒基因给切碎进而保护自身

在切碎这些入侵序列的一系列蛋白质当中一个叫Cas9的蛋白非常有利用价值CRISPER结合起来我们可以实现对任意匹配序列点位进行精准的DNA切割而且如果提供一段基因的话细胞自身的修复机制会自动把这些基因插入到切口上这样我们就可以实现对遗传物质的任意增删了

通过巧妙的构造我们实现了一套被称为Crisper-Cas9的基因编辑工具,它非常的简单好用而且便宜这个剪切编辑工具对人类的影响是如此的重要以至于2020年的诺贝尔化学奖就颁发给了他

在中国也许你不太了解这个技术的细节但是应该会对和它相关的两个影响很大的事件有所耳闻一个是2016年河北某大学学术造假事件另一个是2018年深圳的基因编辑婴儿事件

好了没必要讨论Crisper-Cas9过多的细节了重要的是有了这个工具,我们就可以任意的突破生物杂交的限制,对某段基因实现精准的剪切拼接

尽管这个技术放到人身上有违伦理道德但是我们是不在意把它用在狗兔子身上的。

我们看一下皮卡丘我们在生物界里找几种具有它的特征的动物游戏里说它是一种鼠类毛皮又是黄色的,所以黄鼠狼最接近它的描述

但是他的体型又比黄鼠狼大且肥胖很多,跟猫差不多两只耳朵很长,有点像兔子行为风格则更像一只狗

如果有可能的话,我们把这些特征综合起来比如黄色的毛皮,长耳朵偏圆的体型以及边的标志性的两个点从自然界的生物里提取这些相关的基因把它综合到一只狗的胚胎上进而构造产生出一种长相类似于皮卡丘的生物

然而,直接构造远没有那么简单我们现在只是把一些特殊的特定的基因可以进行编辑插入要是构造一个复杂的协调的整个生物个体系统的话,绝不是简单的基因拼凑那么简单在生物生长发育的过程中,它有很多基因表达的一些特殊的精妙的细节,我们甚至有的都还没有能够仔细的去理解

然而,我们可以一步一步来就像我们驯化宠物一样,也不是一步到位的,它需要若干年若干代的不停的繁殖培育比如先把黄鼠狼的皮毛渐渐的转移到一只狗上面然后在这些狗的后代上面添加,比如说像兔子那样的耳朵然后调整它的四肢结构

Crisper-Cas9一经推出以后,就立刻得到了投资界的追捧几名创始人都拿到了风投并建立了自己的公司,然而若干年过去了,在资本潮水逐渐退去之后他们却很难盈利最近开始裁员并且砍掉了许多研发线

实际上,我觉得他们一开始就走歪了当然,医疗和制药领域是一个巨大的机会但是,基因编辑技术虽然可以解决这些问题,可是他对每一个人拥有不同的基因都要特殊的定制化,构造一个不同的编辑剪切方案才能去治疗而不像传统的制药公司,在工厂里可以大量的生产一个药品卖给所有人

解决这个问题的方式是换一个新的领域比如育种再比如我们今天讨论的这个构造的宠物市场

实际上,如果觉得构造出来一个皮卡丘实在是太复杂,需要好多年不停的研究积累才能生成这样完美的生物那么就可以选择从简单的方向起步

比如说我简单的搜索了一下发现好多人居然养黄鼠狼当宠物然而,黄鼠狼最让人忍受不了的是它的臭腺,很多人花大价钱去做手术把它摘除这就是一个很好的切入点直接用基因编辑的技术把黄鼠狼的臭腺给切除掉,甚至他们的后代当中都不会再产生这些东西这个品种的黄鼠狼放到宠物市场上一定很畅销至少能给一家初创公司带来可观的现金流,维持整个公司后续的研发运转

如果稍微用心一下,就会发现宠物市场上类似的机会要多得多我就一直奇怪,他们甚至愿意冒着巨大的舆论风险去编辑人类的胚胎婴儿却从来没有看到这个巨大充满利润的市场

当然,制药和解决人类自身疾病也是一个很大的市场做的好的话,不只是带来利益上的回报像什么糖尿病白血病之类的,随便解决一个都有可能获得诺贝尔奖得到巨大的荣誉但是从做一家企业的角度来看路要一步一步走先从简单而且风险低利润大的宠物市场下手公司维持足够的现金流,再去考虑那些困难的方向实际上,在改造宠物这个过程中,是会不停的带来大量的技术积累的说不定我们一不小心就能发现另外一个比Crisper-Cas9更令人激动的技术

既然我们能够造出来皮卡丘了,那么为什么这些类似的技术不能用来改周其他生物呢?比如说马吧,可以让他综合部分牛的基因对饲料不怎么挑剔,然后再加上驴的一些特性温顺和吃苦耐劳,这就产生了实际上更大的生产价值了。其他的类似生物像牛羊驴猪都可以进行符合我们自身利益的改造,进而产生更多的经济价值,以提升我们生活的便利性。

毕竟我不是专业的从业人员这些想法都是一时之间冒出来的,很多细节都没有仔细的思考这个领域也许有其他没有考虑到的困难吧但感觉大体方向是可行的

消费不只是简单的衣食住行人类每年花在宠物身上的钱是非常可观的这是一个至少万亿的市场未来没必要天天非要卷着计算机互联网从目前的趋势来看,在不远的将来生物技术很有可能集中爆发需要的只是几个简单的市场契机作为导火索市场上赚到的真金白银是激励研发的最大动力要是能够形成一个回馈的正循环就会不断激励在医疗,制药以及生物育种的各方面的突飞猛进那就是一个国家的新的支柱产业甚至引发整个人类文明的一场新的革命

好了随便写写记录一下都这么一大堆了,后边有空再讨论其他一些相关领域的想法希望在未来的一二十年之内构造宠物的这些想法能够实现吧到时候比如说逢年过节回趟老家给小朋友带一只活生生的皮卡丘过去想想都很有趣

展开全文

最近韩国人的lk-99引起了整个世界的风暴,才过去了几天,目前从各方面渠道来看,很有可能是真的实现了室温超导。

很多我一直都在念叨着室温超导,翻下以前的博客估计应该还能找到记录,没想到这么短的时间居然很有可能真的看到它成为了现实。

lk99材料成本和制备都很简单,如果真的能大规模实现,绝对是人类历史上的关键转折点,即便后边无法实际应用,至少也能在理论上告诉人们这是可行的,进而促使人们寻找更多的新材料。

想象一下真实的超导材料能带来的未来吧,真的是非常令人激动,甚至让人兴奋的晚上很久都睡不着觉翻来覆去的想。

首先我们看看在机械方面的应用,有了超导体意味着我们可以电能几乎零损耗的获得超强磁场,电动机可以有极大的改善,不再有线圈结构非常简单,输出扭矩超强。

既然我们可以任意的把电流转换成磁场输出扭矩,为什么还要电动机呢?比如汽车吧,我们可以直接在轮毂上放几个超导体,然后在车身内部跟轮毂连接的部位交替的产生变化的磁场,直接驱动轮子转动,通过精密的时序控制来调整轮子的速度。有点像轮毂电机,但是他是无接触式的。可以直接输出超强扭矩,甚至可以通过反向输出来进行刹车,汽车的结构会变得非常简单然而却拥有巨大的动力输出。

甚至车身跟轮毂之间根本不需要接触,类似于悬浮挂在上面,这样可以无视地面凸凹不平带来的任何颠簸震动,比现在最好的空气悬挂还要优秀的多。

实际上磁悬浮列车一样可以非常简单的实现,但是汽车也可以方便的悬浮实现动力输出的话,未来很可能火车会变得越来越小众。

既然我们可以非常方便的把电流变成动力,以前不可能的东西都可以实现,比如类似于人类关节肌肉的动力装置,我们可以制造出来四足的机器人,我们现在各种挖掘机之类的动力装置上上常见的液压泵也都可以换成超导电磁来实现,力量输出和控制精度都能得到质的提升。

我们再看看在医疗方面的实现吧,现在的mri也就是核磁共振设备,需要一个巨大的机器放在房间里,每次运行都需要消耗大量的电力。其实它消耗的能量大部分都用在维持超强磁场上面了。如果我们有室温的超导体,低功耗的手持式的核磁共振设备是完全现实的。

比如我们在科幻电影里经常看到的,像star trek里那样,我们拿个类似于手机的设备放在在胳膊上扫一下,屏幕上就能实时的看到胳膊的内部构造,骨头,肌肉,和血管之间的层次,这对医疗行业来说是天翻地覆的变化。每个家庭和诊所都有这样的设备,任何疾病都可能在很早阶段就直接轻轻扫一下就发现了,极大的改善人类的生活健康水平,并延长人的预期寿命。

甚至说有了这样的设备,我们可以非常方便的来观察人体的血管组织构造,以及甚至动态的内部活动变化,这将带来医学科研方面上的巨大的进步,很多疾病和各种机体运行的原理都可以实时的观察发现,每个人每一个医学专业的学生都可以方便的去进行观察研究,这对生物科学发展带来的改变是天翻地覆的。

我们为什么只是简单的用这些设备来观察人体呢?同样可以检查各种各样材料的内部构造,无接触式的观察。比如说检查建筑的内部是否变形或者断裂,高铁钢轨是否内部产生了形变?汽车发动机坏了不用拆开直接扫一下就能找到出问题的地方,水果内部是否腐烂坏了?等等等等,可以尽情的去想象,这对各行各业来说都是革命式的进步,谁都说不了说不定哪个没注意的行业就因此产生了质的飞跃带来了二次的技术革命。

有了常温超导体,我们在核磁共振成像方面肯定会有日新月异的进步,绝不会停留在现在这种程度的影像精度。

我们再看看在能源方面的,超导体很有可能导致人类实现可控的核聚变。因为核聚变需要至少一两亿度的高温,只有加速到很高能量的粒子才能现实,这样发生反应的材料都变成了等离子态。我们需要构造一个超强的磁场来约束他们,这就是我们现在所谓的托卡马克。现在很大的能量都被浪费在维持低温超导磁场上面了,有了室温超导体,很可能导致我们实现可控制长时间点火的托卡马克反应堆,输出能量大于输入能量,进而实现可控的核聚变引擎。

跟裂变反应堆不一样的是,聚变引擎如果失控并不会导致爆炸或者泄露,如果他把周围的磁场约束给烧坏了,那么等离子体没办法被约束,很快就撞到周围的物质上,只要把引擎单独隔离开来,发生事故只是融坏周围的约束隔离装置,并不会产生任何其他事故。

实现了聚变引擎带来的革命性进展根本不用多说,人类从此将拥有用之不尽的能量之源,征服太阳系甚至迈向星辰大海都是有可能的。

很多人说超导体意味着零电阻的导线可以实现长距离传输电能,当然这是很合理的想象,不过要是仅仅把输电导线换成超导的那就太浪费了。有这种想法的人跟之前那个段子,乞丐问:“皇帝要饭用的碗是金子做的吗?”一样,是很类似的心理。

实际上有了超导体,我们很可能发明出来新的储存能量的装置,是我们现在锂电池的很多倍。磁场可以约束电子的行为,我们只要合理的设计或者甚至只是简单的在一些材料里掺杂,极有可能构造出储存能量巨大的电池。我们为什么还要用现在的发电站通过导线输入到家的方式呢?每户家庭都有一个能存几百度的电池,至少够一个正常家庭一个月使用的。不管是通过太阳能板,还是通过近距离的电网,可以实时的在电价能源便宜的时候动态买入充电到电池里,实际上根本不需要远距离输电,不开空调,用电不多的情况下甚至屋顶的太阳能板都够满足普通家庭的能量需求。

甚至有了这样的电池,我们为什么只是简单的固定的装在家里呢?直接把它装在汽车上,开到哪里都是一个移动的能量引擎,在野外随时随地都不会断电,家庭都没必要接入电网,把车开回家就够了,然后集体公共场所有一个给车充电的地方,甚至家里本身就是屋顶的太阳能板小型电站。

太阳每天照射地球,不是我们不想把这些能量变成电量储存起来,而是我们现在没有很好的装置设备来储存它们,实际上,我们的水电风电也很多都是浪费掉的,有了好的储能装置,可以极大的改善我们的能源使用率。

我们再看看在电子设备上的应用吧,新的材料不知道能否很容易的集成到我们现在的半导体制备工艺上去,如果可以,那就会带来芯片和集成电路的又一次飞跃式的发展,想象一下你的显卡或者手机CPU耗电只有原来的1/10甚至百分之一会是什么样的情况?

如果我们能使用这种材料构造出来新的门电路,那就等于是半导体行业的一个革命了。即便不是这样,我们也可以通过改善芯片上的导线互联或者衬底以及栅级等结构上的优化来降低整个芯片的功耗。

同样一些微型的电子器件或者传感器也会得到长足的进步,记住,我们手机是通过电磁波进行通信的,如果我们能够检测到,比如说现在电流的强度的1/10的电磁波,也就是说我们的手机的信号可以灵敏度增强了十倍,这意味着通信行业巨大的进步。手机基站可以极低的密度,然后又提供极远距离的通信。带来手机能耗的进一步下降,传输速度也能成倍的提升。

比如我们的无人机,现在只能飞几千米到十几千米远,如果传感器的灵敏度上来的话,可以进行几十甚至几百公里远还能保持高清图传,这是多么巨大的进步。当然也有不好的一面,很可能这让人类用来实现武器上,无人操控的远程飞机和坦克机器人等都得以实现,未来战争的形式很可能是类似于打游戏的机器人战争,这有利有弊吧,关键是看人类选择怎么来使用它。

我们有各种各样的传感器,这只是随便想到的有了超导体的加入之前很多想不到的领域很可能都能带来新的突破,特别是微型化,小型化的设备集成上面,很多感觉在科幻电影里看到的场景,很可能将来都成为现实。

好吧,想到的还有很多,已经快11点了,今天就写到这里吧,要赶紧睡觉了,后边有闲时间了再写下来补上。

展开全文

这篇文章的想法起源于前几天的一个新闻,说引汉济渭工程横跨秦岭底部的近一百公里的输水隧洞贯通了。题目有点儿标题党了,叫输水隧道或许更贴切一些。

秦岭是中国大陆气候的分界线,横亘在四川盆地和关中平原之间,隔绝两地往来,自古就是天险。

而在秦岭北侧,也就是位于陕西省靠近关中平原的那一侧,秦岭北麓,它的名字就叫终南山,听过这个名字的人很多,但知道具体位置的人却比较少。也许是古时秦汉的人们从长安往南走,一直走到了头,它挡住了南边的去路,于是就把他叫做终南山吧。

所以,这条隧道穿越了终南山下,也不算太偏题。

在小说和故事里,有很多人在终南山隐居。这里应该确实是个适合居住的地方,有权贵已经用脚投票证明了。前几年的新闻,在秦岭北麓有很多违建别墅,甚至震动了一号领导人,连续发好几个指示都没有能拆掉。

关中平原四面环山,每个方向都有狭窄的出口通道,易守难攻,自古都是各个王朝建都的地方。

然而他有一个致命的问题,那就是缺水。唐朝中后期就是因为长安饮水的问题,基本上把行政中心开始转到了洛阳。 自此之后,西安再也没有在历史当中作为王朝的首都。甚至当年朱元璋都曾经派人去考察过,打算迁都,可惜还是因为水源和交通的问题,最后放弃了。

有人说是因为汉唐之后,中国的气候发生了变化,开始慢慢的变得干燥,导致西安降水减少才使得文明的中心逐渐的东移。其实这个理由根本站不住脚。北京同样很干燥,但是还是可以作为国都,主要还是因为平原交通方便,加上运河联通。古代人对水的需求并不像现在这么剧烈,往地下挖口井是可以用的。最根本的原因应该是隋唐之后的大运河到不了长安,粮食等物资不好运输,才逐渐东移的。到了宋朝更是直接把国都设在更东边的汴梁城,处于交通要道,能支持更大规模的城市和人口。

秦岭自古就是天险,不然李白也不会发出蜀道之难难于上青天的感叹。陡峭的山壁上没有任何道路,古代人硬生生的就是往里边凿一个一个洞,然后插进去木头,这些木头一个接一个的连起来,做成类似于阶梯的东西,进而形成道路。这种道路被称为栈道。当年楚汉争霸,就留下了耳熟能详的“明修栈道,暗度陈仓“的典故。从这些历史的光影当中,依稀可以窥见穿越蜀道的艰难。

而在科技现代化武装的今天,我们终于可以在一定程度上来攻克这些大自然的天险。前几年刚修通的西成高铁就是个例子,刚开通的时候,我还专程去乘坐体验过一次,全线基本上没有什么风景,几乎都是隧道。

饮水工程比单纯的修路更难,不同于道路可以因势利导,选择最容易的方向。从汉江引水需要考虑到高度落差,形成自流,所以才要凿穿秦岭底部,工程量巨大。

解决关中平原缺水问题的引汉济渭工程,十几年前就开工了。然而,却是花了十几年时间,才掘通了98.3公里的引水隧道,平均一年不到10公里。当然,能凿穿秦岭底部,也是一个壮举了。

今天要讨论的不是这个工程的细节,主要是相关的一些技术的引申和思考。

隧道是我们如今为数不多的可以用来对付险峻地形的武器。所以有必要仔细深入的研究讨论一下他。

早期的人们是靠手工去开凿,加上一定程度的爆破。每天掘进一点点,直到贯通。现在仍然有一些国家和地方在使用这种方式。

直到后来,人们发明的盾构机,极大的加速了隧道的掘进。我们看中国这些年基建开始发力,到处修路架桥,其实盾构机功不可没。

盾构机的原理这里就不解释,有兴趣可以自行搜索。我们这里简单考虑一下它的改进。

盾构机在掘进的过程中,工作环境是很艰难的,里边高温,高湿,甚至岩壁也有各种各样的地质情况,有的硬,有的软,甚至有的还会冒水,这些都是一些极端的状况。甚至有时候决还会岩爆,石子就像子弹一样,会危害到工人的生命。

如果我们可以改进盾构机,一方面我们可以把它自动化起来。让它可以用很少的人,甚至不需要人就能够自动化的掘进,或者说我们只需要在远处无线进行操控就可以了,不需要任何人在隧道里作业。

另一方面是改进他的掘进速度,当然这是一个巨大的工程难题,比如发明新材料构成的刀具等,并没有那么容易的解决。我们姑且就假设一下吧。

如果有自动化的,快速掘进的盾构机来替我们工作,我们可以做到什么呢?

我们可以沿着新疆塔克拉玛干大沙漠南麓的昆仑山脉开始掘进,一直朝着大渡河或者说怒江或者雅鲁藏布江等方向,挖一条一两千公里的隧道。当然这个隧道并不一定是完完全全的单一隧道,在中途某些山谷里,我们可以挖一些深坑,作为一些中途的站点,分成若干个段,若干个节点,每一段有几百公里。可以适度的让这个隧道有一定的倾斜,让他从海拔几千米,一直降到最后南疆盆地的一千米左右的海拔,这我们就有了一个可以自行流通的,长距离的输水管道,从中国降水丰富的西南引水到基本上降水稀少的南疆沙漠。

这些水可以把南疆沙漠改造为良田,如果合理的安排流量,位置等,甚至可以新增一两亿亩耕地,也就是意味着额外提供几亿人的粮食,背后的经济和社会效益是巨大的。

为了减少蒸发,新.疆人发明了一种叫做坎儿井的引水装置,有兴趣可以自行搜索,其实这种长距离的饮水隧道,如果中途一部分一部分来看的话,确实是像一个巨大拉长版的坎儿井。

每个几百公里有一些露天开放的深谷,这些深谷是作为隧道掘进过程中的一些中间节点,避免太长而无法对准隧道掘进的位置,同样也能提供一些通风透气,避免隧道缺氧。但是几百公里可能距离有点儿远,也可以做成几十公里。如果可行的话,可以利用河流的落差,逐梯次的在这些深谷做一些水电站,这样就可以给整个隧道提供照明和一些风机的电力来源。

如果隧道的宽度和高度足够的话。那么除了输送水以外,也可以通行一些小型的集装箱船只来进行物流运输。可以做成自动化的电动船只,也可以有人来驾驶。这样就可以为整个青藏高原提供便捷的物流通道,一举多得。

当然除了引水以外,如果我们能够实现这个长距离自动化的掘进超长隧道的话,在全国各地有山的地方都可以开凿运河,也同样可以修建常规的高速公路,那些天然的地形地貌再也无法阻隔我们人类交流沟通的步伐,具有划时代的意义。

目前看来,我们需要克服的技术难度并不是太多,只要不断的改进优化投入。在不久的将来,可能是几十年一百年,甚至更短,这种全自动盾构机就有可能实现。连通山川阻隔,变沙漠为良田,重构地理格局,改变国家和民族的命运。

这并不是一个多么高大上的技术,然而如果突破的话,就会成为一个标志性的节点,人类文明进化史当中一个重要的转折。

好吧,写的有点发散, 因为确实如此,源自于这几天走路散步的时候,偶尔用手机记录下的一些想法,最后简单的整理了一下。

展开全文

我们经常可以在科幻电影里看到在一个培养皿里把人冰冻或者说深度睡眠,然后几百年后重新打开。这种方式在星际旅行或者其他需要大量时间的场合非常有用,可以让人以某种程度,某种意义上向未来的世界旅行。

或者说某种程度上可以延续人的生命时间跨度吧,但是这个生命时间跨度是有限制的,相当于压缩掉人生无聊的时间。

当然科幻电影里那种像速冻水饺一样的冷冻技术过于不现实,很容易直接把人冻死,我们现在还没有找到可行的方式来进行这样的冰冻。至少理论上和现有的工程技术上是不太现实。

今天我们考虑一个更现实的,类似于这种冷冻睡眠的技术。

正常人在晚上睡眠的时候有好几个阶段,其中有一个睡得最深的阶段,我们就叫深度睡眠,这个阶段的心率是很低的,大致有五六十的样子。而且人的新陈代谢以及其他的各种各样的器官的功能都开始变得缓慢。正常人的心率有个七八十,特别是我们运动的时候心率会更快一点,所以如果我们能够一直保持50的心率,就类似于正常晚上深度睡眠的时候,这个代谢程度等同于能够把人的寿命增加一倍。

至于睡眠的机制,我们还没有找到他具体的细节,但是肯定是大脑通过调控机体的一系列的化学反应和各种各样的蛋白质传递的这个消息。比如说褪黑素,就是一种让人陷入睡眠的一种激素,很多安眠药都是有这种成分。如果我们能够找到,确切的说是人进入深度睡眠阶段,分泌的那种化学物质蛋白质或者某种有机物,我们就可以把它注射到人的体内,让人一直保持这个深度睡眠阶段。在睡眠前只要吃够足够的食物,我们通过某种自动的监控系统每隔一定时间让人服用或者注射这种激素,那么我们就能长时间的保持在深度睡眠的状态,把心率维持在50也就是说维持生命的状态,然而又没有过多的消耗,这样可以连续睡个两三天再醒来。这个技术如果能够实现的话,那么对某些无聊的任务,比如说星际旅行,或者那些集装箱货轮的海员们,他们有时候就可以在床上连续睡好几天才醒过来,这样子的话比如说一年的时间就可以能压缩到几个月。一方面这意味着寿命的延长,另一方面意味着无聊时间被压缩,可以把生命花在更多的有意义的事情上。

如果我们能够更进一步的话,也就是说除了我们现有的人体进入深度睡眠的调节机制,我们找到相应的化学物质的激素等相应的药物来调节,我们是否能够对这个系统进行更深度的操作,比如说把心率降得更低,降到比如说每分钟10次,然后让身体维持必要的状态,这样我们一次睡眠可以从一晚上一下子扩展到十几天,这样子的话一年就相当于一个月而已。每次睡一觉半个月醒来一次作为一天来过。

离我们最近的恒星系是半人马座阿尔法星,他离我们的距离有4个光年。如果我们想到达这个恒星系的话,必须使用核动力飞船才行。

地球的脱离速度大致在7.9公里每秒,太阳系的脱离速度是16.7公里每秒,我们的航天器现在大致基本上就在这个速度,如果再加也就是几十公里的量级。假设我们制造一种航天器,不管是使用还没有实现的核聚变的能源,还是现有的可行的,裂变的能源。我们假设这个航天器的可以不依赖外界能量,自身的能量就可以维持个几百年,这样子的话我们才能进行恒星际的探险。我们可以在太空中一直进行加速,因为飞船上的物质是有限的,我们可以使用太阳风等粒子进行反冲,甚至可以用磁场捕获宇宙空间中的粒子然后作为等离子引擎的物质用更大的速度喷射出去。假如可能的话,可以把飞船的加速度稳定在10米每秒,正好是地球的重力加速度大小,这样只要适当的设计飞船内部的布局,就可以像地球上一样正常的生活了。

按照这个加速度的大小,一天可以加速864公里左右,只要一个月就可以把飞船加速到光速的十分之一,当然由于相对论效应的存在,过高的速度是不太现实的。三万公里每秒的速度可以保证在四十多年之内到达半人马座阿尔法星。如果我们巧妙地调整加速度和减速的数值,可以一直保证飞船上存在重力的。

如果我们能够实现睡一觉半个月,能有十几天的时间跨度,那么就可以把这个四十几年的时间压缩到4年。这个时间在航天员一生之内进行往返是很现实的。

好吧,有点跑题了。除了星际旅行,如果深度睡眠这种技术能够实现的话,我们在很多场合都可以使用它。特别是因为人生有很多无聊的事情,有时候你要想办法跨过这段时间。

对于有些人如果愿意的话,再可以把人生中的几十年拉长到上百年或者几百年,这样子的话就可以活到更久的未来,去看那些人类没有发明的技术,再比如说有一些人得了癌症之类的很难治疗的疾病,现在还没有药物来进行有效的治疗。可是未来说不定就有办法对他进行治疗。所以与其现在每天煎熬不如进入这样子的深度睡眠状态,把好几天当成一天过。这样过个几年或者几十年后说不定就有治愈的可能了。

客观的说,找到进行深度睡眠的那种激素或者化学物质,让人长时间维持在心率50左右的深度睡眠状态,从而把一晚上拉长到三四天是很有可能的。

只要我们找到晚上促使深度睡眠那个阶段的整个人体机制调控状态,找到相应的那个真正起决定性作用的那个物质。就像那些糖尿病人天天打胰岛素一样,我相信进入这个睡眠状态肯定是有一种化学物质来控制的。

这是非常现实和可实现的。如果真的有人研制出来这种药物,不管是口服还是注射的,肯定会有巨大的市场前景,名利双收。

所以我一直很奇怪制药行业天天在研究各种各样的单抗,mRNA什么的,治愈各种疾病的药物,却没有人去考虑过,从这个角度去考虑,去来研发一种深度睡眠的药物。

计算机行业现在已经越来越饱和了,而且更多的只是技术性的改良而已,没有什么新奇的革命性的技术出现,未来我更看好的一个方向是生物制药。现在的年轻人或者毕业生都被吸引到了软件领域,觉得这个行业工资高,很少人真的仔细的去看一下未来,去看一下真正未来科技前进的方向。其实与其跟大量的人内卷竞争,倒不如选择一个有可能爆发的新兴领域。另一方面,中国发展了这么多年,对很多家庭来说,生活或者吃饱肚子都不是一个问题了,是时候可以追求一些真正有意义有价值的东西了。

展开全文

得益于长征5号的研发成功,我国航天最近能够把大重量的东西送上太空,所以最近看到了一系列的突破。比如登陆火星,比如空间站,比如月球挖土。
当然这些只是在重复做美国人曾经完成过的事情,我们既然现在有技术有资源为什么不尝试一下前所未有的探索呢?
这是我的一个理想,那就是在月球上建造一个可以住人的基地,甚至建立一座微型的城镇村庄。这并不是科幻,离我们一点都不遥远,只要利用现有的技术是完全可以实现的,可以说只是一个工程问题。
首先我们看现有的空间站,其实已经很大了,至少有几辆大巴车那么大小,是可以住好几个人的,我们在月球上建立基地,第1步也可以把类似的东西发射到月球上,一个一个组装起来,就像现在空间站上用的技术是一样的。
这里最重要的问题要解决的就是能源和材料这样的问题,包括物质。比如说建造,我们想大规模的建造一个类似于购物商场那么大小的基地的话,那么完全从地球上发射是不太现实的,但是我们可以利用月球上已有的物质,看看能把一些什么机械设施发射上去,在月球上就可以采矿,并且制成铁各种各样的金属。进一步可以用来构造基地自身。这样子只需要发射一部分工具,然后利用这些工具开采加工月球上的物质,这一切可以通过几个航天员远程操控的无人机械进行。
先看看现在最需要解决的能源问题,我们可以用几个太阳能板来产生一定的电量,现在空间站就是这样工作的。它的问题也很大,因为能量输出实在是太小了,只是简单的提供一些生命支持,如果进行大规模的工业活动肯定是不够的。
那么我们能不能发射一个核反应堆到月球上呢?这是一个很值得考虑的问题,至少在看来是可以解决的,我们可以把反应堆做得很小,至少目前我们已经在核潜艇上用一些小型的反应堆了,它只有几十吨,而且大小也不是特别大,可能直径只有八九米的样子。而且他这些大小大部分都是外面的屏蔽壳来屏蔽辐射,用来屏蔽辐射的真正核心部分,反应堆的核心并没有多大,而且我们还可以拆分开来,反应堆,燃料以及其他一些组件单独发射,然后到月球上再进行组装。
事实上在月球上的核辐射并不是一个什么问题,因为月球没有大气层,而且受到太阳风等各种各样宇宙粒子射线的影响,月球每天都接受大量的辐射,所以说核反应堆完全不用太考虑保护怎么把这些辐射给屏蔽掉,月球不是地球,宇航员出门都是要穿防辐射的航天服,我们的空间站本身也要是防辐射的。

近几年很多企业以及科研院所都在研发小型核反应堆。比如劳斯莱斯,最近报道说他们在研发一个小型核反应堆,目的就是到月球上去采矿。他们一直做飞机发动机以及核潜艇反应堆好多年了,所以在这方面应该有很多经验。核反应堆的微型化是一个很重要的趋势,毕竟如果能把它塞进汽车集装箱,而且能提供大量足够的电力的话,无论是在军事还是民用救灾等方面,都有很大的用处。当然前提是保证核燃料的安全性。

如果有一定担心的话,在月球上我们可以给核反应堆打造一个适合的地形。比如挖一个大坑专门放置它,这样可以挡住它水平方向的辐射,朝着太空的辐射,我们是可以不用管的。这个核反应堆可以放在我们月球基地几公里之外,通过线缆把电力输送到基地就可以了。考虑到冗余备份,可以多建几个类似的反应堆电站,即使一个不工作也不影响基地的正常运行。
一个潜艇的核反应堆大致有几百兆瓦的功率,我们其实可以把这个功率做得更小一些,只要有几十兆瓦甚至几兆瓦的功率就够了。前期可以建设一个几十人的基地,这已经不少了,现在的国际空间站最多也就容纳七个人而已。

我们可以先发射一些类似挖掘机等机械装备到月球上。有别于传统的挖掘机,我们把它做成电动的。因为月球表面是崎岖不平的,我们可以采用坦克那样的履带以及其他一些技术使他拥有全地形通过能力。现在电动汽车上面的电池,比如说像特斯拉的电池大致有将近一吨的重量,能提供四百多公里的行驶里程。直接把这些电池模块移植到这些挖掘机上,能够给提供几个小时的工作时间就够了。当然我们可以把电池做得更大一些也行,这样子的话没有必要,这都是权衡取舍了,到时候可以做成模块化的设计。
如果能在这些挖掘机上做一个驾驶室,就像航天服一样封闭的且含有氧气,工作人员可以直接坐在里面操控挖掘,那就是最好了。但如果这些需要的空间太大或者说重量太大以至于不划算的话,也可以做成远程遥控的,可以让工作人员在一个专门的通行车辆上,在它几十米上百米远的地方进行遥控操作也可以。
可以利用这些机械在基地周围往外修建道路,这里所谓的道路是指削峰填谷,把路铺平可以通过履带式的机械即可,没必要像地球上的路那样规整。
月球上有丰富的稀土元素,以及我们未探索的各种各样的矿产,这些矿产有可能包括铁矿啊以及各种各样的稀有金属。对我们来说,前期最重要的我们可以找到一些小型的铁矿或者什么之类的。开采这些铁矿,并且把他们提炼成钢铁。这些钢铁可以用来建造我们的月球基地,这样子的话我们可以把月球基地建得很大很大,比如说达到一个购物商场的大小,或者构造很多类似的建筑单元通过管道把他们连接起来,把这些各种各样的单一的建筑体组成一个小型的村镇。
在月球上建立一个炼钢厂是一个挑战,毕竟没有大气不同于地球的环境,而且我们可以使用的能量只有电能,同样月球上的铁矿石的化学成分跟地球上的可能有些区别,所以钢厂的结构和原理会有很大的不同。不过,在理论上是可行的吧,有时间可以仔细研究一下。

有了钢铁,我们就并且能把月球建设的很大,利用钢铁焊接起来的密闭房屋,里面充入合适的大气,人类就可以居住了。如果空间够大,可以在里面通过灯光建立室内农场,种植一些蔬菜。我们只要给基地送上去几十年的粮食,就足够维持运转了。更进一步,可以种植一些粮食作物,小麦水稻当然好,但是需要的空间大产量低,最好的选择是种植红薯和土豆,如果规划得当可以给基地提供自给自足的食物供应。在电影火星救援里面,主角就是依靠在火星上种土豆进行生存的。

以目前长征五号的运载能力,还不足以实现登月。现在正在研发中的长征九号就是专门为登月研发的一颗火箭,它的研制成功才能实现我们载人登月。所以还要等好几年。不过据报道,长征九号的研发现在加快了速度,改为多个成熟发动机捆绑的形式而不是当初的单一大推力发动机,这类似于spacex的玩法。时间方面应该比重新研发一个新型发动机要快不少,毕竟稳定性测试需要花大量时间。

空间站是个很好的东西,当年前苏联就得出论断,认为登上月球没有太大实际意义,而地球近地空间站可以进行各种各样的观测和科研,还有一个失重的环境可以进行各种各样的实验,他们给出的综合结论就是发展空间站是更划算更经济的一种方式。

但是月球基地不同于简单的登月,同样也有它的优势。首先没有大气层有利于科研观测,而且月球上有各种各样的矿产资源可以进行开采,如果有足够的矿产燃料各种各样的东西开采出来的话,甚至我们都可以在月球上直接建一个发射基地,火箭之类的大部分都可以直接用月球上开采的元素来进行建造。比如说去火星的话,从月球进行发射,它的成本比地球要小很多很多,因为月球的重力很小。

月球上有重力,而且这个重力不大是地球的1/6,这很重要,因为我们普通人类可以在上面背负更多的重要的东西,比如说航天服可以做的很重,可以装上去更多的能量和氧气燃料,这样子的话就可以走很远,而且人类在上面可以跑得很快很远,这是一个优势。有重力的话就不用考虑各种各样失重情况下需要担心的比如说航天服离开了空间站飞走了就回不来了等问题。月球基类似与地球的环境,只不过重力减小而已,可以慢慢到处走。

从我们现有的技术来看,没有任何科幻的元素,都是已有的已实现的,我们可进行工程化的东西。建造一个类似于一个村镇的大小的聚集单位,比如说容纳几百人上千人都是可能的。我们可以在月球上建立真正的人类永久驻扎的基地。
如果月球上能够实现粮食自给自足,那就更好了,一旦真正自给自足的闭环能力可以得以形成,月球基地就可以脱离地球的补给而单独存活,甚至发展成为人类的一个月球分支。当然前提是月球月上有足够的核燃料,以提供核反应堆的持续运行,而且月球上的人需要学习大量的知识,把他们维护起来。

1970年左右,美国国力处于巅峰时代,他们进行了登月,而且实现了一系列的成果,今天人类虽然在机械和能量燃料方面没有什么推进,理论上也没有大的突破,但是很多应用技术已经有了飞跃。主要代表是集成电路芯片的发展带来的一些微型控制器和通信技术。
比如说控制器,当时的芯片跟现在的芯片数字化控制技术简直是天壤之别,当时飞船上的阿波罗计算机只有2k的内存,72k rom,使用汇编编写控制代码,现在随便拿个stm32都能秒杀它。
甚至现在都可以看到国际空间站里的一些模电时代的仪表盘,而中国的空间站里全部都进行了数字化,提升还是很大的。
另一方面的大量进展是在通信技术上,举个例子,得益于数字基站,我们空间站的宇航服就是通过CDMA跟空间站来通讯的,可以直接传递音视频和控制指令。比当初的短波模拟信号通信强大很多。
不得不佩服当年的登月,原始的计算机加上一行行汇编代码,都实现了这样的壮举。
另一个则是这些年电池技术的发展,不讲成本的话其实已经可以实现各种各样的电动机械了,加上其他一些化工和材料方面的进展,其实现在实现登月的条件要比1970年左右好太多了,这也使得月球基地的建设成为可能。

今天,中国的国力已经超过当年登月时的美国了,而且还在持续增长当中。加上人类技术进展的加持,可以实现的远比当年多得多。按照我们目前的航天规划,是有在月球南极上建立一个基地的打算的。我个人觉得,除了简单的科研基地以外,可以分阶段分步骤,把目标和计划制定的更宏大,更长远一些。

简单重复的实现登月只是在重复美国人伟大的成就而已,如果我们真正能够建设成月球基地并且进行采矿等一系列操作的话,这将是人类史无前例的壮举,才是真正引领人类科技探索的未来。

有生之年,我们很可能看到这一切都成为现实。

展开全文