《从负无穷到0》

~~父母的第一节人工智能通识课~~

以下是头脑风暴式的草稿，特此说明刘之博

-∞

如果说当下轰轰烈烈进行的AI科技与产业革命能够为后入留下些什么思想遗产的话，我认为这一命题结论的层级应该是很高的：从计算上的角度，人类自认为复杂的语言系统是由及其简单的系统表示的；人类高度进化的视觉系统也是通过简单的层级式网络表示。

我们因此可以斗胆下一个定义：智能，是一种由简单规则集合在时间维度展开的现象。

如何解读这个定义？首先智能是现象，是计算过程，其计算的进行是由简单规则约束的；其次，这种现象和自然界十分统一：人类已知的世界运行的规则（例如物理学）也是相对简单的，在这个体系下衍生出的人类智能是相对复杂的。再次，时间维度的展开就是计算，计算等价性原理和计算不可约性决定了这一现象无法用数学描述，在这个维度现象与计算过程这两个词可以相互替换。

关于白面馒头的故事

我曾在深夜问过我父亲一个关于本质的问题“我为什么要学习”，那年我高二，长期的睡眠剥夺和无休止的重复刷题让我身心俱疲。

“能顿顿吃白面馒头” 这是我父亲给我的答案。他出生并成长在关中地区的农村，那个年代经历过饥荒的庄稼人对于知识改变命运最朴素的理解就是顿顿能吃到白面馒头。如果顿顿能吃饺子，那就是皇帝般的神仙日子。在物质生活极度匮乏的年代，学习，前进，没有时间左顾右盼。

“为什么要学习” 换句话说，对于一个人类个体，学习的目的是什么。再换个表述方式：如果此刻你的银行账户上有一千亿人民币，你还要学习吗？如果要，为什么。没错，要讨论学习的目的，必须将物质，或者说赚钱这一因素剥离。基础教育的主要功能不是育人，更多的是选拔人才。高等教育的目的也并不主要是探寻真理。追求真理、高价值的科研一直以来都是少数人的事儿。做一个不恰当的比喻：就类似改变世界的企业家是少数，多数的老板只是在解决过日子的问题。

那么，为什么要学习？我从很多优秀的高校科研者口中发现了他们的旁敲侧击的提及过这个问题。不过是这个问题的另一个形式：“是什么支撑他们当年拿下博士学位的？” 答案很简单：“成就感” 。如今在学术这条道路上事业有成的人当年的攀登博士学位时、在他们最迷茫至暗时，支撑的力量源泉来自成就感。

如果抛开本章的上下文情景，这其实也揭示了一个残酷的事实：和打工、做生意一样，科研是一种事业。换句话说，职业金融人，职业互联网人，科学家是职业科研人。在不同产业分类上各司其职，虽然收入和社会地位上（可能）有高下之分，但逻辑上无高下之分。

最顶级的科学家，往往会散发出另一种气质：好奇心。这个好奇心是有前提的：智力自信+良好的教育。当然，最好有优渥的物质支持，没有的话，有个有钱的富太太伸出援手也未尝不可。

如果基本的物质欲望还没有得到满足，独立的科学研究就无从谈起。逻辑很简单，人类社会任何制度都不能违反人性，人性、人内心的欲望是有层级的，基础需求没有被满足的情况下，高层次需求大概率也无法被满足。换句话说，科研和赚钱，本应是两件平行的事情。现实中，先赚了钱再科研也是一种上策了，但是作为家长朋友们，关于自己的孩子是否选择科研的这件事儿上，希望你们考虑一下他的物质条件是已经被满足。

“不要认为读了硕士、博士了就是搞科研的了，科研一点也不高端” 有了上述铺垫，这个出自科研从业者的观点，是不是就可以接受了。

大脑的一大功能就是给自己的行为赋予合理性，可以解释成自恋，也可以解释成意义，更可以解释成智能体的某种价值函数。无论如何，科学研究是无法脱离人类社会的，智能的研究也不例外。统计上来说，推动科学进步的，往往是少数人，而且同时代的这些少数人往往还相互认识彼此熟悉。这两句话可以换一个角度解读：人类社会有的所有毛病，科学家体系内也有。我们有极大的概率是大多数人。

Def:AI

从哲学的角度：
从数学的角度：
从逻辑的角度：
从统计的角度：
从计算的角度：

人工智能是个不好的词儿， artificial本身强调是人类创造的智能，这本身是人类出于无知站在极其高傲的角度起的名字。类似的，如果有个人说我的人工数学学的不好，你一定觉得很奇怪。数学作为一个学科/现象/规律/whaterever you name it，是客观存在的。 AI这个词儿imply智能是人类独有的，不是普遍的。因此才要加上人工二字强调。因此，我跟倾向于machine intelligence，强调其载体。同时用智能intelligence这一次来描述我们研究的学科。

牛顿成功论证了自然哲学是可以通过数学原理进行归纳的，基于他的理论演绎出了繁荣的物理世界。站在此刻的人类，是否需要发展和自然哲学同一层级的另一个内容？自然哲学的超集是哲学，中国人可能跟倾向将这个概念总结成“道”，那么在道的这个集合里，有自然哲学

无数先贤们在数学，逻辑，计算机，差分机分析机电子计算机的道路上奉献一生，当他们看到如今的电脑可以完成他们毕生梦寐以求的功能时候，他们也会惊讶的发现，人们只用它来看视频娱乐。这是讽刺的，多数人never appreciate the power of computer。他们就是利索当然的认为科技的发展让他们的生活更加丰富，然而互联网知识的丰富和当代人们思想的贫瘠形成了鲜明的反差。很少有人会好奇计算机是如何运行起来的。
拉贝奇计算的机械化
ada 计算的通用化
莱布尼兹知识的系统化形式化

AI学科建设

当家长们还在考虑如何规划孩子编程/AI时，国家已经把她的规划写出来了：涵盖了初等教育和高等教育。

最典型的时间就是各个高校近几年开始陆续设立人工智能学院，同时人工智能的学科建设以经提上了日程。

101计划
人工智能本科培养计划
国家二十大报告关于人工智能的规划
高考人才培养体系对于AI的规划
自动化学会 AI资格培养
少儿编程

东数西算与AI算力基础设施

学习编程的路径：项目驱动型

第一阶段：以项目的形式，培养好奇心为主
第二阶段：

孩子多大可以学习编程

首先我想旗帜鲜明的告诉各位家长： 锻炼孩子的逻辑思维能力不需要通过学习编程来实现 。原因很简单：我们人类是通过语言来学习提升自己的逻辑能力的，多和孩子高质量的聊聊天可能都比报个少儿编程班在逻辑思维能力提升上效果来的好。

我认识的一位美国计算机专业博士老师让他的女儿6岁开始学python，对于中国孩子，英语毕竟不是母语，我认为八九岁其实就可以开始学一学了，其实不难。

不同于大人，孩子学习需要及时反馈，一上来就数据类型和算法，没有人愿意学。项目驱动，在一个又一个小的project中，自然而然计算机编程的基本概念就掌握了。同时我强烈建议父母们也花点时间自学一下，计算机这个社群是非常开放的，所有学习资料都有开源免费的。

学习AI的路径：让我们创造一个凸特慢

什么是AI启蒙？

~~什么是AI启蒙？反正我不知道。~~

小学篇

中学篇

学AI需要那些数学知识？

~~不需要什么数学知识，高中生也能发顶级会议论文。~~

brain storming

人工智能属于国家战略产业。
生成式AI，改变商业模式。从传统的信息检索转变为信息生成。
- 英伟达公司CEO黄仁勋
- AI将从根本改变人类的生产生活方式，此刻我们看待AI如同一百年前的人看待电力一样。历史已经告诉我们，电力彻底改变了人类社会，史称第二次工业革命。第四次工业革命会不会是基于AI技术的？没人知道，但可以肯定的是围绕数据生成AI大规模的基础设施建设正在进行。
"We need more transformers for transformers" 电力的需求

“社会生活现象极端复杂，随时都可以找到任何数量的例子或者个别的材料来证实任何论点”（《列宁全集》第2卷人民出版社）这句话放在理解一个学科的时候也适用。
感知，认知，规划 perception， recognition， decision . information knowledge experience
我摒弃了从历史、现状、前沿、未来展望这种行文逻辑，原因很简单：极其无聊，而且大而散。相对的，用问题为导向来组织本书，将AI的历史，研究现状等穿插其中，也许是个更好的选择。
至于媒体鼓吹的强人工智能，我相信受过专业训练的同学心里应该有数，我在这里卖个关子：图灵机，可计算的，可解的。

人工智能是一个典型的交叉学科，近几年才有学校陆绪设立了人工智能学院。就拿我比较熟悉的西安交大来说，西交的人工智能学院是依托于人机所的，无论是人工智能学院，计算机学院，自动化学院，软件学院还是数学院都有从事人工智能研究的老师与团队。你在大学和同行说自己的方向是做人工智能的等于啥也没说。同时，人工智能也是跨学科交叉的领域：医疗AI，具身AI等等。所以，想回答“人工智能博士们都在研究什么”这一问题只有两个角度：要么大而全，百科全书的式的把所有大类小类跨学科类别过一遍，要么小而精，从我自身角度出发举例说明。

作者本人恰好在视觉、文本、决策这三个方面都有跟过一些一线科研经历，平时对AI产业和投资比较感兴趣，算是一个非典型博士了。在AI交叉这一点上，我也参与过医疗AI，艺术AI，电力AI的一线科研，加上本科、硕士和博士所属的一级学科分别是数学、统计学和计算机科学，这也给我看待AI有了比较多的视角。有一说一，我不推荐您的孩子以后这么读书，因为我们最宝贵的资源毕竟是时间和精力，但既然有我这样的样本能给大家提供这样的视角，也算值了。

AI三大方向：视觉、文本和决策。对应的计算机视觉（Computer Vision），自然语言处理（Natural Language Processing），和强化学习（Reinforcement Learning）。从学习（Learning）的角度，可以分为监督学习（Supervised Learning）半/弱/无/自监督学习（Semi/Weak/Un/Self Supervised Learning) 和强化学习。比如，加入我是做国产大语言模型（LLM）的，那么按照上述分类模式，就是自然语言处理 + 自监督学习，当然，你叫他生成式AI也没毛病。至于为什么叫自监督学习，我们之后再聊。

无论如何，从事AI相关研究的博士生们的科研工作还是有很多共性的：大量读高水平国际会议的文章，写代码，改代码，补一补数学统计。从某种角度来说，任何学科的博士其实做的事情都有共通点：和自己死磕。

从投资人的角度， AI技术不重要，场景/商业模式更重要。扪心自问，你会为chatgpt付费吗？或者说，你会为他长期付费吗？这个不是技术的问题，这是“从0到1”跨越鸿沟的商业问题，这里不展开讨论。和21世纪初的互联网市梦率一样，10年后他会无处不在的。这一规律我认为区块链也成立。
从国家的角度，
从学生的角度，AI的分数据说是一年比一年高。
从算法的角度，AI是启发式算法
从数学/统计的角度，AI是统计模型
从角度，是universal approximator
从求职者的角度
从创业者的角度，AI是赛道
从美国角度，AI是战略性学科
从中国的角度，AI是可能的第四次工业革命的学科
从生物学角度
从我的角度，这是我作为一个人了解智能这一命题目前看来最为可行且效率最高的途径/工具

这句话我需要解释一下，我喜欢举例子：假如我是一个热爱化学材料学的人，脱离研究单位，我能力再强什么事儿也做不成的，因为我的科研/工作/探索离不开大型实验装置，离不开一个大型企业，一个大型团队。这就像我说我拿十万块一个人创业搞AI，好像没那么离谱，换做十万启动资金一个人创业搞汽车，你绝对劝我去精神病医院看看。一个道理，我经常和我媳妇说，给我电脑和网络，我就可以搞研究。当然，数学，理论物理等等很多学科也是如此，但对于我而言，自己有没有能力做这些研究，我心里还是有点数的。

开一些脑洞吧，咱们分析分析AI这个学科，过去现在以及将来会给我们带来了多少惊喜，有多少想象空间。

从最低层需求来说，人都想知道我们怎么来的，这其中有一个很重要的命题就是智能，意识。那么，人类在这一命题上有什么有力的研究工具吗？单单视觉这一对动物来说很简单的感知（perception）功能，都没法用数学去描述，跟别说认知（recognition）了。 Steve Wolfram20年前就振臂高呼，说自己发现了一种新的科学，它无法用人类已知的所有工具去研究处理它。某种程度上我是认同的。但无论如何，AI至少给了我们到达它的可能性。

图灵奖得主Hinton说过，想让机器飞，不需要让他像鸟，你需要研究空气动力学。智能也是一个道理，只从生物学，脑科学的角度，希望通过模拟大脑来实现这一目标，目前看来是行不通的。AI者10年的突飞猛进，绕不开几个基础的技术/发现： back propagation，卷积算子（transfermer）， activation 。也没有跳脱machine leanring/statstical learning 这一范式，本质上是统计模型。但其实人类刚开始研究AI的时候是两条腿走路的，连接主义和符号主义。专家系统，模糊逻辑这些词儿就是那个时代的显学。

人类引以为傲的逻辑，其实无外乎两种：演绎推理和归纳假设。举个例子，blablabla。

三巨头: Yann LeCun 评价 Geoffrey Hinton沉迷于研究magical math， Lecun只相信算法， Yoshua Bengio研究意识去了。

-1

NKFS

潜意识

GenAI：范式革命

基于提取vs基于生成

说人话就是google vs chatGPT， baidu vs kimi。这是底层服务模式的转变。

ChatGPT对历史的贡献是什么？

超级个体

赛博空间与数字资产

有生之年数字资产一定是实物资产是XX被，无论承认与否，这是规律。

单能多能群智

复杂与涌现

hebb rule

符号与连接/逻辑与启发

0

数学的乏力：真实的Deadlock

AI的历史

相比于chatGPT， AI的历史一点也不性感，甚至有些枯燥乏味。媒体上说的AI其实在以前有很多名字：计算机视觉（computer vision），模式识别（pattern recogniation），自然语言处理（nature language processing），机器学习（machine learning），统计学习（statistical learning）等等。在2012年深度学习席卷全球之前，其实AI有两个流派的：连接主义和符号主义。故事要从达特茅斯的一个summer school说起，blablabla。这块儿其实不重要，你只需要知道就是一帮人希望通过一个暑假解决计算机视觉这一问题，然后他们发现解决不了，于是AI这一学科就诞生了。

AI有意识吗？

没有

具身智能：当智能体走进物理世界

这个方向太火了，以至于我决定单独把它拎出来讲一讲。

什么是具身智能？说白了就是机器人+ 智能算法，大家最关注的是人形机器人。我看有的公司已经A+++++轮融资了，可见有多火。

设想一个场景：花一辆汽车的价格买一个general purpose humaniod robot，工厂，士兵，武器，经济，生产力，人类社会 blablabla

1

通用人工智能：目标月球

假设通用人工智能的目标是登陆到月球，评价指标是每天距离月球的距离有没有缩短。不断的换更高的树去爬和几十年潜心研究火箭，哪个更有可能实现这一目标呢？

要讨论着个问题，先需要定义。别说AGI了， AI的定义都没有。我们只能说些共识甚至例子：

这是哲学问题

规律、数学、科学和智能

数学是不科学的
智能可能不是数学的

图灵机智能意识

这块需要用一点点数学，希望你可以耐心看下去：

∞

hypernet

后记

reason

事情是这样子的，有一天我在朋友圈发了张照片，里面是这个月我读的书。一位朋友的评论让我注意到照片里面恰巧有两本书名字很像：彼得·蒂尔的《从0到1》和乔治·伽莫夫的《从一到无穷大》。半开玩笑的，我回复了一句：

“以后我也写本：从负无穷到0”

于是便有了此书

Archive

我经常和朋友解释博士在干什么：
“一个很厉害的人发明了番茄炒蛋这一菜谱，我们在研究如何用马尔可夫过程在真空环境下用两个土鸡蛋和一个墨西哥西红柿炒菜。”
一般说完这句话大家都哈哈一笑，但某种程度上，我其实没有开玩笑，我是在做比喻。不信的话你去问问身边的教授，看他同不同意这个观点：“99%的论文都是垃圾，没有读的必要” 要我来看，99.99%都不为过。但这并没有否认博士研究的价值，因为如果没有人搞研究，技术是一定不会进步的。数量决定质量，是一个受过统计训练的人来说百试不爽的“真理”

~~我是一个研究人工智能的计算机在读博士爸爸，孩子5岁，和许多朋友交流后发现当父母的都对孩子的教育非常重视、紧张、焦虑、恐慌和无奈。~~
本书是介于科普书和教材之间的，希望通过不那么严格的论证，帮助广大父母们理解人工智能的历史、当前研究领域和未来的展望。目的是当你读完这本书，自己的孩子在人工智能这个领域该如何学习与培养能形成独立的见解，终极目标是通过你和你的孩子共同的讨论和学习，在AI领域制定合适自己的长期可行的学习计划与目标。
本书无意也不可能对人工智能进行全面的介绍，机械的堆叠知识是没有意义的，因为大部分都在网上可以找到。我希望从一个一在读博士和父亲的独特的视角，将这些信息进行归纳、整理，梳理出一条简洁清晰的脉络，方便读者，也方便自己，对人工智能这一新兴学科的整体框架有一个宏观把控。一旦你掌握了一个学科的“常识”了，自媒体各种传播的焦虑就不会困扰你了。
作为研究AI的计算机在读博士生，也作为一个5岁孩子的父亲，我将我关于AI教育的思考与计划全部写在书中，献给我的孩子，献给我自己，也献给所有伟大的父亲母亲们，这是基于我的专业知识和对自己孩子未来发展的思考与计划。有娃了之后才意识到真正的奢侈品是教育。教育是三方面的：家庭、学校和社会。我们尽力配合学校教育，我们无法改变社会教育，那么让我们一起从家庭教育开始，一起来了解人工智能。

其实我本人非常非常讨厌学术圈里的一种对话： “谁谁谁去年发来3篇顶会，非常厉害”。我们仔细分析一下：这是一句评价，对学者对评价，结论是非常厉害，依据是3篇顶会。但这句话其实和这个学者研究的内容没有半毛钱关系。它的潜台词是：你搞得什么研究不重要，解决了什么问题不重要，重要的是你发的这个期刊/会议排名高。我甚至见过有的老师说“热烈祝贺xxx同学文章发表到XXX会议/期刊上” ，我连文章的题目都看不到。刚开始我是愤怒的，搞科研梦寐以求的nature，你去看看事后错误的比例有多少。但现在也释然了，没有人有耐心有能力去搞懂你做的是什么，看你文章的层次和IF就是最快捷的方法。能否毕业，选人才，评职称都是这个方式，仔细想想，如果不用这套评价体系的话，可能会更糟。我唯一不开心的是很多一线科研人员完全沉迷其中了。很像马斯克说的一句话，越是聪明的人越要先问一句，你研究的这个问题首先需不需要研究，一瞬间卷入一个庞大的体系然后埋头苦干，我是不认同的。当然，我也没有资格说这些。毕竟上述那些期刊和会议我一个也没投过。但从一个在读博士爸爸的立场上，我认为指出这一显现是有必要的。

要么编程要么拍视频

AI与资本
AI是泡沫吗？这要看从什么角度来说了
互联网区块链


### 例子

先来看个简单的例子：

>  “*我们提出了一种改进人类椅子设计的方法。该方法的目标是生成大量的椅子设计候选方案，以便通过创建草图和3D模型来辅助人类设计师。这个方法包括图像合成模块（学习训练数据集的潜在分布）、超分辨率模块（提高生成图像的质量）以及人类参与的环节。最后，我们手动挑选了其中一个生成的候选方案，并制作出一把实物椅子进行展示。*”



![pipeline](img/chair-pipeline.jpg)

说人话就是：利用生成对抗网络GAN生成一大堆椅子来辅助设计。 思路其实很简单，利用爬虫在网上（Pinterest）收集大约3万8千张椅子图片，然后把这些数据交给算法。

![chariwall](img/chair-chairwall.jpg)

如果硬要说里面用到的方法的话，其实就是模型的网络架构：包括图像合成模块（DCGAN架构）和超分辨率模块（SRGAN架构）组成。

![network](img/chair-network.jpg)



再列一些这些算法背后的数学公式吧：对于生成器 $G$ 和判别器 $D$，我们将目标表达为：

<img src="./img/book-equationGan.jpg" alt="equationGan" style="zoom:35%;" />

这是个很有意思的对抗思想：$G$ 像小偷一样目标是骗过 $D$ ， $D$ 的目标是识别 $G$ 。



<img src="./img/chair-3d.jpg" alt="3d" style="zoom:50%;" />

这其实就是一个简易版的AI论文了。 受过半年训练的同学其实很容易做出来。 

<img src="img/chair-realChair.jpg" alt="real_chair" style="zoom:50%;" />