连续的签到和点赞,在这边已经7级,可以申请吧主了!距离上次发帖说“我可以来当吧主吗”已经过去近一个月了。吧主已申请,希望通过~
那趁这个特别的时间来发一个特别的文吧。本来想着发偏技术性与干货的文,但是一时想不到具体该写什么方面,觉得任何具体的技术和硬核的细节,都不太适合发在当下的时间点。那就……来聊聊一些宽泛的话题吧!
目前的大语言模型,的确已经应用于生活的方方面面,各种领域,各种维度。好像能用语言编码的事情,都可以使用大语言模型?不管是人类社会语言,还是程序语言,数学语言,甚至音乐语言,图片语言,视频语言……似乎,一切可以编码的内容,都能被大语言模型解析,并理解!
虽然在技术上,还没办法做到各方面都高效通畅的响应。但既然要谈可能性,那就暂且抛开基础,仅从理论上来看。那似乎已经有了一个解:任何可编码的东西,都是大语言模型所在之处!只要这个编码是有逻辑的,有规律的,那么,大语言模型就能依照这样的逻辑或规律,生成针对性的响应。
以当前的方式:就是给出一段编码,AI会根据编码的第一个内容 去预测第二个,再根据前两个预测第三个……以此类推,然后拿预测的结果与真实编码的结果,计算loss值,去调整神经网络参数(这就是自回归模型+Transformer架构)。从而让AI理解 这段编码的逻辑和含义。而在海量的数据中,AI可能 用自己的01的编码,以某种建模或方式,理解了给定的原始编码语言。从而,在这个 存在建模的神经网络 之下,对待其他的编码,也能很好的预测出下文。也就是:能根据需要,进行任何形式的编码的创作。比如文字,图片,音乐。
可能有些人会说“AI没有建模,并不理解原来的编码,只是根据概率进行预测的机器”。我暂时不讨论AI的神经网络是否真的理解了原本编码的逻辑和规则。但就“可以创作对应编码”的能力来说,至少AI已经建立了一个 针对该编码的概率模型!那么,真有一个 能创作出该领域编码 的模型,我也不知道……和“理解了该领域本质”又有什么不同?
哲学上一直有一个问题:“本质”是什么?我和一个人在一起很熟悉,了解这个人的一切,这算是理解了这个人的“本质”了吗?我充其量只不过是了解了这个人在各种情况下的各种行为。
我们了解宇宙暗物质 具有质量,但却完全不了解任何暗物质相关的其他信息……因为暗物质,除了参与“质量”以外,不参与任何 人类所了解的其他行为。
其实任何人都是如此:把了解的主体的行为,作为对这个主体本质的了解。所以康德的意思:我们只能从时间,空间维度去了解,而没办法了解“本质”。把这个无法了解的本质称作“物自体”。
而黑格尔就直接认为:没有所谓的,无法了解的“物自体”,一切事物都是由彼此的联系相互定义的!其他个体发出的信息,被我所了解,那我就形成了对 这个个体的定义。所有外界对这个个体的感知与响应,就形成了对这个个体所有的定义。如果宇宙中只有一个个体存在,而这个个体 不影响任何其他个体。那这个个体本身,就相当于不存在。
我不知道现代哲学有没有进化出更合理的对“本质”的理解。而以黑格尔的理解来看,AI拥有“能创作出该领域编码”的能力,那就是事实上被定义为:“理解了该领域的编码”。毋庸置疑……
而前面说过:“只要这个编码是有逻辑的,有规律的,那么,大语言模型就能依照这样的逻辑或规律,生成针对性的响应。”,任何人任何模型任何东西,都无法理解无逻辑无规律的东西!这是必然。比如女生为什么生气,就是一个无论怎么建模怎么思考都没有逻辑和规律的东西,那注定是无法理解的。
而人类社会语言,能被大语言模型所“理解”这意味着什么?用沃尔夫勒姆的话来说,就是“意味着,语言其实是一个简单系统!” 语言本身,是有某种数学的,固定的规律的。而这个规律,在大语言模型的自回归模型+Transformer架构 下,被建模,被“理解”出来了。虽然人类不知道语言的数学规律和逻辑是什么,但是大语言模型,在阅读了人类的语言之后,却已经找到了一个事实上的数学模型,作为“语言的规律模型”,并进行输入输出了。
注意:大语言模型,没办法编码特别深刻复杂的学术内容,但却可以编码人类语言内容进行交流对话。那就说明,其实语言的数学逻辑,并不比 那些学术问题更复杂。只是目前,人类还不知道这个数学逻辑是什么。
举这个例子是想说:大语言模型,其实可以“理解”任何,具有逻辑,具有规律的编码。并对这个领域的编码进行创作与交流——这就是大语言模型,能做到的事情。
那趁这个特别的时间来发一个特别的文吧。本来想着发偏技术性与干货的文,但是一时想不到具体该写什么方面,觉得任何具体的技术和硬核的细节,都不太适合发在当下的时间点。那就……来聊聊一些宽泛的话题吧!
目前的大语言模型,的确已经应用于生活的方方面面,各种领域,各种维度。好像能用语言编码的事情,都可以使用大语言模型?不管是人类社会语言,还是程序语言,数学语言,甚至音乐语言,图片语言,视频语言……似乎,一切可以编码的内容,都能被大语言模型解析,并理解!
虽然在技术上,还没办法做到各方面都高效通畅的响应。但既然要谈可能性,那就暂且抛开基础,仅从理论上来看。那似乎已经有了一个解:任何可编码的东西,都是大语言模型所在之处!只要这个编码是有逻辑的,有规律的,那么,大语言模型就能依照这样的逻辑或规律,生成针对性的响应。
以当前的方式:就是给出一段编码,AI会根据编码的第一个内容 去预测第二个,再根据前两个预测第三个……以此类推,然后拿预测的结果与真实编码的结果,计算loss值,去调整神经网络参数(这就是自回归模型+Transformer架构)。从而让AI理解 这段编码的逻辑和含义。而在海量的数据中,AI可能 用自己的01的编码,以某种建模或方式,理解了给定的原始编码语言。从而,在这个 存在建模的神经网络 之下,对待其他的编码,也能很好的预测出下文。也就是:能根据需要,进行任何形式的编码的创作。比如文字,图片,音乐。
可能有些人会说“AI没有建模,并不理解原来的编码,只是根据概率进行预测的机器”。我暂时不讨论AI的神经网络是否真的理解了原本编码的逻辑和规则。但就“可以创作对应编码”的能力来说,至少AI已经建立了一个 针对该编码的概率模型!那么,真有一个 能创作出该领域编码 的模型,我也不知道……和“理解了该领域本质”又有什么不同?
哲学上一直有一个问题:“本质”是什么?我和一个人在一起很熟悉,了解这个人的一切,这算是理解了这个人的“本质”了吗?我充其量只不过是了解了这个人在各种情况下的各种行为。
我们了解宇宙暗物质 具有质量,但却完全不了解任何暗物质相关的其他信息……因为暗物质,除了参与“质量”以外,不参与任何 人类所了解的其他行为。
其实任何人都是如此:把了解的主体的行为,作为对这个主体本质的了解。所以康德的意思:我们只能从时间,空间维度去了解,而没办法了解“本质”。把这个无法了解的本质称作“物自体”。
而黑格尔就直接认为:没有所谓的,无法了解的“物自体”,一切事物都是由彼此的联系相互定义的!其他个体发出的信息,被我所了解,那我就形成了对 这个个体的定义。所有外界对这个个体的感知与响应,就形成了对这个个体所有的定义。如果宇宙中只有一个个体存在,而这个个体 不影响任何其他个体。那这个个体本身,就相当于不存在。
我不知道现代哲学有没有进化出更合理的对“本质”的理解。而以黑格尔的理解来看,AI拥有“能创作出该领域编码”的能力,那就是事实上被定义为:“理解了该领域的编码”。毋庸置疑……
而前面说过:“只要这个编码是有逻辑的,有规律的,那么,大语言模型就能依照这样的逻辑或规律,生成针对性的响应。”,任何人任何模型任何东西,都无法理解无逻辑无规律的东西!这是必然。比如女生为什么生气,就是一个无论怎么建模怎么思考都没有逻辑和规律的东西,那注定是无法理解的。
而人类社会语言,能被大语言模型所“理解”这意味着什么?用沃尔夫勒姆的话来说,就是“意味着,语言其实是一个简单系统!” 语言本身,是有某种数学的,固定的规律的。而这个规律,在大语言模型的自回归模型+Transformer架构 下,被建模,被“理解”出来了。虽然人类不知道语言的数学规律和逻辑是什么,但是大语言模型,在阅读了人类的语言之后,却已经找到了一个事实上的数学模型,作为“语言的规律模型”,并进行输入输出了。
注意:大语言模型,没办法编码特别深刻复杂的学术内容,但却可以编码人类语言内容进行交流对话。那就说明,其实语言的数学逻辑,并不比 那些学术问题更复杂。只是目前,人类还不知道这个数学逻辑是什么。
举这个例子是想说:大语言模型,其实可以“理解”任何,具有逻辑,具有规律的编码。并对这个领域的编码进行创作与交流——这就是大语言模型,能做到的事情。