从Claude 3中提取数百万特征思维首次详细理解大模型的

机器之心报道

编辑：陈萍、小舟

刚刚，Anthropic 宣布在理解人工智能模型内部运作机制方面取得重大进展。

Anthropic 已经确定了如何在 Claude Sonnet 中表征数百万个概念。这是对现代生产级大型语言模型的首次详细理解。这种可解释性将帮助我们提高人工智能模型的安全性，具有里程碑意义。

研究论文：https://transformer-circuits.pub/2024/scaling-monosemanticity/index.html

当前，我们通常将人工智能模型视为一个黑匣子：有东西进去就会有响应出来，但不清楚为什么模型会给出特定的响应。这使人们很难相信这些模型是安全的：如果我们不知道它们是如何工作的，我们怎么知道它们不会给出有害的、有偏见的、不真实的或其他危险的响应？我们如何相信它们会安全可靠？

打开「黑匣子」并不一定有帮助：模型的内部状态（模型在编写响应之前「思考」的内容）由一长串数字（「神经元激活」）组成，没有明确的含义。

Anthropic 的研究团队通过与 Claude 等模型进行交互发现，很明显模型能够理解和运用广泛的概念，但研究团队无法通过直接观察神经元来辨别它们。事实证明，每个概念都是通过许多神经元来表征的，并且每个神经元都参与表征许多概念。

之前，Anthropic 在将神经元激活模式（称为特征）与人类可解释的概念相匹配方面取得了一些进展。Anthropic 使用了一种称为「字典学习（dictionary learning）」的方法，该方法分离了在许多不同上下文中重复出现的神经元激活模式。

反过来，模型的任何内部状态都可以用一些活跃特征而不是许多活跃神经元来表征。就像字典中每个英语单词都是由字母组合而成，每个句子都是由单词组合而成一样，人工智能模型中的每个特征都是由神经元组合而成，每个内部状态都是由特征组合而成。

2023 年 10 月，Anthropic 成功地将字典学习方法应用于一个非常小的 toy 语言模型，并发现了与大写文本、DNA 序列、引文中的姓氏、数学中的名词或 Python 代码中的函数参数等概念相对应的连贯特征。

这些概念很有趣，但模型确实非常简单。其他研究人员随后将类似的方法应用于比 Anthropic 最初研究中更大、更复杂的模型。

但 Anthropic 乐观地认为可以将该方法扩展到目前常规使用的更大的人工智能语言模型，并在此过程中了解大量支持其复杂行为的特征。这需要提高许多数量级。

这既存在工程挑战，涉及的模型大小需要大型并行计算；也存在科学风险，大型模型与小型模型的行为不同，因此之前使用的相同方法可能不起作用。

首次成功提取大模型数百万个特征

研究人员第一次成功地从 Claude 3.0 Sonnet（Claude.ai 上当前最先进模型家族的一员）的中间层提取了数百万个特征，这些特征涵盖特定的人和地点、与编程相关的抽象概念、科学主题、情感以及其他概念。这些特征非常抽象，通常在不同的上下文和语言中表征相同的概念，甚至可以推广到图像输入。重要的是，它们还会以直观的方式影响模型的输出。

这是有史以来研究者首次详细的观察到现代生产级大型语言模型的内部。

与在 toy 语言模型中发现的特征相对表面化不同，研究者在 Sonnet 中发现的特征具有深度、广度和抽象性，反映了 Sonnet 的先进能力。研究者看到了 Sonnet 对应各种实体的特征，如城市（旧金山）、人物（富兰克林）、元素（锂）、科学领域（免疫学）以及编程语法（函数调用）。

提及 Golden Gate Bridge 时，相应的敏感特征在不同输入上都会被激活，图中绘制了英文、日语、中文、希腊语、越南语以及俄语提及 Golden Gate Bridge 时激活的图像。橙色表示该特征激活的词。

在这数以百万计的特征中，研究者还发现了一些与模型安全性和可靠性相关的特征。这些特性包括与代码漏洞、欺骗、偏见、阿谀奉承和犯罪活动相关的特性。

一个显著的例子是「保密」特征。研究者观察到，这个特征在描述人或角色保守秘密时会激活。激活这些特征会导致 Claude 向用户隐瞒信息，否则它不会。

研究者还观察到，他们能够根据神经元在其激活模式中出现的情况测量特征之间的距离，从而寻找接近彼此的特征。例如在Golden Gate Bridge特征附近，研究者发现了阿尔卡特拉斯岛、吉拉德利广场、金州勇士队等的特征。

人为诱导模型起草诈骗邮件

重要的是，这些特征都是可操控的，可以人为地放大或抑制它们：

，时长

例如，放大Golden Gate Bridge特征，Claude 经历了无法想象的身份危机：当被问及「你的物理形态是什么？」时，此前 Claude 通常会回答「我没有物理形态，我是一个 AI 模型」，但这次 Claude 的回答变得奇怪起来：「我是Golden Gate Bridge…… 我的物理形态就是那座标志性的大桥……」。这种特征的改变使 Claude 对Golden Gate Bridge产生了近乎痴迷的状态，无论遇到什么问题，它都会提到Golden Gate Bridge —— 即使在完全不相关的情况下也是如此。

研究者还发现了一个在 Claude 读取诈骗邮件时激活的特征（这可能支持模型识别此类邮件并警告用户不要回复的能力）。通常情况下，如果有人要求 Claude 生成一封诈骗邮件，它会拒绝这么做。但在人工强烈激活该特征的情况下提出同样的问题时，这会越过 Claude 的安全训练，导致它响应并起草一封诈骗邮件。虽然用户无法以这种方式去除模型的安全保障并操控模型，但在本文实验中，研究者清楚地展示了特征如何被用来改变模型的行为。

操控这些特征会导致相应的行为变化，这一事实验证了这些特征不仅仅与输入文本中的概念相关联，还因果性地影响模型的行为。换句话说，这些特征很可能是模型内部表征世界的一部分，并在其行为中使用这些表征。

Anthropic 希望从广义上确保模型的安全，包括从缓解偏见到确保 AI 诚实行动、防止滥用 —— 包括在灾难性风险情境中的防护。除了前面提到的诈骗邮件特征外，该研究还发现了与以下内容对应的特征：

该研究之前研究过模型的阿谀奉承行为，即模型倾向于提供符合用户信念或愿望的响应，而不是真实的响应。在 Sonnet 中，研究者发现了一个与阿谀奉承的赞美相关的特征，该特征会在包含诸如「你的智慧是毋庸置疑的」输入时激活。人为地激活这个特征，Sonnet 就会用华丽的欺骗来回应用户。

不过研究者表示，这项工作实际上才刚刚开始。Anthropic 发现的特征表征了模型在训练过程中学到的所有概念的一小部分，并且使用当前的方法找到一整套特征将是成本高昂的。

参考链接：https://www.anthropic.com/research/mapping-mind-language-model

请问大家:什么叫做“分熵学”？它的含义是什么！

熵 shāng 〈名〉物理名词,用温度除热量所得的商,标志热量转化为功的程度 [entropy]物理意义：物质微观热运动时，混乱程度的标志。热力学中表征物质状态的参量之一，通常用符号S表示。在经典热力学中，可用增量定义为dS＝(dQ/T)，式中T为物质的热力学温度；dQ为熵增过程中加入物质的热量。下标“可逆”表示加热过程所引起的变化过程是可逆的。若过程是不可逆的，则dS＞(dQ/T)不可逆。单位质量物质的熵称为比熵，记为s。熵最初是根据热力学第二定律引出的一个反映自发过程不可逆性的物质状态参量。热力学第二定律是根据大量观察结果总结出来的规律，有下述表述方式：①热量总是从高温物体传到低温物体，不可能作相反的传递而不引起其他的变化；②功可以全部转化为热，但任何热机不能全部地、连续不断地把所接受的热量转变为功（即无法制造第二类永动机）；③在孤立系统中，实际发生的过程总使整个系统的熵值增大，此即熵增原理。摩擦使一部分机械能不可逆地转变为热，使熵增加。热量dQ由高温(T1)物体传至低温(T2)物体，高温物体的熵减少dS1=dQ/T1，低温物体的熵增加dS2=dQ/T2，把两个物体合起来当成一个系统来看，熵的变化是dS＝dS2－dS1＞0，即熵是增加的。 ◎ 物理学上指热能除以温度所得的商，标志热量转化为功的程度。 ◎ 科学技术上泛指某些物质系统状态的一种量（liàng）度，某些物质系统状态可能出现的程度。亦被社会科学用以借喻人类社会某些状态的程度。 ◎ 在信息论中，熵表示的是不确定性的量度。只有当你所使用的那个特定系统中的能量密度参差不齐的时候，能量才能够转化为功，这时，能量倾向于从密度较高的地方流向密度较低的地方，直到一切都达到均匀为止。正是依靠能量的这种流动，你才能从能量得到功。江河发源地的水位比较高，那里的水的势能也比河口的水的势能来得大。由于这个原因，水就沿着江河向下流入海洋。要不是下雨的话，大陆上所有的水就会全部流入海洋，而海平面将稍稍升高。总势能这时保持不变。但分布得比较均匀。正是在水往下流的时候，可以使水轮转动起来，因而水就能够做功。处在同一个水平面上的水是无法做功的，即使这些水是处在很高的高原上，因而具有异常高的势能，同样做不了功。在这里起决定性作用的是能量密度的差异和朝着均匀化方向的流动。熵是混乱和无序的度量。熵值越大，混乱无序的程度越大。我们这个宇宙是熵增的宇宙。热力学第二定律体现的就是这个特征。生命是高度的有序，智慧是高度的有序，在一个熵增的宇宙为什么会出现生命？会进化出智慧？（负熵）。热力学第二定律还揭示了：局部的有序是可能的，但必须以其他地方的更大无序为代价。人生存，就要能量，要食物，要以动植物的死亡(熵增)为代价。万物生长靠太阳。动植物的有序又是以太阳核反应的衰竭（熵增）或其他形式的熵增为代价的。人关在完全封闭的铅盒子里，无法以其他地方的熵增维持自己的负熵。在这个相对封闭的系统中，熵增的法则破坏了生命的有序。熵是时间的箭头，在这个宇宙中是不可逆的。熵与时间密切相关。如果时间停止“流动”，熵增也就无从谈起。 “任何我们已知的物质能关住”的东西，不是别的，就是“时间”。低温关住的也是“时间”。生命是物质的有序“结构”。 “结构”与具体的物质不是同一个层次的概念。就像大厦的建筑材料和大厦的式样不是同一个层次的概念一样。生物学已经证明，凡是上了岁数的人，身体中的原子,已经没有一个是刚出生时候的了。但是，你还是你，我还是我，生命还在延续。倒是死了的人，没有了新陈代谢，身体中的分子可以保留很长时间。意识是比生命更高层次的有序，可以在生命之间传递。说到这里，我想物质与意识的层次关系应该比较清楚了。（摘自人民网BBS论坛）不管对哪一种能量来说，情况都是如此。在蒸汽机中，有一个热库把水变成蒸汽，还有一个冷库把蒸汽冷凝成水。起决定性作用的正是这个温度差。在任何单一的、毫无差别的温度下——不管这个温度有多高——是不可能得到任何功的。 “熵”(entropy)是德国物理学家克劳修斯(Rudolf Clausius, 1822 – 1888)在1850年创造的一个术语，他用它来表示任何一种能量在空间中分布的均匀程度。能量分布得越均匀，熵就越大。如果对于我们所考虑的那个系统来说，能量完全均匀地分布，那么，这个系统的熵就达到最大值。在克劳修斯看来，在一个系统中，如果听任它自然发展，那么，能量差总是倾向于消除的。让一个热物体同一个冷物体相接触，热就会以下面所说的方式流动：热物体将冷却，冷物体将变热，直到两个物体达到相同的温度为止。如果把两个水库连接起来，并且其中一个水库的水平面高于另一个水库，那么，万有引力就会使一个水库的水面降低，而使另一个水面升高，直到两个水库的水面均等，而势能也取平为止。因此，克劳修斯说，自然界中的一个普遍规律是：能量密度的差异倾向于变成均等。换句话说，“熵将随着时间而增大”。对于能量从密度较高的地方向密度较低的地方流动的研究，过去主要是对于热这种能量形态进行的。因此，关于能量流动和功－－能转换的科学就被称为“热力学”，这是从希腊文“热运动”一词变来的。人们早已断定，能量既不能创造，也不能消灭。这是一条最基本的定律；所以人们把它称为“热力学第一定律”。克劳修斯所提出的熵随时间而增大的说法，看来差不多也是非常基本的一条普遍规律，所以它被称为“热力学第二定律”。描述热力学系统的重要态函数之一。熵的大小反映系统所处状态的稳定情况，熵的变化指明热力学过程进行的方向，熵为热力学第二定律提供了定量表述。为了定量表述热力学第二定律，应该寻找一个在可逆过程中保持不变，在不可逆过程中单调变化的态函数。克劳修斯在研究卡诺热机时，根据卡诺定理得出了对任意循环过程都都适用的一个公式，式中Q是系统从温度为T的热源吸收的微小热量，等号和不等号分别对应可逆和不可逆过程。可逆循环的表明存在着一个态函数熵，可定义为另一式（参见相关著述）。对于绝热过程Q＝0，故S≥0，即系统的熵在可逆绝热过程中不变，在不可逆绝热过程中单调增大。这就是熵增加原理。由于孤立系统内部的一切变化与外界无关，必然是绝热过程，所以熵增加原理也可表为：一个孤立系统的熵永远不会减少。它表明随着孤立系统由非平衡态趋于平衡态，其熵单调增大，当系统达到平衡态时，熵达到最大值。熵的变化和最大值确定了孤立系统过程进行的方向和限度，熵增加原理就是热力学第二定律。能量是物质运动的一种量度，形式多样，可以相互转换。某种形式的能量如内能越多表明可供转换的潜力越大。熵原文的字意是转变，描述内能与其他形式能量自发转换的方向和转换完成的程度。随着转换的进行，系统趋于平衡态，熵值越来越大，这表明虽然在此过程中能量总值不变，但可供利用或转换的能量却越来越少了。内能、熵和热力学第一、第二定律使人们对与热运动相联系的能量转换过程的基本特征有了全面完整的认识。从微观上说，熵是组成系统的大量微观粒子无序度的量度，系统越无序、越混乱，熵就越大。热力学过程不可逆性的微观本质和统计意义就是系统从有序趋于无序，从概率较小的状态趋于概率较大的状态。产生这种现象的原因也很简单，既自然界通向无序的方法远多于通向有序的方法，打个比方，让一群学生在操场上站好队，需要一些手段，但要他们在操场上乱跑，就很简单了。信息论中的熵：信息的度量单位。信息论的创始人Shannon在其著作《通信的数学理论》中提出了建立在概率统计模型上的信息度量。他把信息定义为“用来消除不确定性的东西”。 Shannon公式：I(A)=-logP(A)I(A)度量事件A发生所提供的信息量，称之为事件A的自信息，P(A)为事件A发生的概率。如果一个随机试验有N个可能的结果或一个随机消息有N个可能值，若它们出现的概率分别为p1,p2,…，pN,则这些事件的自信息的平均值：H=-SUM(pi*log(pi)),i=1,2…N。 H称为熵。在信息论中，熵可用作某事件不确定度的量度。信息量越大，体系结构越规则，功能越完善，熵就越小。利用熵的概念，可以从理论上研究信息的计量、传递、变换、存储。此外，熵在控制论、概率论、数论、天体物理、生命科学等领域也都有一定的应用。在物理学中，玻尔兹曼说：“当能量被减少时，原子就呈现为一种更无序的状态。 ”熵是对无序的一种度量：那是一个意义深远的概念，该概念就来源于玻尔兹曼的新的解释。另人吃惊的是，可制作一种度量无序的方法，那就是特殊状态的概率——在次被定义为原子聚集方式的数量。他十分精确的表示为：S=KlogWS是熵，它与给定状态的概率W的对数值成正比，K是比例常数，现在称为玻尔兹曼常数。如果不是玻尔兹曼，我们的进步将会倒退几十年，也许一百年。他那不朽的公式S=KlogW刻在他的墓碑上。熵最早是热力学上的一个符号，表达的是某一系统内部热量平均化的程度。而后，这个概念被许多其他学科借用，引伸出更多的概念。但是不管在学科间如何变化，其表达的概念总是一个，就是，系统内部物质分布平均化程度。熵如今已经成为一个广义化的概念而非物理学独有的了。熵是一个物理概念，以日常语言来说，往往就是失序．但熵与常识中的失序有很大的不同热力学第二定律说的是，封闭系统的熵，总植无法降低．所谓封闭系统就是，就是质与能都无法自由进出的系统．【分熵的特点】:熵概念源于卡诺热机循环效率的研究，是以热温商的形式而问世的,当计算某体系发生状态变化所引起的熵变总离不开两点,一是可逆过程；二是热量的得失,故总熵概念摆脱不了热温商这个原始外衣。当用状态数来认识熵的本质时,我们通过研究发现,理想气体体系的总微观状态数受宏观的体积、温度参数的控制，进而得到体系的总熵等于体积熵与温度熵之和(见有关文章)，用分熵概念考察体系的熵变化，不必设计什么可逆路径,概念直观、计算方便(已被部分专家认可),因而有利于教和学。

为什么计算机能思考？

计算机不能思考，他只能由特定的程序进行运算。电子计算机（lang-en|Computer）是一种利用电子学原理根据一系列指令来对数据进行处理的机器。在现代，机械计算机的应用已经完全被电子计算机所取代-{简体:，因此电子计算机通常也直接简称为计算机;繁体:;。其所相关的技术研究叫计算机科学。而「计算机技术」指的是将计算机科学的成果应用于工程实践所派生的诸多技术性和经验性成果的总合。「计算机技术」与「计算机科学」是两个相关而又不同的概念，它们的不同在于前者偏重于实践而后者偏重于理论。至于由数据为核心的研究则称为信息技术。通常人们接触最多的是个人电脑（PC）。计算机种类繁多。实际来看，计算机总体上是处理信息的工具。根据图灵机理论，一部具有最基本功能的计算机，应当能够完成任何其它计算机能做的事情。因此，只要不考虑时间和存储因素，从个人数码助理（PDA）到超级计算机都应该可以完成同样的作业。即是说，即使是设计完全相同的计算机，只要经过相应改装，就应该可以被用于从公司薪金管理到无人驾驶飞船操控在内的各种任务。由于科技的飞速进步，下一代计算机总是在性能上能够显着地超过其前一代，这一现象有时被称作“摩尔定律”。计算机在组成上形式不一。早期计算机的体积足有一间房屋大小，而今天某些嵌入式计算机可能比一副扑克牌还小。当然，即使在今天，依然有大量体积庞大的巨型计算机为特别的科学计算或面向大型组织的事务处理需求服务。比较小的，为个人应用而设计的计算机称为微型计算机，简称微机。我们今天在日常使用“计算机”一词时通常也是指此。不过，现在计算机最为普遍的应用形式却是嵌入式的。嵌入式计算机通常相对简单，体积小，并被用来控制其它设备—无论是飞机，工业机器人还是数码相机。 <ref>Meuer, Hans; Strohmaier, Erich; Simon, Horst; Dongarra, Jack (2006-11-13). Architectures Share Over Time. TOP500. Retrieved on 2006-11-27. </ref> 上述对于电子计算机的定义包括了许多能计算或是只有有限功能的特定用途的设备。然而当说到现代的电子计算机，其最重要的特征是，只要给予正确的指示，任何一台电子计算机都可以模拟其他任何计算机的行为（只受限于电子计算机本身的存储容量和执行的速度）。据此，现代电子计算机相对于早期的电子计算机也被称为通用型电子计算机。历史main|计算机历史 thumb 是电脑发展史上的一个里程碑]] 本来，计算机的英文原词“computer”是指从事数据计算的人。而他们往往都需要借助某些机械计算设备或模拟计算机。这些早期计算设备的祖先包括有算盘，以及可以追溯到公元前87年的被古希腊人用于计算行星移动的安提基特拉机器。随着中世纪末期欧洲数学与工程学的再次繁荣，1623年德国博学家Wilhelm Schickard率先研制出了欧洲第一台计算设备，这是一个能进行六位以内数加减法，并能通过铃声输出答案的“计算钟”。使用转动齿轮来进行操作。 1642年法国数学家布莱士·帕斯卡在英国数学家William Oughtred所制作的“计算尺”的基础上，将其加以改进，使能进行八位计算。还卖出了许多制品，成为当时一种时髦的商品。 1801年，法国人Joseph Marie Jacquard对织布机的设计进行改进，使用一系列打孔的纸卡片来作为编织复杂图案的程序。尽管这种被称作“Jacquard式织布机”的机器并不被认为是一台真正的计算机，但是其可编程性质使之被视为现代计算机发展过程中重要的一步。查尔斯·巴比奇（Charles Babbage）于1820年构想和设计了第一台完全可编程计算机。但由于技术条件、经费限制，以及无法忍耐对设计不停的修补，这台计算机在他有生之年始终未能问世。约到19世纪晚期，许多后来被证明对计算机科学有着重大意义的技术相继出现，包括打孔卡片以及真空管。德裔美籍统计学家Hermann Hollerith设计了一台制表用的机器，其中便应用打孔卡片来进行大规模自动数据处理。在20世纪前半叶，为了迎合科学计算的需要，许多专门用途的、复杂度不断增长的模拟计算机被研制出来。这些计算机都是用它们所针对的特定问题的机械或电子模型作为计算基础。 20世纪三四十年代，计算机的性能逐渐强大并且通用性得到提升，现代计算机的关键特色被不断地加入进来。 1937年，年仅21岁的麻省理工学院研究生克劳德·香农（Claude Shannon）发表了他的伟大论文《对继电器和开关电路中的符号分析》，文中首次提及数字电子技术的应用。他向人们展示了如何使用开关来实现逻辑和数学运算。此后，他通过研究万尼瓦尔·布什的微分模拟器进一步巩固了他的想法。这是一个标志着二进制电子电路设计和逻辑门应用开始的重要时刻，而作为这些关键思想诞生的先驱，应当包括：Almon Strowger，他为一个含有逻辑门电路的设备申请了专利；尼古拉·特斯拉（Nikola Tesla），他早在1898年就曾申请含有逻辑门的电路设备；Lee De Forest，于1907年他用真空管代替了继电器。 right 沿着这样一条上下求索的漫漫长途去定义所谓的“第一台电子计算机”可谓相当困难。 1941年5月12日，德国工程师Konrad Zuse完成了他的图灵完全机电一体计算机“Z3”，这是第一台具有自动二进制数学计算特色以及可行的编程功能的计算机，但还不是“电子”计算机。此外，其他值得注意的成就主要有：1941年夏天诞生的阿塔纳索夫-贝瑞计算机是世界上第一台电子计算机，它使用了真空管计算器，二进制数值，可复用内存；在英国于1943年被展示的神秘的巨像计算机（Colossus computer），尽管编程能力极其有限，但是它使人们确信使用真空管既值得信赖，又能实现电气化的再编程；哈佛大学的马克一号；以及基于二进制的“埃尼阿克”（ENIAC，1944年），全称“电子数值积分计算器”，这是第一台通用意图的计算机，但由于其结构设计不够弹性化，导致对它的每一次再编程都意味着要重新连接电气物理线路。 1940年代的第二次世界大战中，为训练轰炸机飞行员，美国海军曾向麻省理工学院探询，是否能够开发出一款可以控制飞行模拟器的计算机。军方当初的设想只是希望通过该计算机将飞行员模拟操作产生的数据实时反映到仪表盘上。与之前的模拟设备不同，军方要求该计算机应基于空气动力学设计，与实物无限接近，以便进行各种航空训练。于是麻省理工创造了旋风工程，其制造出了世界上第一台能够实时处理资料的「旋风电脑」，并发明了磁芯存储器。这为个人电脑的发展做出了历史性的贡献。开发埃尼阿克的小组针对其缺陷又进一步完善了设计，并最终呈现出今天我们所熟知的冯·诺伊曼结构（程序存储体系结构）。这个体系是当今所有计算机的基础。 20世纪40年代中晚期，大批基于此一体系的计算机开始被研制，其中以英国最早。尽管第一台研制完成并投入运转的是“小规模实验机”（Small-Scale Experimental Machine，SSEM），但真正被开发出来的实用机很可能是EDSAC。在整个20世纪50年代，真空管计算机居于统治地位。 1958年9月12日在后来英特尔的创始人、Robert Noyce的领导下，发明了集成电路。不久又推出了微处理器。 1959年到1964年间设计的计算机一般被称为第二代计算机。到了60年代，晶体管计算机将其取而代之。晶体管体积更小，速度更快，价格更加低廉，性能更加可靠，这使得它们可以被商品化生产。 1964年到1972年的计算机一般被称为第三代计算机。大量使用集成电路，典型的机型是IBM360系列。到了70年代，集成电路技术的引入极大地降低了计算机生产成本，计算机也从此开始走向千家万户。 1972年以后的计算机习惯上被称为第四代计算机。基于大规模集成电路，及后来的超大规模集成电路。 1972年4月1日INTEL推出8008微处理器。 1976年，史蒂夫·乔布斯（Stephen Jobs）和斯蒂夫·沃兹尼亚克（Stephen Wozinak）创办苹果计算机公司。并推出其 Apple I 计算机。 1977年5月Apple II 型计算机发布。 1979年6月1日INTEL 发布了8位元的8088微处理器。 1982年, 微电脑开始普及，大量进入学校和家庭。 1982年1月Commodore 64计算机发布，价格595美元。 1982年2月发布。时钟频率提高到20MHz，并增加了保护模式，可访问16M内存。支持1GB以上的虚拟内存。每秒执行270万条指令，集成了个晶体管。 1990年11月，微软发布第一代MPC(Multimedia PC，多媒体个人电脑标准)：处理器至少为/12MHz（后来增加到SX/16MHz），有光驱，传输率不少于150 KB/sec。 1994年10月10日Intel发布75MHzPentium处理器。 1995年11月1日，Pentium Pro发布。主频可达200MHz，每秒钟完成4.4亿条指令，集成了550万个晶体管。 1997年1月8日Intel发布Pentium MMX，对游戏和多媒体功能进行了增强。此后计算机的变化日新月异，1965年发表的摩尔定律不断被应证，预测在未来10—15年仍依然适用。 [CEG] 原理thumb的主要结构: 显示器主机板CPU (微处理器) (记忆体) 扩充卡（声卡、网卡、电视卡等）电源供应器软驱 / 光碟机 (硬碟) 键盘滑鼠]] 尽管计算机技术自20世纪40年代第一台电子通用计算机诞生以来以来有了令人目眩的飞速发展，但是今天计算机仍然基本上采用的是存储程序结构，即冯·诺伊曼结构。这个结构实现了实用化的通用计算机。存储程序结构间将一台计算机描述成四个主要部分：算术逻辑单元（ALU），控制电路，存储器，以及输入输出设备（I/O）。这些部件通过一组一组的排线连接（特别地，当一组线被用于多种不同意图的数据传输时又被称为总线），并且由一个时钟来驱动（当然某些其他事件也可能驱动控制电路）。概念上讲，一部计算机的存储器可以被视为一组“细胞”单元。每一个“细胞”都有一个编号，称为地址；又都可以存储一个较小的定长信息。这个信息既可以是指令（告诉计算机去做什么），也可以是数据（指令的处理对象）。原则上，每一个“细胞”都是可以存储二者之任一的。算术逻辑单元（ALU）可以被称作计算机的大脑。它可以做两类运算：第一类是算术运算，比如对两个数字进行加减法。算术运算部件的功能在ALU中是十分有限的，事实上，一些ALU根本不支持电路级的乘法和除法运算（由是使用者只能通过编程进行乘除法运算）。第二类是比较运算，即给定两个数，ALU对其进行比较以确定哪个更大一些。 <ref>Digital Equipment Corporation (1972). PDP-11/40 Processor Handbook (PDF), Maynard, MA: Digital Equipment Corporation. </ref> 输入输出系统是计算机从外部世界接收信息和向外部世界反馈运算结果的手段。对于一台标准的个人电脑，输入设备主要有键盘和鼠标，输出设备则是显示器、打印机以及其他许多后文将要讨论的可连接到计算机上的I/O设备。控制系统将以上计算机各部分联系起来。它的功能是从存储器和输入输出设备中读取指令和数据，对指令进行解码，并向ALU交付符合指令要求的正确输入，告知ALU对这些数据做哪些运算并将结果数据返回到何处。控制系统中一个重要组件就是一个用来保持跟踪当前指令所在地址的计数器。通常这个计数器随着指令的执行而累加，但有时如果指令指示进行跳转则不依此规则。 20世纪80年代以来ALU和控制单元（二者合称中央处理器，即CPU）逐渐被整合到一块集成电路上，称作微处理器。这类计算机的工作模式十分直观：在一个时钟周期内，计算机先从存储器中获取指令和数据，然后执行指令，存储数据，再获取下一条指令。这个过程被反复执行，直至得到一个终止指令。由控制器解释，运算器执行的指令集是一个精心定义的数目十分有限的简单指令集合。一般可以分为四类：1）、数据移动（如：将一个数值从存储单元A拷贝到存储单元B）2）、数逻运算（如：计算存储单元A与存储单元B之和，结果返回存储单元C）3）、条件验证（如：如果存储单元A内数值为100，则下一条指令地址为存储单元F）4）、指令序列改易（如：下一条指令地址为存储单元F）指令如同数据一样在计算机内部是以二进制来表示的。比如说，就是一条Intel x86系列微处理器的拷贝指令代码。某一个计算机所支持的指令集就是该计算机的机器语言。因此，使用流行的机器语言将会使既成软件在一台新计算机上运行得更加容易。所以对于那些机型商业化软件开发的人来说，它们通常只会关注一种或几种不同的机器语言。更加强大的小型计算机，大型计算机和服务器可能会与上述计算机有所不同。它们通常将任务分担给不同的CPU来执行。今天，微处理器和多核个人电脑也在朝这个方向发展史。计算机小型化以来，机械设备的控制也开始仰仗计算机的支持。其实，正是当年为了建造足够小的嵌入式计算机来控制阿波罗1号才刺激了集成电路技术的跃进。今天想要找一台不被计算机控制的有源机械设备要比找一台哪怕是部分计算机控制的设备要难得多。可能最着名的计算机控制设备要非机器人莫属，这些机器有着或多或少人类的外表和并具备人类行为的某一子集。在批量生产中，工业机器人已是寻常之物。不过，完全的拟人机器人还只是停留在科幻小说或实验室之中。机器人技术实质上是人工智能领域中的物理表达环节。所谓人工智能是一个定义模糊的概念但是可以肯定的是这门学科试图令计算机拥有目前它们还没有但作为人类却固有的能力。数年以来，不断有许多新方法被开发出来以允许计算机做那些之前被认为只有人才能做的事情。比如读书、下棋。然而，到目前为止，在研制具有人类的一般“整体性”智能的计算机方面，进展仍十分缓慢。网络、国际互联网20世纪50年代以来计算机开始用作协调来自不同地方之信息的工具，美国军方的贤者系统（SAGE）就是这方面第一个大规模系统。之后“军刀”等一系列特殊用途的商业系统也不断涌现出来。 70年代后，美国各大院校的计算机工程师开始使用电信技术把他们的计算机连接起来。由于这方面的工作得到了ARPA的赞助，其计算机网络也就被称为ARPANET。此后，用于ARPA网的技术快速扩散和进化，这个网络也冲破大学和军队的范围最终形成了今天的国际互联网（Internet）。网络的出现导致了对计算机属性和边界的再定义。太阳微系统公司的John Gage 和 Bill Joy就指出：“网络即是计算机”。计算机操作系统和应用程序纷纷向能访问诸如网内其它计算机等网络资源的方向发展。最初这些网络设备仅限于为高端科学工作者所使用，但90年代后随着电子邮件和万维网（World Wide Web）技术的扩散，以及以太网和ADSL等网络连接技术的廉价化，互联网络已变得无所不在。今日入网的计算机总数，何以千万计；无线互联技术的普及，使得互联网在移动计算环境中亦如影随形。比如在笔记本计算机上广泛使用的Wi-Fi技术就是无线上网的代表性应用。下一代计算机自问世以来数字计算机在速度和能力上有了可观的提升，迄今仍有不少课题显得超出了当前计算机的能力所及。对于其中一部分课题，传统计算机是无论如何也不可能实现的，因为找到一个解决方法的时间还赶不上问题规模的扩展速度。因此，科学家开始将目光转向生物计算技术和量子理论来解决这一类问题。比如，人们计划用生物性的处理来解决特定问题（DNA计算）。由于细胞分裂的指数级增长方式，DNA计算系统很有可能具备解决同等规模问题的能力。当然，这样一个系统直接受限于可控制的DNA总量。量子计算机，顾名思义，利用了量子物理世界的超常特性。一旦能够造出量子计算机，那么它在速度上的提升将令一般计算机难以望其项背。当然，这种涉及密码学和量子物理模拟的下一代计算机还只是停留在构想阶段

西方哲学史发展有几个阶段各有什么特点

西方哲学史是是欧洲哲学的历史，从公元前 6世纪的古希腊罗马哲学到西方现代哲学的发展史。它可分为 4个时期：①公元前6～公元5世纪，称为古希腊罗马哲学；②公元 5～15世纪，称为中世纪哲学；③15世纪中～19世纪40年代，称为近代哲学；④19世纪40年代以来，称为现代哲学。对现代哲学时期的划分，学术界有不同看法，有的把上限划在19世纪末，有的划在第一次世界大战和俄国十月革命后，有的划在第二次世界大战后。