机器之心报道
编辑:Panda W
LLM 很强,而为了实现 LLM 的可持续扩展,有必要找到并实现能提升其效率的方法,混合专家(MoE)就是这类方法的一大重要成员。
最近,各家科技公司提出的新一代大模型不约而同地正在使用混合专家(Mixture of Experts:MoE)方法。
混合专家这一概念最早诞生于 1991 年的论文《Adaptive mixtures of local experts》,三十多年来已经得到了广泛的探索和发展。近年来,随着稀疏门控 MoE 的出现和发展,尤其是与基于 Transformer 的大型语言模型相结合,这种已有三十多年历史的技术焕发出了新的生机。
MoE 框架基于一个简单却又强大思想:模型的不同部分(称为专家)专注于不同的任务或数据的不同方面。
使用这一范式时,对于一个输入,仅有与之相关的专家(Expert)才会参与处理,这样一来便能控制计算成本,同时仍能受益于大量专业知识。因此,MoE 可在不大幅提升计算需求的前提下提升大语言模型的能力。
如图 1 所示,MoE 相关研究增长强劲,尤其是在 2024 年 Mixtral-8x7B 以及 Grok-1、DBRX、Arctic、DeepSeek-V2 等各种产业级 LLM 出现之后。
这张图来自香港科技大学(广州)的一个研究团队近日发布的一篇 MoE 综述报告,其中清晰且全面地总结了 MoE 相关研究,并提出了一种全新的分类法,将这些研究归类到了算法、系统和应用三大类。
论文标题:A Survey on Mixture of Experts
论文地址:https://arxiv.org/pdf/2407.06204
机器之心整理了这篇综述报告的内容主干,以帮助读者了解当前 MoE 的发展概况,更多详情请阅读原论文。此外,我们也在文末整理了一些与 MoE 相关的报道。
混合专家的背景知识
在基于 Transformer 的大型语言模型(LLM)中,每个混合专家(MoE)层的组成形式通常是 个「专家网络」{_1, ... , _} 搭配一个「门控网络」G。
这个门控网络的形式通常是一个使用 softmax 激活函数的线性网络,其作用是将输入引导至合适的专家网络。MoE 层的放置位置是在 Transformer 模块内,作用是选取前向网络(FFN),通常位于自注意力(SA)子层之后。这种放置方式很关键,因为随着模型增大,FFN 的计算需求也会增加。举个例子,在参数量达到 5400 亿的 PaLM 模型中,90% 的参数都位于其 FFN 层中。
用数学形式描述的话:每个专家网络 _ (通常是一个线性 - ReLU - 线性网络)都由 W_ 进行参数化,其接收同一输入 x 并生成输出 _ (x; W_)。同时,参数为 Θ 的门控网络 G(通常由一个线性 - ReLU - 线性 - softmax 网络构成)得到输出 G (x; Θ)。再根据门控函数的设计方式,可以将 MoE 层大致分为以下两类。
密集 MoE
密集混合专家层是在每次迭代过程中激活所有专家网络 {_1, ... , _}。早期的 MoE 研究普遍采用了这一策略。近段时间也有一些研究采用了密集 MoE,比如 EvoMoE、MoLE 、LoRAMoE 和 DS-MoE。图 2a 给出了密集 MoE 层的结构。因此,密集 MoE 层的输出可以表示成:
其中,(x; Θ) 是 softmax 运算之前的门控值。
稀疏 MoE
尽管密集混合专家的预测准确度通常更高,但其计算负载也非常高。
为了解决这个问题,Shazeer et al. 的论文《Outrageously large neural networks: The sparsely-gated mixture-of-experts layer》引入了稀疏门控 MoE 层,其能在每次前向通过时仅激活选定的专家子集。该策略实现稀疏性的方式是计算 top-k 个专家的输出的加权和,而非将所有专家的输出聚合到一起。图 2b 展示了这种稀疏 MoE 层的结构。
根据上述论文提出的框架,可对 2.2 式进行修改以反映稀疏门控机制:
这里解释一下:TopK (・, ) 函数是仅保留向量原始值的前 k 项,同时将其它项设置为 −∞。之后是 softmax 运算,所有 −∞ 项都会变成近似于零。超参数 k 要根据具体应用选取,常见选项是 = 1 或 = 2。加入噪声项 R_noise 是训练稀疏门控 MoE 层的一种常用策略,可促进专家之间的探索并提升 MoE 训练的稳定性。
尽管稀疏门控 G (x; Θ) 可在不增加相应计算成本的前提下显著扩展模型的参数空间,但也会导致负载平衡问题。负载平衡问题是指各专家的负载分布不均 —— 某些专家被频繁使用,而另一些专家则很少被使用甚至完全不上场。
为了解决这个问题,每个 MoE 层都要集成一个辅助损失函数,其作用是敦促每批次的 token 被均匀分配给各个专家。从数学形式描述来看,首先定义一个包含 T 个 token 的查询批次 B = {x_1 , x_2, ... , x_ } 以及 N 个专家。则对于其的辅助负载平衡损失定义为:
其中 D_i 是分配给专家 i 的 token 比例,P_i 是分配给专家 i 的门控概率比例。为了确保该批次在 N 个专家之间均匀分布,应当最小化负载平衡损失函数 L_{load-balancing}。当每个专家都被分配了同等数量的 token D_ = 1/ 和同等的门控概率 P_ = 1/ 时,即达到最优条件:
此时各专家的负载达到平衡。
在后文中,除非另有明确说明,则「MoE」这一术语单指「稀疏 MoE」。
混合专家的分类
为了帮助研究者在大量采用 MoE 的 LLM 研究中找到目标,该团队开发了一套分类方法,根据三个方面对这些模型进行了分类:算法设计、系统设计和应用。
图 3 展示了这种分类法以及一些代表性研究成果。
下面将全面深入地介绍各类别的情况。
混合专家的算法设计
门控函数
门控函数(也被称为路由函数或路由器)是所有 MoE 架构的基础组件,其作用是协调使用专家计算以及组合各专家的输出。
根据对每个输入的处理方法,该门控可分为三种类型:稀疏式、密集式和 soft 式。其中稀疏式门控机制是激活部分专家,而密集式是激活所有专家,soft 式则包括完全可微方法,包括输入 token 融合和专家融合。图 4 展示了 MoE 模型中使用的各种门控函数。
稀疏式
稀疏门控函数在处理各个输入 token 时会激活被选中的部分专家,这可被视为一种形式的条件计算。
门控函数可以实现多种形式的门控决策,比如二元决策、稀疏或连续决策、随机或确定性决策;其已经得到了深入的研究,可使用各种形式的强化学习和反向传播来训练。
Shazeer et al. 的研究《Outrageously large neural networks: The sparsely-gated mixture-of-experts layer》开创性地提出了一种使用辅助负载平衡损失的可微分启发式方法,其中可根据选取概率对专家计算的输出进行加权。这为门控过程引入了可微性,由此可通过梯度来引导门控函数的优化。
后来,这一范式便成了 MoE 研究领域的主导范式。由于这种方法会针对每个输入 token 选择专家,因此可将其看作是 token 选择式门控函数。
以下为这一小节的要点,详见原论文:
token 选择式门控
用于 token 选择式门控的辅助损失
token 选择式门控的专家容量
token 选择式门控的其它进展
不可训练的 token 选择式门控
专家选择式门控
密集式
密集 MoE 是指处理每个输入时都激活所有专家。
虽然稀疏 MoE 有效率方面的优势,但密集 MoE 方向依然在不断迎来创新。尤其值得一提的是,密集激活在 LoRA-MoE 微调方面表现很好,并且 LoRA 专家的计算开销相对较低。这种方法能够有效灵活地集成多个 LoRA 以完成各种下游任务。这能保留原始预训练模型的生成能力,同时保留各个 LoRA 针对各个任务的独有特性。
soft 式
对稀疏 MoE 来说,一大基本离散优化难题是如何决定为每个 token 分配哪些合适的专家。为了确保专家能平衡地参与并尽可能减少无分配 token,这通常必须启发式的辅助损失。在涉及分布外数据的场景(比如推理批次小、有全新输入或迁移学习)中,这个问题尤其显著。
类似于密集 MoE,soft MoE 方法在处理每个输入时也会使用所有专家,从而维持完全可微性,进而避免离散专家选择方法的固有问题。soft MoE 与密集 MoE 的不同在于前者会通过对输入 token 或专家进行门控加权的融合来缓解计算需求。
专家
这一节会介绍 MoE 框架内专家网络的架构,并会讨论协调这些专家的激活的门控函数。
网络类型
自从 MoE 被整合到 Transformer 架构中以来,其通常会替代这些模型中的前向网络(FFN)模块。通常来说,MoE 层中的每个专家都会复制其替换的 FFN 的架构。
这种将 FFN 用作专家的范式到现在依然是主流,但人们也对此做了不少改进。
超参数
稀疏 MoE 模型的规模由几个关键超参数控制,包括:
每个 MoE 层的专家数量
每个专家的大小
MoE 层在整个模型中的放置频率
这些超参数的选择至关重要,因为它会深刻影响模型在各种任务中的性能和计算效率。因此,要根据特定的应用要求和计算基础设施来选择最佳超参数。表 2 给出了一些使用 MoE 的模型的配置情况。
另外,表 3 列举了一些近期的开源模型的参数数量和基准性能。
激活函数
基于密集 Transformer 架构构建的稀疏 MoE 模型采用了与 BERT、T5、GPT 和 LLAMA 等领先的密集 LLM 类似的激活函数。激活函数已经从 ReLU 发展出了 GeLU、GeGLU、SwiGLU 等更先进的选择。
这一趋势也扩展到了 MoE 模型的其它组件,它们经常整合均方根层归一化(RMSNorm)、分组查询注意力(GQA)和旋转位置嵌入(RoPE)等技术。
共享专家
DeepSpeed-MoE 创新性地引入了残差 MoE(Residual-MoE)架构,其中每个 token 都由一个固定专家外加一个门控选择的专家进行处理,实现了每一层都有两个专家参与处理,同时也不会让通信成本超过 top-1 门控方法。这种方法是把门控选择的 MoE 专家当作是固定密集 FFN 的纠错辅助。
NLLB 中使用的条件式 MoE 路由(CMR/Conditional MoE Routing)也采用了类似的方法,将密集 FFN 和 MoE 层的输出组合起来使用。
将固定 FFN 和稀疏 MoE 整合起来的范式通常被称为共享专家,如图 5b 所示。
近期有 DeepSeekMoE、OpenMoE、Qwen1.5-MoE 和 MoCLE 等模型采用这一范式,表明其正在成为一种主流配置。不过 DeepSeekMoE 和 Qwen1.5-MoE 采用了多个共享专家,而不是单个。
混合参数高效型专家
参数高效型微调(PEFT)是一种提升微调效率的方法。简单来说,PEFT 就是在微调时仅更新基础模型的一小部分参数。
PEFT 很成功,但由于其可训练的参数有限以及可能存在的灾难性遗忘问题,该方法难以用于需要泛化到多个任务的情况。
为了缓解这些局限,混合参数高效型专家(MoPE)诞生了,其将 MoE 框架与 PEFT 整合到了一起。MoPE 集成了 MoE 的门控机制与多专家架构,同时每个专家都使用了 PEFT 技术进行构建。这种巧妙的组合能极大提升 PEFT 在多任务场景中的性能。此外,由于使用了 PEFT 来构建专家,因此 MoPE 使用的参数也更少,资源效率比传统 MoE 模型高得多。
MoPE 融合了 MoE 的多任务特性与 PEFT 的资源效率,是一个极具前景的研究方向。图 6 根据在 Transformer 模型架构中的位置对 MoPE 进行了分类。至于 MoPE 方面更详细的研究成果介绍,请参看原论文。
训练和推理方案
混合专家在进步发展,相关的训练和推理方案也在进步发展。
初始的训练和推理方案需要从头开始训练 MoE 模型,直接采用训练的模型配置来执行推理。
但现在,MoE 模型的训练和推理方面已经出现了许多新范式,包括组合密集模型和稀疏模型的优势实现取长补短。
图 7 展示了与 MoE 相关的训练和推理方案,可以看到新出现的方案可分为三类:
密集到稀疏:从密集模型训练开始,逐步过渡到稀疏 MoE 配置;
稀疏到密集:涉及到将稀疏 MoE 模型降格为密集形式,这有利于将推理实现为硬件形式;
专家模型融合:将多个预训练密集专家模型整合成一个统一的 MoE 模型。
MoE 的衍生技术
混合专家(MoE)启发了许多不同的变体技术。举个例子,Xue et al. 的论文《Go wider instead of deeper》提出了模型宽度增大的 WideNet,其做法是将前向网络(FFN)替换成 MoE 层,同时维持 Transformer 层上的共享可训练参数,但归一化层除外。
另外还有 Tan et al. 提出的 SYT(稀疏通用 Transformer)、Antoniak et al. 提出的 MoT(混合 token)、Choi et al. 提出的 SMoP(稀疏混合提词)、Chen et al. 提出的 Lifelong-MoE、Raposo et al. 提出的 MoD(混合深度)等。
总结一下,MoE 衍生技术的发展揭示了一个趋势:MoE 的功能越来越多,越来越能适应不同的领域。
混合专家的系统设计
混合专家(MoE)虽然能增强大型语言模型的能力,但也带来了新的技术挑战,因为其具有稀疏且动态的计算负载。
GShard 引入了专家并行化(expert parallelism),可根据专家能力的负载平衡限制来调度切分后的局部 token,从而实现并行的门控和专家计算。该范式已经成为促进 MoE 模型高效扩展的基础策略。我们可以将该方法看作是增强版的数据并行化 ——MoE 层中的每个专家都被分配到一台不同设备,同时所有设备上都重复配备所有非专家层。
如图 8a 所示,专家并行化的工作流程是按顺序执行以下操作:门路由、输入编码、All-to-All 调度、专家计算、All-to-All 组合、输出解码。
一般来说,GEMM 的输入大小需要足够大,以便充分利用计算设备。因此,要使用输入编码将同一个专家的输入 token 聚合到连续的内存空间中,这由门路由中的「token - 专家映射」决定。之后,All-to-All 调度的作用是将输入 token 分发给各设备上对应的专家。之后是专家的本地化计算。计算完成后再通过 All-to-All 组合汇总,然后解码输出,根据门控索引恢复原始数据的布局。
此外,也有研究者探索专家并行化与其它已有并行策略(比如张量、管道化、序列并行化)的协同,以提升 MoE 模型在大规模分布式环境中的可扩展性和效率。
图 8 中给出了一些混合并行化示例,包括 (b) 数据 + 专家 + 张量并行化、(c) 数据 + 专家 + 管道并行化、(d) 专家 + 张量并行。
需要认识到,计算效率、通信负载、内存占用之间存在复杂的相互作用,分布式并行化策略的选择会对其产生影响,并且也会被不同的硬件配置影响。因此,在部署用于实际应用的策略时,必须细致地权衡考虑并针对具体场景进行调整。
之后,该团队分计算、通信和存储三大板块介绍了 MoE 模型开发所面临的系统设计难题以及解决这些难题的研究成果,详见原论文。表 4 给出了开源 MoE 框架的概况。
混合专家的应用
在当前 Transformer 主导的大型语言模型(LLM)领域,混合专家(MoE)范式颇具吸引力,因为其能在不给训练和推理阶段引入过大计算需求的前提下大幅提升模型能力。这类技术能显著 LLM 在多种下游任务上的性能,甚至造就了一些超越人类水平的 AI 应用。
有传言说强大如斯的 GPT-4 可能也采用了某种 MoE 架构 —— 由 8 个 2200 亿参数的专家构成,在多样化的数据集和任务上完成了训练,并使用了一种 16 次迭代的推理过程。有关该传言的更多详情可参阅机器之心报道《终极「揭秘」:GPT-4 模型架构、训练成本、数据集信息都被扒出来了》。
所以,毫不奇怪 MoE 在自然语言处理、计算机视觉、推荐系统和多模态应用中遍地开花了。
这些应用本质上就需要使用条件计算来大幅提升模型的参数量,以此增强模型在固定计算成本下的性能,或通过门控机制实现动态专家选择来实现高效多任务学习。
该团队也介绍了这些不同领域的代表性 MoE 应用,可帮助读者理解如何将 MoE 用于具体任务。详见原论文。
挑战与机遇
混合专家,功能强大,降低成本,提升性能。前景虽好,仍有挑战。
这一节中,该团队梳理了 MoE 相关的关键性挑战,并指出了有希望获得重要成果的未来研究方向。下面简要列出了这些挑战和研究方向,更多详情请查看原论文。
训练稳定性和负载平衡
可扩展性和通信开销
专家的专业化和协作
稀疏激活和计算效率
泛化和稳健性
可解释性和透明性
最优的专家架构
与现有框架整合
有哪些项目的前三都是一个国家的
我找到了,哈哈。 个人信息就不上传了,只传关键的。 嵌入式汽车身份自动识别系统一、项目介绍(研究目标、研究背景及现状、工作原理和方案设想、计划进度安排等)见附录。 二、项目自我评价1、先进性:在数字信息技术和网络技术高速发展的后PC时代,随着嵌入式处理器性能的不断提高,高性能的处理器已经能满足复杂算法应用和其他复杂功能应用,嵌入式将不可避免得走进各个领域。 另一方面,伴随着我国经济的快速发展和北京奥运会的举行,“交通智能化”将毋庸质疑的成为热门话题。 由于交通行业的特殊性,其对ITS设备的技术参数、使用条件都有苛刻的要求,而嵌入式恰好能够满足此要求,因此嵌入式智能交通设备的大范围应用是必然趋势。 嵌入式汽车身份自动识别系统是智能化交通管理系统的重要组成部分,是嵌入式技术与汽车身份识别技术的完美结合,他涵盖了嵌入式车牌识别、嵌入式车标识别以及汽车颜色识别三大主体功能,力求将汽车目标一次性锁定。 它拥有以下优点:1、高度独立:使用嵌入式技术,仅通过通信接口与应用系统连接,独立性高。 2、功能齐全:同时识别汽车车牌、车标及颜色,一次性锁定目标,具有现有系统所没有的强大功能。 3、可塑性强:前端可与信号触发装置等上游产品结合,末端内置无线网络及多种串口接口以便与下游产品结合。 系统功能与使用范围得到极大拓展。 4、易于维护:修理、维护仅涉及本系统而不影响其他模块,维护成本远低于同类产品。 5、便携灵活:设备高度集成,小巧灵活,使用方便。 2、可操作性和可实现性:目前,车牌识别、车标识别等技术日趋成熟与完善,相关资料较易获取。 现有的嵌入式技术也比较成熟。 故,从技术难度上讲该选题较于其他的前沿科学容易实现。 选题所涉及的设备和材料也较易获得,且成本适中。 3、创新点:现有的车牌识别装置一般使用电脑处理数据,有些甚至需要若干台电脑合作完成,占用大量空间与资源。 即使偶有由嵌入式完成的系统其功能也仅限于车牌识别或车标识别。 本系统创造性地将嵌入式与车牌识别、车标识别以及汽车颜色识别相结合,一次性解决了目前设备体系臃肿、集成难度大、稳定性差,维护难,功能单一等问题。 4、可能存在的问题:目前,主要问题是嵌入式集成度及无线传输的距离。 我们所设想的理想情况是:针对现在大多使用电脑整机处理数据,设备灵活性差的缺点,开发出便携式、数据可无线传输的汽车身份识别系统。 但是由于我们时间、精力和资金的限制,“便携的程度”是目前最大的难题。 另外车速与景深对图像识别的影响问题也是我们可能会面对的难题。 三、预期成果(成果的具体形式,如:申请专利、公开发表论文、制作科技实物(含软件程序)等,可以同时有多种成果形式)我们预计我们的实验成果有以下几个方面。 首先,我们计划制作出科技实物,即确实地完成该嵌入式系统,拿出实实在在的成果。 第二,从我们对市场现状的分析来看,该嵌入式汽车身份识别系统的市场前景非常乐观,故可以将我们的产品申请专利并投入市场进行生产。 第三方面,由于汽车颜色、车牌、车标的组合识别还没有合适的算法,所以在完成本系统的过程中我们不可避免的要完成算法设计,而这部分成果可以通过公开发表论文的形式进行展示。 因为我们计划完成一个系统,所以我们需要同时完成该系统的硬件和软件两个部分。 从大的角度来看,软件及算法部分的成果可以通过论文发表,而硬件方面的成果则可以通过投入生产和申请专利来体现。 无疑,我们的成果形式会比只做软件部分或者只做硬件部分的选题多。 这也是我们的一大优势。 实验环境要求经费预算 内容 用途 预算金额 预计执行时间 CCD摄像部分 前端图像的获取,购买摄像头或摄像机 .12~ 08.2月 辅助光源 针对特殊环境进行光线补充 1500 07.12~ 08.2月 图像采集卡 模拟信号数字化 2500 07.12~ 08.2月 嵌入式系统硬件设施 图像的处理 4000 08.3~ 08.10月 硬盘录像机 视频信息的存储 2500 08.10~ 08.12月 显示装置 输出图像识别结果 1500 08.12~ 09.2月 无线收发或有线传输装置 信息的传输 2500 09. 2~ 09.3月 机械加工 机械零件组装成样机 2000 最后阶段 合计元学院审批意见专家委员会评审意见学校审批意见附录一:选题的现状、背景及意义自1885年,世界上第一台汽车诞生至今,汽车为我们日常工作与生活的带来了翻天覆地的影响。 一百多年来,汽车以其价格低廉,操作方便等优势逐渐被大众所接受,走入了千家万户。 在我国,每年都有许多人加入有车一族。 随之而来的自然是越来越快捷方便的生活方式以及由此引发的一系列问题:汽车盗窃案每年逾万,交通事故时有发生……无疑,汽车需要规范管理。 现在,我国的大部分汽车管理工作都是由人来操作完成的。 不难想象,面对越来越庞大的汽车队伍,人工操作明显的力不从心。 所以“交通智能化”将成为未来交通管理的必然趋势。 要实现交通智能化怎么可以没有“汽车身份”的识别呢。 早在上个世纪九十年代初,汽车身份识别已经引起了全世界的广泛重视,人们开始研究有关汽车身份证——汽车牌照自动识别的相关问题。 几年后,汽车的另一个重要的身份象征——汽车标志识别也成为了热门话题。 车牌识别的一般途径为:采用计算机图象处理技术对车牌进行分析后自动提取车牌信息以确定车牌号。 车标识别则基于边缘直方图和模板匹配相关系数混合的算法。 目前车牌与车标识别的理论已经成熟,离线算法识别率已经达到较高的水平,同时正向着集成化、智能化方向发展。 在智能化交通管理系统中,汽车身份识别相当于vc++中的“基类”地位,即智能化交通管理系统中的其他子模块需要在汽车身份识别的基础上进行继承和发展。 所以我们认为,汽车身份识别要求较高的集成度,最好能由可以嵌入到其他系统中的、集成度高的模块来完成,如单片机、CPLD。 而现阶段的汽车身份识别大部分却是依靠计算机来完成的。 另外,由于汽车身份识别的“基类”定位,使用时对“能否唯一的锁定汽车”以及“能否很快地判定是哪辆车”就有了一定的要求。 而现阶段的汽车身份识别却仅依靠单纯的识别车牌来完成。 市场上存在的也多是车牌或是车标的单独识别系统,将二者结合的系统则非常罕见。 而这些单一的系统显然很难达到真正的识别锁定汽车身份的目的。 结合智能化交通管理系统的要求,现今汽车身份识别的现状以及二者的发展趋势,我们小组选择了嵌入式汽车身份自动识别系统作为我们本次创新实验计划的选题。 我们计划以嵌入式完成汽车身份识别后,将处理完的数字信息传递到智能化交通管理系统的其他模块中。 用嵌入式代替电脑处理汽车身份识别将大大提高智能化交通管理系统的集成度,降低成本。 区别于单一的识别系统,我们设计完成的汽车身份识别系统将车牌识别与车标识别相结合,并辅以汽车颜色识别。 同时识别,同时输出,从而从多方面判断并锁定汽车,力求达到万无一失。 从而极大地方便了该系统在各个领域的使用。 公安交管领域,该嵌入式汽车身份自动识别系统可被应用在交管系统中。 将本产品嵌入到用来测速、测超载的其他交通设施中,就可以完成一系列的管理工作;与终端电脑处理系统相连,传输的是已经经过处理的数字信息而非图片信息,大大节省了终端电脑的处理时间和内存空间,提高反应速度与处理效率,有效解决交管领域人手不足的现状。 在园区车辆管理方面,本嵌入式汽车身份自动识别系统将留有端口,使其可以与园区的业主入住时所登记的汽车信息库相连。 在园区大门处,安装我们的车牌自动识别系统,以对进出车辆自动识别,然后将数据传到数据库并根据数据库中的车牌数据判断是否是园区内的车辆,然后分情况处理。 这将大大增加园区汽车的安全系数,而使用该系统的成本远低于使用电脑处理的系统的成本。 关于停车场管理,我们的嵌入式车牌自动识别系统可以完成智能化管理过程。 将系统安装在停车场的出、入口处,用来对进出停车场的车辆进行自动识别,而处理后的数据将传入终端电脑,由终端电脑结合传入的信息与数据库判断是否属已买(或租)车位的车辆做出相应处理。 综上,我们有理由相信我们计划完成的嵌入式车牌自动识别系统可以在未来的交通智能化管理系统中发挥举足轻重的作用,是值得去研究和探索的。 附录二:工作原理及方案设想本汽车身份识别系统包含车牌识别、车色以及车标的识别,本系统将使用嵌入式系统完成此三部分的识别。 由于我们刚接触这部分内容,所以想法不是很成熟。 下面将分车牌识别与车色、车标识别以及嵌入式三个部分介绍我们的工作原理和方案。 第一部分:车牌识别1、总体结构 车牌自动识别系统主要分为三大模块:(1)触发:即前端设备的数据入口处,如测速系统等。 (2)图像处理部分:分为图像采集、车牌定位、字符分割和字符识别四部分。 (3)无线传输系统将所处理得的数据传送至后端应用系统,如交通违规管理系统,只能停车场系统,安检系统等。 2、算法部分①前端CCD摄像机:原始图像获取由CCD摄像机及辅助照明装置组成。 获取图像质量的好坏直接影响到后端处理和识别的效果. 要获得比较清晰的图像, 需要考虑许多影响图像质量的因素, 主要包括: 摄像头和图像卡的选取, 摄像机的位置标定, 汽车的车速, 出入单位的汽车车队之间的距离, 天气、光线等情况对摄像机所摄图像曝光量的影响。 判断是否有车辆进入观测区采用图像差值法来判断监测区是否有目标进入,即首先将视频图像灰度化,然后比较两幅图像对应像素点的灰度值,看是否有变化以及变化有多少。 图像差分只能测定监测区中是否有物体经过,但它是否交通车辆,尚未可知。 鉴于图像差分所产生的噪声、行人、自行车比汽车所占区域小得多,设计尺度滤波器将尺度较小的物体及噪声滤掉。 ②车牌定位及预处理左图为车牌定位的主要算法。 完成基本的车牌定位后,还需要对车牌进行一些基本的预处理。 包括倾斜矫正与铆钉和边框的去除。 I、车牌字符的倾斜矫正车牌字符分割的难点在有些车牌是倾的,直接分割效果不好,需要做校正。 首先求出车牌的倾斜率,根据此斜率对车牌做旋转校正。 II、车牌边框和铆钉的去除先验知识:对于标准车牌,字符间间距为12mm,第2、3个字符间间距为34mm,其中,中间小圆点l0mm宽,小圆点与第2、3个字符间间距分别为12mm。 在车牌边框线的内侧,通常有四个铆钉,他们不同程度地与第2个字符或第6个字符粘连,如果不去除铆钉,将给第2和第6在字符的识别造成困难。 将车牌图像进行二值化后,图像仅黑、白二值。 白色像素点(灰度值255)取1,黑色像素点(灰度值0)取0,这里采用的是白底黑字模式。 对车牌图像逐行进行从内向外式扫描,当扫描到车牌图像某一行中,白色像素点的宽度大于某一阀值时(第一个符合条件的行),则认为是车牌字符的边沿处,切除这一行以上或以下的所有行。 ③车牌字符分割右图为车牌字符分割的主要算法。 在此,由于我们的知识有限就不对这些算法做具体介绍了。 ④字符识别方法字符识别是车牌识别的核心部分。 常见的车牌字符识别算法包括六种。 我们将他们罗列在右图中。 其中,我们比较感兴趣的是基于神经网络的字符识别算法。 下面,我们具体介绍两种比较简单且普遍的算法以及基于神经网络的字符识别算法。 I、模板匹配车牌字符识别中国车牌的字符模板分为汉字、英文字母和数字模板,由统计方法构造并保存到数据库中。 模板匹配是将字符模板和标准化了的车牌字符进行匹配来识别字符。 II、特征匹配车牌字符识别车牌识别的方法中,可利用的字符特征很多,大致可以分为结构特征、象素分布特征及其他特征。 在这里,我们拟重点突破神经网络法,因为人工神经网络技术具有非线性描述、大规模并行分布处理能力、高度鲁棒性和自学习与联想等特点,适用于非线性时变大系统的模拟与在线控制。 具体步骤如下图所示: 此外,我们还会尝试将各种算法结合起来,以扬长避短,如:将遗传算法与人工神经网络结合起来,既能利用遗传算法能并行计算且能快速、全局搜索的优点又能克服神经网络固有的搜索速度慢且易陷入局部旱热的缺点等。 由于我们还在大学二年级学习专业基础课程,对图像处理的最新算法还不够了解,我们会在实际操作过程中,选择一种最优的方案并且结合我们的系统特征提出改进意见。 第二部分:车色以及车标识别①、车身颜色识别颜色特征具有对图像本身的尺寸、方向、视角等依赖小、鲁棒性高等优点,因此在基于内容的图像索引技术和智能交通系统以及众多的I业(如造纸、纺织、印刷等)系统中有着极其重要的应用。 长期以来,由于各种原因,人们提出了数量众多的彩色空间模型,主要可分为三类:第一类是基于人类视觉系统(HumanV isionS ystem,H VS)的彩色空间,它包括RGB,H SI,M unsell彩色空间等;第二类是基于特定应用的彩色空间,它包括电视系统中所采纳的YUV和YIQ、摄影行业如柯达的YCC、打印系统的CMY (K)彩色空间;第三类是CIE彩色空间(包括CIE XYZ, CIE Lab和CIE Luv等)。 这些彩色空间各有优缺点,它们在各自的领域里发挥了重要的作用。 我们拟采用RGB彩色空间完成我们的系统。 RGB彩色空间在计算机相关领域里应用广泛,例如用于常见的CRT显示器等。 在RGB彩色空间中,各彩色值用R、G、B三通道值的组合来共同表示,而其相应的通道值是通过图形采集卡或者CCD传感器等类似器件中的光感受器来获得的。 其中,各通道值用入射光及其相应光感受器的光敏函数值之和来表示:R=G=B=其中,S (A)是光谱,R(A)、G(A)和B(A)分别是R,G,B传感器的灵敏度函数。 从上式可以看出,该彩色空间是设备相关的,它与具体捕获设备的光敏函数相关。 然而,由于RGB值易于获得和在计算机中计算和表示,因此通常可以用来表示其他各彩色空间,即把RGB值转换为其他彩色空间值。 RGB彩色空间的标准色差定义为:)由于不同的彩色对人主观感受的影响不同,为了更好的表示色差,在本颜色识别子系统中使用经验色差公式:对于我们拟设计的车身颜色识别系统主要分以下四大步骤完成车身颜色识别1.识别区域的选取为了准确识别出车身颜色,识别区域的选取至关重要。 本实验选取车脸前部靠近排气扇的部分2.颜色直方图计算对所选区域,计算出现次数最多的颜色。 在实际应用中,由于其他彩色空间模型的分量值均可用RGB值来表示,为了计算简便,在计算颜色直方图时可仅针对RGB彩色空间模型进行。 3.色差计算根据相应彩色空间模型的色差计算公式,计算其与颜色模板间的色差。 4、颜色识别在得到样本色与标准色在各个彩色空间模型中的对应色差后,就可以根据其结果进行颜色识别。 即选取前一步计算得到的色差中的最小值,作为识别结果。 ②、车标识别部分毋庸质疑,车牌和车标的自动、实时识别是运动车辆类型精确识别系统中至关重要的两个部分。 目前人们已经提出了众多的车牌定位算法,主要可以分为两大类:基于黑白图像的车牌定位算法和基于彩色图像的车牌定位算法。 基于黑白图像的车牌定位算法又可以分为多类,如基于特征的车牌定位算法基于自适应能量滤波的车牌定位算法,基于小波变换和形态学处理相结合的车牌定位算法,基于二值投影的车牌定位算法,以及基于遗传算法的车牌定位算法等。 这些车牌定位算法各有优缺点,但他们都可以在一定程度上作为车标定位的参考。 车标定位与识别无论在国内还是国外都是一个较为崭新的领域。 由于车标本身固有的特殊性:目标小、相似性大、受尺寸和光照影响大、背景不统一,以及不同汽车公司的车标形状大小不一致等,使得其精确定位识别成为一个难点。 我们将车标识别分为以下几个主要步骤:(l)车牌定位:根据车牌的纹理特征,基于多分辨率分析快速获取车牌区域 ;(2)车头定位:根据车头区域能量较高且较为集中的特点,通过OTSU二值化算法 进 行 图像二值化,然后利用二值投影,并结合车牌位置信息进行车头快速定位 ;(3)中轴定位:在车头区域内,根据轴对称性定位车头中轴;(4)车标粗定位:在定位出车头的基础上,根据车标与车牌的先验知识,得到车标经验搜矩形;(5)车标精确定位:在第(4)步的基础上,利用车标纹理特征进行车标的精确定位。 主要包括两步:一是根据车标区域在垂直方向上具有能量高且相对集中的特点,利用能量增强和自适应形态学滤波进行车标的一次定位;二是利用改进的模板匹配算法进行车标的精确定位。 车标识别系统是运动车辆识别系统中的重要组成部分,与车牌识别一样,它也包括了定位和识别两项关键技术。 上图为车标识别系统结构示意图,与典型的目标识别系统一样,它包括了离线的训练过程和在线的识别过程。 在训练过程中,首先将手工采集得到的车标样本进行图像归一化、尺度归一化等预处理,然后分别进行模板提取以得到车标标准模板库。 车标标准模板库中的模板不仅用于车标定位,还用于进行特征提取以得到车标特征模型库用于车标识别。 在定位过程中,除了输入汽车图像外,还需输入车牌的位置信息。 这是因为各类车标不具有稳定的纹理特征,且大小、形状各不相同,所以在复杂的背景下直接利用特征匹配或模板匹配进行车标定位是非常困难的。 因此必须利用车牌位置、车辆对称性等先验信息进行粗定位,在此基础上再利用相关图像处理技术和模板匹配进行精确定位。 车标定位以后,车标识别问题就转化为一个2D形状的识别问题,这可以通过模板匹配的方法实现。 但是在实际采集的图像中,往往存在光照、噪声、部分遮挡和形状相似等问题的影响,常规的模板匹配方法难以达到满意的识别效果。 因此通常还需要一种合适的特征提取和识别方法来辅助进行车标识别,以提高系统的识别率。 第三部分:嵌入式按照历史性、本质性、普遍性要求,嵌入式系统应定义为:“嵌入到对象体系中的专用计算机系统”。 “嵌入性”、“专用性”与“计算机系统”是嵌入式系统的三个基本要素。 对象系统则是指嵌入式系统所嵌入的宿主系统。 嵌入式系统的核心是嵌入式微处理器,它有4个优点: (1) 对实时和多任务有很强的支持能力,能完成多任务并且有较短的中断响应时间,从而使内部的代码和实时操作系统的执行时间减少到最低限度; (2) 具有功能很强的存储区保护功能。 (3) 可扩展的处理器结构,可以迅速地扩展出满足应用的高性能的嵌入式微处理器;(4) 嵌入式微处理器的功耗很低,尤其是用于便携式的无线及移动的计算和通信设备中靠电池供电的嵌入式系统更是如此,功耗只能为 mW甚至μ W级,这对于能源越来越稀缺昂贵的时代,无疑是十分诱人的。 另外,嵌入式实时操作系统提高了系统的可靠性。 这些都值得我们去做一个嵌入式车牌识别系统。 考虑到通常车牌以及车标识别算法的运算量大,同时又要满足实时性要求。 因此,我们准备采用32位ARM嵌入式微处理器作为核心单元,以CPLD作为时序控制单元,采用基于ARM 9 S3C 241 C的嵌入式图像采集处理系统,在内嵌Linux操作系统的草础上,充分利用了ARM器件体积小、能力强以及功耗低的特点,实现并行数据总线/USB日接口图像接入、图像快速处理、图像信息的本地压缩存储和IP化数数据传输。 该系统可使整个系统简化电路并且减少占用资源。 系统设计构成整个系统由USB图像采集子系统,ARM处理子系统和网络数据传输子系统成摄像头采集现场视频数据通过U SB传输至ARM处理板;ARM处理板内嵌Linux操作系统,采用快速图像算法对图像序列进行处理,并根据处理结果采取相应的措施;网络传输子系统可以处理数据上传监控中心做进一步后续处理,系统结构下图所示。 ARM图像处理子系统拟采用S3C 2410处理器,能满足图像处理速度的要求;USB图像接入,可以保证图像传输速度;扩展64MSD RAM与64MFlash,大容量的RAM能够保存多幅图像,便于图像的分析与处理;无线网络接口实现了数据信息的网络化管理。 当然,以上只是我们的初步设想这些设想都将在我们以后的大量实验过程中得到论证和优化!附录三:计划进度与安排计划进度安排:1.用约15天时间买一些实验所需的基本用品。 2.利用课余时间学习所需知识。 3.用约七个月时间完成编程,解决软件方面问题。 4.用约一年完成硬件方面,并制作样机。 5.初步检查,花费约一个月。 6.以六个月时间调试样机,发现缺陷并修正。 反复试验,直至达到一个令人满意的水平。 综上,我们是计划用两年左右的时间拿下这个项目。 当然,以上只是大体计划,以后会随实验的实际进度进行适当调整。
中国数学教育的中国数学教育的传统与发展初探:教科书视角
众所周知,数学教科书作为数学课程的主要载体,是数学教育得以落实的主要渠道,不同时期的数学教科书往往在很大程度上真实地反映了当时数学教育的理论水平和实践状况:数学教科书不仅是数学教育思想观念的真实写照,而且数学教科书的质量和水平真实地反映了社会的发展状况和人的精神面貌;数学教科书的质量和水平不仅能够真实地反映出数学教育研究的实际水平,而且能够较为全面地折射出数学课堂教学的实际。 特别地,数学教科书改革是数学课程改革的核心工作,也是数学教育历次改革发展的焦点之一。 本文试图从中国中小学数学教科书发展的基本脉略,洞察中国中小学数学教育发展的基本脉络和轨迹。 一、 中国古代数学教科书的突出特征(一)中国古代数学教育发展的基本脉络古代中国是世界上进行数学教育最早的国家之一:我国从原始公社制末期到奴隶制社会初期,已经逐岁建立起专门的教育机构——学校。 据古籍记载和殷墟甲骨文考证,商朝已有较完备的学校教育。 而西周已注重数学教育,数学已成为“国子”的必修课程之一。 相传周公制礼(相当于现在的宪法)《周官、保氏(负责教育的官员)》上说:“救国子以六艺,一曰礼,二曰乐,三曰射,四曰御,五曰书,六曰数”。 到了隋唐王朝,数学教育又有了新的进步。 唐初国子监内没有设立“算学”,656年(显庆元年)始添设算学馆, 李淳风作为唐高宗朝官太史令,受诏与国子监算学博士粱述、太学助教王真儒等校注和编定《周髀》、《九章》等十部算经,作为全国通用的数学教科书。 当然,算学博士的官阶是从九品下(官阶中最低的一级)。 算学学生学习“十部算经”年数过多,教学效率不高。 宋元时代的朱世杰堪称中世纪世界最伟大的数学家。 他曾周游五湖四海20多年,长期靠教授数学为业。 他的《算学启蒙》(1299年)和《四元玉鉴》(1303年)是我国古代数学发展史的重要里程碑。 1487年开始,明清推行八股文科举考试制度,这对数学教育起了很坏的作用,也是使中国本土数学高呼向低潮的重要原因之一。 (二)中国古代数学教科书的突出特征古代中国在数学教育方面开始很早,而且独具特色:第一个特色是数学教育始终置于政府的控制之下,远在周代,数学就作为“六艺”之一,列入贵族子弟教育的内容。 唐代中期以后,“十部算经”由国家颁布用于国子监,并作为科举考试所依据的经典。 数学典籍的编纂、增修和注释一般是在政府官员的主持下进行的。 这种实施数学教育的做法,在世界史上是少见的,这无疑对社会进步和科学技术发展都产生了积极的影响。 第二个特色是带有技术教育的性质,官办数学教育的目的是为政府培养专业计算人员。 基于以上分析,我们认为, 在中国古代的数学教育中,作为数学教科书出现的材料具体体现出如下特点:1.实用——经世致用:中国古代的数学著作大多数是为了指导实践,必然考虑到如何便于教给人们掌握,较为注重由浅入深,举一反三,都可以作为数学教材。 尽管中国古代数学著作很多,如明代的商业数学,吴敬《九章算法比类大全》(1450)等等。 但是,古代中国数学教科书总体上具有《九章算术》的特征。 从《九章算术》的内容可以看出,它是以应用问题解法集成的体例编纂而成的书,几乎包括了当时社会生产和生活的各个领域。 其目的是解决当时社会生产和生活所提出的各种计算问题,为当时社会各个领域中的应用服务。 2.应用问题集:强调相对系统的实用数学问题的解决。 以《九章算术》为例。 《九章算术》的全部理论是以寻求各种应用问题的普遍解法为中心的,一个具有浓厚的“应用数学”色彩的开放性的归纳体系,这种表述体系是按照由个别到一般的推导方式建立起来的:通常是先举出某一社会生活领域中的一个或几个个别问题,从中归纳出某一类问题的一般解法,即算法(术);再把各类算法综合起来,得到解决该领域中各种问题的方法,从而构成一章;最后,把解决社会生产生活各领域中问题的数学方法全部综合起来,就得到整个《九章算术》。 这种归纳的特点还有另一层含意,即按照解决问题的不同数学方法进行归纳。 许多不同领域的实际问题可能需用相同的计算方法,从这些方法中提炼出数学模型,最后再以数学模型立章写入《九章算术》,盈不足、方程、勾股三章[①]就是如此([①]刘徽著,李淳风注释.九章算术[M],上海:上海古籍出版社,1990年)。 这与《几何原本》追求逻辑的完美形成了鲜明的对照。 3.开放的归纳体系——缺乏系统的逻辑体系和符号体系。 《九章算术》以归纳为主的叙述方式,与古希腊数学代表著作欧几里得的《几何原本》以演绎为主的叙述方式有明显不同。 以后的中国古代数学著作,大都采用这种以归纳为主的叙述方式。 这也是中国古代数学的一大特色,并反映出古代中国人的思维方式。 正如吴文俊先生指出的:“《九章算术》和《几何原本》东西辉映,是现代数学思想的两大源泉(吴文俊.《九章算术注释》序,载:白尚恕著.九章算术注释[M],北京:科学出版社,1988年:第1页)。 吴先生在几何定理的机器证明领域所取得的成就,正是以《九章算术》为代表的中国传统数学特色在现代条件下的发扬光大。 值得一提的是,值得提出的,中国古代也强调逻辑。 但是,这里的“逻辑”与古希腊以“三段论”为代表的演绎逻辑有所不同,而是一种自然的逻辑,其体系并不是相对完整的。 总之,中国传统数学最本质的方法是归纳,认识过程是由特殊到一般,在数学教育的方法上强调启发式,强调对一些典型问题反复思考,举一反三,从中体会一般法则。 中国传统数学的特点和数学教育的目的,决定了数学教育的内容是为传授应用技能而设计的,在思想和方法上采取了注重应用、以问题为中心、以算法为基础、主要依靠归纳思建立数学模型、强调基本法则及其推广的一整套模式。 二、 “西学东渐”对中国数学教科书的影响“西学东渐”是指近代西方学术思想向中国传播的历史过程,其虽然亦可以泛指自上古以来一直到当代的各种西方事物传入中国,但通常而言是指在明末清初以及晚清民初两个时期之中,欧洲及美国等地学术思想的传入。 明朝万历年间,随着耶稣会传教士的到来,对中国的学术思想有所触动。 1605年利玛窦辑著《乾坤体义》,被《四库全书》编纂者称为“西学传入中国之始”。 清朝政府在1860年代开始,推行了洋务运动,当时的洋务人士,主要采取“中学为体,西学为用”的态度来面对西学。 甲午战争以后,大量的西方知识传入中国,影响非常广泛。 许多人以转译日本人所著的西学书籍来接受西学。 进入民国时期,由于对政治的不满又进一步导致知识分子们提出全盘西化的主张,在五四时期这种思想造成了很大的影响。 1850年以后,西洋资本主义国家的近代数学教科书被介绍进来了,中国的数学教育逐渐走上了世界化的道路。 西学东渐对中国中小学数学教育影响过最大的莫过于《几何原本》。 利玛窦和徐光启合译的欧几里得的《几何原本》,第一次把欧几里德几何学及其严密的逻辑体系和推理方法引入中国,同时确定了许多我们现在耳熟能详的几何学名词,如点、直线、平面、相似、外似等。 他们只翻译了前6卷,后9卷由数学家李善兰与英国人伟烈亚力(Alexander Wylie)等人在1857年译出,同时,翻译了《代数术》《代微积拾级》等著作,为符号代数及微积分首次传入中国。 此外,数学家华衡芳在19世纪60年代以后与傅兰雅合作译了不少著作,介绍了对数表、概率等新的数学概念。 清末新式学堂中的数学教材多采取于两人的著作。 到20世纪初,随着留外学生的增加,西方数学大量传入中国,至1913年北京大学成立数学门,为第一个专门的数学的学术教育单位。 三、 20世纪初期中国中小学数学教科书的基本特征我国近代学校教育,始于1862年(同治元年)设同文馆于北京。 清末兴办学堂时期,没有系统的学制,数学教科书多用外国传教士编译的教本,如《代数备旨》、《形学备旨》、《八线备旨》、《代形合参》等。 1902至1910年这一时期,中学数学教科书以翻译本居多,亦出现我国自编的一些教本,但质量较差。 1911年中华民国成立,不久便颁布新学制,中学为四年制,配有统一的课程标准。 我国自编的数学教科书开始有计划有系统地出版。 主要有《共和国教科书》、《民国新教科书》等。 主要编纂人有秦沅、秦汾、寿孝天、骆师曾、黄元、吴在渊等人。 1922年11月我国进行学制改革,实行六三三学制。 新学制课程标准起草委员会拟定了初中算学,高中代数、几何、三角及解析几何大意课程纲要。 其中,初中数学课程采用混合法讲授。 以代数几何为主,算术、三角为辅,合一炉而冶。 为此出版了《新学制混合算学教科书》(段育华编,六册,1926),以及傅种孙先生编写的《初级混合数学》。 但不少学校对混合讲授持有异议,坚持分科讲授。 为此,商务印书馆又出版一套现代初中教科书,包括算术、代数学、几何和三角术。 其中代数学(两册)是由吴在渊(1884~1935)编写的。 1928年我国开始制订中学课程标准。 先公布了暂行标准,经征求意见修订后,1933年前后公布中小学正式课程标准,使我国中学教育逐步走上较正规的发展道路。 根据课程标准,吴在渊编写了《高级中学几何学教科书》(上、下册)。 随着课程标准的修正,这部教材在吴在渊去世后经人修改,继续出版。 如署名吴在渊、张鹏飞的《修正课程标准适用 ·高中平面几何学》(上、下),署名吴在渊、陶鸿翔的《修正课程标准适用·高中立体几何学》,在40年代末尚在流行。 值得注意的是,1932年起吴在渊根据新课程标准还编写了一套“中国初中教科书”,包括《初中算术》(一册)、《初中代数》(上、下)、《初中几休学》(上、中、下)、《初中三角》(一册),由上海中国科学图书仪器公司出版。 这套教材一直出版到40年代末,1947年12月出11版。 其中,《初中几何学》一改过去模式,全书分为实验几何学和理论几何学两大部分。 先讲实验几何之目的在于“为理论作前驱,尤在使学生自动觉察,若有种种图形性质,隐跃于心目间,呼之欲出”。 这是我国20世纪三四十年代中学几何教材改革的一个突出特点。 值得一提的是,民国初年我国的数学教学大多采用注入式,“教员讲,学生听;教员写,学生抄;教员做,学生看”。 教学方法上的注入式之弊端尚不为广大教育工作者所重视。 而其原因是多个方面的。 四、 20世纪50、60年代的中国中小学数学教科书的发展众所周知,1949年,以中国共产党为核心的中国新政府开始运行。 至今已经开展了八次大规模的中小学数学教育改革。 20世纪五、六十年代,是中国自20世纪50年以来数学教科书发展的第一阶段,其突出特征是:关注双基,突出“教”材特征。 其间,先后进行过三个大的改革发展:(一)1949-1952年的第一次课程教材改革新中国成立后,1949年12月教育部召开第一次全国教育工作会议,从此开始了我国第一次课程改革。 这次改革是教育部门自上而下进行的,实行对旧课程的改造,初步确立了我国中小学新课程体系,形成了全国统一教学计划、统一教学大纲与统一教科书的“大一统”课程模式。 1950年8月教育部颁发《中学暂行教学计划(草案)》,这是新中国成立后的第一个教学计划;同年9月,在全国出版会议上提出中小学教材必须全国统一供应的方针,并成立人民教育出版社,承担编写国家统一教材的任务,于1951年出版了第一套中小学全国通用教材。 1951年10月,政务院颁发了《关于改革学制的决定》,重新规定了中小学的学制, 规定小学实行五年一贯制,取消初高两级分段制,中学修业年限为六年,分初高两级,各三年。 根据学制的要求,1952年3月教育部颁发了小学和中学暂行规程,这是新中国成立后颁发的第一个全面规范中小学课程的政府文件。 这一时期的中小学课程教材的突出特点是:强调中央集权,全国统一,只设必修课,不设选修课;课程内容方面,注意科学性和思想性的有机结合;模仿前苏联的痕迹明显,某些课程在一定程度上脱离了中国实际。 (二)1953~1957年的第二次课程教材改革1953年1月召开的大区文教委员会主任会议和6月召开的第二次全国教育工作会议吹响了新一轮改革的号角。 两次会议确立了今后教育工作的重点是整顿、巩固和发展中小学。 1954年4月,政务院颁布了《关于改进和发展中学教育的指示》, 1956年教育部颁发了建国以来全国第一套比较齐全的教学大纲:中小学各科教学大纲(修订草案)。 这一轮改革随着“一五”计划提前完成,于1957年初结束。 这一时期的改革发展存在的问题集中表现为:初步形成了比较全面的中小学课程体系,但模仿前苏联的痕迹仍很深;课程变动过于频繁,教材跟不上需要,致使教学工作不能完全按照教学计划执行。 (三)1957~1965年的第三次、第四次课程教材改革社会主义制度的基本确立,国民经济的健康发展,国泰民安。 1957年2月,毛泽东作了“关于正确处理人民内部矛盾的问题”的报告, 提出:“我们的教育方针, 应该使受教育者在德育、智育、体育几方面都得到发展,成为有社会主义觉悟的有文化的劳动者。 “为了更好地贯彻这一教育方针,在教育部的周密部署下,又掀起了课程改革的新浪潮,历经三个阶段:第一阶段是1957~1958年的调整,加强知识教学与劳动教学相结合及完成中学肩负的“双基”任务。 第二阶段是课程改革大跃进,其中,课程改革的主题是:缩短学制、精简课程。 具体表现在1960年,人教社按照中小学适当缩短学制年限的要求,赶编了第三套全国用教材,把原来12年学完的内容压缩到10年完成,供试验10年制的学校选用。 第三阶段是1961~1963年的调整和反思,以“调整、巩固、充实、提高”方针为指导对中小学课程进行改革,制定了新的教学计划和教学大纲,对中小学课程做了必要的调整;编写了第四套全国通用教材,供12年制学校选用,但因种种原因,修改后的教材没有在学校正式使用过。 这次改革,虽然基本扭转了课程编写和实施中的混乱局面,但仍存在一些问题,如某些地区反映教材内容深、分量重、教材难等。 20世纪六十年代左右,中国中小学数学教科书关注基础知识、基本技能的获得,其标志是1963年的大纲和教材(1965年出齐),它表明中国的数学教育逐步走向成熟。 其突出特点在于:强调知识的巩固、技能的熟练掌握,虽然1963年《全日制中学数学教学大纲(草案)》中明确提出计算能力、逻辑推理能力和空间想象能力,但是,具体体现在数学教材上还是不太注重数学能力,对数学过程是忽略的。 归根结底,这一时期教科书的突出特征仍是“教”材,但是,强调如何更好地有利于学生接受。 五、 20世纪70、80年代的中国中小学数学教科书的发展这是新中国成立以来的第五次课程教材改革。 其突出特征是:在关注双基的同时关注能力培养,“教”材特征明显。 1978年1月,教育部颁发《全日制十年制中小学教学计划试行(草案)》,颁布了全国统一的教学大纲,集中编写第五套全国通用的十年制中小学教材,于1978年秋开始在全国使用。 这套教材注意到基础知识的选择,智力的启迪和能力的培养,其主要缺点是“深、难、重”。 20世纪八十年代,在关注双基获得的同时,关注能力的培养。 其标志是九年义务数学教学大纲的颁布和相应的“八套半”九年义务教育教材(八套九年义务教育教材,一套小学复式教学教材)的逐步实验。 这一时期的数学教科书提出打破所谓“一纲一本”的旧模式,实行“编审分开”,成立全国(以及各省、自治区、直辖市)中小学教材审查机构,分别负责对通用教材和地方教材进行审查,通过后方可在相应范围内试(使)用。 正如蔡上鹤先生所分析的,它的主要特色是(蔡上鹤.新中国中学数学教材建设51年[J],数学通报,2002(10):12-15):突出基本数学思想和数学方法,在重视双基的同时,注意培养能力,使数学学科特点与学生认知特点相结合,以统一性为主,兼具灵活性,结合内容加强思想品德教育,重视实习作业,按教学内容介绍科学计算器的使用方法。 20世纪七、八十年代中小学数学教科书的突出特征在于:突出三大能力(正确迅速的运算能力、逻辑思维能力和空间想象能力),重视分析问题和解决问题的能力培养(虽然实际做的不太理想),提出辩证唯物主义观点培养的问题。 这一时期教科书的特征仍是“教”材,但是,更强调激发学生的兴趣和学习的外在动力。 六、 20世纪90年代的中国中小学数学教科书的发展20世纪90年代以来,我国提出并开始实施素质教育。 为了全面实施素质教育,为了更好地解决前七次课程改革遗留的课程问题,为了顺应世界课改的潮流,中国政府又开始了一场广泛、全面、深入持久的课程系统改革。 1993年,中共中央、国务院印发《中国教育改革和发展纲要》。 中小学教材编写和使用开始呈现“一纲多本”“多纲多本”的局面。 其中,高中两省一市(天津、山西、江西)1997年秋进入高一的20多万名学生,于2000年夏完成学业并进行了高考。 小学初中实施九年义务义务教育方案,1992年、1993年在小学、初中开始实施,1996年夏季,初中第一轮实验结束,1996年12月,教育部组织有关专家进行九年义务教育课程实施方案的调查,1997年12月公布《九年义务教育课程实施方案的调查报告》。 20世纪90年代,是新中国成立50年来以来中国中小学数学教材改革发展的第三阶段,其突出特征是,关注知识的获得,又关注知识的获取过程,努力构建有利于学生接受和能力培养的“教”材体系。 七、 21世纪初期以来的中国中小学数学教科书的发展2001年2月,国务院批准《基础教育课程改革纲要(试行)》,标志着我国基础教育课程改革全面启动。 作为数学学科来说,2000年3月,《数学课程标准》(征求意见稿)的颁布,提出了“三位一体”的教育目标,“关注结果,关注过程,关注情感态度价值观”,及随后2001年9月开始数学课程标准实验教科书的正式实验。 新型的教科书正在形成,并逐步体现出“人的全面发展观”下的新风貌。 从历史发展的视角,我们认为,这一时期数学教科书的突出特征是,关注结果,关注过程,关注情感态度价值观,“学”材特征特别明显(孔凡哲.义务教育课程标准实验教科书数学的主要特点[J],(人大报刊复印资料)中学数学教与学,2004(07):38-43)。 亦即,一方面,围绕知识技能、过程方法、情感态度价值观而展开,关注人的全面、健康可持续发展,体现数学与学科内外的必然联系,体现社会进步、科技经济发展,关注学生数学思维水平的切实提升。 另一方面,教科书的“学”材特征特别明显。 这是“人的全面发展观”在教科书中的自然体现,也是素质教育进数学教科书的自然体现。 随着改革的不断深入,诸如“学生用书与教师用书应该明确不同职责、亟待出现立体化教科书”等等新要求日趋凸现(孔凡哲.数学课程标准实验教科书发展中的问题及其对策[J],教育科学研究,2005(03):53-56)。 八、 中国中小学数学教科书的未来发展趋势展望2007年以来,随着《全日制义务教育数学课程标准》(修改稿)的完成,中小学数学教科书在关注数学基础知识、基本技能的同时,也在很大程度上关注基本的数学活动经验以及数学的核心思维方式方法(演绎、抽象、归纳、类比等等)。 亦即:关注基础知识、基本技能,关注数学活动经验,数学思想(数学能力,数学思维方式方法),既关注归纳思维的养成,也关注演绎思维的培养和发展,既关注发现问题、提出问题能力的培养,也关注分析问题、解决问题能力的培养。 回顾中国几千以来中小学数学教育(特别是数学教科书)的发展,我们看到,数学教科书的发展大致经历了如下几个典型的发展阶段(参见下图、表):开放的归纳体系 重逻辑思维训练的系统的演绎体系欧氏几何学特征的教科书体系,关注双基和三大能力的培养(中国创造)关注归纳体系,但不抛弃演绎体系年代线索古代中国“西学东渐”时期20世纪上半叶20世纪下半叶21世纪“归纳”线索主体教育主体退缩,仍有存在有些痕迹,但不受重视开始关注“演绎”线索零散少数人关注,未走向大众主体内容之一主体内容有所降低,仍是主角之一;有部分现代数学内容中国的数学科学发展实用数学为主近代数学产生和发展近现代数学奠基和发展数学分支学科纷纷派生数学发展带来新挑战其中,20世纪20、30年代有“混科编排”、“分科编排”两种风格,而实验几何、综合数学即使在今天也有参考价值(虽然当时未成为主导趋势)。 这个发展脉络,可以给我们一些启示,即:从教科书视角看,重归纳、重实用是古代中国的数学教育传统,特别是,形成了“问 (问题—模型)→答→术 (原理、规则、算法) ”的教科书呈现模式;20世纪50年代后的一定时期一度忽略(甚至丢掉)了这个传统,而转向重视演绎、重视基础知识、基本技能的近代新习惯,形成“概念→公理、定理、法则、公式→应用、强化”的教科书呈现模式,虽然这种模式是必需的,但过于单一、不能反映数学的全貌,也影响了数学的其他功能的全面发挥;近十年来,中国中小学数学教育正在走向兼顾归纳与演绎两种思维方式的趋势,教科书的呈现出向多种风格并存,探究发现式与有意义接受式互补并存,即“问题情景→建立模型→解释应用→拓展反思”的探究式的呈现模式,“能激发有意义学习的问题情景→概念→公理、定理、法则、公式→应用、强化→形成数学内容体系”的接受式的呈现模式。 也可以这样理解:如同人类文化的发展史,教育的发展史往往也像钟摆一样在“在两极之间摇摆”,中国数学教育的发展似乎也遵循着这样一条规律。 中国数学教育的传统也是在发展变化中,其中,既有中国古代形成的数学教育的历史传统,也有中国近现代以来形成的数学教育的新习惯(或称之为近现代新传统)。