纯靠嘴炮也能机器学习 不做数值运算 基于自然语言的全新ML范式

本文作者肖镇中是德国马克思普朗克-智能系统研究所和图宾根大学的博士生,Robert Bamler 是图宾根大学机器学习方向的教授,Bernhard Schölkopf 是马克思普朗克-智能系统研究所的所长,刘威杨是马普所剑桥大学联合项目的研究员。

论文地址:https://arxiv.org/abs/2406.04344

图 1:VML 的训练算法。

图 2:VML 中模型和优化器的自然语言模版样例。

图 3: VML 在多项式回归任务中的训练过程记录。

非线性二维平面分类

仔细观察第五十步后的模型参数,我们可以看到加了归纳偏置的模型描述中包含了很多与肺炎相关的医学词汇,比如「感染」、「发炎」;而没有加归纳偏置的模型描述中只有对肺部 X 光片的特征描述,比如「透明度」、「对称」。

同时,这些模型所学到的描述,都是可以被具备专业知识的医生验证的。这种可解释和人工检验的机器学习模型在以安全为重的医疗场景下十分有价值。

图 5: VML 在 PneumoniaMNIST 图片二分类上的训练记录。

结语

该文章介绍了一种基于大语言模型的机器学习新范式 Verbalized Machine Learning (VML; 言语化的机器学习),并在回归和分类任务上展示了 VML 的有效性和可解释性的特点。


数据挖掘和深度学习哪个更有发展前景

1、数据挖掘、机器学习、自然语言处理三者之间既有交集也有不同,彼此之间既有联系和互相运用,也有各自不同的领域和应用。 2、数据挖掘是一门交叉性很强的学科,可以用到机器学习算法以及传统统计的方法,最终的目的是要从数据中挖掘到需要的知识,从而指导人们的活动。 数据挖掘的重点在于应用,用何种算法并不是很重要,关键是能够满足实际应用背景。 而机器学习则偏重于算法本身的设计。 3、机器学习通俗的说就是让机器自己去学习然后通过学习到的知识来指导进一步的判断。 用一堆的样本数据来让计算机进行运算,样本数据可以是有类标签并设计惩罚函数,通过不断的迭代,机器就学会了怎样进行分类,使得惩罚最小。 然后用学习到的分类规则进行预测等活动。 4、自然语言处理是计算机科学领域与人工智能领域中的一个重要方向。 它研究能实现人与计算机之间用自然语言进行有效通信的各种理论和方法。 自然语言处理是一门融语言学、计算机科学、数学于一体的科学。 因此,这一领域的研究将涉及自然语言,即人们日常使用的语言,所以它与语言学的研究有着密切的联系但又有重要的区别。 自然语言处理并不是一般地研究自然语言,而在于研制能有效地实现自然语言通信的计算机系统,特别是其中的软件系统。 因而它是计算机科学的一部分。 自然语言处理(NLP)是计算机科学,人工智能,语言学关注计算机和人类(自然)语言之间的相互作用的领域。

该不该坚持学习Machine Learning

Machine Learning的前景怎么样?Machine Learning作为统计学的一个分支,最近好像特别吃香,请大神们解疑,Machine Learning具体是干什么的,前景什么样?正好刚回答过类似的问题,直接引用下吧Machine Learning现在是一个很火的研究方向。 机器学习是研究计算机怎么模拟人类的学习行为,并且能组织已有的知识构架使之不断完善的性能的学科。 是人工智能的核心,是使计算机具有智能的根本途径。 与其说是统计学的分支,不如说是统计学,计算机科学,信息科学的交叉分科。 其涉及的知识面很广,涵盖了工智能、哲学、信息论、生物学、认知科学、计算复杂性等众多领域的专业知识。 现在存在的一些计算器系统是没有学习的能力的(或者是有的已有了特别局限的学习能力?),因而是不能满足生产的需求的。 随意随着科技的发展,machine Learning肯定会得到长足的发展的。 只是,machine Learning也有许多发展方向,不是每个方向都发展的起来。 附上这篇文章的链接吧: 数据挖掘和深度学习(deep learning)哪个更有发展前景?我再补充下Machine Learning的研究目标吧: 认知模型——即是3M认知模型,是人类对真实世界进行认知的过程模型。 认知是个系统的过程,其中包含感知,记忆,判断与学习。 因而完成这个认知过程,是个一及其艰难和浩大的工程。 通用学习算法——像是大家熟知deep Learning就是Machine Learning中的一种比较深的算法。 其实很多ML算法都是非逻辑性的,输入的信息数据通过数学模型而得出一个新的工具,其实可以说是建立一个人工识别号的数据库。 构造学习系统的方法(面向任务的)——其实就是研究如何通过 环境向系统的学习环节提供某些信息。 先说这么多吧,有空的话做个图解释下ML的方法论,觉得还是解释比较抽象,多多包涵吧。 Machine Learning是一门多领域的交叉学科,除了像最常见的统计学、逼近论、算法复杂度分析理论等,也包括一些与生物领域的科学相关的问题,比如说最常见的人工神经网络中的各类神经元与链接方式都是仿照人脑进行操作的、以及遗传算法中模拟基因突变的过程等。 机器学习主要就是研究计算机如何模型或实现像人一样的思维方式去学习知识,通过对新问题的反馈机制,修改或优化自己已经学习到的知识。 其是人工智能的核心,也就是说,人工智能非常依赖机器学习的好坏与优良程度。 机器学习的方法以及其效果的好坏对于人类未来的发展至关重要,如果效果很高的话,至少可以替代人工做的一些重复的体力劳动,并可以根据特殊情况进行一定的反映。 因此,就前景而言还是很好的,尤其是在现在这个大数据时代,越来越多的人类行为相关数据被记录在案,为机器学习提供了基础内容。 此外,机器学习所产生的一些成果,已经应用于许多领域,包括数据挖掘、自然语言处理等等。 虽然机器学习已经取得了一定的突破,但是还是没有达到人工智能的程度,因此有许多问题是需要研究和发展的,因此,未来的发展也是充满机遇与挑战的。 Machine Learning是个不错的领域,如果想要进入的话,建议多学习一些基础思想和编程。 机器学习已经越来越平民化了(democratizing),数学和算法并非一定要很深厚功力,大多通用算法都是现成的,比如微软Azure Machine Learning平台已经有很多打包的示例,如用来分析customer churn的示例等。 至于operationalization(不知道怎么翻译),现在也没这么难了。 我觉得如果只是应用机器学习来处理现实问题,最难的还是怎么把通用算法和自己公司的现实问题联系起来,比如怎么定feature,用哪种model,另外怎么评价最终效果等等。 难的是深入理解企业的实际业务,而非技术和算法。 个人认为趋势是随着machine learning平台的成熟以及通用场景的算法普及,data scientist这个称号会逐渐平民化甚至消失,最后你搭个回归模型之类的就像使用Excel处理一些数据这样简单。 一个PM或者销售经理可以自己做这事而不需要养一个专门的职位。 机器学习的应用在工业界需求很高,有过工作经验的人可以很轻松的找到工作,供给远远小于需求,而且需求越来越大。 但是招 New Grad (PhD 可以考虑) 相对较少。 原因很多,简单来说,就是 New Grad 往往工程经验不够,学术能力也不够。 工业界的现状不复杂:大公司搞机器学习的组大、人多、要求高,PhD 是进入的门槛;小公司人少,每个人都要独当一面,因此必须要有过搭建实际机器学习系统的经验。 因此如果两边都没有优势的话,自然找工作比较吃力。 因此,对于有志于做这个方向的同学来说,建议找工作时调整心态,第一份工作尽量找到工作职责与机器学习相关的组,而不必追求一步到位。 人生的职业生涯很长,做好3到5年的职业生涯规划,积累实际工作经验,不断学习与强化自己。 人与人的差距并不会在第一份工作中体现,而是在前几年逐渐显现出来。

机器学习究竟能在计算语言学上走多远

目前来看,机器学习在自然语言领域还是缺少突破。 虽然在目前深度学习这么火热的情况下,自然语言有了一定的进步,但这种进步相对于语音识别或者图像领域来说,这种进步基本上可以认为是微不足道的。 这里面一个最大的原因在于,图像能够拿到像素级别的特征,这种特征可以认为是最基本的特征。 但是语言完全不一样,语言是高度抽象的产物,也就是说,当我们说一句话表达一个意思的时候,已经相当于做了一次抽象,语言只是中间的产物,因此,这种抽象势必会导致信息的丢失。 那么,如果顺着上面这个思路,我们可以考虑,如果机器学习(深度学习)想要进一步的提升,一个可行的思路是进一步研究语言学,去研究人类表达的方式,这种表达方式应该凌驾于语言种类之上,需要有一定的普适性。 另外一方面,自然语言的数据相对来书比较少,所以,无监督学习可能是另外一个比较大的方向(比如最近火热的GAN,也可以应用到自然语言领域),以上一点看法,希望帮到你,

  • 声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系,我们将在24小时内删除。
  • 本文地址:https://120.77.238.70/kuaibao/34815.html
手机 充电宝!电池技术迎来大升级 爆改
暂无