入职MIT后首次带队 何恺明新作再战生成 IOI金牌得主邓明扬参与

何恺明 入职MIT副教授后, 首次带队 的新作来了!

让自回归模型抛弃矢量量化,使用连续值生成图像。 并借鉴扩散模型的思想, 提出Diffusion Loss

他加入MIT后,此前也参与过另外几篇CV方向的论文,不过都是和MIT教授Wojciech Matusik团队等合作的。

这次何恺明自己带队,参与者中还出现一个熟悉的名字:

邓明扬 ,IMO、IOI双料奥赛金牌得主,在竞赛圈人称“乖神”。

目前邓明扬MIT本科在读,按入学时间推算现在刚好大四,所以也有不少网友猜测他如果继续在MIT读博可能会加入何恺明团队。

接下来具体介绍一下,这篇论文研究了什么。

借鉴扩散模型,大改自回归生成

传统观点认为,图像生成的自回归模型通常伴随着 矢量量化 (Vector Quantization),比如DALL·E一代就使用了经典的VQ-VAE方法。

但团队观察到,自回归生成的本质是根据先前的值预测下一个token,这其实 与值是离散还是连续没啥必然联系 啊。

关键是要对token的概率分布进行建模,只要该概率分布可以通过损失函数来测量并用于从中抽取样本就行。

并且从另一个方面来看,矢量量化方法还会带来一系列麻烦:

那么有什么更好的替代方法?

何恺明团队选择在损失函数上动刀,借鉴近年大火的扩散模型的思想,提出 Diffusion Loss ,消除了离散tokenizer的必要性。

如此一来,在连续值空间中应用自回归模型生成图像就可行了。

具体来说,它让自回归模型输出一个潜变量z作为条件,去训练一个小型的去噪MLP网络。

通过反向扩散过程,这个小网络就学会了如何根据z去采样生成连续值的token x。扩散的过程天然能建模任意复杂的分布,所以没有类别分布的局限。

这个去噪网络和自回归模型是端到端联合训练的,链式法则直接把损失传给自回归模型,使其学会输出最佳的条件z。

这篇工作的另一个亮点,是各种自回归模型的变体都适用。它统一了标准的自回归AR、随机顺序的AR、以及何恺明擅长的掩码方法。

其中 掩码自回归(MAR) 模型,可以在任意随机位置同时预测多个token,同时还能和扩散损失完美配合。

在这个统一的框架下,所有变体要么逐个token预测,要么并行预测一批token,但本质上都是在已知token的基础上去预测未知token,都是广义的自回归模型,所以扩散损失都能适用。

通过消除矢量量化,团队训练的图像生成模型获得了强大的结果,同时享受序列建模的速度优势。

论文在AR、MAR的各种变体上做了大量实验,结果表明扩散损失比交叉熵损失稳定带来2-3倍的提升。

与其他领先模型一比也毫不逊色,小模型都能做到1.98的FID分数,大模型更是创下了1.55的SOTA。

而且它生成256x256图像速度也很快,不到0.3秒一张。这得益于自回归生成本来就很快,比扩散模型少采样很多步,再加上去噪网络又很小。

最后总结一下,这项工作通过自回归建模token间的相关性,再搭配扩散过程对每个token的分布进行建模。

这也有别于普通的潜空间扩散模型中用单个大扩散模型对所有token的联合分布建模,而是做局部扩散,在效果、速度和灵活性上都展现出了巨大的潜力。

当然,这个方法还有进一步探索的空间,团队提出,目前在在某些复杂的几何图形理解任务上还有待提高。

何恺明团队都有谁

最后再来介绍一下即将或可能加入何恺明课题组的团队成员。。

Tianhong LI(黎天鸿) ,清华姚班校友,MIT博士生在读,将于2024年9月加入何恺明的课题组,担任博士后。

Mingyang Deng(邓明扬) ,MIT本科数学和计算机科学专业在读。

他在高一获得IMO金牌,高三获得IOI金牌,是竞赛圈为数不多的双料金牌得主,也是IOI历史上第三位满分选手。

目前邓明扬的研究重点是机器学习,特别是理解和推进生成式基础模型,包括扩散模型和大型语言模型。

不过他的个人主页上还没有透露下一步计划。

One More Thing

何恺明当初在MIT的求职演讲备受关注,其中提到未来工作方向会是 AI for Science ,还引起圈内一阵热议。

现在,何恺明在AI4S方向的参与的首篇论文也来了: 强化学习+量子物理学方向

把Transformer模型用在了动态异构量子资源调度问题上 ,利用自注意力机制处理量子比特对的序列信息。并在概率性环境中训练强化学习代理,提供动态实时调度指导,最终显著提升了量子系统性能,比基于规则的方法提高了3倍以上。

这样一来,何恺明在自己的成名领域CV和探索新领域AI4S上都没耽误,两开花,两开花。

论文:https://arxiv.org/abs/2406.11838

参考链接:[1]https://www.tianhongli.me[2]https://lambertae.github.io[3]https://arxiv.org/abs/2405.16380


conflux是什么?与姚期智有什么关系?

Conflux成立于2018年,拥有区块链行业内最顶尖的理论和研发团队。 它的首席科学家便是由世界知名计算机科学家、华人唯一图灵奖得主、中国科学院院士、美国国家科学院外籍院士、清华大学交叉信息研究院院长——姚期智先生担任。 顺便介绍下,Conflux创始人龙凡博士毕业于清华大学“姚班”,曾2次斩获国际信息学奥林匹克(IOI)金牌,并获得麻省理工学院(MIT)计算机科学博士学位,在各大顶级计算机科学会议中(PLDI,POPL,ICSE,NSDI,ISSTA,FSE等)发表论文超过20篇。 如果满意请采纳,谢谢!

偶像宣言的chance歌词,要中文谐音的,歌词我打到下面,谢谢帮忙的,如果不会就关了。

チャチャ Chance! ムテキの势いで チャチャ Chance! ツヨキのその意気で 今日までの AH毎日にさよならを告げるわ チャチャ Chance! どれだけ変わっても チャチャ Chance! 変わらず见ていてね キラキラのこの先の道を歩くわあなたとね 予报外れて太阳サンサン!? 会计合计777(ナナナナナナ)円!? これが今のモードなの 月が 2つよ ツキまくりよ なんでもかなうわ チャチャ Chance! キセキに切り抜けて チャチャ Chance! キョウテキそこのけで 今日からの AH毎日を剧的に変えるわ チャチャ Chance! 代わりはいなくって キラキラのこの先の道を歩くのあなたよね 亀を助けてゴージャス待遇!? ここ掘れワンワンゴールドラッシュ!? これが今のムードなの おとぎの国が 颜パスなら どこでも行けるわ チャチャ Chance! ステキないでたちで チャチャ Chance! ホウセキ散りばめて 今日からの AH毎日をデコレーションするわ チャチャ Chance! うっかり迷ったら チャチャ Chance! しっかり抱きとめて キラキラのその先の道を照らしてあなたがね Chacha Chacha! Muteki ne ikioi de Chacha Chacha! Tsuyoki no sono iki de Kyou made no AH mainichi ni sayonara wo tsugeru wo Chacha Chacha! Dore dake kawattemo Chacha Chacha! Kawarazu miteite ne Kirakira no kono saki ni michi wo aruku wa anata do ne Yohou hazurete taiyou sansan! Kaikei goukei nanananananaan! Kore ga ima no moodo nano Tsuki ga futatsu yo tsuki makuri yo nandemo kanau wa Chacha Chacha! Kiseki ni kirinukete Chacha Chacha! Kyouteki sokonoke de Kyou kara no AH mainichi wo gekiteki ni kaeru wa Chacha Chacha! Dore dake kawattemo Chacha Chacha! Kawari ha inakutte Kirakira no kono saki ni mizhi wo aruku no anata yo ne Kame wo tasukete goojasu taiguu!? Koko hore wanwan goorudo rasshu!? Kore ga ima no muudo nano Otogi no kuni ga kao pasu nara doko demo ikeru wa Chacha Chacha! Sutekina idetachi de Chacha Chacha! Houseki chiribamete Kyou kara no AH mainichi wo dekoreeshon suru wa Chacha Chacha! Ukkari mayottara Chacha Chacha! Shikkari dakitomete Kirakira no sono saki no michi wo terashite anata ga ne Chacha Chacha! Muteki no ikioi de Chacha Chacha! Tsuyoki no sono iki de Kyou made no AH mainichi ni sayonara wo tsugeru we Chacha Chacha! Dore dake kawattemo Chacha Chacha! Kawarazu miteite no Kirakira no kono saki no michi wo aruku wa anata to no Transliterated by Kikyosamea 说实话 日文读音不好找汉字读,你想学唱不如我一句一句教你,这些歌词有些发音不好用汉字打出来的,有断句的。 罗马发音还标准点。

星梦天使所有的歌曲(插曲也算)的中文谐音歌词

两个人是NS久住小春and萩原舞一处某头卡瓦纳拉一有空干我瓦砾头像偷袭达打激素嘎达搜有抗震你虎娃虎娃里有泪路嘎弥都KI拉波拉哈拉稀咔达强都西大欧哈有挖那一开都gen ki 那爱嘎挖得卡带带我秀逸都啊给路达给瓦塔喜给米gi 那拉ki米挖hi 大龄一尺魔阿瓦那意义ki N得魔内那无卡内唔系ki大内Ki米nou用口噶一起搬屋怄气出库瓦塔喜我有有口你挖一次某ki米Ki米nou油口你哇搜我一次某瓦塔西谁哈牡大大ki都那贼卡斌大龄库鲁迹象骷nou爱路头爱苏米达一达内波卡里阿姨达hi达里卡瓦雅贴腻米哈拉西卡意一ki心ki偶得五ki一 nou逆那贼嘎ki五阿里卡诶你密集达尅偶哇大有那贼一卡库强都西大够美内挖那一尅都没路得卡哇伊府骨弥足尅大有斗殴库鲁达给瓦塔喜给阿欧码内Ki米蛙啊卡一簇某阿瓦哪一申诉得某内那五卡内复习ki达nei~Ki米噶因那姨都Ken ki 噶得拿已有瓦塔喜nou搜把逆哇一簇某ki米Ki米nou手把你挖搜我一组某瓦塔西谁哈恩大达ki都那贼卡Hihi租给阿武吉祥库nou恩牡忒诶数米大一大内瓦塔喜nou有够你瓦伊租某ki米Ki米nou有够你哇搜我一簇某瓦塔西谁哈五大大尅都那贼卡斌大龄库路基箱库nou诶路头爱苏米大一大内这是伴奏

  • 声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系,我们将在24小时内删除。
  • 本文地址:https://120.77.238.70/keji312/36808.html
为什么我不能和他拍张呢 这是最棒的事 梅西谈想和乔丹合影
暂无