当前位置:首页 >> 药膳食疗 >> 李飞飞团队明确提出零样本泛化的技术,性能超越SOTA!

李飞飞团队明确提出零样本泛化的技术,性能超越SOTA!

发布时间:2023-03-10

要挖掘出从低频和高频构造噪声之中的随机抽样导致最佳的总体结果。原作者了解到,在混合之中补上加随机只用略微有利于精度的大幅提高,似乎是因为它更佳了教师战略并不一定的三维空间不变性。

次测试以下内容

四种各有不同场景的影像战略众所周知基准次测试(从上至下):DMControl Suite、CARLA、Robosuite和iGibson

首必先,原作者提出了一个适用于四种各有不同层面的基准次测试,系统地分析影像agent的众所周知能力。

在每个层面之中,小组研究者了在一个环境污染之中专业训练的算法,在零抽取增设之中的各种已非环境污染之中的表现如何。此时很难加分信号和额外的试验。

在每个训练任务之中,SECANT以前的SOTA算法为基准:SAC、SAC+crop、DR、NetRand、SAC+IDM和PAD。

DMControl

研究者小组依照前人的增设,用作来自DMControl的8个训练任务开行次测试。

测量众所周知能力,随机生成或多或少和人造人本身的颜色,将真实的图片作为快照或多或少。

除了一项训练任务外,SECANT在所有训练任务之中都在在优于必在此之后的SOTA,不一定高于88.3%。

所有原理都经过50万步专业训练,有密集的训练任务特定加分。

Robosuite:人造人操作应用软件

Robosuite是用于人造人研究者的小型简化应用软件。

原作者在4个带有吸引力的改进型和双手操作训练任务上对SECANT和必在此之后原理开行了基准次测试。

用作带有操作三维空间依靠的Franka Panda人造人建模,并用作特定于训练任务的密集加分开行专业训练。

所有agent都送达一个168×168以自我为之中心的RGB视图作为输入。

与前SOTA相对于,SECANT有337.8%的大幅提高

次测试说明了,与前的最佳原理相对于,SECANT在简单增设之中获取的加分少于降低了287.5%,在困难增设之中降低了374.3%,在保守增设之中降低了351.6%。

CARLA:自动驾车应用软件

为了开一步验证SECANT对自然转变的众所周知能力,原作者在CARLA应用软件之中构建了一个带有影像检视的真实驾车场景。

次测试能够是在1000个时间步长内沿着8字型高速公路(CARLA Town 4)车辆尽似乎远,不与泊车或车辆发生摩擦。

agent在「晴朗的之中午」情景接受专业训练,并在之中午和日落时对各种快照天气状况和光条件开行分析。

例如,潮湿天气状况的特点是柏油路带有高反射光点。经过少于每个天气状况大约10集和5次专业训练运行,SECANT在次测试之中能够比前的SOTA车辆的距离降低47.7%。

iGibson:之中庭物体遥测

iGibson是一个交互式应用软件,有高度逼真的3D房间和家具。

在这个应用软件之中,次测试的能够是尽似乎接近一盏灯。

加分算子激励agent使灯在眼界之当中占去的VGA比例最大,当这个比例在周内10个步骤之中大约5%时就算成功。

在本次测试之中,在已非过的房间里,SECANT的成功率比前的原理高于15.8%。

原作者简介

本文一作是郭飞飞真传得意弟子Linxi Fan,他考入于天津次测试之中学,独立学院所大学考入纽约哥伦比亚所大学,现在在加州所大学伯克利分校大学毕业耶鲁所大学,主修计算机科学影像、最弱简化研读以及人造人技术。在英伟达实习生期间完成了本专著。

本文二作徐德安同样师从郭飞飞,独立学院考入于国立台湾所大学,获取了卡内基梅隆所大学硕士学位。现在在加州所大学伯克利分校计算机科学科学专业大学毕业耶鲁所大学学位,在NVIDIA花钱众所周知研读类研究者。

三作禹之鼎也是来自NVIDIA的科学家,获取华南理工所大学电机工程倡议班学位、香港科技所大学电子工程学位,2017年在卡内基梅隆所大学获取了ECE耶鲁所大学学位。2018年加入英伟达,现在是英伟达自然语言处理研究者组的高级研究者科学家。

参考资料:

无锡专业的男科医院
上海看妇科去哪里好
南昌男科医院排名
北京甲状腺医院怎么去
天津白癜风医院挂号
标签:
友情链接: