Meta元宇宙副总裁离职…『Go语言圣经』发布!德云社失业警告!AI要说相声了;一键就能AI绘图的网站;前沿论文 | ShowMeAI资讯日报
携手创造,一起成长!这是我参加「日新计划 8 月更文应战」的第31天,点击检查活动详情
日报合辑 | 电子月刊 | 大众号下载资料 | @韩信子
扎克伯格元世界自拍被群嘲后,业务副总裁 Vivek Sharma 离任了…
www.reuters.com/technology/…
Horizon 是 Meta 投入数十亿美元建造所谓元世界的首要门户。几天前,扎克伯格在 Facebook 上发布了截图,不料被群嘲图形质量太差,国内网友吐槽『甚至不如上个世界的QQ秀』。
Vivek Sharma 过去六年一直任职于 Meta,在商场和游戏部分担任高级职务,最近还挑起了元世界的重担,在西雅图监督各种VR项目的推动。关于这位副总裁的离任,Meta公司发言人称『由于他的领导,Horizon已经建立了一个强壮的团队,拥有一个雄心勃勃的愿景,而且它才刚刚开端』。
工具&结构
『edgeRec』可运转在小型服务器和边际设备的一站式引荐体系
github.com/auxten/edge…
edgeRec 是一个根据深度学习的一体式引荐体系,能够在小型服务器或边际设备上运转。中心技能为深度学习(Item2vec Embedding + MLP),掩盖特征工程 & 练习 & 猜测功用。
『Learn-to-Race』面向无人驾驶的开源强化学习环境
github.com/learn-to-ra…
learn-to-race.org/
Learn-to-Race 是一个契合 OpenAI gym 标准的多模态控制环境,agents 在这里学习如何竞赛。与许多简单的学习环境不同,l2r 的学习环境是围绕着 Arrival 的高保真赛车模拟器建立的,具有完好的软件在环(SIL),甚至是硬件在环(HIL)的模拟才能。
这个模拟器在将自动驾驶赛车技能带到现实生活中的Roborace系列中发挥了关键作用,这是世界上第一个开发自动驾驶人工智能的团队的极限竞赛。
『Molecular Nodes』用于在Blender中处理结构生物学和分子数据的插件
github.com/BradyAJohns…
bradyajohnston.github.io/MolecularNo…
Molecular Nodes 是一个用于在 Blender 中处理结构生物学和分子数据的插件。它供给了将结构生物学文件导入Blender的便捷办法,以及在 Blender 的 Geometry Nodes 内处理原子数据的几个节点。
Blender 的 Geometry Nodes 为程序性建模和动画供给了一个强壮的接口。现在,它在读取任何类型的结构化数据文件作为输入方面的才能是有限的,非三维网格。Molecular Nodes 供给了一个接口,能够将.pdb和其他类型的文件转化为Geometry Nodes能够运用的网格,从而弥补了这个间隔。
『DinkyTrain』普林斯顿NLP的预练习库
github.com/princeton-n…
普林斯顿 NLP 的预练习库,是根据 fairseq 与 DeepSpeed 内核的整合,供给了一个用于高效练习掩码言语模型(MLM)的库。
『Chinese-CLIP』CLIP模型的中文版别
github.com/billjie1/Ch…
CLIP模型的中文版别项目,运用大规模中文数据进行练习(约2亿图文对),旨在帮助用户完成中文范畴的跨模态检索、图画标明等。本项目代码根据『open_clip project』建造,并针对中文范畴数据以及在中文数据上完成更好的效果做了优化。
博文&分享
『The Go Programming Language』Go言语圣经(中文版) 3.3k stars
github.com/gopl-zh/gop…
gopl-zh.github.io/
在 Go 言语2009年正式发布约5年之后,由Go言语中心团队成员 Alan A. A. Donovan 和 Brian W. Kernighan 合作编写了Go言语方面的经典教材《The Go Programming Language》。大部分Go言语中心团队的成员都参加了该书校正作业,因而该书的质量是能够完全放心的。中文版由中文Go言语社区的团队写作完成。
该书2014年开端写作,2015年出书,介绍了Go言语简直悉数特性,而且跟着言语的深入层层递进,对每个细节都解读得十分详尽,每一节内容都精彩不容错失,是广阔Gopher的必读书目。书中包含了上百个精心挑选的习题,期望大家能先用自己的方式测验完成习题,然后再参考官方给出的解决方案。
『DALLE mini』一个用文本生成图画的项目
github.com/borisdayma/…
www.craiyon.com/
Craiyon(原名DALLE mini),是一款能够根据恣意提示文字进行绘画的AI模型!在网站输入提示文字,等待约2分钟后,体系会生成9张绘制的图片。能够点击某张图片扩大观看,也能够运用网站供给的『截图』功用生成卡片。
数据&资源
『Awesome Weakly-supervised Temporal Action Localization』弱监督时刻动作定位相关资源列表
github.com/Pilhyeon/Aw…
『CROSSTALK-GENERATION』现在为止最大的中文开源相声数据集
github.com/anonNo2/cro…
这是现在为止最大的中文开源相声数据集(搜集来源为网络、图书、其他开源项目), 数据类型包括单口相声、对口相声、群口相声以及小品。
因作者的研讨仅针关于对口相声,所以从初始数据中清洗筛选出的2948篇对口相声,验证集为从初始数据中筛选出的368篇对口相声,测试集为从初始数据中筛选出的50篇对口相声中的10轮对话。
研讨&论文
大众号回复关键字日报,免费获取整理好的论文合辑。
科研进展
- 2022.07.29 『新视角合成』 Neural Density-Distance Fields
- 2022.08.18 『伪标签』ConMatch: Semi-Supervised Learning with Confidence-Guided Consistency Regularization
- 2022.08.09 『自然言语处理』USB: A Unified Semi-supervised Learning Benchmark
- 2022.08.15 『计算机视觉』DM-NeRF: 3D Scene Geometry Decomposition and Manipulation from 2D Images
⚡ 论文:Neural Density-Distance Fields
论文时刻:29 Jul 2022
范畴使命:Novel View Synthesis, Visual Localization,新视角合成
论文地址:arxiv.org/abs/2207.14…
代码完成:github.com/ueda0319/ne…
论文作者:Itsuki Ueda, Yoshihiro Fukuhara, Hirokatsu Kataoka, Hiroaki Aizawa, Hidehiko Shishido, Itaru Kitahara
论文简介:However, it is difficult to achieve high localization performance by only density fields-based methods such as Neural Radiance Field (NeRF) since they do not provide density gradient in most empty regions./但是,仅靠根据密度场的办法,如神经辐射场(NeRF),很难完成高的定位功能,因为它们在大多数空白区域没有供给密度梯度。
论文摘要:神经场在三维视觉使命中的成功现在已是不争的事实。在这一趋势下,一些旨在完成视觉定位(如SLAM)的办法被提出来,运用神经场来估计间隔或密度场。但是,仅靠根据密度场的办法,如神经辐射场(NeRF),很难完成高的定位功能,因为它们在大多数空白区域没有供给密度梯度。另一方面,根据间隔场的办法,如神经隐含外表(NeuS),在物体的外表形状方面有局限性。本文提出了神经密度-间隔场(NeDDF),这是一种新型的三维标明办法,对间隔场和密度场进行彼此限制。咱们将间隔场表述扩展到没有清晰边界外表的形状,如毛皮或烟雾,这使得间隔场到密度场的清晰转化成为可能。经过显式转化完成的共同的间隔场和密度场能够对初始值具有鲁棒性并完成高质量的挂号。此外,场之间的共同性答应从稀疏的点云中快速收敛。试验标明,NeDDF能够完成高的定位功能,一起在新的视图合成上供给与NeRF相当的结果。该代码可在github.com/ueda0319/ne…
⚡ 论文:ConMatch: Semi-Supervised Learning with Confidence-Guided Consistency Regularization
论文时刻:18 Aug 2022
范畴使命:pseudo label,伪标签
论文地址:arxiv.org/abs/2208.08…
代码完成:github.com/jiwoncocode…
论文作者:Jiwon Kim, Youngjo Min, Daehwan Kim, Gyu搜索引擎优化ng Lee, Junyoung Seo, Kwangrok Ryoo, Seungryong Kim
论文简介:We present a novel semi-supervised learning framework that intelligently leverages the consistency regularization between the model’s predictions from two strongly-augmented views of an image, weighted by a confidence of pseudo-label, dubbed ConMatch./咱们提出了一个新的半监督学习结构,该结构智能地运用了来自图画的两个强增强视图的模型猜测之间的共同性正则化,由伪标签的决心加权,咱们称之为ConMatch。
论文摘要:咱们提出了一个新颖的半监督学习结构,该结构智能地运用了模型对图画的两个强增强视图的猜测之间的共同性正则化,并以伪标签的置信度加权,咱们称之为ConMatch。虽然最新的半监督学习办法运用图画的弱增强视图和强增强视图来界说方向性的共同性丢失,但如何为两个强增强视图之间的共同性正则化界说这种方向仍未被探索。为了阐明这一点,咱们在非参数和参数办法中,经过弱增强的视图作为锚,为来自强增强的视图的伪标签提出了新的决心办法。特别是在参数办法中,咱们初次提出在网络中学习伪标签的置信度,这是以端到端的方式经过主干模型学习的。此外,咱们还提出了一个阶段性的练习,以进步练习的收敛性。当纳入现有的半监督学习器时,ConMatch持续提升了功能。咱们进行了试验来证明咱们的ConMatch比最新的办法有效,并供给了广泛的消融研讨。代码已在github.com/JiwonCocode… 上公开。
⚡ 论文:USB: A Unified Semi-supervised Learning Benchmark
论文时刻:12 Aug 2022
范畴使命:Natural Language Processing,自然言语处理
论文地址:arxiv.org/abs/2208.07…
代码完成:github.com/microsoft/s…
论文作者:Yidong Wang, Hao Chen, Yue Fan, Wang Sun, Ran Tao, Wenxin Hou, RenJie Wang, Linyi Yang, Zhi Zhou, Lan-Zhe Guo, Heli Qi, Zhen Wu, Yu-Feng Li, Satoshi Nakamura, Wei Ye, Marios Savvides, Bhiksha Raj, Takahiro Shinozaki, Bernt Schiele, Jindong Wang, Xing Xie, Yue Zhang
论文简介:Semi-supervised learning (SSL) improves model generalization by leveraging massive unlabeled data to augment limited labeled samples./半监督学习(SSL)经过运用很多未符号的数据来增强有限的符号样原本进步模型的泛化才能。
论文摘要:半监督学习(SSL)经过运用很多未符号的数据来增强有限的符号样原本进步模型的通用性。但是,现在,盛行的SSL评价协议往往被限制在计算机视觉(CV)使命上。此外,以前的作业一般从头开端练习深度神经网络,这很耗时,而且对环境不友好。为了解决上述问题,咱们从计算机视觉、自然言语处理(NLP)和音频处理(Audio)中挑选了15个不同的、具有应战性的和全面的使命,构建了一个一致的SSL基准(USB),咱们在这些使命上体系地评价了主流的SSL办法,还开源了一个模块化和可扩展的代码库,以便对这些SSL办法进行公正评价。咱们进一步为CV使命供给最先进的神经模型的预练习版别,以使进一步调整的本钱能够接受。USB使单一的SSL算法能够在多个范畴的更多使命上进行评价,但本钱更低。具体来说,在单个NVIDIA V100上,只需求37个GPU天来评价USB中15个使命的FixMatch,而在典型协议下的5个CV使命上则需求335个GPU天(除ImageNet外的4个CV数据集需求279个GPU天)。
⚡ 论文:DM-NeRF: 3D Scene Geometry Decomposition and Manipulation from 2D Images
论文时刻:15 Aug 2022
范畴使命:计算机视觉
论文地址:arxiv.org/abs/2208.07…
代码完成:github.com/vlar-group/…
论文作者:Bing Wang, Lu Chen, Bo Yang
论文简介:In this paper, we study the problem of 3D scene geometry decomposition and manipulation from 2D views./在本文中,咱们研讨了从二维视图进行三维场景几许分化和操作的问题。
论文摘要:在本文中,咱们研讨了从二维视图进行三维场景几许分化和操作的问题。经过运用最近的隐性神经表征技能,特别是吸引人的神经辐射场,咱们引入了一个物体场组件,仅从二维监督中学习三维空间中所有个别物体的唯一代码。这个组件的关键是一系列精心设计的丢失函数,以使每一个三维点,特别是在非占用空间,即便没有三维标签也能有效优化。此外,咱们引入了一种反查询算法,以自在地操作所学场景标明中的任何指定的三维物体形状。值得注意的是,咱们的操作算法能够清晰地解决关键问题,如物体磕碰和视觉遮挡。咱们的办法被称为DM-NeRF,是第一个在单一管道中一起重建、分化、操作和渲染复杂的三维场景的办法。在三个数据集上的广泛试验清楚地标明,咱们的办法能够准确地从二维视图中分化出所有的三维物体,答应任何感兴趣的物体在三维空间中自在操作,如翻译、旋转、尺度调整和变形。
咱们是 ShowMeAI,致力于传达AI优质内容,分享行业解决方案,用知识加快每一次技能成长!
◉ 点击 日报合辑,在大众号内订阅话题 #ShowMeAI资讯日报,可接纳每日最新推送。
◉ 点击 电子月刊,快速浏览月度合辑。