标签归档:数据集

First Order Motion Model 教程

由于 bilibili 的审核原因,不允许 UP 主上传和 “AI 换脸” 相关的教程视频。但是产出物的审核相对叫较松。视具体内容而定,因此在本站提供 damedane 在线制作的教程文字版备忘

首先访问下面的链接进行注册:

https://openbayes.com/console/signup

注册后,会自动登录,然后进入控制台首页,点击左侧边栏的公共教程

然后在右侧列表中选择 damedane:

进入教程页面之后,页面右上角有一个克隆按钮,点击克隆后,将该教程克隆到自己的账户下:

然后容器名称随便取,算力选择 vGPU 或者 CPU 都可以,vGPU 速度会快一些,但额度优先 CPU 有更多的赠送额度,但速度相对较慢。下面的参数都不需要改,镜像就用默认的 PyTorch 就可以了,然后直接点审核并执行:

然后稍等片刻,等运行状态变为运行中时,就可以点击页面下方的打开 Jupyter 编辑器:

在 Jupyter 编辑器中,左侧双击 damedane.ipynb。打开相应文件:

在左侧的文件列表中,可以看到有 import.mp4import.png 两个文件,其中 import.mp4 为 damedane 的原视频文件,unravel.mp4 则为 Unravel 的源文件

这个教程默认运行的是 unravel 的。也就是说你如果什么都不操作直接执行的话,创建出来的换脸视频就是 unravel 的痛视频。如果我们需要制作 damedane 的换脸视频,我们需要做的是:

  • 修改代码中输入图片的 source_image_name 变量
  • 修改代码中输入视频的 source_video_name 变量
  • 执行任务

接下来我们就用制作 damedane 来举例子,首先准备好自己要使用的图片,注意图片不要太大,最好为 256×256 像素,然后直接通过拖拽上传到左侧的文件列表中。或者点击上方的「Upload Files」也可以上传。

然后在右侧代码块中,滚动到下方标有 [20]: 的代码块。将 import.png 替换为刚刚上传的图片的文件名:

然后点击上方菜单栏的「Run – Run All Cells」执行所有代码块。然后稍等 3-5 分钟

提示:正在执行和等待执行的代码块,左侧会显示为 [*]: 符号。并且执行完成的代码块在下方会有相应的执行时间提示:

执行完成后,就可以看到预览,然后按照最后代码块中的提示进行操作即可:

2020 九月产品更新

新功能

  • 所有的镜像里为 Conda 指定了默认的国内源,提升安装速度
  • 支持将数据集的目录创建为一个新的数据集版本,见文档
  • 调整了容器展示界面,优先展示最新一次执行的文件内容
  • 允许公开自己的数据仓库 / 容器,见公开容器以及公开数据仓库
  • 暴露 JupyterLab 的链接,方便与 VS Code、PyCharm 的集成

对「数据集」概念的变更

之前 OpenBayes 数据存储功能被称为「数据集」,这更容易被理解为机器学习场景下的标注数据,而实际上这里除了放置标注数据外也可以放置其他任意类型的数据,包括代码、训练的模型文件等。

为了避免这个歧义,也是为新的「模型部署」功能做准备,OpenBayes 对原有的「数据集」概念做了调整,将「数据集」改称作「数据仓库」。

对其概念的更新也同步到了文档中:

2019 十一月份产品更新

新功能

  • 数据集和代码的上传支持更多的压缩包格式,如果不是压缩包也可以支持单个文件的上传,具体信息见文档
  • 数据集版本支持增量更新了,具体信息见文档
  • 数据集和容器都支持搜索了
  • 拆分了独立的「公开资源」部分,对资源进行了分类并支持资源的搜索

修复和增强

  • 在「继续执行」时强制确认是否绑定上一次执行的内容
  • 恢复了 tensorflow-1.12tensorflow-1.11 的运行时环境
  • 创建容器时更详细的进度展示,尤其是在需要数据的拷贝时展示拷贝的进度
  • 容器和数据集恢复了对中文名称的支持

2019 七月份产品更新(2)

新功能

  • 增加了新的镜像
    • tensorflow-1.14
    • tensorflow-2.0.0beta
    • pytorch-1.0.1
    • pytorch-1.1.0
  • 新增了大量的公开数据集

修复与增强

  • 不再允许在数据集、容器名字中使用中文字符, 这一开始可能会给大家带来困扰,但是会在未来提升命令行工具的友好度,中文描述可以放在容器、数据集的「描述」字段
  • 更新对容器空闲的提醒文案,强调容器的负载超过 1% 那么容器将不会被关闭,详细信息请见 Jupyter 的自动关闭

2019 七月份产品更新

新功能

  • 我们正式提供命令行工具 bayes,通过命令行工具可以大大提升本地提交代码的体验,使用方式参见 bayes 命令行工具入门

错误修复与增强

  • 修复数据集列表页面在进入数据集的时候会偶尔报错的问题
  • 修复运行中容器的日志输出只显示一行的问题
  • 修复了文件输入/输出的内容显示错误

2019 六月产品更新

新功能

错误修复与增强

  • 在用户更新密码之后强制所有客户端重新登录
  • 在浏览器导航栏更新展示预览文件的 url,例如 LUNA/subset0

2019 三月产品更新(3)

错误修复

  • 数据集上传锁定整个数据集的问题,现在如果某一个版本出了问题不影响新版本的创建
  • 数据集 / 代码 zip 上传的验证和提示

新的功能

  • 容器按照操作时间进行排序
  • 增加 4 个公有数据集
    • AISHELL:178 小时中文普通话数据库(19.3 GB)
    • SynthText:由 80 万个图像组成,约有 800 万个合成单词实例(48 GB)
    • DOTA:2806 幅航拍图像,包含 188,282 个实例,每个实例由任意(8 d.o.f.)四边形标记(19.8 GB)
    • BERT:由 Google 发布的 BERT 预训练模型(5 GB)
  • JupyterLab 替换了 Jupyter Notebook
  • 新的 MXNet(v1.3.0)镜像支持
  • 支持 TensorBoard
    • 目前 OpenBayes 容器在创建 Task 或 Jupyter Notebook 时都已经支持了 TensorBoard 
  • metrics 展示界面
    • OpenBayes 默认提供了执行时的关键指标的展示,目前支持的有 CPU 以及 内存。未来将支持更多的指标 

界面增强

  • 创建容器时的镜像选择组件
  • 数据集绑定组件的展示方式
  • 新的数据集界面
  • 新的容器展示界面