数据源
简介
Service Workbench 可以在内部托管数据集,并提供在部署Service Workbench的AWS账户之外的S3存储桶中的外部数据集的访问权限。数据源页面使管理员能够配置和管理这些外部数据集。
外部数据集账户必须向 Service Workbench 提供访问包含外部数据集的特定 S3 存储桶和路径的权限。这些权限是使用Service Workbench程序生成的 AWS CloudFormation 模板在外部账户中创建的。
数据源页面列出了已在 Service Workbench 中注册的外部数据集。外部数据集也出现在具有权限的用户的数据集页面上。
使用 Service Workbench 注册外部数据集
要注册外部数据集,请执行以下步骤:
第 1 步:设置外部学习账户
- 使用左侧的菜单导航到 数据源 页面。
- 点击注册数据集按钮。
- 输入包含 S3 存储桶的 AWS 账户的 AWS 账户 ID。
- 先前注册的外部学习账户可在下拉列表中找到。
- 如果选择了之前注册的账户,请跳到第 2 步。
- 选择将用于部署注册CloudFormation模板的区域。
- 在 Service Workbench UI 中输入用于标识此账户的账户名称。
- 指定账户的可选联系信息。
步骤 2:指定 S3 存储桶详细信息
- 对于 Bucket Name,选择外部 S3 存储桶的名称。
- 下拉列表中提供了以前注册的外部存储桶。
- 如果选择了之前注册的存储桶,则跳到步骤 3。
- 对于 Bucket Region,选择一个区域。
- 对于Bucket Default Encryption,如果外部存储桶使用AWS Key Management Service key (SSE-KMS),则KMS Arn 字段需要一个值。
步骤 3:指定数据集详细信息
- 单击添加数据集。
- 对于 Study Id,输入唯一的数据集 ID。
- 对于 Study Name,输入数据集名称。
- 对于 Study Folder,输入文件夹名称(S3 存储桶中的路径)。
- 对于项目,选择一个项目。
- 选择类型。有关详细信息,请参阅 创建数据集。
- 对于 Access,选择 Read Only 或 Read/Write。如果是组织的数据集,则可以在数据集页面上按用户分配适当的权限。
- 对于 Description,输入数据集项目详细信息。
- 对于 Study KMS ARN,输入值(如果适用)。
- 对于Admin,如果是组织数据集,请为数据集选择一个或多个管理员。这可以稍后在 数据集 页面上进行编辑。
- 单击保存并继续。
将显示一个信息面板,指示账户、存储桶和数据集已在 Service Workbench 中注册。最后一步是使用生成的 CloudFormation 模板加入账户。
加入外部数据集账户
如果外部数据集账户是首次加入 Service Workbench,则选择 Create Stack 选项。该应用程序将生成一个适合首次加入的新 CloudFormation 模板。
如果外部数据集账户已注册(请参阅上面的“使用 Service Workbench 注册外部数据集”部分),则选择 Update Stack 选项。该应用程序生成对先前部署的 CloudFormation 模板的更新。
首次注册外部数据集账户:
- 在 Register Studies 窗口中,单击 Next 以显示 CloudFormation 模板信息。
- 显示生成的 CloudFormation 模板,特定于外部学习账户和外部 S3 存储桶。选择了适当的 Create Stack 或 Update Stack 选项。
- 如果您拥有外部数据集账户的管理员权限:
- 在新的浏览器选项卡中,登录 AWS 管理控制台中的外部数据集账户。确保选择了正确的区域。
- 在 Service Workbench 中,根据需要单击 Create Stack 或 Update Stack 按钮,将 CloudFormation 模板加载到 AWS 管理控制台中。
- 在 AWS 管理控制台中,按照提示操作并单击 Create Stack。
- 单击完成。
- 如果您对 S3 存储桶所在的 AWS 账户没有管理员访问权限:
- 单击按钮将 CloudFormation 模板链接复制到剪贴板。
- 向账户管理员创建一封电子邮件,其中包含指向 CloudFormation 模板的链接。 注意:指向 CloudFormation 模板的链接有效期为 12 小时。
- 单击完成。
- 显示数据源页面,新注册的数据集处于 Pending 状态。在所有初始工作完成并且 Service Workbench 可以访问数据集后,它将显示状态为可用。
- 单击测试连接。
删除外部数据集
目前不支持删除外部数据集,该功能会在以后的版本实现。
要删除对外部数据集账户中数据的访问权限,请删除 AWS 账户中的 CloudFormation 堆栈(在上面的“启用外部数据集账户部分”中指定)。这将删除允许访问数据的权限。