有关 Amazon S3 中安全功能的更多信息,请参阅 访问控制主题在 Amazon S3 开发人员指南。
数据持久性和可靠性
Amazon S3 为任务关键型和主要数据存储提供了高度持久的存储基础设施。Amazon S3 通过冗余方式将数据存储在多个设施以及一个设施内的多个设备上。为了提高耐用性,Amazon S3 在确认数据已成功存储之前会将数据同步存储在多个设施中。此外,Amazon S3 还会在存储或检索数据时对所有网络流量计算校验和,以检测数据包是否损坏。与需要进行费时耗力的数据验证和手工修复的传统系统不同,Amazon S3 可以定期执行系统的数据完整性校验,并且内置了自动的自我修复功能。
Standard 具有以下特点:
以 Amazon S3 服务等级协议作为后盾,以确保可用性。
设计旨在特定年度内为对象提供 99.999999999% 的持久性和 99.99% 的可用性。
能够承受同时两个设施中的数据丢失。
Standard – Infrequent Access 具有以下特点:
以 Amazon S3 服务等级协议作为后盾,以确保可用性。
设计目的是在指定年度内为对象提供 99.999999999% 的耐用性和 99.9% 的可用性。
能够承受同时两个设施中的数据丢失。
Amazon Glacier 具有以下特点:
设计目的是在指定年度内为对象提供 99.999999999% 的耐用性。
能够承受同时两个设施中的数据丢失。
管理您的数据
Amazon S3 让数据管理变得异常简便。 通过 Amazon S3 的数据生命周期管理功能,您可以自动将数据对象存档到成本更低的存储选项,或者执行重复删除,帮助您降低数据对象在生命周期内的成本。 Amazon S3 还允许您监视和控制不同业务职能部门的成本。 所有这些管理功能都可以使用 Amazon S3 API 或管理控制台轻松管理。 下面将详细介绍 Amazon S3 提供的各种数据管理功能。
数据生命周期管理
随着您的数据不断发展,Amazon S3 可以自动分配和更改成本和性能特性。它甚至还能自动执行常见的数据生命周期管理任务,包括预配置容量、自动迁移以降低费用层级,以及遵守法规合规性策略和最终按计划删除。
在存储新数据时,Amazon S3 让您不必再计划容量,因为它能够按需扩展,您只需为使用的容量付费即可。如果采用传统的存储系统,计划容量是一个极易出错的过程,尤其是存储需求的增长无法预测时。过度的预配置容量会导致设备闲置和成本增加,而预配置不足又会让您超出计划过早进行昂贵的硬件升级。
随着数据老化,或者在硬件故障或到达使用寿命时,Amazon S3 会自动并且透明地负责将您的数据迁移到新硬件上。 这种机制让您不必执行昂贵、耗时且风险极大的硬件迁移。 随着数据老化,Amazon S3 还可以自动将数据迁移到成本较低的存储中。您可以基于数据的使用年限定义规则,将 Amazon S3 对象自动迁移到 Standard – Infrequent Access (Standard – IA) 或 Amazon Glacier。
一旦数据结束了其生命周期,Amazon S3 还提供了编程选项,用于删除重复和大量数据。对于重复删除,您可以将规则定义为在预定义的时间段后删除对象集。这些规则可用于存储在 Standard 或 Standard – IA 中的对象,也适用于已归档到 Amazon Glacier 的对象。
您还可以针对 Amazon S3 对象的版本定义生命周期规则以降低存储成本。例如,您可以创建规则,当较旧版本的对象不再需要时自动将其彻底删除,从而节省资金并提高性能。除此之外,您还可以创建规则来将较旧的版本自动迁移到 Standard – IA 或 Amazon Glacier,从而进一步降低您的存储成本。
成本监视和控制
Amazon S3 提供了多种用于管理和控制成本的功能。 您可以使用 AWS 管理控制台和 Amazon S3 API 为 Amazon S3 存储桶添加标签,以便您将成本分配到多个业务维度,包括成本中心、应用程序名称或拥有者。 然后,您可以使用亚马逊 AWS 成本分摊报告(其中显示了按标签统计的使用情况和成本)来查看成本的分布。有关为 S3 存储段添加标签的详细信息,请参阅 Amazon S3 Developer Guide 中的 Bucket Tagging 主题。
传输大量数据
您可以使用 AWS Direct Connect 将大批量数据传输到 Amazon S3。AWS Direct Connect 服务便于您建立一个连接内部设施和 AWS 的专用网络。使用 AWS Direct Connect,您可以在 AWS 和数据中心、办公室或主机托管环境之间建立私有网络连接。在很多情况下,这样做可以降低网络成本、提高带宽吞吐量,并提供比基于 Internet 的连接更为一致的网络体验。