AWS Auto Scaling応用：予測スケーリング、ターゲット追跡、ウォームプール

Auto Scalingは、需要に応じてリソースを自動調整するサービスです。本記事では、効率的なスケーリング戦略と高度な機能を解説します。

スケーリングポリシーの種類

比較

flowchart TB
    subgraph Policies["スケーリングポリシー"]
        Target["ターゲット追跡"]
        Step["ステップスケーリング"]
        Simple["シンプルスケーリング"]
        Scheduled["スケジュール"]
        Predictive["予測スケーリング"]
    end

    Target --> |"推奨"| Auto1["自動調整"]
    Predictive --> |"ML活用"| Auto2["先読み調整"]
    Step --> |"段階的"| Manual1["詳細制御"]
    Scheduled --> |"定期"| Manual2["時間ベース"]

    style Target fill:#22c55e,color:#fff
    style Predictive fill:#3b82f6,color:#fff

ポリシー	用途	特徴
ターゲット追跡	一般的なワークロード	自動調整、推奨
予測スケーリング	パターンのあるワークロード	ML活用、先読み
ステップスケーリング	複雑な要件	段階的なスケーリング
スケジュール	予測可能なパターン	時間ベース

ターゲット追跡スケーリング

設定

TargetTrackingScalingPolicy:
  Type: AWS::AutoScaling::ScalingPolicy
  Properties:
    AutoScalingGroupName: !Ref AutoScalingGroup
    PolicyType: TargetTrackingScaling
    TargetTrackingConfiguration:
      PredefinedMetricSpecification:
        PredefinedMetricType: ASGAverageCPUUtilization
      TargetValue: 50.0
      DisableScaleIn: false

# カスタムメトリクス
CustomMetricPolicy:
  Type: AWS::AutoScaling::ScalingPolicy
  Properties:
    AutoScalingGroupName: !Ref AutoScalingGroup
    PolicyType: TargetTrackingScaling
    TargetTrackingConfiguration:
      CustomizedMetricSpecification:
        MetricName: RequestCountPerTarget
        Namespace: AWS/ApplicationELB
        Dimensions:
          - Name: TargetGroup
            Value: !GetAtt TargetGroup.TargetGroupFullName
        Statistic: Sum
        Unit: Count
      TargetValue: 1000.0

複数ポリシーの組み合わせ

# CPUベース
CPUPolicy:
  Type: AWS::AutoScaling::ScalingPolicy
  Properties:
    PolicyType: TargetTrackingScaling
    TargetTrackingConfiguration:
      PredefinedMetricSpecification:
        PredefinedMetricType: ASGAverageCPUUtilization
      TargetValue: 60.0

# リクエスト数ベース
RequestPolicy:
  Type: AWS::AutoScaling::ScalingPolicy
  Properties:
    PolicyType: TargetTrackingScaling
    TargetTrackingConfiguration:
      PredefinedMetricSpecification:
        PredefinedMetricType: ALBRequestCountPerTarget
        ResourceLabel: !Sub "${ALB.FullName}/${TargetGroup.TargetGroupFullName}"
      TargetValue: 500.0

予測スケーリング

概要

flowchart LR
    subgraph Predictive["予測スケーリング"]
        History["履歴データ"]
        ML["機械学習"]
        Forecast["予測"]
        Scale["Scaling"]
    end

    History --> ML
    ML --> Forecast
    Forecast --> |"先読み"| Scale

    style Predictive fill:#3b82f6,color:#fff

設定

PredictiveScalingPolicy:
  Type: AWS::AutoScaling::ScalingPolicy
  Properties:
    AutoScalingGroupName: !Ref AutoScalingGroup
    PolicyType: PredictiveScaling
    PredictiveScalingConfiguration:
      MetricSpecifications:
        - TargetValue: 50
          PredefinedMetricPairSpecification:
            PredefinedMetricType: ASGCPUUtilization
          # または詳細設定
          CustomizedCapacityMetricSpecification:
            MetricDataQueries:
              - Id: capacity
                MetricStat:
                  Metric:
                    MetricName: GroupInServiceInstances
                    Namespace: AWS/AutoScaling
                    Dimensions:
                      - Name: AutoScalingGroupName
                        Value: !Ref AutoScalingGroup
                  Stat: Average
                ReturnData: true
          CustomizedLoadMetricSpecification:
            MetricDataQueries:
              - Id: load
                MetricStat:
                  Metric:
                    MetricName: RequestCount
                    Namespace: AWS/ApplicationELB
                  Stat: Sum
                ReturnData: true
      Mode: ForecastAndScale  # または ForecastOnly
      SchedulingBufferTime: 300  # 5分前にスケール
      MaxCapacityBreachBehavior: IncreaseMaxCapacity
      MaxCapacityBuffer: 10  # 予測の10%上乗せ

ウォームプール

概要

flowchart TB
    subgraph WarmPool["ウォームプール"]
        Pool["プール内インスタンス<br/>（停止状態）"]
        InService["InService<br/>（稼働中）"]
    end

    Pool --> |"スケールアウト"| InService
    InService --> |"スケールイン"| Pool

    style WarmPool fill:#f59e0b,color:#000

設定

AutoScalingGroup:
  Type: AWS::AutoScaling::AutoScalingGroup
  Properties:
    # ... 基本設定 ...

WarmPool:
  Type: AWS::AutoScaling::WarmPool
  Properties:
    AutoScalingGroupName: !Ref AutoScalingGroup
    MinSize: 2
    MaxGroupPreparedCapacity: 5
    PoolState: Stopped  # または Running, Hibernated
    InstanceReusePolicy:
      ReuseOnScaleIn: true

# ライフサイクルフック
WarmPoolHook:
  Type: AWS::AutoScaling::LifecycleHook
  Properties:
    AutoScalingGroupName: !Ref AutoScalingGroup
    LifecycleTransition: autoscaling:EC2_INSTANCE_LAUNCHING
    DefaultResult: CONTINUE
    HeartbeatTimeout: 300
    NotificationTargetARN: !Ref HookTopic
    RoleARN: !GetAtt HookRole.Arn

起動時間の比較

方式	起動時間	コスト
通常起動	3-5分	低
Stopped	1-2分	中
Hibernated	30秒-1分	高
Running	即時	最高

インスタンスリフレッシュ

概要

flowchart TB
    subgraph Refresh["インスタンスリフレッシュ"]
        Old["旧インスタンス"]
        New["新インスタンス"]
        Rolling["ローリング更新"]
    end

    Old --> |"順次置換"| Rolling
    Rolling --> New

    style Refresh fill:#22c55e,color:#fff

設定

# インスタンスリフレッシュ開始
aws autoscaling start-instance-refresh \
    --auto-scaling-group-name my-asg \
    --strategy Rolling \
    --preferences '{
        "MinHealthyPercentage": 90,
        "InstanceWarmup": 300,
        "MaxHealthyPercentage": 110,
        "SkipMatching": true,
        "ScaleInProtectedInstances": "Refresh",
        "StandbyInstances": "Terminate"
    }' \
    --desired-configuration '{
        "LaunchTemplate": {
            "LaunchTemplateId": "lt-1234567890abcdef0",
            "Version": "$Latest"
        }
    }'

CloudFormation定義

AutoScalingGroup:
  Type: AWS::AutoScaling::AutoScalingGroup
  UpdatePolicy:
    AutoScalingRollingUpdate:
      MaxBatchSize: 2
      MinInstancesInService: 2
      MinSuccessfulInstancesPercent: 100
      PauseTime: PT10M
      WaitOnResourceSignals: true
      SuspendProcesses:
        - HealthCheck
        - ReplaceUnhealthy
        - AZRebalance
        - AlarmNotification
        - ScheduledActions

混合インスタンスポリシー

スポットインスタンス併用

AutoScalingGroup:
  Type: AWS::AutoScaling::AutoScalingGroup
  Properties:
    MixedInstancesPolicy:
      InstancesDistribution:
        OnDemandBaseCapacity: 2
        OnDemandPercentageAboveBaseCapacity: 30
        SpotAllocationStrategy: capacity-optimized
        SpotInstancePools: 0
        OnDemandAllocationStrategy: lowest-price
      LaunchTemplate:
        LaunchTemplateSpecification:
          LaunchTemplateId: !Ref LaunchTemplate
          Version: !GetAtt LaunchTemplate.LatestVersionNumber
        Overrides:
          - InstanceType: m5.large
          - InstanceType: m5.xlarge
          - InstanceType: m4.large
          - InstanceType: m4.xlarge
          - InstanceType: c5.large

スケーリングクールダウン

設定

AutoScalingGroup:
  Type: AWS::AutoScaling::AutoScalingGroup
  Properties:
    DefaultCooldown: 300
    HealthCheckGracePeriod: 300

# ポリシー別クールダウン
ScaleOutPolicy:
  Type: AWS::AutoScaling::ScalingPolicy
  Properties:
    PolicyType: SimpleScaling
    AdjustmentType: ChangeInCapacity
    ScalingAdjustment: 2
    Cooldown: 180  # スケールアウト用

ScaleInPolicy:
  Type: AWS::AutoScaling::ScalingPolicy
  Properties:
    PolicyType: SimpleScaling
    AdjustmentType: ChangeInCapacity
    ScalingAdjustment: -1
    Cooldown: 300  # スケールイン用（長め）

終了ポリシー

終了順序

AutoScalingGroup:
  Type: AWS::AutoScaling::AutoScalingGroup
  Properties:
    TerminationPolicies:
      - OldestLaunchConfiguration
      - OldestLaunchTemplate
      - ClosestToNextInstanceHour
      - OldestInstance
      - Default

ポリシー	説明
OldestInstance	最も古いインスタンス
NewestInstance	最も新しいインスタンス
OldestLaunchConfiguration	古い起動設定
ClosestToNextInstanceHour	課金時間に近い
Default	AZバランス→古い起動設定→課金時間

ベストプラクティス

flowchart TB
    subgraph BestPractices["Best Practices"]
        Target["ターゲット追跡を基本に"]
        Predictive["予測スケーリング併用"]
        Warmup["適切なウォームアップ"]
        Mixed["混合インスタンス"]
    end

    style BestPractices fill:#22c55e,color:#fff

カテゴリ	項目
基本	ターゲット追跡ポリシーを使用
高度	予測スケーリングでML活用
パフォーマンス	ウォームプールで起動高速化
コスト	スポットインスタンス併用

まとめ

機能	用途
ターゲット追跡	自動的なメトリクスベーススケーリング
予測スケーリング	パターンベースの先読みスケーリング
ウォームプール	起動時間の短縮
混合インスタンス	コスト最適化

Auto Scalingの高度な機能を活用することで、効率的でコスト最適化されたスケーリングを実現できます。

スケーリングポリシーの種類

比較

ターゲット追跡スケーリング

設定

複数ポリシーの組み合わせ

予測スケーリング

概要

設定

ウォームプール

概要

設定

起動時間の比較

インスタンスリフレッシュ

概要

設定

CloudFormation定義

混合インスタンスポリシー

スポットインスタンス併用

スケーリングクールダウン

設定

終了ポリシー

終了順序

ベストプラクティス

まとめ

参考資料