Skip to content

Amazon S3에서 Snowflake로 데이터 전송하기

데이터가 현재 Amazon S3에 있는 경우, ELT(추출 로드 변환) 프로세스를 사용하여 Snowflake 또는 다른 관계형 데이터 웨어하우스로 데이터를 전송할 수 있습니다.

자동화된 로드 프로세스

이 자동화된 로드 프로세스는 데이터를 스노우플레이크로 옮기고, 이를 통해 브라즈 룩커 블록을 사용하여 룩커에서 해당 데이터를 시각화하여 캠페인, 캔버스 및 세그먼트에 대한 인사이트와 피드백을 도출할 수 있습니다.

Currents to S3 내보내기를 설정하고 라이브 이벤트 데이터를 수신하고 나면 다음 구성 요소를 구성하여 Snowflake에서 라이브 ELT 파이프라인을 구성할 수 있습니다:

AWS SQS 대기열 구성

자동 수집 스노우파이프는 S3에서 스노우파이프로 알림을 전송하기 위해 SQS 대기열을 사용합니다. 이 프로세스는 SQS를 구성한 후 Snowflake에서 관리합니다.

1단계: 외부 S3 스테이지 구성

Braze에서 커런트를 설정할 때, 커런트 파일이 S3 버킷에 따라갈 폴더 경로를 지정하세요. 여기서는 기본 폴더 경로인 currents 을 사용합니다.

그런 다음 나열된 순서대로 다음을 생성합니다:

  1. AWS에서 조직의 보안 요구 사항에 따라 권한을 부여하여 원하는 S3 버킷에 대한 새 공개-개인 키 쌍을 생성합니다.

  2. 스노우플레이크에서 원하는 데이터베이스와 스키마를 만듭니다(다음 예제에서는 currentspublic ).

  3. 눈송이 S3 스테이지를 생성합니다( braze_data):

1
2
3
4
5
CREATE OR REPLACE STAGE
    currents.public.braze_data
    url='s3://snowpipe-demo/'
    credentials = (AWS_KEY_ID = '...' AWS_SECRET_KEY = '...' );
show stages;

다음으로 스테이지에 사용할 AVRO 파일 형식을 정의합니다.

1
2
3
4
CREATE FILE FORMAT
    currents.public.currents_avro
    type = 'avro'
    compression = 'auto';
1
2
3
4
ALTER STAGE
    currents.public.braze_data
SET
    file_format = currents.public.currents_avro;
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
CREATE OR REPLACE PIPE
  pipe_users_messages_pushnotification_open
    auto_ingest=true AS

COPY INTO
  users_messages_pushnotification_open
          FROM
           (SELECT
             $1:id::STRING,
             $1:user_id::STRING,
             $1:external_user_id::STRING,
              $1:time::INT,
              $1:timezone::STRING,
              $1:app_id::STRING,
              $1:campaign_id::STRING,
              $1:campaign_name::STRING,
              $1:message_variation_id::STRING,
              $1:canvas_id::STRING,
              $1:canvas_name::STRING,
              $1:canvas_variation_id::STRING,
              $1:canvas_step_id::STRING,
              $1:canvas_step_message_variation_id::STRING,
              $1:platform::STRING,
              $1:os_version::STRING,
              $1:device_model::STRING,
              $1:send_id::STRING,
              $1:device_id::STRING,
              $1:button_action_type::STRING,
              $1:button_string::STRING

              FROM
@currents.public.braze_data/currents/dataexport.prod-01.S3.integration.INTEGRATION_ID_GOES_HERE/event_type=users.messages.pushnotification.Open/);

마지막으로 show pipes; 명령을 사용하여 SQS 정보를 표시합니다. 이 파이프는 자동 수집 파이프로 만들어졌기 때문에 SQS 큐의 이름은 NOTIFICATION_CHANNEL 이라는 새 열에 표시됩니다.

2단계: 버킷 이벤트 만들기

AWS에서 새 눈송이 단계의 해당 버킷으로 이동합니다. 그런 다음 속성 탭에서 이벤트로 이동합니다.

AWS 속성 탭

필요에 따라 각 커런츠 데이터 세트(메시징, 사용자 행동) 또는 둘 다에 대해 새 이벤트를 생성합니다.

AWS에서 새 이벤트 만들기

양식 하단(눈송이의 알림 채널 열에서)에 있는 ARN과 개체 만들기 알림에 해당하는 상자를 선택합니다.

자동 인제스트 스노우파이프 구성

AWS SQS 구성이 올바른 테이블을 생성하도록 하려면 메시지 참여 또는 메시징 이벤트, 사용자 또는 고객 행동 이벤트 또는 둘 다에 대한 커런츠 문서에 명시된 다음 예제와 스키마를 사용하여 수신 데이터의 구조를 올바르게 정의해야 합니다.

브레이즈 커런츠는 특정 데이터 유형의 특정 필드를 통해 지속적으로 데이터를 로드하므로 브레이즈 커런츠 스키마에 따라 테이블을 구성하는 것이 중요합니다. 예를 들어 user_id 은 문자열로 로드되고 Currents 데이터에서 user_id 으로 호출됩니다.

먼저, Currents 스키마에서 다음 구조를 사용하여 지속적으로 로드할 INTO 테이블을 만듭니다:

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
CREATE TABLE
  users_behaviors_app_firstsession (
        id               STRING,
        user_id          STRING,
        external_user_id STRING,
        app_id           STRING,
        time             INT,
        session_id       STRING,
        gender           STRING,
        country          STRING,
        timezone         STRING,
        language         STRING,
        device_id        STRING,
        sdk_version      STRING,
        platform         STRING,
        os_version       STRING,
        device_model     STRING
    );

그런 다음 auto_ingest 파이프를 만들고 지정합니다:

  1. 로드할 테이블
  2. 다음 표를 로드하는 방법
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
CREATE OR REPLACE PIPE
  pipe_users_behaviors_app_firstsession
    auto_ingest=true AS

COPY INTO
  users_behaviors_app_firstsession
          FROM
            (SELECT
              $1:id::STRING,
              $1:user_id::STRING,
              $1:external_user_id::STRING,
              $1:app_id::STRING,
              $1:time::INT,
              $1:session_id::STRING,
              $1:gender::STRING,
              $1:country::STRING,
              $1:timezone::STRING,
              $1:language::STRING,
              $1:device_id::STRING,
              $1:sdk_version::STRING,
              $1:platform::STRING,
              $1:os_version::STRING,
              $1:device_model::STRING

              FROM
@currents.public.braze_data/currents/dataexport.prod-01.S3.integration.INTEGRATION_ID_GOES_HERE/event_type=users.behaviors.app.FirstSession/);

먼저, Currents 스키마에서 다음 구조를 사용하여 지속적으로 로드할 INTO 테이블을 만듭니다:

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
CREATE TABLE
    public_users_messages_pushnotification_open (
        id STRING,
        user_id STRING,
        external_user_id STRING,
        time INT,
        timezone STRING,
        app_id STRING,
        campaign_id STRING,
        campaign_name STRING,
        message_variation_id STRING,
        canvas_id STRING,
        canvas_name STRING,
        canvas_variation_id STRING,
        canvas_step_id STRING,
        canvas_step_message_variation_id STRING,
        platform STRING,
        os_version STRING,
        device_model STRING,
        send_id STRING,
        device_id STRING,
        button_action_type STRING,
        button_string STRING
        );

그런 다음 자동 연속 로드 파이프를 생성하고 지정합니다:

  1. 로드할 테이블
  2. 다음 표를 로드하는 방법
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
CREATE OR REPLACE PIPE
  pipe_users_messages_pushnotification_open
    auto_ingest=true AS

COPY INTO
  users_messages_pushnotification_open
          FROM
           (SELECT
             $1:id::STRING,
             $1:user_id::STRING,
             $1:external_user_id::STRING,
              $1:time::INT,
              $1:timezone::STRING,
              $1:app_id::STRING,
              $1:campaign_id::STRING,
              $1:campaign_name::STRING,
              $1:message_variation_id::STRING,
              $1:canvas_id::STRING,
              $1:canvas_name::STRING,
              $1:canvas_variation_id::STRING,
              $1:canvas_step_id::STRING,
              $1:canvas_step_message_variation_id::STRING,
              $1:platform::STRING,
              $1:os_version::STRING,
              $1:device_model::STRING,
              $1:send_id::STRING,
              $1:device_id::STRING,
              $1:button_action_type::STRING,
              $1:button_string::STRING

              FROM
@currents.public.braze_data/currents/dataexport.prod-01.S3.integration.INTEGRATION_ID_GOES_HERE/event_type=users.messages.pushnotification.Open/);

브레이즈 커런트를 사용하여 수행할 수 있는 분석의 유형을 확인하려면 룩커 블록을 참조하세요.

이 페이지가 얼마나 도움이 되었나요?
New Stuff!