IT

#2 구글 애널리틱스 GA4_데이터 수집하기

Lemong 2023. 4. 9. 18:41
반응형
  • 구글 애널리틱스 데이터 수집하기

    웹사이트에 추적코드를 심어 놓으면, 사용자가 웹사이트를 방문하여 액션을 취할 때마다 웹사이트와 사용자 간 상호작용(interactions) 정보가 수집됩니다. 웹사이트에서 고유한 하나하나의 사용자 상호작용을 GA4에서는 이벤트(event)라고 합니다. 페이지 조회, 링크/버튼의 클릭, 스크롤 내리기, 동영상 조회 등이 이벤트에 포함됩니다.

  • 수집 정보

    데이터는 크게 사용자, 채널(유입 경로), 행동(이벤트), 그리고 전환(conversion) 네 가지 카테고리로 구분할 수 있습니다.

  • 사용자 정보는 사용자의 연령과 성별 등 인구통계 정보, 기기 카테고리, 브라우저, 운영체제 등 기술 정보를 포함합니다.

  • 채널 정보는 소스와 매체, 기본 채널 그룹, 캠페인 등 유입 경로 정보를 포함합니다.

  • 사용자 행동과 관련해서는 웹사이트에 도달에서 떠날 때까지 조회한 페이지 정보를 자동으로 수집합니다. GA4에서는 향상된 측정 기능이 도입되어, 스크롤 깊이(90%), 유튜브 동영상 조회, 사이트 검색, 파일 다운로드, 양식 상호작용, 아웃바운드 링크 클릭 이벤트를 자동으로 수집해 줍니다.

  • 전환 데이터는 웹사이트 유형에 따라 조금씩 다를 수 있지만, 대체로 아래와 같은 사용자 행동 데이터를 예로 들 수 있습니다.

    전자상거래 사이트: 결제/구매 데이터
    커뮤니티/매체 사이트: 회원가입 및 구독신청
    B2B나 오프라인 기반의 서비스 웹사이트: 견적문의/상담신청/서비스예약 등
    이들 전환 데이터는 자동으로 수집되지않기에, 전자상거래 추적 설정 또는 맞춤 이벤트 추적 설정과 같은 추가 이벤트 설정을 통해 별도로 데이터를 수집해 주어야 합니다.


  • 측정 프로토콜(Measurement Protocol)

    측정 프로토콜은 이벤트를 수집하고 구글 애널리틱스 서버로 직접 전송하는 과정에 대한 일련의 표준 규칙입니다. 소스 코드에 직접 GA 추적코드를 설치하든, 구글 태그관리자(GTM)를 통해 GA 태그를 설치하든 모든 애널리틱스 데이터는 측정 프로토콜 방식으로 GA 서버에 전송됩니다.

  • 측정기준과 측정항목

    애널리틱스 데이터는 크게 측정기준(dimensions)과 측정항목(metrics)으로 나뉩니다. GA 속성에서는 이들 측정기준과 측정항목을 조합하여 다양한 유형의 보고서를 제공하는데, 이를 기본 보고서(basic reports)라고 합니다.

  • 측정기준(dimensions): What

    측정기준은 데이터의 속성을 의미하며, 측정기준을 갖고 데이터를 구분합니다. 데이터를 설명하며 일반적으로 숫자가 아닌 텍스트로 되어 있습니다. 연령, 성별, 기기 카테고리, 소스/매체, 기본 채널 그룹, 방문 페이지, 이벤트 이름, 거래 ID, 항목 이름 등 구글 애널리틱스의 보고서를 구성하는 각각의 항목이 측정기준에 포함됩니다.

  • 측정항목(metrics)(How)

    측정항목은 합계, 비율, 시간 또는 금액으로 측정될 수 있는 양적 측정 요소를 말합니다. 우리가 흔히 지표라고 부르며, 항상 텍스트가 아닌 숫자로 되어 있습니다. 측정항목의 특징 중 하나는 수학 연산을 적용할 수 있다는 점입니다. 사용자, 새 사용자 수, 참여 세션수, 참여율, 평균 참여 시간, 이벤트 수, 전환, 총 수익 등의 지표가 측정항목에 포함됩니다.


이벤트, 세션, 사용자

  • 이벤트
    이벤트 구글 애널리틱스에서 가장 작은 데이터 수집 단위로 사용자가 웹사이트나 앱에서 행하는 모든 개별적 상호작용을 말합니다. 첫 방문(first_visit), 세션 시작(session_start), 페이지 조회(page_view), 참여(user_engagement), 클릭(click), 스크롤(scroll), 구매(purchase) 등의 사용자 상호작용을 이벤트 예시로 들 수 있습니다.

  • 세션
    세션은 사용자가 웹사이트를 방문한 시점부터 웹사이트를 떠난 시점까지의 기간을 의미합니다. 달리 표현하자면, 동일한 사용자가 1회 방문 동안 발생시킨 이벤트 집합을 말합니다. 사용자의 활동성을 토대로 이벤트를 그룹화하며(하나의 세션으로 묶으며) 30분 동안 활동이 없는 경우 해당 세션이 종료됩니다.

  • 사용자
    사용자는 웹사이트나 앱에서 상호작용하는 사용자를 하나의 사용자로 인식하는 단위를 의미합니다. 유저 ID(User-ID), 구글 신호데이터(Google Signals) 및 기기 ID(Device-ID)를 토대로 사용자를 식별합니다.


구글 애널리틱스 계정 구조

  • 계정(Account)
    계정은 구글 애널리틱스의 계정 구조의 최상위 레벨에 해당하며 속성을 포함합니다. 애널리틱스에 접속하려면 하나 이상의 계정이 있어야 합니다. 보통 회사/조직 별로 하나의 계정을 운영합니다

  • 속성(Property)
    속성은 추적코드가 발급되는 단위이자, 이 코드를 통해 수집한 데이터를 다양한 보고서를 통해 확인할 수 있는 곳입니다. 데이터의 수집과 분석이 속성 단위에서 이뤄진다고 생각하면 쉽습니다. 이에 따라 보통 웹사이트(브랜드) 별로 속성을 만들어 운영합니다.속성 설정, 데이터 스트림 설정, 데이터 설정(수집/보관/필터), 기여 분석 설정 등 주요 설정뿐만 아니라 구글애즈, 빅쿼리, 서치 콘솔 등 구글 제품과의 연동도 속성 단위에서 이뤄집니다.

  • 데이터 스트림(Data stream)
    속성 내에 위치하며 앱 또는 웹사이트의 데이터 소스를 말합니다. 속성마다 최대 3개의 데이터 스트림을 사용하는 것이 좋습니다.정리하자면, 보통 회사별로 하나의 GA 계정을 만들어 사용합니다. 다수의 브랜드 즉 다수의 웹사이트를 운영하는 경우 브랜드 별로 속성을 만들어 운영하며, 각 속성이 개별 분석 단위가 됩니다. 물론 여러 브랜드가 상호 유기적으로 운영된다면 하나의 속성을 운영하는 것도 방법입니다

참고: 오컴데이터 https://occamdata.kr/blog/google-analytics-4/1754/

반응형