helena1129 2024. 9. 26. 15:03

관계

  • 논리적 계층에서 두 개의 데이터를 열을 기준으로 연결하는 방법

  • 두 개의 데이터를 관계로 연결해도 데이터를 별도로 유지하기 때문에 두 데이터를 한 번에 볼 수 없다

  • 기본적으로는 교집합인 데이터만 보여준다

  • 측정값을 추가하면 교집합이 아닌 데이터도 확인 가능하다

조인

  • 물리적 계층에서 두 개의 데이터를 열을 기준으로 연결하는 방법

  • 연결하면 두 데이터 사이에 벤 다이어그램이 추가된다
  • 관계와는 다르게 두 테이블의 열을 결합한 하나의 큰 테이블이 생성된다
  • 벤 다이어그램의 팝업 메뉴를 통해 조인의 종류를 설정 가능
  • 조인 기준이 두 번 이상 충족되면 중복이 발생할 수 있음

블렌드

  • 단순히 조인하면 값이 중복되는 일이 발생하므로 이를 방지하는 방법
  • 두 데이터의 세부 수준(Level of Detail)이 다르기 때문

같은 파일을 불러와 각각 다른 데이터 선택

 

끊긴 링크 아이콘을 클릭해서 연결, 뜨지 않는다면 Data - Edit Blend Relationships에서 직접 연결을 추가

 

열 이름이 다르면 직접 Edit Blend Relationship에서 추가한 뒤 연결

 

  • left join과 비슷하게 작동
  • 주 데이터셋의 모든 데이터를 사용하고, 보조 데이터셋에서 일치하는 값들만 가져옴
  • 조인과 달리 혼합은 결합된 테이블을 만들지 않는다

유니온

  • 조인과 블렌드, 관계는 기존 데이터셋에 (측정값과 차원)을 추가
  • 유니온은 을 추가
  • 관계(조인)과 달리 데이터를 으로 추가
  • 첫 워크시트 아래에 두번째 워크시트를 추가한 셈
  • 데이터를 어디에서 가져왔는지 알려주는 열이 추가됨
  • 열의 이름이 다른 경우: 두 열을 함께 선택한 후 우클릭 - Merge Mismatched Fields

조인과 관계를 사용할 때에 대한 설명

  • 기본적으로 관계를 사용하고 정말 필요할 때만 조인을 사용
  • 관계의 장점: 데이터 중복이 발생하지 않음 & 사용하지 않는 데이터는 불러오지 않는다
  • 참고) 데이터 중복은 LOD expressions를 사용해 처리 가능

데이터 프로퍼티 관리하기

  1. 데이터 원본 패널 & 시트에서 데이터 이름 변경 가능
  2. 별칭(alias) 설정 가능 → 차트에서 표시됨
  3. 데이터 필드에 지리적 역할 할당: 디폴트는 자동 인식(Zip, State, Country, City 등)

→ 지리적 시각화 가능

→ Map - Edit Locations 활용해서 지역 변경 가능

   4. 데이터 유형 변경(ex. 숫자 → 문자): 적절하게 변환 가능한 유형으로 선택해야 함

   5. 기본 프로퍼티 변경(ex. 합계 → 평균)