DATABASE/Hive
-
UNION과 UNION ALL의 차이점DATABASE/Hive 2024. 9. 29. 11:57
프로젝트를 진행하면서 순위 관련 쿼리문을 자주 작성하다 보니, UNION과 UNION ALL에 대해 더 깊이 알아봐야겠다는 필요성을 느꼈다. 또한 중복된 데이터가 왜 필요한지, 그리고 주로 어떤 곳에 활용되는지에 대한 궁금증이 생겼다. 이를 통해 더 알아볼 필요가 있다고 생각했다. UNION과 UNION ALL 둘 다 두 개 이상의 쿼리 결과를 합치는 데 사용되지만, 중요한 차이점이 있다. 1. UNION (중복 제거)- 중복을 제거한다.- 결과 집합에서 중복된 행은 한 번만 나타난다. 1) 중복 제거가 필요한 경우/*여러 쿼리의 결과를 결합하면서 중복된 레코드를 제거하고 싶을 때 사용한다.예시로 두 개의 테이블에서 고객 데이터를 가져와서 고유한 고객 목록을 생성하고 싶을 때 적합하다.*/SELECT c..
-
HiveQL - SELECT 문DATABASE/Hive 2024. 6. 11. 21:53
중첩 SELECT 문상위 2개의 테이블을 사용하여 고객의 총 주문 금액을 계산하고, 총 주문 금액이 300,000원 이상인 고객을 선택하는 쿼리를 작성했다.SELECT a.고객ID ,a.이름 ,a.총_주문금액 FROM ( SELECT 고객.고객ID, 고객.이름, SUM(주문.주문금액) AS 총_주문금액 FROM 고객 JOIN 주문 ON 고객.고객ID = 주문.고객ID GROUP BY 고객.고객ID, 고객.이름 ) a # 서브쿼리를 이용하여 a라는 테이블로 임시 테이블을 생성WHERE a.총_주문금액 >= 300000 # 조건에 일치하는 데이터를LIMIT 10; # 상위 10위를 뽑아냄 결과 1) 서브쿼리의 결과는 다음과 같다.고객ID이름총_주문금액1김철수2..