분류 전체보기
-
UNION과 UNION ALL의 차이점DATABASE/Hive 2024. 9. 29. 11:57
프로젝트를 진행하면서 순위 관련 쿼리문을 자주 작성하다 보니, UNION과 UNION ALL에 대해 더 깊이 알아봐야겠다는 필요성을 느꼈다. 또한 중복된 데이터가 왜 필요한지, 그리고 주로 어떤 곳에 활용되는지에 대한 궁금증이 생겼다. 이를 통해 더 알아볼 필요가 있다고 생각했다. UNION과 UNION ALL 둘 다 두 개 이상의 쿼리 결과를 합치는 데 사용되지만, 중요한 차이점이 있다. 1. UNION (중복 제거)- 중복을 제거한다.- 결과 집합에서 중복된 행은 한 번만 나타난다. 1) 중복 제거가 필요한 경우/*여러 쿼리의 결과를 결합하면서 중복된 레코드를 제거하고 싶을 때 사용한다.예시로 두 개의 테이블에서 고객 데이터를 가져와서 고유한 고객 목록을 생성하고 싶을 때 적합하다.*/SELECT c..
-
HiveQL - SELECT 문DATABASE/Hive 2024. 6. 11. 21:53
중첩 SELECT 문상위 2개의 테이블을 사용하여 고객의 총 주문 금액을 계산하고, 총 주문 금액이 300,000원 이상인 고객을 선택하는 쿼리를 작성했다.SELECT a.고객ID ,a.이름 ,a.총_주문금액 FROM ( SELECT 고객.고객ID, 고객.이름, SUM(주문.주문금액) AS 총_주문금액 FROM 고객 JOIN 주문 ON 고객.고객ID = 주문.고객ID GROUP BY 고객.고객ID, 고객.이름 ) a # 서브쿼리를 이용하여 a라는 테이블로 임시 테이블을 생성WHERE a.총_주문금액 >= 300000 # 조건에 일치하는 데이터를LIMIT 10; # 상위 10위를 뽑아냄 결과 1) 서브쿼리의 결과는 다음과 같다.고객ID이름총_주문금액1김철수2..
-
[TIL]새빨간 거짓말, 통계 - 통계의 속임수를 피하는 다섯 가지 열쇠TIL 2024. 4. 29. 22:51
오늘 TIL 3줄 요약 거짓 통계를 어떻게 간파하여 내동댕이칠 수 있는가는 매우 중요한 일인데, 수많은 사기와 협잡 속에서 올바르고 건전한 데이터를 어떻게 식별해 내는가에 관한 것이다.누가 발표했는가? 출처를 캐보고 어떤 방법으로 알게 되었는지 조사 방법에 주의해야 한다. 빠진 데이터는 없는지 숨겨진 자료를 찾아보아야 하고 내용이 뒤바뀐 것은 아닐지 쟁점 바꿔치기에 주의해야 한다. 또한 상식적으로 말이 되는 이야기인가 살펴봐야 한다. TIL (Today I Learned) 날짜 2023.04.28 오늘 읽은 범위 10장. 통계의 속임수를 피하는 다섯 가지 열쇠 책에서 기억하고 싶은 내용 거짓 통계를 어떻게 간파하여 내동댕이칠 수 있는가는 매우 중요한 일인데, 수많은 사기와 협잡 속에서 올바르고 건전한 ..
-
GROUP BY - 동명 동물 수 찾기코테 2024. 4. 27. 22:50
문제 설명 ANIMAL_INS 테이블은 동물 보호소에 들어온 동물의 정보를 담은 테이블입니다. ANIMAL_INS 테이블 구조는 다음과 같으며, ANIMAL_ID, ANIMAL_TYPE, DATETIME, INTAKE_CONDITION, NAME, SEX_UPON_INTAKE는각각 동물의 아이디, 생물 종, 보호 시작일, 보호 시작 시 상태, 이름, 성별 및 중성화 여부를 나타냅니다.NAME TYPE NULLABLE ANIMAL_ID VARCHAR(N) FALSE ANIMAL_TYPE VARCHAR(N) FALSE DATETIME DATETIME FALSE INTAKE_CONDITION VARCHAR(N) FALSE NAME VARCHAR(N) TRUE SEX_UPON_INTAKE VARCHAR(N) F..
-
[TIL]새빨간 거짓말, 통계 - 통계를 조작하는 법TIL 2024. 4. 27. 22:49
오늘 TIL 3줄 요약 통계자료를 사용하여 사람들에게 잘못된 정보를 제공하는 것을 통계 조작이라 한다. 지도는 사실을 감추어 둔 채 여러 관계들을 일그러지게 만들어 줄 수있는 변량들이 담겨 있는 주머니처럼 소개된다. 물가지수란 것을 필요에 따라 얼마든지 늘렸다 줄였다 할 수 있다. TIL (Today I Learned) 날짜 2023.04.27 오늘 읽은 범위 9장. 통계를 조작하는 법 책에서 기억하고 싶은 내용 통계자료를 사용하여 사람들에게 잘못된 정보를 제공하는 것을 통계 조작이라 한다. 신문이나 잡지에 자주 실리는 잘못된 도표는 사물을 과장되게 표현하여 센세이션을 일으킨 경우는 많아도 이를 축소하는 경우는 거의 보기 드물다. 통계의 잘못이 항상 어느 한 편에 치우쳐 나타난다면 그 원인을 사소한..
-
SUM, MAX, MIN - 최솟값 구하기코테 2024. 4. 26. 20:42
ANIMAL_INS 테이블은 동물 보호소에 들어온 동물의 정보를 담은 테이블입니다. ANIMAL_INS 테이블 구조는 다음과 같으며, ANIMAL_ID, ANIMAL_TYPE, DATETIME, INTAKE_CONDITION, NAME, SEX_UPON_INTAKE는각각 동물의 아이디, 생물 종, 보호 시작일, 보호 시작 시 상태, 이름, 성별 및 중성화 여부를 나타냅니다.NAME TYPE NULLABLE ANIMAL_ID VARCHAR(N) FALSE ANIMAL_TYPE VARCHAR(N) FALSE DATETIME DATETIME FALSE INTAKE_CONDITION VARCHAR(N) FALSE NAME VARCHAR(N) TRUE SEX_UPON_INTAKE VARCHAR(N) FALSE문제..
-
SELECT - 평균 일일 대여 요금 구하기코테 2024. 4. 26. 00:25
문제 설명 다음은 어느 자동차 대여 회사에서 대여중인 자동차들의 정보를 담은 CAR_RENTAL_COMPANY_CAR 테이블입니다. CAR_RENTAL_COMPANY_CAR 테이블은 아래와 같은 구조로 되어있으며,CAR_ID, CAR_TYPE, DAILY_FEE, OPTIONS 는 각각 자동차 ID, 자동차 종류, 일일 대여 요금(원), 자동차 옵션 리스트를 나타냅니다.Column name Type NullableCAR_ID INTEGER FALSECAR_TYPE VARCHAR(255) FALSEDAILY_FEE INTEGER FALSEOPTIONS VARCHAR(255) FALSE 자동차 종류는 '세단', 'SUV', '승합차', '트럭', '리무진' 이 있습니다. 자동차 옵션 리스트는 콤마(',')로..
-
[TIL]새빨간 거짓말, 통계 - 통계도 논리이다TIL 2024. 4. 26. 00:25
오늘 TIL 3줄 요약그럴듯한 숫자로 모양을 바꿔 등장시키는 수법의 오류가 있다. B는 A가 발생한 후에 일어난 것이니 A는 B의 원인이라고 결론을 내리는 오류이다.음의 상관관계라는 것은 어떤 변수가 증가할 때 다른 변수는 감소하는 경향을 말한다.어떤 경우에는 원인과 결과가 때때로 서로 뒤바뀌는 경우도 있고, 또 양쪽이 동시에 원인이 되기도 하고 결과가 되기도 하는 경우가 있다.TIL (Today I Learned) 날짜2023.04.26 오늘 읽은 범위8장. 통계도 논리이다. 책에서 기억하고 싶은 내용어떤 사람이 담배를 피우는 학생은 그렇지 않은 학생보다 대학에서의 성적이 나쁘지 않을까 하는 문제를 열심히 조사한 적이 있었다. 조사결과는 그렇다는 것으로 판명되었다. 사람들은 이 독특한 연구가 적절한 ..