我们现在回到函数上。记得我们用
sum
这个指令来算出所有的 sales (营业额)吧!如果我们的需求变成是要算出每一间店 (store_name) 的营业额 (sales),那怎么办呢?在这个情况下,我们要做到两件事:第一,我们对于 store_name 及 sales 这两个栏位都要选出。第二,我们需要确认所有的 sales 都要依照各个 store_name 来分开算。这个语法为:
select "栏位1", sum("栏位2") from "表格名" group by "栏位1"
在我们的示范上
store_information 表格
store_name |
sales |
date |
los angeles |
$1500 |
jan-05-1999 |
san francisco |
$300 |
jan-08-1999 |
boston |
$700 |
jan-08-1999 |
那我们如何对函数产生的值来设定条件呢?举例来说,我们可能只需要知道哪些店的营业额有超过 $1,500。在这个情况下,我们不能使用
where
的指令。那要怎么办呢?很幸运地,sql 有提供一个
having
的指令,而我们就可以用这个指令来达到这个目标。
having
子句通常是在一个 sql 句子的最后。一个含有 having 子句的 sql 并不一定要包含
group by
子句。having
的语法如下:
select "栏位1", sum("栏位2") from "表格名" group by "栏位1" having (函数条件)
请读者注意: group by 子句并不是一定需要的。
在我们store_information 表格这个例子中
store_information 表格
store_name |
sales |
date |
los angeles |
$1500 |
jan-05-1999 |
san francisco |
$300 |
jan-08-1999 |
boston |
$700 |
jan-08-1999 |
如对本文有疑问, 点击进行留言回复!!
HBase Filter 过滤器之FamilyFilter详解
去 HBase,Kylin on Parquet 性能表现如何?
如何找到Hive提交的SQL相对应的Yarn程序的applicationId
网友评论