hive 其实是用 sql 来开发的 mapreduce 任务,其中的一些有优化技巧和 sql 优化也有相同的地方
在经过一周的 sql boy 历练以后,写 sql 的水平也算是更上一层楼了
虽然说hive 跑的都是t-1的离线数据,不怎么需要在意运行时间,但是比较 yarn 集群资源有限,使用尽量少的资源来完成尽量多的工作也是很棒的!这里总结一下一些 hql 优化上的技巧
hive 其实是用 sql 来开发的 mapreduce 任务,其中的一些有优化技巧和 sql 优化也有相同的地方
在经过一周的 sql boy 历练以后,写 sql 的水平也算是更上一层楼了
虽然说hive 跑的都是t-1的离线数据,不怎么需要在意运行时间,但是比较 yarn 集群资源有限,使用尽量少的资源来完成尽量多的工作也是很棒的!这里总结一下一些 hql 优化上的技巧
Update your browser to view this website correctly. Update my browser now