Tez의 안정화로 기존의 배치잡뿐만 아니라 HIVE의 성능 향상 기대

최근에 메모리를 최대한 활용하는 Spark에 살짝 밀리는 분위기이지만 그 컨셉은 아직 유효 지금은 이미 분석을 Tez기반을 할 지 선택가능하게 되어 있어서 기존 HIVE의 성능에 불만이라면 바꾸어 보아도 될 듯 HiIVE는 SQL을 그동안 무식하게 수많은 MR잡으로 바꾸어서 실행했으나 Tez는 실행 단계를 압축시켜서 속도를 많이 올렸다고 함 Apache Tez Graduates to Top-Level http://hortonworks.com/blog/apache-tez-graduates/ Apache™ Tez is an extensible framework for building YARN based, high performance batch and interactive data processing applications in Hadoop that need to handle TB to PB scale datasets. It allows projects in the Hadoop ecosystem, such as Apache Hive and Apache Pig, as well as 3rd-party software vendors t

4.7 Star App Store Review!
The Communities are great you rarely see anyone get in to an argument :)
Love Love LOVE

Select Collections