Appet Drill, New-Age vaicājumu dzinēja izpēte

Šī Apache Drill apmācība sniedz jums visu nepieciešamo informāciju, lai sāktu darbu ar Apache Drill vaicājumu motoru, lietošanu ar Hadoop, Big Data & Apache Spark.

Apache Drill ir nozares pirmais bez shēmas SQL Engine. Urbis nav pasaulē pirmais vaicājumu dzinējs, taču tas ir pirmais, kas nodrošina lielisku līdzsvaru starp elastību un ātrumu. Urbis ir paredzēts mērogošanai līdz vairākiem tūkstošiem mezglu un vaicājumu petabaitu apjomā ar interaktīvu ātrumu, kas nepieciešams BI / Analytics vidēm.





To var integrēt ar vairākiem datu avotiem, piemēram, stropu, HBase, MongoDB, failu sistēmu, RDBMS. Arī Drill sistēmā viegli var izmantot tādus ievades formātus kā Avro, CSV, TSV, PSV, Parkets, Hadoop Sequence failus un daudzus citus.

Kāpēc Apache Drill?

Apache Drill lielākā priekšrocība ir tā, ka tā var atrast shēmu lidojumā, kad pieprasāt jebkādus datus. Turklāt tas var strādāt ar jūsu BI rīkiem, piemēram, Tableau, Qlikview, MicroStrategy uc, lai uzlabotu analīzi.



Šeit ir nozares analītiķa citāts, kurā apkopota Apache Drill vērtība:

“Drill nav tikai SQL-on-Hadoop. Tas ir par SQL-on-pretty-much-anything, nekavējoties un bez formalitātēm. '

- Endrjū Bursts, Gigaom Research, 2015. gada janvāris



Drillbit ir Apache Drill dēmons, kas darbojas katrā klastera mezglā. Tas izmanto ZooKeeper visai saziņai klasterī un uzturēt kopas dalību. Tas ir atbildīgs par klienta pieprasījumu pieņemšanu, vaicājumu apstrādi un rezultātu atdošanu klientam. Urbjmašīna, kas saņem klienta pieprasījumu, tiek saukta par “meistaru”. Tas ģenerē izpildes plānu, izpildes fragmenti tiek nosūtīti citiem urbjiem, kas darbojas klasterī.

Drillbits-Apache-Drill

Vēl viena priekšrocība ir tā, ka urbja uzstādīšana un iestatīšana ir diezgan vienkārša. Ļaujiet mums uzzināt, kā instalēt Apache Drill.

Pirmais solis ir urbšanas pakotnes lejupielāde.

kas ir charat java

Komanda: wget https://archive.apache.org/dist/drill/drill-1.5.0/apache-drill-1.5.0.tar.gz

Komanda: darva -xvf apache-drill-1.5.0.tar.gz

Komanda: ls

Pēc tam iestatiet vides mainīgos .bashrc failā.

Komanda: sudo gedit .bashrc

eksportēt DRILL_HOME = / home / edureka / apache-drill-1.5.0

eksportēt PATH = $ PATH: /home/edureka/apache-drill-1.5.0/bin

Šī komanda atjauninās izmaiņas:

Komanda: avots .bashrc

Tagad dodieties uz urbt conf direktoriju un rediģējiet failu drill-override.conf ar klastera ID un zookeeper resursdatoru un portu, mēs to palaidīsim vietējā kopā.

Komanda: cd apache-drill-1.5.0

Komanda: sudo gedit conf / drill-override.conf

Pēc noklusējuma DRILL_MAX_DIRECT_MEMORY būs 8 GB mapē drill-env.sh, un mums tas jāsaglabā atbilstoši mūsu rīcībā esošajai atmiņai.

Komanda: sudo gedit conf / drill-env.sh

Lai instalētu urbi tikai vienā mezglā, varat izmantot iegulto režīmu, kur tas darbosies lokāli. Palaižot šo komandu, tas automātiski sāks urbšanas pakalpojumu.

Komanda: ./bin/drill-embedded

datu zinātne kas tas ir

Lai pārbaudītu instalēšanu, varat izpildīt vienkāršu vaicājumu.

Komanda: atlasiet * no sys.options WHERE type = ‘SYSTEM’ un nosaukumu, piemēram, ‘security%’

Lai pārbaudītu Apache Drill tīmekļa konsoli, tīmekļa pārlūkprogrammā jādodas uz vietni hosthost: 8047.

Varat arī izpildīt vaicājumu cilnē Vaicājums.

Lai palaistu urbšanu sadalītajā režīmā, jums ir jārediģē klastera ID un jāpievieno informācija ZooKeeper vietnē drill-override.conf, kā norādīts tālāk.

Tad mums katrā mezglā ir jāuzsāk ZooKeeper serviss. Pēc tam ar šo komandu ir jāsāk urbšanas pakalpojums katrā mezglā.

Komanda: ./bin/drillbit.sh sākums

Komanda: jps

Tagad mēs izmantojam komandu zemāk, lai sāktu urbšanas apvalku.

Tagad mēs varam izpildīt vaicājumus klasterī izplatītajā režīmā.

Šis ir pirmais emuāra ziņojums divdaļīgā Apache Drill emuāru sērijā. Drīz būs pieejams sērijas otrais emuārs.

Vai mums ir jautājums? Pieminiet tos komentāru sadaļā, un mēs ar jums sazināsimies.

Saistītās ziņas:

Apache Drill 2. daļas izpēte

Apache Spark Vs Hadoop MapReduce