Datu integrācijas tehnoloģijas

2.0 kredītpunkti

Studiju kursa mērķis ir apgūt zināšanas un prasmes, kas nepieciešamas mērogojamu reāllaika datu integrācijas risinājumu izstrādei un darbināšanai mākoņdatošanas vidē.

Mūsdienās pastāvīgi tiek ģenerēti liela apjoma dati, kuru apstrāde ir teorētiski un tehnoloģiski sarežģīts process. No datiem potenciāli iegūstamais labums pieaug, ja dati no heterogēniem avotiem tiek integrēti un apstrādāti tuvu reālajam laikam, tādējādi minimizējot iegūtās informācijas un zināšanu latentumu. Šiem mērķiem izmanto datu straumēšanas, konteksta apstrādes un sistēmu adaptācijas tehnoloģijas. Studiju kursā tiek aplūkotas datu integrācijas tehnoloģijas, galveno vērību pievēršot datu straumju apstrādes un integrācijas tehnoloģijām, piemēram, Apache Spark un Apache Kafka. Tās tiek apskatīts datu dzīves cikla ietvaros, kas iekļauj datu integrāciju, apstrādi, interpretāciju un iegūtās informācijas izmantošanu sistēmu pielāgošanai tuvu reālajam laikam. Datu straumju integrācijā vienlīdz svarīga nozīme ir datu loģiskajai integrācijai un infrastruktūras risinājumiem, kam jānodrošina integrācijas loģikas izpilde dalītā, horizontāli mērogojamā vidē. Studiju kursa laikā tiek aplūkoti tuvu reālā laika straumju integrācijas lietošanas gadījumi, kas balstās uz Apache Spark, Apache Kafka, Apache Cassandra, Docker un CloudStack platformām.

Patstāvīgā darba uzdevums ir izveidot un eksperimentāli izvērtēt reāllaika datu integrācijas risinājumu uz esošas datu integrācijas platformas bāzes.

Pasniedzēji