Moderne tilgange til datahåndtering - kursus RUB 27.900. fra IBS Training Center, træning 16 timer, Dato 26. november 2023.
Miscellanea / / December 02, 2023
Når man designer applikationer, er en af de vigtige beslutninger, hvordan man lagrer data. I flere årtier var relationelle DBMS'er den første og eneste mulighed; projekter adskilte sig kun i graden af normalisering, placering af forretningslogik osv. De sidste ti til femten år har alternative systemer blomstret hurtigt - fra objektorienterede og dokumentorienterede DBMS'er til distribuerede filsystemer og strømbehandlingssystemer data. Kurset undersøger en række moderne løsninger, der tillader langsigtet sikker lagring af data, årsager til fremkomsten af løsninger af forskellige klasser, deres fordele, ulemper og foretrukne metoder brug.
Emner dækket:
1. Udvikling af tilgange til datalagring (teori – 2 timer).
Databaser, datavarehuse, databasemotorer, massivt parallelle arkitekturer, hyperkonvergens.
2. Relationsmodel (teori – 2 timer).
Hvilke problemer løser det, og til hvilken pris?
Replikering, sønderdeling, distribuerede transaktioner.
3. Minimum Key-Value model (teori – 1 time, praksis – 1 time).
Nøglestrukturmuligheder, værdistrukturmuligheder, softwaregrænseflader.
Effektivitet ved at bruge ikke-relationelle databaser: nødvendige og tilstrækkelige betingelser [Cassandra, HBase].
4. Dokumentorienteret model [MongoDB] (teori – 0,5 time, praksis – 0,5 time).
5. Distribuerede filsystemer i stedet for datamodeller: klyngearkitektur [HDFS] (teori - 1 time, praksis - 1 time).
6. SQL over distribuerede filsystemer (teori – 1 time, praksis – 2 timer).
Arkitekturmuligheder, filformater, begrænsninger, transaktioner [Hive, Spark, Spark SQL, Parket, ORC].
7. Distribuerede datalagringssystemer i RAM [Hazelcast, Ignite, Tarantool] (teori – 1 time).
8. Distribuerede OLAP-systemer [Clickhouse, Druid] (teori – 1 time).
9. Behandling af datastrømme [Spark Streaming] (teori – 1 time).
10. Selvkonfigurerende og autonome databaser (teori – 1 time).