БЕСПЛАТНО [BigData Тeam] Практический курс по Big Data. Часть 2. Spark: from zero to hero (2023)

root

Тех.поддержка
АДМИНИСТРАТОР
МОДЕРАТОР
Статус
Вне сети
Регистрация
31 Май 2022
Сообщения
1.115
Реакции
4
  • Автор темы
  • Администратор
  • #1
Screenshot_2.png


Практический курс по Big Data. Часть 2. Spark: from zero to hero [bigdata team]

На протяжении этой части курса вы будете работать со Spark: от основных терминов и RDD до Spark DataFrames и оптимизации Spark вычислений.

В этом модуле вы изучите:

  • cхема выполнения задачи в Spark;
  • основные термины Spark (job, task, stage);
  • представление вычислений в виде графа. Spark Python API. Spark RDD API;
  • Broadcast-сообщения и счетчики.
  • взаимодействие Hive и Spark SQL;
  • отличия DF от RDD.
  • Spark on YARN;
  • типы stage в Spark;
  • оптимизация операции shuffle;
  • настройка Garbage Collection, тюнинг потребления памяти.
Скачать:
To view the content, you need to Sign In .
 
Активность
Пока что здесь никого нет

Пользователи, которые просматривали тему (Всего: 0)

Тема долгое время не просматривалась.
Назад