- Статус
- Вне сети
- Регистрация
- 31 Май 2022
- Сообщения
- 1.115
- Реакции
- 4
- Автор темы
- Администратор
- #1
Практический курс по Big Data. Часть 2. Spark: from zero to hero [bigdata team]
На протяжении этой части курса вы будете работать со Spark: от основных терминов и RDD до Spark DataFrames и оптимизации Spark вычислений.
В этом модуле вы изучите:
- cхема выполнения задачи в Spark;
- основные термины Spark (job, task, stage);
- представление вычислений в виде графа. Spark Python API. Spark RDD API;
- Broadcast-сообщения и счетчики.
- взаимодействие Hive и Spark SQL;
- отличия DF от RDD.
- Spark on YARN;
- типы stage в Spark;
- оптимизация операции shuffle;
- настройка Garbage Collection, тюнинг потребления памяти.
To view the content, you need to Sign In .
Похожие темы:
- [Макс Ширко] Курс по личному бренду и ведению соцсетей для дизайнеров (2025)
- [Катя SMMetanova] Что-то на ИИшном. Готовый набор промптов для любой нейросети (2025)
- [TutorPlace] Анна Астафьева → Как создать подкаст (2026)
- [Антон Назаров] Подписка на контент Осознанная меркантильность. Тариф Волчара. Февраль (2026)
- [Дмитрий Черемушкин] Стратегический вебинар по рынку США (глобальный). Февраль (2026)
- [Udemy] Mike Pritula → Как HR создать свой чатбот для сотрудников? (2026)
- [klerk] Ирина Гамова → Блокировка счетов по 115-ФЗ. Как работать с расчетным счетом чтобы его не заблокировали (2026)
- [Михаил Дашкиев, Андрей Калашников] Нечто. Восьмой сезон (2025)
- [Алена Мишурко] 20 AI-ассистентов. Тариф Система продаж (2026)
- [Арнольд Оберлейтер] [Udemy] Агентный ИИ Буткемп: ИИ агенты при помощи Python, n8n, MCP & RAG (2025)