Data mining курсы: бесплатные курсы для продолжающих обучение / Блог компании SkillFactory / Хабр

Содержание

бесплатные курсы для продолжающих обучение / Блог компании SkillFactory / Хабр

Как говорил Бьерн Страуструп: «Наша цивилизация в значительной степени зависит от программного обеспечения. Мы должны совершенствовать наши системы и для этого должны расти профессионально». Продолжая мысль Бьерна, можно сказать, что для профессионального роста, мы не можем перестать учиться — у более опытных коллег, а также самостоятельно, используя различные инструменты, например, массовые открытые онлайн-курсы. О них и пойдет речь в статье.



Бенджамин Оби Тайо, известный физик и преподаватель Data Science, в одном из своих постов про массовые открытые онлайн-курсы (МООК) написал: «Большинство массовых открытых онлайн-курсов носят характер вводных. Они хороши для тех, кто имеет солидный опыт в смежных областях — физика, компьютерные науки, математика, инженерия, бухгалтерское дело, и пытается вникнуть в Data Science».

И он прав. Множество вводных курсов конкурируют между собой за тех, кто только начинает изучать Data Science. Это хорошо, когда вы ищете именно это. Но что, если вы уже достаточно продвинулись? Какие у вас есть варианты? Существуют ли вообще МООК для продолжающих?

Как отмечает Тайо, существует множество альтернатив МООК для изучения науки о данных.
Тем более что есть аргументы, ставящие под сомнение ценность МООК для более сложных целей:

Первый аргумент: есть представление, что каждый, кто проходит курс Data Science, не имеет абсолютно никакого предшествующего опыта или образования. И связанное с этим предположение: люди считают, что могут стать Data Scientist всего за 4 недели.

Второй аргумент: существует убеждение, что огромное количество людей проходят курс исключительно для того, чтобы получить соответствующие сертификаты, и связанное с этим предположение: люди верят, что такие сертификаты неизбежно приведут к успеху в Data Science.

Если вы игнорируете эти аргументы, то можете рассматривать МООК как возможность обучения и инструмент приобретения навыков.

Учитывая, что многие МООК составляются институтами и преподавателями мирового уровня, есть хороший шанс почерпнуть из них нечто ценное.

С этой мыслью я писал пост, который вы читаете. Посмотрим на несколько продвинутых курсов Data Science для тех, у кого есть четкое представление о фундаментальных навыках в Data Science. Что значит продвинутых? Договоримся, что это субъективно. Но я делаю всё возможное, чтобы подобрать релевантные курсы. Что значит фундаментальные навыки Data Science? Это тоже субъективное понятие, и оно может меняться в зависимости от конкретного курса. Чтобы сузить широкий спектр предложений, я придумал критерии отбора:

  • Курс находится на платформе массовых открытых онлайн-курсов со свободным доступом к материалам и возможностью при желании получить платный сертификат.
  • Курс предлагается университетом, учебным заведением или аффилированными лицами
  • Это отдельные курсы в наборе из нескольких.

Примечательно, что первый пункт отсеивает Udacity и смежные платные платформы. Второй пункт отсеивает подобные Udemy платформы, где создать курс может каждый. Третий пункт в теории разрешает цепочки, позволяющие с течением времени выстраивать углубленное понимание предмета.

Среди основных платформ эти критерии оставляют нам Coursera и edX. Можно придумать другие критерии, но это подборка не претендует на то, чтобы быть исчерпывающей, а призвана поделиться идеями. Итак, если вам знакомы основы науки о данных, но вы не знаете, как продолжить обучение, посмотрите этот список.



Специализация «Продвинутое машинное обучение» от НИУ ВШЭ на Coursera по целому ряду тем машинного обучения.
Эта специализация — введение в глубокое обучение, обучение с подкреплением, понимание естественного языка, компьютерное зрение и байесовские методы. Лучшие практики машинного обучения Kaggle и ученые ЦЕРНа поделятся своим опытом решения реальных проблем и помогут заполнить пробелы между теорией и практикой. По окончании семи курсов вы сможете применять современные методы машинного обучения на предприятии и понимать подводные камни реальных данных и настроек.

Курсы этой специализации включают:
  1. Введение в глубокое обучение.
  2. Как выиграть соревнование в науке о данных: учитесь у лучших на Kaggle.
  3. Байесовские методы машинного обучения.
  4. Обучение с подкреплением на практике.
  5. Глубокое обучение в области компьютерного зрения.
  6. Обработка естественного языка.
  7. Решение проблем Большого Адронного Коллайдера с помощью машинного обучения.



Специализация «Вероятностное графическое моделирование» это три курса от профессора Стенфорда Дафны Коллер на Coursera.
Вероятностные графические модели представляют собой богатую структуру для кодирования распределений вероятности в сложных областях: совместных (многомерных) распределениях по большому числу случайных, взаимодействующих друг с другом величин. Представления находятся на стыке статистики и информатики, опираясь на концепции теории вероятностей, графовых алгоритмов, машинного обучения и многого другого.
Они являются основой для самых современных методов в широком спектре областей: медицинской диагностике, понимании изображений, распознавании речи, обработке естественного языка и многих, многих других. Они также являются основополагающим инструментом в формулировании многих проблем машинного обучения.

Специализация состоит из этих курсов:
  • Вероятностные графические модели. Представление
  • Вероятностные графические модели. Вывод
  • Вероятностные графические модели. Обучение



Программа MicroMasters в области искусственного интеллекта из Колумбийского университета и edX состоит из 4 курсов и дает глубокое погружение в искусственный интеллект.
Приобретите опыт в одной из самых увлекательных и быстрорастущих областей информатики с помощью инновационной онлайн-программы, которая охватывает захватывающие темы в области искусственного интеллекта и его приложений. Эта программа от Колумбийского университета даст строгую, продвинутую, профессиональную, аспирантскую основу в области искусственного интеллекта.
Программа представляет собой 25% курсовой работы по направлению к магистерской степени в области компьютерных наук в Колумбийском университете.

Вот 4 курса, которые составляют программу:
  1. Искусственный интеллект
  2. Машинное обучение
  3. Робототехника
  4. Анимация и движение CGI



Специализация по обучению с подкреплением из Университета Альберты на Coursera представляет собой сборник из 4 курсов, охватывающих использование подкрепляющего обучения для решения реальных проблем.
Использование всего потенциала искусственного интеллекта требует адаптивных систем обучения. Реализуя систему обучения с подкреплением от начала до конца, узнайте, как обучение с подкреплением помогает решать реальные проблемы через взаимодействия методом проб и ошибок. К концу этой специализации учащиеся поймут основы большей части современного вероятностного искусственного интеллекта и будут готовы пройти более продвинутые курсы или применить инструменты и идеи ИИ к реальным проблемам.
Содержание сосредоточено на проблемах небольшого масштаба так, чтобы понимать основы обучения с подкреплением. Преподают всемирно известные эксперты факультета естественных наук Университета Альберты.

Курсы включают:
  1. Основы обучения с подкреплением
  2. Основанные на выборках методы обучения 
  3. Прогнозирование и управление с помощью приближения функций
  4. Завершенная система обучения с подкреплением (финальный проект)

Это всё на сегодня. Надеемся, что подборка будет вам полезной.

Сделать первые шаги в освоении Data Science или повысить имеющуюся квалификацию вы можете на одном из наших курсов прямо сейчас.



Читать еще


21 канал на YouTube, где вы можете бесплатно изучить ИИ, машинное обучение и Data Science


Мы уже не раз делились в своем блоге полезными материалами для развития (их список можно найти в конце этого поста). Сегодня продолжаем это начинание и специально перед стартом новых потоков курсов по Data Analytics и Data Science представляем подборку YT-каналов по Data Science, искусственному интеллекту и машинному обучению, существование многих из которых неочевидно: например, представлен канал ArXiv Insights, посвящённый научным работам, и Google Cloud Platform.




Пока пандемия удерживает нас дома, удалёнка стала новой нормой для многих из нас. И хотя сейчас трудно найти стоящий тренинг, это не значит, что мы должны перестать учиться. Можно сказать, что наступил идеальный момент, чтобы чему-нибудь научиться. Почему бы не посвятить остаток этого сумасшедшего 2020 года изучению ИИ, программирования на Python, ML и DS? Такие рабочие роли, как аналитики данных, специалисты по машинному обучению, робототехнической инженерии, цифровой трансформации, являются лидерами в дальнейшем будущем. Это расширяющаяся область знаний, которая играет огромную роль в жизни общества.


Этот канал публикует интервью с дата-сайентистами из больших компаний, подобных Google, Uber, Airbnb и т. д. Из этих видео вы получите представление о том, что значит быть дата-сайентистом, и ценные жизненные советы.


Ксандер Стинбрюгге — исследователь машинного обучения в ML6. Его канал — резюме критически важных вопросов ML, где обучают с подкреплением искусственного интеллекта, в основном с технической точки зрения, делая их доступными для широкой аудитории.


Новый канал ML Youtube, о котором должен знать каждый. Machine Learning 101 публикует объяснение начальных понятий в области искусственного интеллекта. Кроме того, канал публикует подкасты с экспертами Data Science, работающими в коммерческих индустриях.


FreeCodeCamp — невероятная некоммерческая организация. Это опенсорс сообщество, предлагающее коллекцию ресурсов, которые помогают людям научиться программировать бесплатно, через создание проектов.


Кевин Маркхем записывает понятные YouTube туториалы. Data School с самого начала фокусируется на темах, которые вам нужно изучить, чтобы стать дата-сайентистом, и предлагает углубленные туториалы, понятные вне зависимости от вашего образования.


ML TV — ресурс для студентов и энтузиастов, созданный, чтобы вы лучше понимали ML.


Этот канал YouTube направлен на то, чтобы сделать машинное обучение и обучение с подкреплением доступнее для всех. Вы найдете 12 плейлистов — это исчерпывающее введение в нейронные сети для начинающих, и, похоже, следующие ролики о нейронных сетях сейчас снимаются.


Андреас Крец — дата-инженер и основатель компании Plumbers of Data Science. Он транслирует на своем канале понятные программы о том, как получить практический опыт в области разработки данных, а также видео с вопросами и ответами о разработке данных с помощью Hadoop, Kafka, Spark и не только.


Edureka — это платформа с туториалами и руководствами на актуальные темы в области больших данных, Hadoop, DevOps, блокчейна, искусственного интеллекта, Angular, Data Science, Apache Spark, Python, Selenium, Tableau, Android, сертификации PMP, архитектуры AWS, digital-маркетинга и многого другого.


Эндрю Ын был назван одним из 100 самых влиятельных людей, по версии Time, в 2012 году и самой культовой личностью, по версии Fast Company. Он — один из основателей Coursera и deeplearning.ai, вице-президент и главный научный сотрудник Baidu, а также адъюнкт-профессор Стэнфордского университета.


На официальном канале Deep Learning AI есть видеоуроки из специализации глубокого обучения на Coursera. DeepLearning.ai — это образовательная технологическая компания, которая развивает глобальное сообщество талантов в области искусственного интеллекта.

Накопленный под руководством экспертов опыт deeplearning.ai в области образования предоставляет специалистам-практикам и нетехническим специалистам ИИ необходимые инструменты, позволяющие им пройти весь путь от основ до передовых прикладных программ, расширяя их возможности в создании будущего на основе ИИ.


Тим — блестящий программист, преподающий Python, разработку игр с помощью Pygame, Java и машинное обучение. Он создает качественные учебные пособия по программированию на Python.


Созданный в 2016 году Университет машинного обучения (MLU) — инициатива Amazon с ясной целью — обучить как можно больше сотрудников технологиям и необходимой компании магии предложения продуктов с помощью интегрированных технологий ML.


Этот канал YouTube содержит обучающие видеоролики, связанные с наукой, технологиями и искусственным интеллектом.


Sentdex создает один из лучших учебников по программированию Python на YouTube. Его учебные пособия варьируются от начального уровня до продвинутого с более чем 1000 видео о программировании на Python. Это больше, чем просто основы. В них рассказывается о машинном обучении, финансах, анализе данных, робототехнике, веб-разработке, разработке игр и многом другом.


Joma Tech — ютубер, который делает видео, помогающие людям попасть в технологическую индустрию. Он работал в крупных технологических компаниях в качестве дата-сайентиста и инженера-программиста. Основываясь на своем опыте, он делает видеоинтервью с экспертами, видео об образе жизни в Силиконовой долине, делает науку о данных более доступной.


Содержание Python Programmer — это учебные пособия по Python, Data Science, ML, рекомендации книг и многое другое.


Этот канал YouTube посвящен инструкциям, обзорам библиотек ПО и приложений, а также интервью с ключевыми персонами в области глубокого обучения. DL TV посвящено области исследований, которая учит машины воспринимать мир. Начиная с серии, посвященной упрощенному объяснению DL, на канале выкладываются ролики с инструкциями, обзорами библиотек программного обеспечения и приложений, а также интервью с ключевыми персонами в этой области. С помощью серии концептуальных видеороликов, демонстрирующих интуитивно понятные объяснения лежащих в основе глубокого обучения методов, канал показывает, что глубокое обучение на самом деле проще, чем вы думаете.


Видеоролики YouTube помогут вам создавать будущее с помощью безопасной инфраструктуры, инструментов разработчика, API, анализа данных и машинного обучения.


Кит Гэлли — недавний выпускник MIT. Он делает обучающие видео о DS, программировании, настольных играх и о многом другом.


Data Science Dojo — это канал, который обещает научить Data Science всех желающих в простой для понимания форме. Вы найдете множество туториалов, лекций и курсов по инженерии данных и Data Science.

Заключение


Эти каналы уникальны, я уже долго слежу за ними и очарован огромным количеством знаний, которые сегодня доступны в сети бесплатно. Я надеюсь, что вам понравится, и, если вы знаете какие-либо другие интересные каналы YouTube об ИИ, машинном обучении, глубоком обучении или науке о данных, оставьте их в комментариях!

А если хочется не только смотреть каналы но и перенимать опыт практиков — приходите к нам, а специальный промокод HABR — приплюсует 10% к скидке на баннере.




Рекомендуемые статьи


Программа «Машинное обучение и майнинг данных»

Программа помогает получить базовые компетенции аналитика данных, среди которых адекватный выбор метода для решения конкретной задачи анализа данных, предобработка данных, настройка параметров метода анализа и интерпретация полученных результатов. Содержание программы охватывает основные устоявшиеся разделы современного машинного обучения (Machine Learning) и майнинга данных (Data Mining).  
Теоретический материал подкрепляется большим количеством практических занятий, домашних заданий и соревнованиями на Kaggle.

Итоговая аттестация будет проводиться в форме защиты проекта по анализу реальных данных.

Преподаватели

Екатерина Кондратьева

Семинарист на курсах «Прикладная статистика в машинном обучении» факультета компьютерных наук НИУ ВШЭ, «Машинное обучение» факультета «Науки о данных» Сколтеха. Научные интересы: анализ сигналов и изображений, компьютерное зрение, вычислительные нейронауки. Призер международных чемпионатов по машинному обучению в медицинских применениях, соавтор статей и участник ведущих конференций по темам научного интереса.


 

Полина Полунина

Практикующий Data Scientist в X5 Retail Group, победитель и призер международных чемпионатов по машинному обучению, предиктивному финансово-математическому моделированию. Преподавательская награда зимней школы по машинному обучению «9th Munich Earth Skience School».


 

Основные темы программы

  • Введение в машинное обучение и разработку данных
  • Свободно-распространяемые системы машинного обучения и разработки данных
  • Методы классификации
  • Методы регрессии
  • Методы кластеризации
  • Отбор признаков и снижение размерности
  • Работа с выбросами и пропущенными значениями
  • Работа с текстовыми и категориальными данными
  • Обучение линейных моделей на больших данных, vowpal wabbit

Начальные требования

Знание базовой программы курса «Высшая математика» и основ программирования (желательно Python). Для тех, кто еще не знаком с основами программирования, но хочет узнать об инструментах машинного обучения и майнинга данных, мы разработали программу «Data Science для бизнеса».


Расписание занятий

Занятия по понедельникам, средам, пятницам (19:00-22:00) c 22 июля по 9 августа.
 

 

академических часов

По итогам программы выдается Удостоверение о повышении квалификации установленного НИУ ВШЭ образца

 

Мне как человеку с экономическим, а не математическим/техническим образованием было страшновато идти на этот курс. Однако базовых знаний Python и статистики, хватило, чтобы учиться со всеми наравне и освоить весь материал. Очень много практики, реальные данные и задачи! После курса смогла сделать первый реальных проект на живых данных. Курс закладывает очень хорошие основы в Data Mining
and Machine Learning для того, чтобы дальше уже самостоятельно углубляться в интересующую область.

 

Подать заявку

Вас также могут заинтересовать

Полная программа профессиональной переподготовки

средства Data Mining для подготовки данных

CRISP-DM, SEMMA и другие стандарты Data Mining не случайно выделяют подготовку данных в отдельную фазу. Data Preparation — весьма трудоемкий итеративный процесс, который занимает до 80% всех затрат ресурсов и времени в жизненном цикле Data Mining и включает следующие задачи обработки исходных («сырых») данных [1]:

  1. Выборка данных – отбор признаков (features или предикторов) и объектов с учетом их релевантности для целей Data Mining, качества и технических ограничений (объема и типа) [2];
  2. Очистка данных – удаление опечаток, некорректных значений (например, число в строковом параметре и пр. ), отсутствующих значений (Missing values или NA), исключение дублей и разных описаний одного и того же объекта, восстановление уникальности, целостности и логических связей [3];
  3. Генерация признаков – создание производных признаков и их преобразование в векторы для модели Machine Learning, а также трансформация для повышения точности алгоритмов машинного обучения [4];
  4. Интеграция – слияние данных из различных источников (информационных систем, таблиц, протоколов и пр.), включая их агрегацию, когда новые значения вычисляются путем суммирования информации из множества существующих записей [2];
  5. Форматирование – синтаксические изменения, которые не меняют значение данных, но требуются для инструментов моделирования, например, сортировка в определенном порядке или удаление ненужных знаков препинания в текстовых полях, обрезка «длинных» слов, округление вещественных чисел до целого и т. д. [2].
Data Preparation: этапы подготовки данных к моделированию

Почему нужно готовить данные к моделированию?

Далеко не всегда исходные данные получены из корпоративного хранилища или витрины данных и имеют четкую структуру. А, вопреки общественному мнению, машинное обучение не работает автономно и самостоятельно. Для адекватного функционирования этого инструмента, как и любого ИТ-средства, необходимы четко определенные исходные данные и инструкции. Невозможно загрузить в алгоритм Machine Learning все накопленные большие данные разных форматов и получить на выходе корректные результаты. Кроме того, исходные данные зачастую искажены и ненадежны: в них могут присутствовать значения, выходящие за границы допустимых диапазонов (шумы), аномальные значения (выбросы), а также пропуски (отсутствие значений).

К тому же, часто возникает задача предварительной подготовки исходных данных. Например, если стоит задача определения тональности клиентских отзывов, необходимо сначала разбить текст на смысловые выражения (токены), «оцифровать» слова и превратить их в числовые вектора. В географических данных могут встречаться опечатки в адресах и ошибки определения координат из-за особенностей местности, в частности, в подвальных помещениях, среди холмов и т.д. [4]. В числовых рядах могут встречаться значения, выходящие за пределы возможного диапазона, например, цифра 7 в пятибальной шкале оценок. Также числовые значения исходных данных могут сильно варьироваться по абсолютным величинам: от нескольких сотых процентов до десятков тысяч единиц [5]. Подобные погрешности исказят результаты моделирования и не позволят получить модель машинного обучения с приемлемым качеством. 

Трансформация данных в процессе Data Mining

Как Data Scientist готовит данные: методы и средства Data Preparation

Перед тем, как применять алгоритмы машинного обучения, данные необходимо преобразовать в табличное представление, которое наиболее распространено в Machine Learning и Data Mining. Получив файл с «сырыми» данными, например, в формате CSV, аналитик сначала просматривает его, чтобы понять характер записей (строк), а также смысл, тип и диапазон значений признаков (столбцов). Затем data scientist формирует выборку (dataset, датасет) – отбирает данные, которые потенциально имеют отношение к проверяемой гипотезе машинного обучения. Например, по номеру телефона можно определить регион абонента, чтобы предложить пользователю обратиться в местный филиал компании.

Далее выполняется очистка данных с помощью встроенных инструментов программных средств Big Data, например Hive, Azure, SQL Server Data Tools и пр. [6]. Иногда исследователь данных самостоятельно пишет скрипт, например, на языке R или Python, чтобы исправить опечатки в текстовых значениях, в частности, «ординатор» вместо «ординатр» и т.д. Аналогично, с помощью встроенных команд среды обработки данных или собственного скрипта, выполняется конвертация типов данных, агрегация признаков, заполняются отсутствующие значения, исправляются шумы и выбросы. Для числовых переменных применяется нормализация данных, чтобы привести их к одинаковой области изменения и использовать их вместе в одной модели Machine Learning [5]. Как правило, нормализация данных означает преобразование исходных числовых значений в новые в диапазоне от 0 до 1, основываясь на начальном минимуме и максимуме.

Определив независимые предикторы и сгенерировав на их основе целевые признаки, data scientist снова проверяет полученный датасет, чтобы исключить мультиколлинеарность факторов, которая повышает размерность модели Machine Learning и может стать причиной ее переобучения. Для этого используются методы отбора признаков (Feature Selection), в частности, главных компонент и ридж-регрессия (ridge regression). 

Интеграция и форматирование датасета, как правило, выполняются средствами СУБД для Big Data или инструментами, предназначенными  для подобных операций: IBM SPSS, SAS. Все эти действия, от выборки до сортировки данных, проводятся несколько раз, до тех пор, пока dataset не станет пригодным для моделирования, с учетом особенностей выбранных алгоритмов машинного обучения и проверяемой гипотезы.

Data Mining — от сведений к знаниям

Как на практике подготовить данные к моделированию, какие выбрать методы матстатистики и способы очистки информации, каким образом сформировать обучающую и валидационную выборки, с помощью каких средств Big Data и инструментов Data Mining оценить качество датасета и другие вопросы Data Preparation мы разбираем на специальном курсе для аналитиков данных. Присоединяйтесь!

Источники

  1. https://habr.com/ru/company/lanit/blog/328858/
  2. http://www.machinelearning.ru/wiki/index.php?title=CRISP-DM/Data_Preparation
  3. http://iso.ru/ru/press-center/journal/1789.phtml
  4. https://m.habr.com/ru/company/ods/blog/325422/
  5. https://neuronus.com/theory/nn/925-sposoby-normalizatsii-peremennykh.html
  6. https://docs.microsoft.com/ru-ru/azure/machine-learning/team-data-science-process/prepare-data

Топ 14 лучших онлайн-курсов Data Science для начинающих

Топ 14 лучших онлайн-курсов Data Science для начинающих

Обязанность, которая является основной для специалиста по Data Science (DS), — обработка данных. Но речь идет не только об обработке однотипной информации стандартными средствами статистики, но и об извлечении и анализе большого объема неуправляемых данных из разноплановых источников. Чтобы последующее преобразование таких массивов в более удобный формат оказывалось эффективным, Data Scientist постоянно ищет способы преодоления технических и методологических ограничений.

 

Поэтому дата-сайентист должен не только знать языки программирования, владеть машинным обучением и работать с множеством профессиональных инструментов, но и обладать особенным складом ума — аналитическим и, одновременно, творческим. Не обойтись такому эксперту и без здоровой пытливости, дополненной терпением и собранностью. Это профессия из разряда «сложно, но интересно и перспективно». В подборке – онлайн-курсы, на которых готовят таких специалистов.

Skillbox

Студенты университета Skillbox.ru проходят путь от новичков до выпускников-специалистов, которым вуз помогает в трудоустройстве, за 300 часов обучения. Комплексное онлайн-обучение включает сразу 7 курсов, ориентированных на айтишников без опыта, программистов, настроенных прокачать уже имеющиеся навыки, и менеджеров, которые заинтересованы в оптимизации бизнес-процессов высокотехнологичными инструментами.

 

На видеоуроках изучаются основы аналитики и статистики, разбираются концепции Machine Learning, рассматриваются нюансы устройства и применения нейронных сетей, происходит знакомство с базами MongoDB, SQLite3, PostgreSQL. Одновременно преподаватели делятся универсальными знаниями, необходимыми любому программисту. Завершающий блок из 10 лекций отведен под освоение студентами англоязычной терминологии в IT-индустрии. Рекомендательная система, создаваемая каждым студентом потока, становится основным проектом для портфолио.

На данный момент на Сикллбокс предлагают еще несколько видов обучения на Data Scientist:

  • Курс на 9 месяцев по анализу данных с выдачей диплома.
  • Профессиональное одногодичное образование на курсе по машинному обучению с последующим трудоустройством.
Помимо комплексной программы освоения профессии, Skillbox предлагает новичкам, присматривающимся к дата-сайенс, записаться на занятия по основам математики.

 

 

Нетология

Образовательная программа по Data Science от дистанционного университета Нетология была отмечена премией «Знак качества» конкурса-форума «Кадры для цифровой экономики». За год учебы по методикам экспертов рунета студенты Нетологии готовят более десятка кейсов для собственных портфолио, выполняют 80 домашних заданий с фидбеком (обратной связью) наставников, участвуют в тестированиях и удаленных лабораторных работах. В учебном плане — изучение возможностей языка структурированных запросов SQL, варианты использования языка Python и библиотек, обработка тестовой информации для передачи в алгоритмы машинного обучения, построение рекомендательной системы и нейронной сети. Результатом стараний обучающихся становятся не только полученные умения — выпускники получают дипломы о профпереподготовке и могут рассчитывать на помощь вуза в трудоустройстве.

 

GeekBrains

На странице факультета искусственного интеллекта, учеба на котором анонсируется платформой GeekUniversity, отмечено: указанный вуз — первый из онлайн-университетов, организовавший обучение Data Science с нуля  с гарантированным трудоустройством.

 

Полтора года учебы разделены на 6 четвертей. В первой преподаются технические основы профессии: работа в Linux, Python и SQL. Второй учебный квартал отведен под сбор данных и статистические исследования, третий — под математику для дата-сайентистов. Далее последовательно изучаются приемы решения бизнес-задач посредством Machine Learning, нейронные сети и задачи искусственного интеллекта.

 

Запланировано и прохождение дополнительных курсов по выбору, среди которых видеолектории о спортивном анализе данных (платформа Kaggle), Git, методах оптимизации. Для зачисления в студенты требований к уровню владения предметом не предъявляется — достаточно школьных знаний. Обещано участие GeekUniversity в поиске работы для своих подопечных. Можно отдельно пройти курс по Машинному обучению, который подходит для начинающих специалистов.

 

OTUS

Платформа авторских курсов OTUS позиционирует себя как сервис, предлагающий углубленные знания IT-специалистов. Основной упор в учебных планах действительно сделан на прокачивание уже имеющихся у пользователей навыков, однако предлагаются и online-курсы с пометкой «базовый». Среди последних — 5-месячный комплекс занятий по машинному обучению. При этом понятие «базовый» преподавателями OTUS не трактуется как поверхностный — принципы работы алгоритмов Machine Learning рассматриваются по методике, которая обеспечивает освоение и применение всех этапов работы с данными на профессиональном уровне. Дистанционные занятия проводятся по вечерам дважды в неделю, каждое длится 2 академических часа. Параллельно с изучением тем курсанты работают над несколькими проектами для портфолио.

Предлагают также учебные программы:

 

Udemy

В каталоге видеокурсов образовательной площадки — DS на Python 3. Помимо вводных мини-лекций, в плане — уроки по 10 темам. Самый насыщенный раздел — непосредственно по основам Python, в который включено 23 лекции с заданиями, обязательными для выполнения. Предметно рассматриваются анализ и визуализация при работе с библиотеками NumPy, Pandas, Matplotlib, Seaborn. Видеокурс периодически обновляется, в планах его автора YouRa Allakhverdov — добавление лекций о библиотеках Plotly и Cufflinks, линейной и логистической регрессиях. Смотреть все программы по теме на сайте.

 

 

 

Русскоязычное ODS-сообщество

Интернет-ресурс русскоязычного открытого DS-сообщества был зарегистрирован в 2017-м. С тех пор команда дата-сайентистов создает глобальные проекты, включая бесплатные конференции, соревнования и онлайн-курсы. Среди последних — образовательная программа по Deep Learning (глубокому изучению методов Machine Learning). В соответствующем разделе сайта размещены видеозаписи 15 лекций, открыт доступ к тематическим слайдам и инструкциям.

 

Stepik

Площадка с внушительным выбором online-курсов предлагает бесплатные и платные варианты учебы. Первые, как правило, для англоговорящих учеников. Среди видеокурсов, которые ориентированы на русскоязычную аудиторию, — «Введение в DS и машинное обучение». В него входит 29 видеоуроков общей длительностью 9 часов, 54 теста и 21 интерактивное задание. Материал усваивается намного быстрее, если ученик, выбравший эту программу, уже обладает базовыми знаниями по статистике и Python-программированию.

 

 

Яндекс Практикум

Учеба по методике Школы анализа данных основана на знакомстве с востребованными инструментами дата-сайентистов: языком Python, его библиотекой Scikit-Learn, техникой XGBoost, веб-приложением Jupyter Notebook, языком SQL. Практикум состоит из двух модулей — бесплатного и платного. В первый включен доступ к тренажеру и создание учебного проекта. Навыки и знания, предлагаемые на вводном курсе, рассчитаны на 20 часов обучения. Среди наставников — аналитики из Yandex и иных IT-компаний.

Бесплатный курс по Data Science

В открытый видеокурс OpenDataScience от Юрия Кашницкого включены 10 лекций. Продолжительность большинства из них — свыше 2-х часов.

На первых занятиях спикер рассказывает о библиотеке Pandas, визуализации и «деревьях» решений. В среднем блоке видеолекций рассматриваются регрессии, регуляризация, специфика работы с библиотекой Vowpal Wabbit. Завершает серию урок о градиентном бустинге.

 

 

Coursera

Преподаватели курса по машинному обучению — сотрудники Высшей школы экономики и представители Школы анализа данных, разрабатывающие эксклюзивные подходы к Machine Learning. В течение 7 недель они знакомят пользователей с превалирующими типами задач, решаемых с помощью Machine Learning (классификация, кластеризация, регрессия), учат оценивать качество моделей. Существенная часть образовательного контента доступна без оплаты.

 

ФКН Высшей школы экономики

Большинство сюжетов длятся час-полтора, среди рассматриваемых тем — примеры использования Machine Learning в Яндексе, машинное обучение в «облаке» (практика сервиса Azure ML), основные ошибки при анализе данных. Язык записей канала — русский и английский.

 

Группа в VK

В группе соцсети Вконтакте публикуются как ссылки на интернет-статьи и новости Дата Сайнс, так и анонсы курсов по подготовке DS-специалистов, вебинаров, YouTube-стримов. Предлагаются варианты бесплатных пособий для скачивания, веб-адреса для занятий по интерактивным учебникам.

 

 

Компьютерные науки

Плейлист канала — одна из самых насыщенных Youtube-подборок лекций по теме Дата Сайнс. В ней опубликованы 95 записей русскоязычных уроков, усредненная продолжительность которых — 30-45 минут.

На занятиях рассматриваются и вопросы, напрямую связанные с работой дата-сайентистов, и аспекты оригинального применения возможностей DS — например, как нейросети помогают понять средневековую китайскую поэзию.

Эксперты по Data Science востребованы во многих отраслях — от банковского дела до медицины. Однако рассчитывать на высокие зарплаты, не имея стажа по специализации, было бы чересчур оптимистично. Уровень дохода дата-сайентистов во многом зависит от их опыта по созданию собственных стартапов и участия в международных проектах, глубины профессиональной экспертизы, а также от локации и сферы деятельности конкретной компании.

25 бесплатных курсов для дата-аналитиков

Подборка курсов для аналитиков данных.

Кто такие дата-аналитики

Специалисты по работе с большими данными умеют извлекать полезную информацию из всевозможных источников и анализировать её для принятия бизнес-решений. Как правило, аналитики сталкиваются с разрозненной информацией, поэтому важно уметь извлекать нужные данные.

Сейчас профессия дата-аналитика считается одной из самых привлекательных и перспективных в мире. Чтобы стать хорошим аналитиком, нужно больше разбираться в статистике, чем в программировании. Потому что во время работы приходится строить математические модели, которые опишут проблему и фактические данные.

Дата-аналитик работает со случайными величинами и вероятностными моделями, его задача — найти неожиданные закономерности. Поэтому знание теории вероятностей и математической статистики — одно из главных требований к соискателям.

Также необходимо знать языки программирования R или Python и иметь представление о технологиях обработки больших данных. Этих знаний достаточно, чтобы претендовать на начальную позицию дата-аналитика.

Чтобы стать хорошим аналитиком, надо не только разбираться в программировании или статистике, но и отлично знать продукт, а главное, уметь проверять и предлагать гипотезы. Большие данные при правильном применении содержат огромное количество классных инсайтов и идей, как улучшить продукт или определить, что важно.

Но у большинства задач нет однозначного решения или алгоритма: в этом плане анализ данных — работа очень творческая. Важно и умение выбрать правильную визуализацию. Одни и те же данные могут выглядеть случайным набором точек или же рассказать много интересного при правильном подходе.

Знание Python и R

Курс «Изучение Python»

Автор: Codecademy.

Язык: английский.

Уровень: начальный.

Онлайн-платформа Codecademy предлагает интерактивное изучение Python: на одной странице объясняется краткая теоретическая информация и интерпретатор кода. Курс рассчитан на начинающих пользователей и рассказывает о базовых командах языка программирования.

Курс предоставляется условно-бесплатно: получить доступ к контрольным заданиям и работе над проектами можно только по платной подписке. Бесплатные уроки подойдут, чтобы изучить простые конструкции и разобраться в синтаксисе языка.

Самоучитель «Python 3 для начинающих»

Автор: Дмитрий Мусин.

Язык: русский.

Уровень: начальный.

Самоучитель Мусина — одна из крупных баз знаний про Python на русском языке. На сайте находится информация о модулях, материалы про анализ данных с помощью библиотеки Pandas, теоретическая информация, примеры задач и полезные ссылки. Также на основе опубликованных статей подготовлен самоучитель в PDF-формате.

Курс «Программирование на Python»

Автор: Институт биоинформатики.

Язык: русский.

Уровень: начальный.

На курсе преподаватели знакомят с базовыми понятиями программирования. В качестве домашних заданий предлагается большой объём практических задач — все решения проверяет автоматическая система. При этом преподаватели не дают индивидуальные консультации. В курс также вошли задачи повышенной сложности, которые необязательно решать, чтобы пройти курс.

Курс «Python: основы и применение»

Автор: Институт биоинформатики.

Язык: русский.

Уровень: средний.

Требования: базовые навыки программирования на Python или других языках программирования.

Студенты курса изучают фундаментальные основы языка: как интерпретатор исполняет код, где он хранит переменные и данные, как определяются собственные типы данных и функции. Курс рассчитан на пользователей, которые знакомы с базовыми навыками программирования.

Проверочные задачи в курсе разделены на два типа: на закрепление материала и поиск способов для применения изученных навыков. Решения проверяются системой.

Курс «Основы программирования на Python»

Автор: Udacity.

Язык: английский.

Уровень: начальный.

Слушатели изучают три базовые темы: использование функций, создание и использование классов. Последний урок посвящён созданию собственных проектов. Обучение строится на работе над мини-проектами и изучении важных концепций. Курс нацелен на тех, кто хочет стать программистом или планирует с ними работать.

Курс «Основы программирования на R»

Автор: Институт биоинформатики.

Язык: русский.

Уровень: начальный.

В этом курсе преподаватели рассматривают R как язык программирования, а не как инструмент решения конкретных задач. Слушатели изучают основные типы данных и универсальные семантические правила, а также темы, связанные с анализом и обработкой данных.

Курс «Анализ данных в R»

Автор: Институт биоинформатики.

Язык: русский.

Уровень: средний.

Требования: базовые знания в области статистики.

Преподаватели объясняют основные этапы анализа данных с помощью языка R. Студентам расскажут об основных этапах статистического анализа R, считывании и предварительной обработке данных, применении основных статистических методов и визуализации результатов.

Курс «Программирование на R в науке о данных»

Автор: Microsoft.

Язык: английский.

Уровень: средний.

Требования: курс ориентирован на аналитиков, которым необходимо знание R для работы над статистическими проектами.

Курс разработан Microsoft вместе с Техническим университетом Дании. В курсе рассказывают про основы R, учат читать и записывать данные, работать с ними и получать результаты. Также преподаватели объясняют, как выполнять интеллектуальную аналитику с помощью R и визуализировать данные.

Проект DataCamp

Язык: английский.

Уровень: начальный.

DataCamp предлагает интерактивные курсы изучения R и Python по темам в области науки, статистики и машинного обучения. Проект делает упор на работу с данными. DataCamp сотрудничает с RStudio, Continuum Analytics, Microsoft, привлекает преподавателей из компаний-лидеров Pfizer, Liberty Mutual, h3O, DataRobot и других.

Бесплатная подписка открывает доступ к базовым курсам и первой главе платных. Чтобы получить неограниченный доступ, нужно купить подписку за $29 в месяц или за $300 в год.

Знания в области статистики и машинного обучения

Курс «Основы статистики»

Автор: Институт биоинформатики.

Язык: русский.

Уровень: начальный.

На курсе изучают подходы к описанию данных, полученных в ходе исследований, базовые понятия статистического анализа, интерпретацию и визуализацию полученных данных. Основной акцент делается на математических идеях, интуиции и логике, которые обуславливают методы и расчётные формулы.

Курс «Алгоритмы: теория и практика. Методы»

Автор: Computer Science Center.

Язык: русский.

Уровень: средний.

Требования: знания в области одного из языков программирования: циклы, массивы, списки, очереди.

В курсе разбираются базовые алгоритмические методы: «жадные» алгоритмы, метод «разделяй и властвуй», динамическое программирование. Для всех методов преподаватели показывают математическое доказательство корректности и оценки времени работы.

Также на курсе рассказывают об особенностях реализации алгоритмов на C++, Java и Python. Большинство алгоритмов, которые рассматриваются на курсе, необходимо запрограммировать в рамках выполнения заданий.

Курс «Введение в описательную статистику»

Автор: Udacity.

Язык: английский.

Уровень: начальный.

Слушатели курса познакомятся с основными понятиями, используемыми для описания данных. Преподаватели расскажут о методах исследований, научат вычислять и интерпретировать статистические значения, вычислять простые вероятности. Студенты изучат законы распределения и научатся управлять ими для создания вероятностных прогнозов данных.

Курс «Введение в статистический вывод»

Автор: Udacity.

Язык: английский.

Уровень: начальный.

Требования: прохождение курса «Введение в описательную статистику».

Курс посвящён изучению вывода неочевидных данных. Студенты изучат оценку параметров с использованием выборочной статистики, научатся тестировать гипотезы и доверительные интервалы. Преподаватели объяснят работу t-критерия и дисперсионный анализ, корреляцию и регрессию, а также другие методы проверки статистических гипотез.

Курс «Введение в науку о данных»

Автор: Udacity.

Язык: английский.

Уровень: средний.

Требования: базовые навыки программирования на Python.

Слушатели курса изучат основные понятия науки о данных: управление данными, анализ данных с помощью методов статистики и машинного обучения, передача и визуализация информации, работа с большими данными.

Курс «Введение в машинное обучение»

Автор: Высшая школа экономики, Школа анализа данных.

Язык: русский.

Уровень: средний.

Требования: знание основ математики (функции, производные, векторы, матрицы), навыки программирования на Python.

На курсе рассматриваются основные типы задач, решаемых с помощью машинного обучения: классификация, регрессия и кластеризация. Слушатели научатся оценивать качество моделей и решать, подходит ли модель для решения конкретной задачи. Преподаватели расскажут о современных библиотеках, в которых реализованы изучаемые модели и методы оценки их качества.

Курс «Науки о данных: визуализация»

Автор: Гарвардский университет.

Язык: английский.

Уровень: начальный.

В курсе изучаются основы визуализации данных и анализа поисковых данных. Слушатели научатся использовать пакет R ggplot2 для создания пользовательских графиков. Также преподаватель расскажет об основных ошибках, которые допускаются при работе с данными.

Курс «Введение в искусственный интеллект»

Автор: Microsoft.

Язык: английский.

Уровень: начальный.

Требования: практические задания основаны на Microsoft Azure и требуют подписки Azure.

Слушатели курса узнают, как использовать машинное обучение для построения прогностических моделей. Преподаватели курса расскажут, какое программное обеспечение необходимо для обработки и анализа естественного языка, изображений и видео. Также студенты научатся создавать интеллектуальных чат-ботов.

Курс «Машинное обучение»

Автор: Стэнфордский университет.

Язык: английский.

Уровень: начальный.

Слушатели курса узнают об эффективных методах машинного обучения и получат практические навыки их реализации. Также преподаватели расскажут о лучших практиках Кремниевой долины в области машинного обучения и искусственного интеллекта.

Курс даёт широкое введение в машинное обучение, интеллектуальный анализ данных и распознавание статистических моделей. Курс основывается на тематических исследованиях и практическом опыте — студенты узнают, как использовать алгоритмы обучения для построения «умных» роботов, анализировать текст, получат навыки в области компьютерного зрения, медицинской информатики, аудио, интеллектуального анализа баз данных и других областей.

Обработка больших данных

Курс «Hadoop. Система для обработки больших объёмов данных»

Автор: Mail.Ru Group.

Язык: русский.

Уровень: средний.

Требования: желательно уметь читать и писать код, в курсе используются Java и Python.

Hadoop — одна из популярных open-source систем для обработки больших объёмов данных. Среди пользователей системы — Facebook, Twitter, Yahoo!, Bing, Mail.ru. Слушатели изучат основные способы хранения и методы обработки больших объёмов данных. Также студенты курса научатся разрабатывать приложения, используя программную модель MapReduce.

Курс «Введение в Hadoop и MapReduce»

Автор: Cloudera.

Язык: английский.

Уровень: средний.

Особые требования: базовые навыки программирования в Python.

Слушатели курса изучат основы работы с Hadoop и узнают, как его использовать для работы с большими данными. Преподаватели расскажут, какие проблемы решает Hadoop, объяснят концепции HDFS и MapReduce. По итогам курса студенты научатся писать программы с использованием MapReduce и получат опыт самостоятельного решения проблем.

Автор: MongoDB.

Язык: английский.

Уровень: средний.

Особые требования: базовые навыки программирования в Python.

Преобразование данных — это процесс очистки данных для облегчения дальнейшей работы с ними. До сих пор некоторые учёные тратят на это большую часть времени. Студенты курса узнают, как собирать и извлекать данные из широко используемых форматов. Слушатели научатся оценивать качество данных и изучат лучшие методы очистки данных с помощью MongoDB — одной из ведущих баз данных NoSQL.

Работа с большими данными

UCI Machine Learning

Ресурс поддерживает 425 наборов данных для сообщества по машинному обучению. Сервис предлагает качественные, реальные и понятные наборы данных машинного обучения, которые можно использовать для практического изучения методов машинного обучения.

Kaggle

Платформа предлагает соревнования для исследователей разного уровня подготовки, где они могут опробовать свои модели на серьёзных и актуальных данных. Kaggle предусматривает денежное вознаграждение за лучшее решение.

Список KDnuggets

KDnuggets — один из ведущих сайтов по бизнес-аналитике, большим данным, интеллектуальному анализу, науке о данных и машинному обучению. Авторы проекта собрали на одной странице 78 источников открытых данных для обработки.

Список Джо Рикерта

Джо Рикер — один из постоянных участников R-сообщества. Он собрал список сайтов, на которых можно найти открытые данные для анализа в системе R.

Комментарий от Эксперта (ИТ-инженер Центра компетенций по супермассивам данных в «Сбербанк-Технологиях» Диана Борисова).

Самоучитель «Python 3 для начинающих» — отличные уроки. Материал разложен кратко и по теме. К этому сайту обращаются не только начинающие программисты, но также опытные ребята.

Курс «Программирование на Python» подойдёт людям, начинающим изучать Python. Имеет место, но не самый лучший. Основы рассказываются долго — лучше обратиться к самоучителю.

Из плюсов — задачи развивают алгоритмическое мышление, минус — не самое оптимальное решение некоторых задач (зная определённые функции можно решить в две строчки вместо 15).

О «Python: основы и применение» слышала много хороших отзывов. Для начинающих будет сложно. Поэтому он больше подойдёт тем, кто знаком с основами.

«Основы программирования на R» — неплохой курс для тех, кто начинает изучать R. Понятное и структурированное изложение, есть практические задания, обращают внимание на важные мелочи.

Курс «Анализ данных в R» ведёт крутой преподаватель, и курс тоже отличный. После изучения математической статистики и основ программирования на R этот курс нужно пройти обязательно

«Основы статистики» — отличный курс для начинающих. Теория изложена на простых и понятных примерах без погружения в доказательства и без огромного количества формул. Практика помогает закрепить теорию.

Курс «Алгоритмы: теория и практика. Методы» организован Computer Science Center, известным своим хорошим изложением теории программирования.

Курс подходит для тех, кто уже имеет какое-то представление об алгоритмах. Практические задания помогают закрепить материал, над некоторыми задачами придётся посидеть подольше.

Дополнительные советы:

1. Платформа Стэнфордского университета, на которой также можно найти неплохие курсы для разного уровня.

2. Курс «Теория вероятностей для начинающих».

Лучше Андрея Райгородского — преподавателя курса — никто не объяснит эту тему. Разжёвывает всё, даёт понятные примеры. Курс однозначно стоит внимания.

3. Курс «Основы статистики. Часть 2».

После основ статистики можно продолжить углублять знания в данной теме и пройти второй курс. Анатолий Карпов излагает материал максимально понятно и просто.

4. Курс «Нейронные сети».

Очередной отличный курс от Института биоинформатики. Для начинающих, возможно, будет немного сложно. Но курс в любом случае стоит внимания.

5. «Питонтьютор».

Сайт поможет изучить основы программирования на Python. Работа проходит прямо в браузере. Сначала читаешь статью, затем решаешь много практических задач от легкого уровня к сложному.

6. Курс «Ликбез по дискретной математике».

Курс с хорошими отзывами. Думаю, что для тех, у кого хромает математический аппарат, курс обязателен к изучению. Ничего лучше теории в сочетании с практикой придумать нельзя.

Источник

30+ курсов по интеллектуальному анализу данных [2020] | Учиться онлайн бесплатно

Демистификация стратегии SEO-контента: Coursera, MasterClass и edX

Посмотреть близко Класс Центральный Курсы
Субъектов
  • Информационные технологии

  • Здоровье и медицина

  • Математика

  • Бизнес

  • Гуманитарные науки

  • Инженерное дело

  • Наука

  • Образование и обучение

  • Социальные науки

  • Художественный дизайн

  • Data Science

  • Программирование

  • Личное развитие

  • Все предметы
Просмотреть все предметы
Ежемесячные отчеты о курсе
  • Начиная с этого месяца
  • Новые онлайн-курсы
  • Самостоятельный темп
  • Самый популярный
Курсы от 900+ университетов

Меню

  • Информационные технологии

    Информационные технологии

    • Искусственный интеллект
    • Алгоритмы и структуры данных
    • Интернет вещей
    • Информационные технологии
    • Кибер-безопасности
    • Компьютерная сеть
    • Машинное обучение
    • DevOps
    • Глубокое обучение
    • Блокчейн и криптовалюта
    • Квантовые вычисления
    • Посмотреть все компьютерные науки
  • Здоровье и медицина

    Здоровье и медицина

    • Питание и благополучие
    • Болезни и расстройства
    • Здравоохранение
    • Здравоохранение
    • Уход
    • Анатомия
    • Ветеринарная наука
    • Посмотреть все Здоровье и медицина
  • Математика

    Математика

    • Статистика и вероятность
    • Основы математики
    • Исчисление
    • Алгебра и геометрия
    • Посмотреть всю математику
  • Бизнес

    Бизнес

    • Менеджмент и лидерство
    • Финансы
    • Предпринимательство
    • Развитие бизнеса
    • Маркетинг
    • Стратегическое управление
    • Специфическая отрасль
    • Бизнес-аналитика
    • Бухгалтерский учет
    • Отдел кадров
    • Управление проектом
    • Продажи
    • Дизайн-мышление
    • Реклама
    • Программное обеспечение для бизнеса
    • Посмотреть все Бизнес
  • Гуманитарные науки

    Гуманитарные науки

    • История
    • Литература
    • Иностранный язык
    • Грамматика и письмо
    • Философия
    • Религия
    • ESL
    • Культура
    • Виды спорта
    • Журналистика
    • Этика
    • Лингвистика
    • Просмотреть все гуманитарные науки
  • Инженерное дело

    Инженерное дело

    • Электротехника
    • Инженерное дело
    • Гражданское строительство
    • Робототехника
    • Нанотехнологии
    • ГИС
    • Текстиль
    • Производство
    • BIM
    • CAD
    • Химическая инженерия
    • Посмотреть все разработки
  • Наука

    Наука

    • Химия
    • Физика
    • Наука об окружающей среде
    • Астрономия
    • Биология
    • Квантовая механика
    • сельское хозяйство
    • Термодинамика
    • Материаловедение
    • Просмотреть все науки
  • Образование и обучение

    Образование и обучение

    • K12
    • Высшее образование
    • STEM
    • Профессиональное развитие учителей
    • Развитие курса
    • Онлайн-образование
    • Подготовка к тесту
    • Просмотреть все Образование и обучение
  • Социальные науки

    Социальные науки

    • Социология
    • Экономика
    • Психология
    • Антропология
    • Политическая наука
    • Закон
    • Городское планирование
    • Права человека
    • Устойчивость
    • Публичная политика
    • Просмотреть все социальные науки
  • Художественный дизайн

    Художественный дизайн

    • Музыка
    • Кино и театр
    • Цифровых средств массовой информации
    • Изобразительное искусство
    • Дизайн и творчество
    • Посмотреть все Искусство и дизайн
  • Data Science

25 лучших инструментов интеллектуального анализа данных в 2020 году

  • Главная
  • Тестирование

      • Назад
      • Agile-тестирование
      • BugZilla
      • Cucumber
      • Тестирование базы данных
      • Тестирование ETL
      • Jmeter
      • JIRA
      • JIRA
        • Назад
        • JUnit
        • LoadRunner
        • Ручное тестирование
        • Мобильное тестирование
        • Mantis
        • Почтальон
        • QTP
        • Назад
        • Центр качества (ALM)
        • RPA
        • SAP Testing
        • Selenium
        • SoapUI
        • Управление тестированием
        • TestLink
    • SAP

        • Назад
        • A BAP
        • APO
        • Начинающий
        • Basis
        • BODS
        • BI
        • BPC
        • CO
        • Назад
        • CRM
        • Crystal Reports
        • FICO
        • HANA
        • HR
        • QM
        • Заработная плата
        • Назад
        • PI / PO
        • PP
        • SD
        • SAPUI5
        • Безопасность
        • Менеджер решений
        • Successfactors
        • Учебники SAP
    • Интернет

        • Назад
        • Apache
        • AngularJS
        • ASP.Net
        • C
        • C #
        • C ++
        • CodeIgniter
        • СУБД
        • JavaScript
        • Назад
        • Java
        • JSP
        • Kotlin
        • Linux
        • MariaDB
        • MS Access
        • MYSQL
        • Node. js
        • Perl
        • Назад
        • PHP
        • PL / SQL
        • PostgreSQL
        • Python
        • ReactJS
        • Ruby & Rails
        • Scala
        • SQL
        • SQLite
        • Назад
        • SQL Server
        • UML
        • VB.Net
        • VBScript
        • Веб-службы
        • WPF
    • Обязательно учиться!

        • Назад
        • Бухгалтерский учет
        • Алгоритмы
        • Android
        • Блокчейн
        • Бизнес-аналитик
        • Создание веб-сайта
        • Облачные вычисления
        • COBOL
        • Дизайн компилятора
        • Назад
        • Встроенные системы
        • Этический взлом
        • Учебники Excel
        • Программирование Go
        • IoT
        • ITIL
        • Jenkins
        • MIS
        • Сеть
        • Операционная система
        • Назад
        • Prep
        • PMP
        • Photoshop
        • Управление проектами
        • Обзоры
        • Salesforce
        • SEO
        • Разработка программного обеспечения
        • VBA
        900 14
    • Big Data

        • Назад
        • AWS
        • BigData
        • Cassandra
        • Cognos
        • Хранилище данных
        • DevOps
        • HBase
        • Назад
        • Hive
        • InformStarate
        • InformStarate
        • MongoDB
        • NiFi

    Онлайн-курсы по интеллектуальному анализу данных | Гарвардский университет

    Перейти к основному содержанию Просмотреть все курсы
    • Искусство и дизайн
    • Бизнес
    • Компьютерные науки
    • Наука о данных
    • Образование и преподавание
    • Здоровье и медицина
    • Гуманитарные науки
    • Математика
    • Программирование
    • Наука
    • Общественные науки
    Гарвардские онлайн-курсы

    Развивайте свою карьеру.Развивайте свою страсть. Продолжай учиться.

    Назад

    Фильтры курса

    Поиск Предметная область
    • Художественный дизайн

      • Дизайн и творчество

        • Творческий подход

        • дизайн

        • Дизайн-мышление

        • Инновации

        • Дизайн интерьера

        • UX

      • Цифровых средств массовой информации

        • 3D

        • Анимация

        • Цифровых средств массовой информации

        • Игровой дизайн

        • Графический дизайн

        • Видео игры

      • Драматическое искусство

        • Танец

        • Фильм

        • Шекспир

        • Телевидение

    R и курс интеллектуального анализа данных

    Это краткий курс по интеллектуальному анализу данных с помощью R.Он состоит из 9 занятий ниже. Каждое занятие будет длиться 1,5 часа, в т.ч. 1-часовой урок и 30-метровое упражнение.

    Краткое содержание курса

    Часть 1 — Программирование на R, преобразование данных, визуализация данных, классификация и кластеризация

    • R Программирование
      Основы языка R и программирования, параллельные вычисления, импорт и экспорт данных
    • Анализ и визуализация данных
      сводка, статистика и различные диаграммы с Base R
    • Преобразование и визуализация данных с помощью Tidyverse
      Преобразование данных с помощью dplyr и tidyr и визуализация данных с помощью ggplot2
    • Регрессия и классификация
      Линейная регрессия и логистическая регрессия, деревья решений и случайный лес
    • Кластеризация данных
      Кластеризация k-средних, кластеризация k-medoids, иерархическая кластеризация и кластеризация на основе плотности

    Часть 2 — Анализ временных рядов, сетевой анализ, правила ассоциации и интеллектуальный анализ текста

    • Анализ временных рядов
      Декомпозиция, прогнозирование, классификация и кластеризация временных рядов
    • Сетевой анализ и анализ графиков
      Построение графиков, запросы к графику, меры центральности и визуализация графиков
    • Association Rule Mining и Sequence Mining
      интеллектуальный анализ и выбор интересных ассоциативных правил, удаление избыточности и визуализация правил, анализ последовательного шаблона
    • Анализ текста
      Анализ текста, облако слов, тематическое моделирование и анализ тональности
    • Big Data (опционально)
      Hadoop, Spark и R

    Предварительные требования

    • Знание и опыт использования R или аналогичных языков программирования
    • Базовые знания в области интеллектуального анализа данных и машинного обучения, например

    Программное обеспечение и учебные материалы

    Вам нужно будет принести свой ноутбук, если компьютеры не предусмотрены в классе.

    Post A Comment

    Ваш адрес email не будет опубликован. Обязательные поля помечены *

    2021 © Все права защищены.