Воронцов лекции по машинному обучению: Онлайн-курсы

Содержание

8 лекций, которые помогут разобраться в машинном обучении и нейросетях / Хабр


Мы собрали интересные лекции, которые помогут понять, как работает машинное обучение, какие задачи решает и что нам в ближайшем будущем ждать от машин, умеющих учиться. Первая лекция рассчитана скорее на тех, кто вообще не понимает, как работает machine learning, в остальных много интересных кейсов.

Машинное обучение

Вводная лекция от кандидата физико-математических наук Дмитрия Ветрова. Ученый объясняет, как работает машинное обучение, что такое глубинное обучение и как устроены нейросети.

 

Математические методы прогнозирования объемов продаж

Другая лекция от ПостНауки — член Российской академии наук Константин Воронцов показывает частный пример применения методов машинного обучения в бизнесе. Математик объясняет, как его команда построила модель прогнозирования объемов продаж для крупной розничной сети.

 

Прекрасные и ужасные последствия самообучения компьютеров

Спикер TED, специалист по машинному обучению и CEO компании Enlitic Джереми Говард делает свои прогнозы о том, что произойдет, когда мы научим компьютеры учиться.

 

Как мы учим компьютеры понимать изображения

Еще одна лекция в рамках TED. Эксперт по компьютерному зрению Фей-Фей Ли описывает последние достижения машинного обучения, включая базу данных, содержащую 15 миллионов фотографий, которую создала её команда, чтобы научить компьютер понимать изображения.

 

Как мы обучаем технику не смотреть и слушать, а видеть и слышать?

Несмотря на первые 20 минут тишины, довольно бодрая лекция по глубинному обучению от теххаба KL10CH и инженера в области машинного обучения, компьютерного зрения и обработки сигналов в Исследовательского центра Samsung Дмитрия Коробченко. Для самых стойких и продвинутых.

И бонус для тех, кто настроен серьезно:

 

Recent Developments in Deep Learning

Лекция известного специалиста по искусственным нейросетям Джеффри Хинтона, прочитанная в Торонтском университете. Профессор Хинтон рассказывает об основных достижениях в области глубинного обучения.

 

Deep Learning, Self-Taught Learning and Unsupervised Feature Learning

Один из основателей Coursera, доцент Стэнфорда и специалист в области машинного обучения и робототехники Эндрю Ын объясняет тонкости обучения «с учителем» и без.

 

Machine Learning for Video Games

За пять минут на примере Марио вам расскажут, как машинное обучение применяется в разработке видеоигр.

YouTube: ТОП-5 самых популярных видео на тему машинного обучения

1. Машинное обучение и искусственный интеллект (8 015 просмотров)

Илья Толстихин и Борис Янгель, участники проекта «Молодые ученые», организованного T&P (Теории и практики – платформа для обмена знаниями) рассказывают о машинном обучении и его применении в реальной жизни.

2. Вводная лекция — К.В. Воронцов (5 327 просмотров)

Лекция читается в рамках курса «Машинное обучение» Школы анализа данных Яндекс. Этот курс является обязательным для всех студентов.

Лектор: Константин Вячеславович Воронцов, старший научный сотрудник Вычислительного центра РАН. Заместитель директора по науке ЗАО «Форексис». Заместитель заведующего кафедрой «Интеллектуальные системы» ФУПМ МФТИ. Доцент кафедры «Математические методы прогнозирования» ВМиК МГУ. Эксперт компании «Яндекс». Доктор физико-математических наук.

3. Машинное обучение: Начало (3 487 просмотров)

Центр современной информатики, программирования и анализа данных Computer Science Center представляет лекцию Игоря Кураленка, сотрудника Яндекс. Спикер рассказывает об истории машинного обучения, его классификации – обучении с подкреплением, обучении с учителем и без.


4. Машинное обучение — Дмитрий Ветров (3464 просмотра)

Как найти взаимосвязь между наблюдаемыми и скрытыми переменными? Что такое глубинное обучение? Каковы перспективы машинного обучения? Об этом рассказывает кандидат физико-математических наук Дмитрий Ветров в рамках проекта ПостНаука.

5. Искусственный Интеллект и Естественный Язык. Часть 1 (1 672 просмотра)

Максим Таланов, кандидат технических наук, руководитель Лаборатории Машинного Понимания Казанского федерального университета, преподаватель Университета Иннополис, рассказывает о последних достижениях в области искусственного интеллекта.

Data Science курсы: обзор и цены |

В обзор входят лучшие курсы и лекции по Data Science, Python, R как платные, так и бесплатные, как в Украине, так и в мире, поехали!

Автор настоятельно рекомендует пройти именно платные онлайн курсы, они намного качественные, обширнее и вдохновляющие.

Почему же именно эти курсы лучшие? Тут

Andrew Ng’ Machine Learning: Master the Fundamentals

Machine Learning A-Z: Hands-On Python & R In Data Science

200$ (udemy)

Data Science A-Z™: Real-Life Data Science Exercises Included 200$ (udemy)

Data Science: R 442$ и Professional Certificate Provided by Harvard University (edx)
Launch Your Career in Data Science. A ten-course introduction to data science, developed and taught by leading professors. R language (coursera)
Intro to Data Analysis. Python (udacity)
Data Science Foundations (Big Data University)

Machine Learning, Data Science and Deep Learning with Python 160$
Data Science and Machine Learning Bootcamp with R 195$

Доклады с конференции Data Science UA
Відео з другоі зустрічі Чернівецього клубу штучного інтелекту. Доповідь від Олександра Максимця «Машинне навчання в обробці природної мови»
Machine Learning in FinTech. Дарина Перемот (ML Engineer at SynergyOne)
Фонд BrainBasket
Доклады с конференции AI Ukraine Conference
Introduction to machine learning (Лекція ІІ) — Володимир Круглов

Русскоязычные ресурсы по Data Science:

Python
Pandas. Открытый курс OpenDataScience по машинному обучению
Как анализировать данные с Python библиотеками Pandas и Numpy

Азы работы с pandas.DataFrame на примере задачи о Титанике
Курс «Программирование на языке Python для сбора и анализа данных», НИУ ВШЭ, 2015-16 учебный год, лектор Илья Щуров. Лекция №12: библиотека pandas

Курсы по R
Анализ данных на R в примерах и задачах
Основы анализа данных в R
Анализ данных в R

Наука о данных
Data Science, черные ящики – и почему вам сильно повезло
Введение в Data Science
Почему важно заниматься Computer Science прямо сейчас
Введение в Data Science и Machine Learning
Дискуссия «Тренды data science
Алексей Натёкин: «О развитии анализа данных, машинного обучения и искусственного интеллекта»

Наталия Ефремова — Нейронные сети: практическое применение

Курсы по машинному обучению

Вводная лекция — К.В. Воронцов
Машинное обучение и искусственный интеллект
Введение в машинное обучение | Григорий Сапунов

Англоязычные видеолекции:

Python cources
Python Data Science with pandas
Python For Data Science: Introduction
Python For Data Science — 2018 | Become Data Scientist

R cources
Introduction to Data Science with R — Data Analysis
R Programming Tutorial
Basic Analytical Techniques | Data Science With R Tutorial

Data Science cources
Learn Data Science lectures
Fundamentals of data science lectures
CS109 Data Science.

Harvard University

Machine Learning cources
Machine Learning Crash Course from Google
Machine Learning lectures
What is Machine Learning? (AI Adventures)
Introduction to Machine Learning. MIT OpenCourseWare

[Всего: 0   Средний:  0/5]

16 бесплатных онлайн-курсов по машинному обучению

Популярная тенденция в сфере онлайн-образования — массовые открытые онлайн-курсы (Massive open online-courses, MOOC). Появились бесплатные курсы по машинному обучению и data science. Они доступны каждому и основаны на образовательных программах от ведущих университетов, например, МФТИ.

Большинство MOOC по машинному обучению доступны на английском языке и представлены на известных платформах онлайн-образования, таких как

Coursera, Udacity, World Education University и edX.

Отдельно стоит отметить, что курсы Coursera доступны бесплатно только для прослушивания лекций. Для того, чтобы выполнять задания или получить сертификат по окончании курса, нужно оформить подписку или оплатить курс.

Видео-материалы и лекции курса можно получить бесплатно, для этого на странице курса внизу нужно нажать кнопку «прослушать курс»

, как показано на картинке:

Как бесплатно прослушать курсы по машинному обучению

В этой статье собраны бесплатные курсы по машинному обучению и Data Science на русском языке или с русскими субтитрами.

Курсы по data science


Введение в машинное обучение

Авторы: ВШЭ и Яндекс
Платформа: Coursera
Язык: русский

На курсе Константина Воронцова Введение в машинное обучение рассматриваются популярные задачи, решаемые с помощью машинного обучения — классификация, регрессия, кластеризация. Слушателю нужно знать об основных понятиях математики: функциях, производных, векторах, матрицах, желательно иметь базовые навыки программирования и быть знакомым с python.

Продолжительность: 35 часов


Машинное обучение и анализ данных

Авторы: МФТИ и Яндекс
Платформа: Coursera
Язык: русский

Специализация Машинное обучение и анализ данных включает 6 курсов. Осваиваются основные инструменты, необходимые в работе с большим массивом данных: современные методы классификации и регрессии, поиск структуры в данных, проведение экспериментов, построение выводов, фундаментальная математика, основы программирования на python.

Продолжительность: 8 месяцев (7 часов в неделю)


Python для анализа данных

Авторы: МФТИ, ФРОО, Mail.ru Group
Платформа: Coursera

Язык: русский

Курс Python для анализа данных ориентирован на решение практических задач. Студенты будут применять свои навыки программирования для построения предиктивных моделей, визуализации данных и работы с нейросетями.

Продолжительность: 25 часов


Введение в науку о данных

Автор: СПбГУ
Платформа: Coursera
Язык: русский

Курс Введение в науку о данных рассматривает постановку и решение типичных задач, с которыми может столкнуться в своей работе data scientist, подходы к сбору, анализу, обработке и визуализации массивов данных.

Продолжительность: 17 часов


Глубокое обучение в творчестве с TensorFlow

Автор: Google Magenta
Платформа: Kadenze
Язык: английский, русские субтитры

MOOC Использование глубокого обучения в творчестве с помощью TensorFlow расскажет о том, как строить алгоритмы глубокого обучения на основе сверточных, рекуррентных, генеративных нейросетей и применять их для создания творческих приложений.

Продолжительность: 60 часов


Data Science

Автор: Johns Hopkins University
Платформа: Courserа
Язык: английский, русские субтитры

В специализацию Data Science университета John Hopkins входят 10 курсов, включая сбор и сортировку данных, программирование на языке R, регрессионные модели, разработку продуктов для обработки данных и другие.

Продолжительность: 8 месяцев (5 часов в неделю)


Data science для руководителей

Автор: Johns Hopkins University
Платформа: Courserа
Язык: английский, русские субтитры

Data Science для руководителей — это ускоренная обучающая программа — 5 курсов, которые дают базовое понимание о том, что такое data science и как работать с проектами в этой сфере, собирать и развивать команду и даже лидерские качества.

Продолжительность: 40 часов


Нейронные сети

Автор: Институт биоинформатики
Платформа: Stepic
Язык: русский

Бесплатный курс Нейронные сети дает основы теории нейронных сетей и практики применения. Детальный разбор процесса создания и применения нейронных сетей. Алгоритмы, лежащие в основе нейросетей и множество практических задач.

Продолжительность: 33 часа


Программирование на Python

Автор: Институт биоинформатики
Платформа: Stepic
Язык: русский

На курсе Программирование на Python представлены базовые понятия программирования на python и большое количество практических задач. Решения будут проверяться автоматической системой.

Продолжительность: 22 часа


Алгоритмы: теория и практика. Методы

Автор: Computer Science Center
Платформа: Stepic
Язык: русский

Рассматриваются теоретические основы создания алгоритмов и особенности реализации на языках C++, Java и Python.

Продолжительность: 35 часов


Основы программирования на R

Автор: Институт биоинформатики
Платформа: Stepic
Язык: русский

На курсе Основы программирования на R изучаются основные типы данных и семантические правила, анализ и обработка данных.

Продолжительность: 19 часов


Анализ данных в R

Автор: Институт биоинформатики
Платформа: Stepic
Язык: русский

На курсе рассматриваются этапы статистического анализа на R — предварительная обработка данных, применение статистических методов анализа и визуализация данных.

Продолжительность: 21 час


Базы данных

Автор: СПбГУ
Платформа: Coursera
Язык: русский

В основе курса Базы данных изучение и применение языка SQL для создания, модификации объектов и управления данными в реляционных базах данных. Рассматриваются сферы применения NoSQL баз данных и современные подходы к обработке big data.

Продолжительность: 20 часов


От Excel до MySQL: способы анализа бизнес-данных

Автор: Duke University
Платформа: Coursera
Язык: английский, русские субтитры

В специализацию входят 5 курсов, которые демонстрируют, как использовать Excel, Tableau и MySQL для анализа данных, прогнозирования, создания моделей и визуализации данных для решения задач и улучшения бизнес-процессов.

Продолжительность: 8 месяцев (5 часов в неделю)


Линейная регрессия

Автор: СПбГУ
Платформа: Coursera
Язык: русский

В курсе Линейная регрессия разбираются основные методы описания взаимосвязей между количественными признаками, регрессионный анализ и построение моделей. Специальное место отводится операциям с матрицами. Курс ориентирован на людей, которые уже знакомы с базовыми понятиями анализа данных.

Продолжительность: 22 часа


Анализ данных

Автор: НГУ
Платформа: Coursera
Язык: русский

В специализацию Анализ данных Новосибирского государственного Университета входят 4 курса. Курсы содержат материалы по основам теории вероятностей и математической статистики, исследованию связей между признаками, построению прогнозов на основе регрессионных моделей, кластерному и статистическому анализу. Курсы разработаны совместно с 2GIS.

Продолжительность: 4 месяца (3 часа в неделю)

8 лекций, чтобы разобраться в машинном обучении и нейросетях

Spark.ru собрал лекции, которые помогут понять, как работает машинное обучение, какие задачи решает и что нам в ближайшем будущем ждать от машин, умеющих учиться.

Читать далее…

С работой алгоритмов машинного обучения вы сталкиваетесь каждый день. Это распознавание изображений, поисковая выдача, голосовые помощники, рекомендации контента и, конечно же, реклама. Здесь собраны лекции, которые помогут понять, как работает машинное обучение, какие задачи решает и что нам в ближайшем будущем ждать от машин, умеющих учиться.

Другая лекция от ПостНауки — член РАН Константин Воронцов показывает частный пример применения методов машинного обучения в бизнесе. Математик объясняет, как его команда построила модель прогнозирования объёмов продаж для крупной розничной сети.

Спикер TED, специалист по машинному обучению и CEO компании Enlitic Джереми Говард делает свои прогнозы о том, что произойдёт, когда мы научим компьютеры учиться.

Несмотря на первые 20 минут тишины, довольно бодрая лекция по глубинному обучению от теххаба KL10CH и инженера в области машинного обучения, компьютерного зрения и обработки сигналов Исследовательского центра Samsung Дмитрия Коробченко. Для самых стойких и продвинутых.

И бонус для тех, кто настроен серьёзно:

Лекция известного специалиста по искусственным нейросетям Джеффри Хинтона, прочитанная в Торонтском университете. Профессор Хинтон рассказывает об основных достижениях в области глубинного обучения.

Один из основателей Coursera, доцент Стэнфорда и специалист в области машинного обучения и робототехники Эндрю Ын объясняет тонкости обучения с учителем и без.

За пять минут на примере Марио вам расскажут, как машинное обучение применяется в разработке видеоигр. 

Машинное обучение и анализ данных — обзор Специализации от Яндекcа & МФТИ (5 курсов + финальный… | by Vladimir Bogdanov | Breaking into Data Science, part 1

Машинное обучение и анализ данных — обзор Специализации от Яндекcа & МФТИ (5 курсов + финальный проект), предложенной на образовательной платформе Coursera.

Вам может быть полезна данная статья если:

  • Вы хотите “попробовать на вкус” программирование на Python и понять для себя основные принципы работы моделей машинного обучения, использующихся для работы с данными
  • Вы рассматриваете для себя возможность пройти какой-либо обучающий курс по данной тематике и Вам интересно оценить, насколько Специализация от Яндекса & МФТИ подходит для этого

Почему после прохождения всех пяти курсов Специализации появилось желание написать данную статью: если бы я “тот”, который только начинал первый курс данной Специализации, использовал советы, данные в этой статье, эффективность и скорость обучения была бы в разы выше. И плюс до начала обучения я представлял собой чистый лист: ни строчки кода в жизни, только базовые знания теории вероятности, статистики и линейной алгебры, а значит проходил путь с нуля и застревал на каждом шагу, где от студента ждали больше в плане программирования, чем было положено! Тем самым, я представляю собой репрезентативного подопытного 🙂

Почему формат Специализации — это лучшее, что можно выбрать в начале пути? В целом, для обучения на русском языке есть широкий перечень возможностей: аналогичные по форме, но иные по содержанию онлайн-программы (от Вышки и Яндекса на Coursera, курсы по теме на Stepik’e и т.д.), лекции профессора Воронцова, платные курсы типа New Professions Lab, Нетологии и многое другое. Но, на мой взгляд, именно сочетания теории, видео-лекций и контролируемых/проверяемых (!!!) практических работ без необходимости подчиняться какому-то расписанию — лучшее по форме самообразование с наивысшим соотношением цена/качество/удобство . Структура Специализации построена таким образом, что концепция “методов работы с данным” раскрывается постепенно, и ты успеваешь за темпом обучения, даже если ничего не знаешь до начала курсов (за исключением исключений :)). Если стараться просто “впитывать” теорию или неструктурированно браться за какие-то практические задачи есть риск не сдвинуться с места в общем понимании предмета!

Всего в данной Специализации курсов пять:

  1. Математика и Python для анализа данных — вводный курс, наполненный повторением основ мат. анализа и линейной алгебры, жизненно необходимых для прохождения пути
  2. Обучение на размеченных данных (обучение с учителем) — курс, посвященный моделям типа линейной/логистической регрессии, введенению в работу с решающими деревьями и другими моделями, обучение которых возможно только при наличии тех самых “размеченных” данных
  3. Поиск структуры в данных (обучение без учителя) — это про изучение и обучение моделей классификации/кластеризации, используемых в отсутствии размеченных данных
  4. Построение выводов по данным — несмотря на название, этот курс не про визуализацию данных… Он про статистику, про принципы проверки гипотез, в т. ч. множественных, про построение доверительных интервалов и так далее, т.е. про то, как из полученных результатов вашей модели ПРАВИЛЬНО сделать выводы (правильные или нет уже зависит от самой модели и исходных данных))
  5. Прикладные задачи анализа данных

Какое самое важное препятствие Вас ждет, если также как и я, Вы не писали ни строчки кода до начала обучения?)) Полное непонимание структуры языка Python, с которым предстоит очень много работать в процессе обучения. К сожалению, формат Специализации не подразумевает длинного вводного курса и подготовка идет “на бегу” в ходе первого курса. Быстрое повторение основ линейной алгебры, статистики и краткий обзор Python — вот и вся подготовительная работа. Этого очень мало. Несмотря на то, что в требованиях к курсу указано базовое знание основ программирования, презентуется эта программа везде как шанс пройти путь программирования на Python c нуля. Что я хотел бы знать до начала обучения? Необходимость изучения основ Python применительно к анализу данных и только потом — прохождение курсов специализации. Очень важно понимать структуры и типы данных, основные методы работы с числовыми данными, таблицами и основными библиотеками — numpy & pandas. Понимать, уметь работать с кодом (элементарные преобразования, работа с табличными данными и так далее) и знать источники (!) информации, когда чего-то не знаешь (stock overflow, форумы, блоги, каналы в слаке и так далее). Как получить весь базовый набор на русском языке я не знаю, т.к. не ставил цели именно на русском учиться, поэтому в качестве ориентира на данном этапе считаю данную книгу, написанную создателем библиотеки Pandas: Python for Data Analysis: Data Wrangling with Pandas, NumPy, and IPython ©. Если бы всех студентов Специализации заставляли бы ее прочесть и освоить материал до начала учебы — КПД вырос бы минимум вдвое потом 🙂

Отдельно хочется попросить оторвать руки создателям первого курса за задание с работой с текстом — я сейчас делаю финальный проект по итогам пяти курсов и с ужасом вспоминаю, как пришлось тратить часы и дни поиском по форумам, чтобы не имея ни малейшего представления Python, токенизировать тексты и рассчитывать их сходство, используя примитивные циклы, потому что ничего лучше тогда ты не знаешь… Это очень жестоко, я думаю немало людей бросили всю учебу на этом моменте!

Идем дальше. Проходя второй курс Специализации, снова и снова придется возвращаться к основам — до понимания и разбора реальных моделей обучения на размеченных данных (другое название — обучение с учителем) порой просто не доходило! Сидишь и тратишь по 2–3 часа на преобразования и очистку числовой информации, подготовку таблиц и так далее, потому что нет навыка писать на Python, с трудом в голове откладывается его семантика, когда сразу бросают на работу с моделями линейной регресии и другими. В целом, курс очень насыщенный и требует много практической работы — в ходе видео-лекций дается теория по моделям линейной и логистической регрессий, объясняется принцип работы алгоритма градиентного бустинга и других ключевых для работы с данными темами (метрики, оптимизация и прочее). Общее впечатление — идеальное сочетание теории и практики, за исключением сегмента про нейронные сети — очень скомкано и ничего не понятно было тогда..)

Относительно третьего курса могу сказать, что он получился хуже остальных (исключительно мое мнение). Вам предстоит попробовать строить модели для работы с данными в ситуации, когда даже в целях обучения нет тестовых ответов (то есть нет разметки в данных). Но, судя по моему представлению по итогам завершения Специализации и дальнейшего обучения, тема обучения без учителя настолько сложная и глубокая, что реально в рамках третьего курса вы, можно сказать, успеете прочесть “определения из википедии” и сделать пару-тройку элементарных примеров, то есть ощущения того, что хоть чуть “знаешь” не возникнет, а если возникнет — это самообман 🙂

По мере движения вперед и изучения основ Python, вы будете все чаще сталкиваться с пробелами в знаниях теории вероятностей, статистики и линейной алгебры. И сильнее всего это будет чувствоваться на четвертом курсе, который по сути полностью посвящен концепциям из тер. вера и статистики в части тестирования гипотез, построения доверительных интервалов, оценки корреляций и так далее. И это вторая главная проблема всей Специализации — вроде как от студентов ждут “базовых знаний” в начале, но по мере прохождения курсов все отчетливей становится ясно — вы либо ХОРОШО знаете мат. часть, либо будет очень ПЛОХО….)) Реально не отделаться общими словами и “общим” пониманием — чтобы суметь разобраться как “под капотом” работают те или иные модели, на основании каких теорем/аксиом/концепций они строятся и почему результат именно такой, потребуется нечто большее, чем “базовые знания”. Отсюда вывод — если вы собираетесь погружаться в DS в общем и в Специализацию в частности, будьте готовы взяться за повторение мат. аппарата и вспомнить университетские годы — на коленке “попитонить и видосики посмотреть” не получится…)

Вот и все! Дальше идет практика (5 курс и отдельно 7-ми недельный финальный проект), а критически оценить насколько задания сложные или легкие я не могу: у меня опыт в инвестициях и работе на финансовых рынках, а не DS, так что мое мнение в этом вопросе не имеет “веса” …) Одно могу сказать — организовано все очень достойно, в плане разъяснения информации, разнообразия заданий и ощущения эффективности обучения по мере их самостоятельного решения! Плюс, конечно, огромную роль играет определенное community в slack’е — поток студентов на Специализации большой и всегда есть с кем обсудить любой вопрос.

Отвечая на вопрос “порекомендовал бы или нет” данную обучающую программу, отвечу однозначным да! Хотя у меня ушло на нее больше года при постоянной full-time занятости, самое важное — что пришло детальное представление о методах работы с данными с использованием моделей машинного обучения, Python теперь свободно вертится в голове (как когда изучаешь иностранный язык, после определенного уровня уже можешь на нем думать и как-то структурированно изъясняться )) и понятно, куда развивать свое хобби дальше — в работу с временными рядами, но это уже совсем другая история!)

Надеюсь, данный обзор будет вам полезен и позволит сэкономить немного времени / денег или повысит скорость обучения по данной тематике! Успехов!

специалист по Data Science Андрей Созыкин — о возможностях и «черных ящиках» нейронных сетей

Нейросети помогают лечить инфаркты, управляют автомобилями, «заставляют» нас улыбаться на фото и подсказывают банкам, какую услугу стоит нам предложить. С каждым днем они захватывают все новые сферы жизни, а компании расширяют возможности применения больших данных. Но как все это работает изнутри и с чего в принципе стоит начать путь специалиста по анализу больших данных? На эти и другие вопросы ответил специалист по Data science, заведующий кафедрой высокопроизводительных компьютерных технологий Уральского федерального университета Андрей Созыкин в ходе открытого семинара, организованного компанией NVIDIA и Университетом ИТМО. В интервью ITMO.NEWS он рассказал, без каких знаний не обойдется современный Data Scientist, при чем здесь «черный ящик» и почему «открыть» его не так просто.

Важная часть семинара была посвящена современным возможностям обучения Data science. Какие наиболее эффективные способы вы могли бы посоветовать тем, кто только начинает вливаться в эту сферу и, возможно, пока не знает, с чего начать?

Возможностей развиваться в области Data Science и стать специалистом сейчас на самом деле очень много. Во-первых, если у человека есть самодисциплина и мотивация, все можно освоить самостоятельно. Есть открытые курсы, в том числе на русском языке. Разумеется, много курсов ведется на английском, они уже позволяют понять основные алгоритмы и теорию. Из русскоязычных курсов я могу посоветовать Курс «Введение в машинное обучение» (Coursera, «Высшая школа экономики», ведет Константин Воронцов) и Специализация «Машинное обучение и анализ данных» (6 курсов на Coursera, подготовленные совместно МФТИ и «Яндексом»). Из зарубежных наиболее полезны, на мой взгляд, Курс «Machine Learning» (Coursera, ведет Andrew Ng), Курс «Neural Networks for Machine Learning» (Coursera, ведет Geoffrey Hinton), а также несколько так называемых nanodegree на платформе Udacity, подготовленных совместно с крупными компаниями: Data Analyst (совместно с Facebook), Machine Learning Engineer (совместно с Kaggle), Deep Learning.

Чтобы пойти дальше и разобраться в том, как это работает на практике, можно участвовать в соревнованиях по анализу данных. Самый крупный сайт соревнований — это платформа kaggle.com. Здесь проводятся состязания по разным направлениям, например, конкретно сейчас на платформе решается задача от «Сбербанка» по российскому рынку недвижимости. Главная цель — разработать алгоритмы, которые позволят прогнозировать цены на недвижимость, имея на руках данные о жилье и макроэкономические закономерности. Похожие соревнования проводит большое количество компаний, участие в них — хороший способ проверить свои навыки и подтянуть знания. Кроме того, такие конкурсы вкупе с пройденными курсами и статьями с анализом собственных проектов также учитываются работодателями при приеме на работу — сейчас это реальный способ подтвердить свою квалификацию.

Безусловно, есть и программы на базе университетов. Одна из них — школа анализа данных «Яндекса», которая дает хорошие базовые знания в этой области. Такие школы работают не только в Москве и Петербурге, есть они также в Екатеринбурге и Новосибирске.

Какими базовыми компетенциями должен обладать специалист, который уже начинает работать в области Data Science?

Лекция заведующего кафедрой высокопроизводительных компьютерных технологий Уральского федерального университета Андрея Созыкина

Базовый уровень — это знание математики, в частности, прикладной статистики и теории вероятностей, кроме того, безусловно, нужно обязательно знать программирование. Сейчас в области Data Science чаще всего используется язык Python и библиотеки для анализа данных. Помимо прочего, специалист должен разбираться в современных методах машинного обучения. И это не только глубокое обучение (ведь это только один из методов), но и, например, градиентный бустинг, который также активно применяется сейчас на практике. Таким образом, специалисты должны знать все актуальные методы и уметь пользоваться библиотеками для машинного обучения.

За какое время можно освоить азы и уже применять знания на практике?

В целом теорию реально освоить примерно за год — за такой срок можно получить навыки, которые позволят выполнять поставленные задачи, работать с данными при условии, что рядом с вами будет специалист, который объяснит, как эти данные можно использовать в конкретной сфере. Но сейчас компании нуждаются как раз в специалистах, которые могли бы не только выполнять задачи на инженерном уровне, но и уметь все имеющиеся данные применять. Сегодня не теряет актуальность проблема, в основе которой — наличие огромного количества данных у компаний, с одной стороны, и с другой — незнание того, как их можно использовать. Такую проблему может решить только специалист, который владеет конкретной предметной областью.

Безусловно, в идеале специалист по Data Science должен уметь все — и программировать, и знать математику, а также хорошо разбираться в какой-либо предметной области — в банковской сфере, в телекоме, в медицине или других сферах. Ведь это принципиально мультидисциплинарное направление. Другое дело, что часто эти компетенции сочетаются не в одном человеке, а в команде — допустим, кто-то отлично программирует, кто-то на очень высоком уровне знает математику, а кто-то разбирается в тех же банках, а все вместе они выдают результат. И мы в университете тоже изначально стараемся подобрать людей так, чтобы они могли хорошо работать в команде.

Лекция заведующего кафедрой высокопроизводительных компьютерных технологий Уральского федерального университета Андрея Созыкина

В своих исследованиях вы занимаетесь конкретной предметной областью — анализом больших данных в области медицины. Расскажите, пожалуйста, подробнее о текущих проектах.

Мы занимаемся анализом медицинских изображений по двум направлениям: это анализ изображений сердца, а именно результаты магнитно-резонансной томографии, и изображений рака кожи. Зачем это нужно делать? Сейчас, чтобы обработать результаты МРТ, врач-диагност тратит достаточно большое время, как правило, это несколько часов. Ведь результаты МРТ — это не один снимок, а большое количество изображений, это снимки сердца на разных срезах. По этим снимкам врач, обладающий очень высокой квалификацией, должен определить поврежденные участки. Таким образом, ему нужно посмотреть огромное количество снимков, учитывая, что они, как правило, зашумлены, и уже по этой информации определить «области интереса». Это очень долго и сложно. Наша программа и другие существующие в этой области разработки помогают, во-первых, определить такие области на отдельных снимках, а во-вторых, на основе большого количества изображений делать трехмерную персонифицированную модель сердца. Все это в итоге позволяет автоматизировать работу врачей — делать ее быстрее и точнее.

В ближайшее время мы планируем проводить также моделирование различных болезней. Например, сейчас мы исследуем способы, которые позволят бороться с аритмией. Стоит отметить, что по одному из вариантов аритмия происходит, если в левом желудочке возникает спиральная волна и сердце начинает сокращаться очень быстро. Если этот процесс происходит в течение продолжительного времени, это создает большую опасность для человека, вплоть до летального исхода. Но есть способы остановить эту спиральную волну. Разумеется, мы не можем проводить такие исследования на живых людях — не только по этическим соображениям, но и из-за технических трудностей. Но мы можем проводить вычислительные эксперименты на суперкомпьютерах. Мы исследуем различные варианты распространения спиральной волны, а также методы воздействия, иными словами, способы, которые позволят нам остановить эту волну и предотвратить опасность для человека.

Такие исследования выполняют наши студенты и аспиранты, которые в процессе обучения используют так называемый проектный подход. В Екатеринбурге есть школа анализа данных «Яндекса». Некоторые студенты ее окончили, пошли в аспирантуру к нам в университет, соответственно, они уже умеют анализировать данные, а также, помимо этого, хотят изучить конкретную предметную область. У нас они занимаются исследованием медицинских изображений, и такая работа позволяет им продвинуться дальше изучения курсов и решения типовых заданий и выполнять вполне реальные, прикладные научные задачи.

Изображение, обработанное нейронной сетью. Источник: lamcdn.net

С точки зрения развития методов машинного обучения, на ваш взгляд, в каких сферах за последнее время удалось достичь лучших результатов?

Главным достижением развития нейронных сетей и их применения, на мой взгляд, стало развитие сферы беспилотных автомобилей — и с точки зрения технической сложности, и с точки зрения важности этого для прогресса как такового. Кроме того, существенно продвинулись в последнее время системы машинного перевода, всевозможные чат-боты.

Активно развивается и продолжает быть чрезвычайно востребованным это направление в банках — все, что касается финтеха. Стремительно развиваются различные направления, касающиеся сегментации клиентов, уже работает система предложений клиенту: на основе данных о нем банк может подготовить более адресное предложение каждому конкретному человеку, а также прогнозировать отток клиентов.

И, наконец, еще одно важное направление, которое развивается и будет развиваться в ближайшее время, — это все, что связано с автоматизацией рутинного интеллектуального труда. Это работает, например, в бухгалтерии и юриспруденции. Ведь вполне можно автоматизировать и бухгалтерский учет, и такие действия, как проверка составления договоров. Уже есть компании, которые этим занимаются. В том числе и в России. Например, компания Кнопка, которая автоматизирует бухгалтерский учет с помощью машинного обучения и нейронных сетей.

В этом случае все происходит достаточно просто. Благодаря тому, что уже работает электронный документооборот, нейронная сеть может сама получать входящие документы и квалифицировать их. Далее, понимая, какие действия в каждом определенном случае должен выполнить бухгалтер, она выполняет их в предназначенной для этого системе. Бухгалтер как таковой, конечно, остается, но благодаря автоматизации процессов таких специалистов в будущем будет требоваться гораздо меньше. Ведь больше не надо будет вручную обрабатывать в разных системах огромное количество документов. Останутся специалисты, которые будут проверять, что все эти нейронные сети и алгоритмы работают правильно.   

Какие основные задачи в области Data science ученым предстоит решить в ближайшее время?

С технической точки зрения перед учеными стоит задача увеличивать точность работы таких систем. Это, безусловно, накапливание и анализ еще большего объема данных. Например, это позволит улучшить работу беспилотных автомобилей даже в таких ситуациях, которые происходят достаточно редко.

Для типовых ситуаций данных уже много и все в этом случае работает уже хорошо, но, когда происходит что-то экстраординарное — то, что сеть никогда не видела, — машина пока справиться не может. Есть такой известный случай, когда беспилотный автомобиль попал в аварию, ошибившись с цветом прицепа машины, которая ехала перед ним. Этот цвет практически повторял цвет неба и нейронная сеть, управлявшая беспилотным автомобилем, попросту не распознала прицеп как часть машины, из-за чего произошло столкновение. Но, с другой стороны, учтя эту ошибку, в следующий раз сеть сможет ее избежать, причем во всех автомобилях, которыми она управляет. Опыт человека гораздо более ограничен, кроме того, человек зачастую повторяет одни и те же ошибки или, например, может спровоцировать аварию из-за плохого самочувствия. А сеть не устает, она не употребляет алкоголь, не болеет и не может заснуть за рулем.

Беспилотный автомобиль. Источник: svopi.ru

Что по этой логике делает ее гораздо более надежной, чем человека.

Есть много юридических и этических моментов на этот счет. До сих пор нельзя сказать, насколько можно доверять нейронной сети. Особенно актуально вопрос стоит, безусловно, в сфере, которая касается жизни и здоровья людей. Например, в той же медицинской диагностике. С одной стороны, нейронные сети могут выявить настолько сложные закономерности медицинских данных и предложить такие решения, которые не может найти ни один человек. Но с другой, мы до сих пор не понимаем, как именно нейронная сеть это делает. Для нас она работает в так называемом режиме black box — «черного ящика». Мы не понимаем, что у нее происходит внутри и почему она предлагает именно такие варианты. В медицине это неприемлемо, ведь в этой области мы должны четко объяснить и аргументировать каждое действие. Поэтому можем ли мы использовать то, что говорит нам нейронная сеть, в делах, касающихся жизни человека? До сих пор этот вопрос остается открытым.

Насколько реально в обозримом будущем понять причины, по которым сеть выдает те или иные результаты?

Безусловно, ученые постоянно предпринимают попытки понять причину таких действий, но пока результаты не так хороши. Есть даже такой пример, когда мы можем несущественно изменять данные, а нейронная сеть при этом будет выдавать уже совершенно другой результат. Например, в первом случае она распознает, что на изображении автомобиль и это правильно, но далее мы можем эту картинку специальным образом изменить — буквально в нескольких местах заменить несколько пикселов — и в этом случае нейронная сеть уже будет говорить, что на этой картинке изображен кот. Хотя человек по-прежнему увидит здесь автомобиль. Непонятно, почему нейронная сеть реагирует на изменения именно таким образом.

Но то, что можно осуществить уже в ближайшем будущем, касается анализа большего массива данных, разработки более сложных алгоритмов обучения и построения сетей, и с другой стороны — актуальной и реально осуществимой задачей на ближайшие годы является разработка аппаратного обеспечения для ускорения обучения, чтобы то, что раньше делалось за месяц, совершалось за считанные часы.

Открытый семинар по глубокому обучению, или как стать Data Scientist, прошел 16 мая в Петербурге. Организаторы мероприятия — компания NVIDIA и Университет ИТМО. Участникам рассказали, с чего начать путь специалиста по анализу больших данных, а также продемонстрировали решение с нуля классической задачи распознавания изображений с помощью глубокой нейросети. Спикером мероприятия выступил специалист в области Data Science, заведующий кафедрой высокопроизводительных компьютерных технологий Уральского федерального университета Андрей Созыкин. Эксперт занимается научными исследованиями в области анализа медицинских изображений с помощью глубокого обучения, ведет канал YouTube, на котором размещает видеолекции по технологиям Deep Learning.

 

Перейти к содержанию

К.Воронцов: домашняя страница

Машинное обучение, интеллектуальный анализ данных, прикладная статистика, комбинаторика.
Внутри машинного обучения: вычислительная теория обучения, ансамбли, совместная фильтрация.

1988–1994 гг. Студент МФТИ.
1993–1997 гг. Программист, РТИАК (Научно-прикладной токсикологический центр федерального агентства по здравоохранению и социальному развитию).
1994–1997 гг. ВЦ РАН аспирант.
1996–2000 гг. Разработка языка программирования ASDIEL для описания композиций обучаемых алгоритмов.
Разработка библиотек алгоритмов классификации, кластеризации и многомерного шкалирования для ASDIEL.
1996–2005 гг. LaTeX-2e в примерах.Сборник наглядных примеров для быстрого изучения LaTeX2e (на русском языке). Мои ученики осваивают LaTeX за два часа!
1997–2001 гг. Эксперт Московской межбанковской валютной биржи (ММВБ).
Разработка и поддержка систем анализа рынка и наблюдения САФРАН и СМАРТС.
1998–2006 гг. Разработка C++ библиотеки научных и бизнес-диаграмм ChartLib (документация только на русском языке).
1999 кандидатская диссертация «Локальные базисы в алгебраическом подходе к проблеме распознавания» (на русском языке см. некоторые англоязычные статьи в публикациях).
Пожалуйста, не путайтесь в нашей (переведенной на русский язык) терминологии; на самом деле эта работа посвящена ансамблевому обучению, что-то вроде бустинга, но более общего характера. В частности, нелинейные монотонные функции слияния предлагаются как для классификации, так и для регрессии.
2000–2002 гг. Разработка библиотеки C++ MoTor для моделирования торговли. Уникальная особенность MoTor заключается в том, что мы моделируем каждого участника торгов (трейдера, бухгалтерскую фирму) отдельно. Конфиденциальные данные участников используются для настройки модели. После построения модели вся конфиденциальная информация может быть забыта, что позволяет всем использовать и изучать модель.
Разработка и управление проектом FORECSYS Торговый симулятор ImiTrade.
2001 – настоящее время Исследователь, Вычислительный центр Российской академии наук (ВЦ РАН).
Заместитель директора по научной работе ФОРЭКСИС.
2002 г. Разработка и управление проектом Системы мониторинга рынка фьючерсов и опционов ММВБ FORECSYS.
2002 Разработка внутреннего стандарта FORECSYS «Компоненты матричных алгоритмов маКом» для многомерного анализа данных.
2003–2005 гг. Разработка внутреннего стандарта FORECSYS «CommFace» для более быстрой разработки демо- и пилотных проектов.
2003 Разработка пилотной версии системы прогнозирования продаж FORECSYS Goods4Cast.
2004 Разработка пилотной версии кредитной скоринговой системы FORECSYS ScoringPilot.
2004 – настоящее время Доцент, заместитель заведующего кафедрой «Интеллектуальные системы» из СМАМ МФТИ.
2004 Разработка годового курса по машинному обучению для МФТИ.
Конспекты лекций здесь.
2004 Управление проектом по выбору портфеля и механической торговой системе.
2005 Руководство проектом по совместной фильтрации и визуализации карты сходства в Интернете.
2007 Редактирование материалов Российской конференции «Математические методы распознавания образов», ММРО-2007.
Разработка конференции в стиле LaTeX (например, комбинированный стиль, поддерживающий примечания рецензента внутри текста).
2007 Разработка односеместрового курса прикладной статистики для Факультет ВМК.
2007–2008 гг. Разработка годового курса вычислительной теории обучения для Факультет ВМК.
2008 – настоящее время Разработка концепции, администрирование, редактирование вики-ресурс www.MachineLearning.ru.
Моя страница участника : Воков (на русском).

Константин Воронцов | Московский физико-технический институт

Константин Воронцов | Московский физико-технический институт — Academia.edu

Academia.edu больше не поддерживает Internet Explorer.

Чтобы просматривать Academia.edu и более широкий Интернет быстрее и безопаснее, потратьте несколько секунд на обновление браузера.

Papers

Lecture Notes in Computer Science, 2011

Страница 1.Учимся ранжировать с помощью нелинейного монотонного ансамбля Никита Спирин1 и Константин Воронцов… подробнее Страница 1. Учимся ранжировать с помощью нелинейного монотонного ансамбля Никита Спирин1 и Константин Воронцов2 … партитуры). Обучающий набор пар объект-выход {(xk,yk)}l k=1 из Ω×Y и набор базовых алгоритмов b1,. ..,bp индуцируют последовательность векторов оценки {uk}l k=1 …

Paperrank:

Paperrank:

Читателей Learning, 2014

PaperRank: 

Читатели Связанные статьи УпоминанияПросмотр Влияние Вероятностное тематическое моделирование текстовых коллекций — мощный инструмент для статистического анализа текстов… далее Вероятностное тематическое моделирование текстовых коллекций является мощным инструментом статистического анализа текстов. В этой статье мы объявляем о проекте с открытым исходным кодом BigARTM (http://bigartm.org), который предоставляет параллельный онлайн-алгоритм EM для изучения аддитивно регуляризованных мультимодальных тематических моделей больших коллекций. Мы показываем, что BigARTM превосходит другие популярные пакеты по качеству, времени выполнения и многокритериальной функциональности… далее Мы предлагаем комбинаторный метод получения жестких границ обобщения, зависящих от данных, на основе графа расщепления и связности (SC-графа) набора классификаторов. Мы применяем этот подход к параметрическому набору конъюнктивных правил и предлагаем алгоритм для эффективного вычисления с привязкой к SC. Эксперименты с 6 наборами данных из репозитория машинного обучения UCI показывают, что привязка к SC помогает изучать более надежные классификаторы на основе правил как композиции менее подогнанных правил.

PaperRank: 

Читатели Связанные статьи УпоминанияПросмотреть ВлияниеПредложена новая методика оптимизации для слияния классификаторов — Кооперативный коэволюционный ансамбль… подробнее Предлагается новая методика оптимизации для слияния классификаторов — Кооперативное коэволюционное ансамблевое обучение (CCEL). Он основан на специфическом многопопуляционном эволюционном алгоритме — кооперативной коэволюции. Его можно использовать в качестве оболочки для любых слабых алгоритмов, процедур обучения и функций слияния как для задач классификации, так и для задач регрессии. Эксперименты над реальными задачами из репозитория UCI показывают, что CCEL имеет довольно высокую производительность обобщения и генерирует ансамбли гораздо меньшего размера, чем метод бустинга, бэггинга и случайного подпространства.

PaperRank: 

Читатели Связанные статьи УпоминанияПросмотр влияния

PaperRank: 

Читатели Связанные статьи УпоминанияПросмотр влияния

Конспекты лекций по информатике, 2011

Страница 1. Учимся ранжировать с помощью нелинейного монотонного ансамбля Никита Спирин1 и Константин Воронцо… подробнее 1. Обучение ранжированию с нелинейным монотонным ансамблем Никита Спирин1 и Константин Воронцов2 … партитуры). Обучающий набор пар объект-выход {(xk,yk)}l k=1 из Ω×Y и набор базовых алгоритмов b1,…,bp индуцирует последовательность векторов оценки {uk}l k=1 …

PaperRank: 

Читатели Связанные статьи MentionsView Impact

Lecture Notes in Computer Science, 2015

PaperRank: 

Читатели Связанные статьи MentionsView Impact

Lecture Notes in Computer Science, 2013

PaperRank:

Читатели Связанные статьи MentionsView Impact

Machine Learning, 2014

PaperRank:

Читатели Связанные статьи MentionsView Impact Вероятностное тематическое моделирование текстовых коллекций — мощный инструмент для статистического анализа текста. .. далее Вероятностное тематическое моделирование текстовых коллекций является мощным инструментом статистического анализа текстов. В этой статье мы объявляем о проекте с открытым исходным кодом BigARTM (http://bigartm.org), который предоставляет параллельный онлайн-алгоритм EM для изучения аддитивно регуляризованных мультимодальных тематических моделей больших коллекций. Мы показываем, что BigARTM превосходит другие популярные пакеты по качеству, времени выполнения и многокритериальной функциональности… далее Мы предлагаем комбинаторный метод получения жестких границ обобщения, зависящих от данных, на основе графа расщепления и связности (SC-графа) набора классификаторов. Мы применяем этот подход к параметрическому набору конъюнктивных правил и предлагаем алгоритм для эффективного вычисления с привязкой к SC. Эксперименты с 6 наборами данных из репозитория машинного обучения UCI показывают, что привязка к SC помогает изучать более надежные классификаторы на основе правил как композиции менее подогнанных правил.

PaperRank: 

Читатели Связанные статьи УпоминанияПросмотреть ВлияниеПредложена новая методика оптимизации для слияния классификаторов — Кооперативный коэволюционный ансамбль… подробнее Предлагается новая методика оптимизации для слияния классификаторов — Кооперативное коэволюционное ансамблевое обучение (CCEL). Он основан на специфическом многопопуляционном эволюционном алгоритме — кооперативной коэволюции. Его можно использовать в качестве оболочки для любых слабых алгоритмов, процедур обучения и функций слияния как для задач классификации, так и для задач регрессии. Эксперименты над реальными задачами из репозитория UCI показывают, что CCEL имеет довольно высокую производительность обобщения и генерирует ансамбли гораздо меньшего размера, чем метод бустинга, бэггинга и случайного подпространства.

PaperRank: 

Читатели Связанные статьи УпоминанияПросмотр влияния

PaperRank: 

Читатели Связанные статьи УпоминанияПросмотр влияния Войти с Facebook
Войти с Google

Лица: Воронцов Константин Вячеславович

В вашем браузере отключен JavaScript. Включите его, чтобы включить полную функциональность веб-сайта

 
Воронцов Константин Вячеславович

Статистика Math-Net.Ру
Всего публикаций: 11
Научные статьи: 9
Презентации: 21


Количество просмотров:
Эта страница: 6305
Абстрактные страницы: 1694
Полные тексты: 703
Рекомендации: 149
Профессор Российской академии наук
Доктор физико-математических наук (2010)
Специальность: 05. 13.17 (Теоретические основы информатики)
Дата рождения: 1.04.1971
Электронная почта: электронная почта
Веб-сайт: http://www.machinelearning.ru/wiki/index.php?title=:Воков
Ключевые слова: машинное обучение, интеллектуальный анализ данных, прикладная статистика, вычислительная теория обучения, границы обобщения, классификаторы на основе сходства, системы множественных классификаторов, совместная фильтрация.
УДК: 519.714, 519.712.63
МСК: 68Т10, 93Э35

Тема:

Комбинаторная теория эмпирических предсказаний и границ обобщения алгоритмов обучения. Аксиоматика слабой вероятности. Классификация на основе сходства и ансамбля. Совместная фильтрация и анализ клиентской среды. Поддержка и развитие wiki-сайта http://www.MachineLearning.ru.

Биография

1999: Кандидатская диссертация «Локальные базисы в алгебраическом подходе к проблеме распознавания».

С 2001 г. – научный сотрудник Вычислительного центра Российской академии наук (ВЦ РАН). Заместитель директора по исследованиям FORECSYS comp.

С 2004 г. – доцент, заместитель заведующего кафедрой «Интеллектуальные системы» факультета управления и прикладной математики Московского физико-технического института.

   
Основные публикации:
  1. Рудаков К. В., Воронцов К. В., “Методы оптимизации и монотонной коррекции в алгебраическом подходе к задаче распознавания”, Доклады математики, 60:1 (1999), 139  
  2. Воронцов К. В., “Комбинаторное обоснование алгоритмов обучения”, Комп. Математика Математика. Phys., 44:11 (2004), 1997–2009 ; http://www.ccas.ru/frc/papers/voron04jvm-eng.пдф
  3. Воронцов К. В., “Комбинаторные оценки эффективности обучения”, Доклады математики, 69:1 (2004), 145–148 ; http://www.ccas.ru/frc/papers/voron04qualdan-eng.pdf
  4. Каневский Д. Ю., Воронцов К. В., «Кооперативное коэволюционное ансамблевое обучение», Системы множественных классификаторов, 7-й международный семинар (Прага, Чехия, 23–25 мая 2007 г.), Конспект лекций по информатике, Springer-Verlag, 2007, 469–478; http://www.ccas.ru/frc/papers/kanevskiy07ccel.пдф
  5. Воронцов К. В., “Комбинаторная вероятность и точность границ обобщения”, Распознавание образов и анализ изображений, 18:2 (2008), 243–259 ; http://www.springerlink.com/content/78537p01838123u7

http://www.mathnet.ru/eng/person42083
https://ru.wikipedia.org/wiki/,__
Список публикаций в Google Scholar
Список публикаций ZentralBlatt
https://mathscinet.com.ams.org/mathscinet/MRAuthorID/600263
https://elibrary.ru/author_items.asp?authorid=15081
ИСТИНА http://istina.msu.ru/workers/3151446
http://orcid.org/0000-0002-4244-4270
http://www.researcherid.com/rid/G-7857-2014
https://www.scopus.com/authid/detail.url?authorId=6507982932
https://www.researchgate.net/profile/Константин-Воронцов-2

Публикации в Math-Net.Ru
2021
1. Ш. Х. Ишкина, Ш. Х. Ишкина, К. В. Воронцов, “Оценка точности оценок комбинаторной обобщающей способности пороговых решающих правил”, Автомат. и телемех., 2021, 5,  151–168  ; автомат. Дистанционное управление, 82:5 (2021), 863–876    
2020
2. И. А. Ирхин, В. Г. Булатов, К. В. Воронцов, “Аддитивная регуляризация тематических моделей с быстрой векторизацией текста”, Компьютерные исследования и моделирование, 12:6 (2020),  1515–1528  
3. И. А. Ирхин, К. В. Воронцов, “Сходимость алгоритма аддитивной регуляризации тематических моделей”, Тр. Мат. я Мех. УрО РАН, 26:3 (2020),  56–68      
2019
4. А. В. Сухарева, К. В. Воронцов, “Построение полного набора тем вероятностных тематических моделей”, Интеллектуальные системы. Теория и приложения, 23:4 (2019), 7–23 
2012
5. К. В. Воронцов, А. А. Потапенко, “Регуляризация, устойчивость и разреженность вероятностных тематических моделей”, Компьютерные исследования и моделирование, 4:4 (2012),  693–706  
2004
6. К. В. Воронцов, “Комбинаторное обоснование алгоритмов обучения”, Ж. вычисл. Вычисл. Мат. Мат. физ., 44:11 (2004),  2099–2112      ; вычисл. Мат. Мат. Phys., 44:11 (2004), 1997–2009
2000
7. К. В. Воронцов, “Методы оптимизации линейной и монотонной коррекции в алгебраическом подходе к задаче распознавания”, Ж. вычисл. Вычисл. Мат. Мат. физ., 40:1 (2000), 166–176      ; вычисл.Мат. Мат. Phys., 40:1 (2000), 159–168
1998
8. К. В. Воронцов, “Целевая оптимизация базисов в задачах распознавания”, Ж. вычисл. Вычисл. Мат. Мат. физ., 38:5 (1998), 870–880      ; вычисл. Мат. Мат. Phys., 38:5 (1998), 838–847
1995
9. К. В. Воронцов, “Предварительная обработка данных для решения специального класса задач распознавания образов”, Ж. вычисл.Вычисл. Мат. Мат. физ., 35:10 (1995),  1564–1575      ; вычисл. Мат. Мат. Phys., 35:10 (1995), 1259–1267 

2021
10. К. В. Воронцов, Ю. И. Журавлев, А. А. Лазарев, Д. В. Лемтюжникова, К. В. Рудаков, В. В. Стрижов, Юл. В. Чехович, Ю. В. Чехович, “Вступительное слово Программного комитета конференции Интеллектуальная обработка данных.Теория и приложения (ИДП-2020)”, Автомат. и телемех., 2021, 10, 3–5; автомат. Пульт дистанционного управления, 82:10 (2021), 1633–1634    
11. К. В. Воронцов, Ю. И. Журавлев, М. И. Забежайло, А. И. Майсурадзе, А. С. Пушняков, И. А. Соколов, А. Л. Семенов, Р. Таханов, И. Ю. Торшин, А. А. Черепнин, Ю. В. Чехович, “Памяти Константина Владимировича Рудакова (21.06.1954 – 10.07.2021)”, Компьютерные исследования и моделирование, 13:4 (2021),  675–676  ; Компьютерные исследования и моделирование, 13:4 (2021), e675

Презентации в Math-Net.Ру
1.
К. В. Воронцов
Общее собрание Отделения математических наук РАН, 2021
13 декабря 2021 г.
2.
К. В. Воронцов

3 июня 2020 17:30
3.
К. В. Воронцов
Математическая мастерская Школы прикладной математики и информатики (МФТИ)
20 сентября 2019 г. 18:30
4.
К. В. Воронцов
IX Московская международная конференция по исследованию операций (ОРМ2018-Germeyer100)
22 октября 2018 г. 12:15
5. :
К. В. Воронцов

16 октября 2017 18:30
6.
К. В. Воронцов
Коллоквиум факультета компьютерных наук
5 октября 2017 г. 18:10
7.
Райгородский А.М., Стрижов В.В., Воронцов К.В.
Математическая мастерская Школы прикладной математики и информатики (МФТИ)
31 марта 2017 г. 18:30
8. ,
К. В. Воронцов
Математическая мастерская Школы прикладной математики и информатики (МФТИ)
11 ноября 2016 г. 18:30
9.
К.В. Воронцов
Конференция профессоров РАН в Отделении математических наук Российской академии наук
14 июня 2016 г. 11:20
10.
К. В. Рудаков, К. В. Воронцов
Международная конференция по прикладной математике и информатике, посвященная К 60-летию Вычислительного центра им. В. А. Дородницына РАН
9 декабря 2015 11:20
11.
К. В. Воронцов

19 июня 2015 09:00
12.
К. В. Воронцов

17 июня 2015 17:30
13. Многокритериальная регуляризация для вероятностного тематического моделирования больших массивов текстов
К. В. Воронцов
Международная конференция «Оптимизация и приложения в управлении и науке о данных» к 80-летию Бориса Поляка
14 мая 2015 11:00
14.
К. В. Воронцов

27 июня 2014 12:00
15.
К. В. Воронцов

26 июня 2014 15:00
16. Аддитивная регуляризация для вероятностного тематического моделирования
К. В. Воронцов
Успехи в области оптимизации и статистики
15 мая 2014 г. 14:20
17.
К. В. Воронцов
Проблемы стохастического анализа
19 апреля 2014 11:00
18.
К. В. Воронцов
Математический семинар
25 февраля 2014 г. 18:30
19. Комбинаторная теория переобучения
К. В. Воронцов
Международный семинар по статистическому обучению
28 июня 2013 г. 10:30
20.
К. В. Воронцов
Проблемы стохастического анализа
13 апреля 2013 11:00
21. Комбинаторная теория переобучения
К. В. Воронцов
Семинар PreMoLab
24 мая 2012 г. 17:00

Организации
 

Верхние оценки для классификаторов на основе функции различия

  • K.Воронцов В. Комбинаторная вероятность и точность границ обобщения // Распознавание образов и анализ изображений. 2008. Т. 18, № 2. С. 243–259.

  • В. Вапник, Природа статистической теории обучения, Спрингер, Нью-Йорк (2000).

    МАТЕМАТИКА Google ученый

  • Ю. Журавлев И., Алгебраический подход к задачам распознавания или классификации, Проблемы кибернетики, 33 , 5–68 (1978).

    Google ученый

  • К. В. Воронцов, Машинное обучение и анализ данных: цикл лекций «Математические методы обучения на прецедентах», http://www.ccas.ru/voron/teaching.html.

  • Шлезингер М., Главач В. Десять лекций по статистическому и структурному распознаванию. Киев: Наукова думка, 2004.

    Google ученый

  • Т.К. Мун и У. К. Стирлинг, Математические методы и алгоритмы обработки сигналов, Прентис-Холл, Нью-Йорк (2000).

    Google ученый

  • Капустий Б.Е., Русин Б.П., Таянов В.А. Оптимизация классификатора в условиях малой выборки // Автоматическое управление и информатика. 2006. № 5. С. 17–22.

    Google ученый

  • Б. О. Капустий, Б.Русин П., Таянов В.А. Комбинаторная оценка влияния уменьшения информационного покрытия класса на обобщающую способность алгоритмов классификации 1NN // Искусственный интеллект. 2008. № 1. С. 49–54.

  • Карлин С. Основы теории случайных процессов. М.: Мир, 1971.

  • Королюк В. С., Портенко Н. И., Скороход А. В., Турбин А. Ф. Руководство по теории вероятностей и математической статистике. М.: Наука, 1985.

    Google ученый

  • К. М. Бишоп, Распознавание образов и машинное обучение (информатика и статистика), Springer, Лондон (2006).

    Google ученый

  • Э. В. Вайсштейн, Неравенство Чебышева, http://mathworld.wolfram.com/Chebyshev Inequality.html, 10.12.2008.

  • Э. В. Вайсштейн, Неравенство Гаусса, http://mathworld.wolfram.com/GaussInequality.html, 10.12.2008.

  • Г. Ту. и Гонсалес Р. Принципы распознавания образов. М.: Мир, 1978.

  • Капустий Б.О., Русин Б.П., Таянов В.А. Новый подход к определению вероятности правильного распознавания объектов из множеств // УСИМ. 2005. № 2. С. 8–13.

  • DL Теоретический класс

    Это старая версия класса. Для последней итерации класса проверьте здесь.

    Классная дискуссионная группа: подпишитесь, чтобы получать объявления и участвовать в обсуждениях.

    Описание

    Исследования в области глубокого обучения дают самые современные результаты по ряду задач машинного обучения. Большинство этих достижений основаны на интуиции и обширных исследованиях методом проб и ошибок. В результате теория в настоящее время отстает от практики. Сообщество машинного обучения не до конца понимает, почему работают лучшие методы.

    • Почему мы можем надежно оптимизировать невыпуклые объективы?
    • Насколько выразительны наши архитектуры с точки зрения описываемого ими класса гипотез?
    • Почему некоторые из наших самых сложных моделей обобщаются до невиданных ранее примеров, когда мы используем наборы данных на несколько порядков меньше, чем те, которые классическая статистическая теория обучения считает достаточными?

    Симптомом этого непонимания является то, что методам глубокого обучения в значительной степени не хватает гарантий и интерпретируемости, двух необходимых свойств для критически важных приложений.Что еще более важно, прочная теоретическая основа может помочь в разработке эффективных методов нового поколения без необходимости слепого исследования методом проб и ошибок.

    На этом занятии мы рассмотрим ряд недавних публикаций, пытающихся пролить свет на эти вопросы. Прежде чем обсуждать новые результаты в каждой статье, мы сначала представим необходимые фундаментальные инструменты из оптимизации, статистики, теории информации и статистической механики. Цель этого класса — вовлечь студентов в новые исследования в этой области.С этой целью большая часть кредита будет дана за отчет о проекте класса и презентацию по соответствующей теме.

    Предпосылки: Это предназначено для продвинутых выпускников для студентов, которые хотят участвовать в теоретических исследованиях глубокого обучения. Мы представим некоторые необходимые теоретические инструменты, но начните с предположения, что учащимся удобно:

    • Вероятность
    • Линейная алгебра
    • Машинное обучение

    Если вы не посещали курсы по всем вышеперечисленным темам, этот курс не предназначен для вас. Вместо этого вы должны взять другой класс.

    Люди

    Лектор: Иоаннис Митлягкас,

    Информация о классе

    Зимний семестр 2019 г.:

    • Среда 9:40-11:25
    • Четверг 9-10:55

    Комната: Новая аудитория Mila, 6650 St. Urbain.

    Часы работы: с 10:45 до 11:45 в четверг сразу после занятий.

    Связь

    Мы будем использовать классную дискуссионную группу на все вопросы. Если у вас есть что-то личное / деликатное для обсуждения, не стесняйтесь, напишите мне.Если вы начнете тему электронной почты с «IFT6085:», это гарантирует, что ваша электронная почта не будет классифицирована неправильно.

    Оценка

    Класс проекта: 40% Бумажная презентация: 25% Викторины-сюрпризы, промежуточные: 20% Скрайбинг: 10% Участие класса: 5%

    Используйте этот латексный шаблон для надписей.

    Предварительные темы — будут обновляться по мере продвижения

    • Обобщение: теоретический анализ и практические оценки
    • Теория информации и ее приложения в машинном обучении (информационное узкое место, нижние границы и т. д.).)
    • Генеративные модели за пределами красивых картинок: инструмент для обхода множества данных, проекций, завершения, замен и т. д.
    • Приручение враждебных целей: GAN Вассерштейна, подходы к регуляризации и управление динамикой
    • Выразительная сила глубоких сетей (глубокое распространение информации, анализ среднего поля случайных сетей и т. д.)

    Обширная библиография класса

    Расписание

    ПРИМЕЧАНИЕ. В первой половине урока мы будем внимательно следить за предыдущая итерация класса.

    9 января Введение в класс [слайды, викторина]


    Ускоренный курс оптимизации

    10 января Основы выпуклого анализа и градиентного спуска [ новых исписанных заметок]

    Чтение:

    Основы выпуклого анализа из «Выпуклой оптимизации» Бойда, Ванденберге ([5] по ссылкам):

    • Глава 2 (требуется: начало главы до 2.1.4, рекомендуется: 2.1.5 до конца раздела)
    • Глава 3 (требуется: начало главы до 3.1, рекомендуемые: 3.2, 3.3 и 3.4)

    Доказательства сходимости: из главы 3 [1] («Выпуклая оптимизация…» С. Бубека в разделе «Ссылки»)

    • Требуется: доказательство сходимости теоремы 3.2 (обратите внимание, что мы изучали неограниченный кейс. В этом случае оператор проектирования PiX(x) является тождественным оператором)

    16-17 января Разные скорости градиентного спуска: от липшицевого до сильно выпуклого [ новых исписанных заметок]

    Чтение:

    Доказательства сходимости из главы 3 книги [1] («Выпуклая оптимизация…» С.Бубек под ссылками)

    • Требуется: доказательство сходимости теоремы 3.12

    23 января Модели черного ящика и нижние границы [ новых исписанных заметок]

    Чтение: [1, теорема 3.15], [6]

    24 января Ускоренные методы: импульс Поляка (метод тяжелого шара) [ новых исписанных заметок] [слайды]

    Чтение: [6], [7, стр. 67-76], [8], [9]

    30 января Ускоренный градиент Нестерова, стохастический градиентный спуск [ новых исписанных заметок]

    Чтение: разделы с 6 по 6.2 из [1], раздел 14.3 из [4]


    Ускоренный курс статистической теории обучения

    31 января Элементы статистической теории обучения [ новых исписанных заметок]

    Чтение: Разделы 2 (если вам нужно введение), 3, 4 и 6 из [4].

    6 февраля Границы PAC-Байеса [ новых исписанных заметок]

    Чтение: [12]

    Чтение (сложнее): Раздел 6 из [2]

    7 февраля Стабильность и обобщение [ новых исписанных заметок]

    Чтение: [13,14]


    Семинарская часть класса

    13 февраля: Приглашенный лектор, Гийом Рабюссо Теоремы о выразительности и универсальной аппроксимации [ новых исписанных заметок]

    20 февраля Приложения стабильности [ новых исписанных заметок]

    Чтение: [14]

    21 февраля Генеративные модели [ новых исписанных заметок]

    Чтение: [16,17]

    27 февраля ГАН Вассерштейна [ новых исписанных заметок]

    Чтение: [18,19]

    28 февраля Числа GAN [ новых исписанных заметок] [слайды]

    6 марта ПЕРЕРЫВ Нет класса

    7 марта ПЕРЕРЫВ Нет класса

    13 марта Промежуточный экзамен

    14 марта: Приглашенный лектор, Гийом Лажуа Введение в динамические системы с приложением к нейронным сетям [ новых исписанных заметок]

    Чтение: [31, 32, 33]

    20 марта, утро Презентации студенческих работ, A

    Форма оценки

    20 марта, вторая половина дня Презентации студенческих работ, B

    Форма оценки

    21 марта Взвешенные суммы случайных кухонных раковин: замена минимизация с рандомизацией в обучении [ новых исписанных заметок]

    Чтение: [23]

    27 марта, утро Основные результаты обучения с подкреплением [ новых исписанных заметок]

    Чтение: [34], главы 3 и 4

    27 марта, вторая половина дня Презентации студенческих работ, D

    Форма оценки

    28 марта, утро Презентации студенческих работ, C

    Форма оценки

    3 апреля Распределенное обучение с подкреплением [ новых исписанных заметок]

    Бонусные лекции

    Этот раздел содержит полезный материал (старые лекции), которые были заменены новым материалом, но все равно очень интересно и полезно.Студенты не будут экзаменоваться по этому материалу.

    21 марта 2018 г. Методы уменьшения дисперсии для стохастической оптимизации [заметки]

    Чтение: [22], раздел 5.3 из [21]

    29 марта 2018 г. PacGAN: сила двух образцов в генеративно-состязательных сетях

    Чтение: [24]

    4 апреля 2018 г. Некоторые результаты по невыпуклой оптимизации

    Чтение: [25,26]

    5 апреля 2018 г. Выход из седловых точек [записанные заметки] слайды Ян Юаня

    Чтение: [27, 28]

    11 апреля 2018 г. Теория спиновых стекол

    Гостевая лекция Алекса Фриберга , UdeM Math.

    Чтение: [29]

    12 апреля 2018 г. Поверхности потерь многоуровневых сетей

    Чтение: [30]

    Ресурсы

    1. Выпуклая оптимизация: алгоритмы и сложность, Себастьян Бюбек.
    2. Теория классификации: обзор некоторых последних достижений Стефан Бушерон, Оливье Буске и Габор Лугоши
    3. Ноутбук iPython демонстрация основных идей градиентного спуска и стохастического градиентного спуска, простые и сложные модели, а также обобщение.
    4. Понимание машинного обучения: от теории к алгоритмам, Шай Шалев-Шварц и Шай Бен-Дэвид.
    5. Выпуклая оптимизация, Стивен Бойд и Ливен Ванденберге.
    6. Ускоренный градиентный спуск Нестерова для гладкой и сильно выпуклой оптимизации, запись в блоге Себастьяна Бубека.
    7. Вводные лекции по выпуклой оптимизации, Юрий Нестеров.
    8. Почему моментум действительно работает, сообщение в блоге Габриэля Го (в этом сообщении в блоге используется немного другая параметризация алгоритма импульса.Версия, которую мы обсуждаем в классе, применяет скорость обучения только к градиенту.)
    9. YellowFin и искусство настройки импульса, препринт Дж. Чжан, И. Митлягкас.
    10. Крупномасштабное машинное обучение и оптимизация (класс), Димитрис Папайлиопулос, Университет Висконсина.
    11. Передовые системы машинного обучения (класс), Крис Де Са, Корнельский университет.
    12. Учебное пособие по PAC-Байесу с границей отсева, Дэвид Макаллестер.
    13. Устойчивость и обобщение, О.Буске, А. Елисеев.
    14. Тренируйтесь быстрее, обобщайте лучше: Устойчивость стохастического градиентного спуска, М. Хардт, Б. Рехт, Ю. Зингер.
    15. Вычисление непустых границ обобщения для глубоких (стохастических) нейронных сетей с гораздо большим количеством параметров, чем обучающие данные, Гинтаре Каролина Дзюгайте, Дэниел М. Рой
    16. Конспект лекций по алгоритмам генеративного обучения, Эндрю Нг
    17. Генеративно-состязательные сети, Ян Гудфеллоу и др.
    18. Вассерштейн ГАН, Мартин Аржовски, Сумит Чинтала, Леон Ботту
    19. Чтение: Вассерштейн ГАН, Алекс Ирпан
    20. Численность GAN, Ларс Мешедер, Себастьян Новозин, Андреас Гейгер
    21. Методы оптимизации для крупномасштабного машинного обучения, Леон Ботту, Фрэнк Э.Кертис, Хорхе Носедаль
    22. Ускорение стохастического градиентного спуска с использованием прогнозирующего уменьшения дисперсии, Ри Джонсон, Тонг Чжан
    23. Взвешенные суммы случайных кухонных раковин: замена минимизации рандомизацией в обучении, Али Рахими, Бен Рехт
    24. PacGAN: сила двух образцов в генеративно-состязательных сетях, Зинан Лин, Ашиш Кетан, Джулия Фанти, Севунг О
    25. Стохастические методы первого и нулевого порядков для невыпуклого стохастического программирования, Саид Гадими, Гуанхуи Лан
    26. Линейная сходимость градиентных и проксимально-градиентных методов при условии Поляка-Лоясевича, Хамед Карими, Джули Нутини, Марк Шмидт
    27. Выход из седловых точек — онлайн-стохастический градиент для тензорной декомпозиции, Жун Ге, Фужун Хуан, Чи Цзинь, Ян Юань
    28. Как эффективно избегать седловых точек, Чи Джин, Ронг Ге, Пранит Нетрапалли, Шам М.Какаде, Майкл И. Джордан
    29. СЛУЧАЙНЫЕ МАТРИЦЫ И СЛОЖНОСТЬ СПИНОВЫХ СТЕКЛОВ, АНТОНИО АУФФИНГЕР, ЖЕРАРД БЕН АРУС И ДЖИРИ ЧЕРНИ
    30. Поверхности потерь многослойных сетей, Анна Чороманска, Микаэль Хенафф, Майкл Матье, Жерар Бен Арус, Янн Лекун
    31. Изучать долгосрочные зависимости с помощью градиентного спуска сложно, Y Bengio, P Simard, P Frasconi
    32. О сложности обучения рекуррентных нейронных сетей, Разван Паскану, Томас Миколов, Йошуа Бенжио
    33. Открытие черного ящика: низкоразмерная динамика в многомерных рекуррентных нейронных сетях, Дэвид Суссилло и Омри Барак
    34. Обучение с подкреплением: введение, Ричард С.Саттон и Эндрю Г. Барто

    Недавнее обсуждение

    Специалист по Data Science Андрей Созыкин о возможностях нейронных сетей

    Нейронные сети помогают лечить сердечные приступы, управлять трафиком, анализировать изображения и советуют банкам, какие услуги предлагать. С каждым днем ​​они входят в новые сферы нашей жизни, а компании находят для них все больше применений. Но какова их внутренняя работа и как начать свой путь к тому, чтобы стать специалистом по анализу больших данных? На эти вопросы ответил заведующий кафедрой высокопроизводительных компьютерных технологий Уральского федерального университета Андрей Созыкин в ходе открытой лекции, организованной Университетом ИТМО и компанией NVIDIA.

    Ваш совет тем, кто только начал заниматься этой сферой и не знает, с чего начать?

    На самом деле сейчас есть много возможностей стать специалистом в Data Science. Во-первых, если у человека есть самодисциплина и мотивация, он может всему научиться сам. Есть открытые курсы, в том числе и на русском языке. Наверняка многие на английском, и их достаточно для понимания основных алгоритмов и теории.Из российских курсов могу порекомендовать «Введение в машинное обучение» (Coursera, НИУ ВШЭ, руководитель Константин Воронцов) и специализацию «Машинное обучение и анализ данных» (шесть курсов на Coursera от МФТИ и Яндекса) . Что касается зарубежных курсов, то я считаю наиболее полезными «Машинное обучение» (Coursera, руководитель Эндрю Нг), «Нейронные сети для машинного обучения» (Coursera, руководитель Джеффри Хинтон), а также так называемые наностепени на платформе Udacity, созданные в сотрудничество с крупными компаниями: Data Analyst (совместно с Facebook), Machine Learning Engineer (совместно с), Deep Learning.

    Чтобы углубиться и понять, как это работает на практике, можно поучаствовать в конкурсах по анализу данных. Самая большая платформа для этого — kaggle.com https://www.kaggle.com/competitions. Проводятся конкурсы по разным направлениям; например, текущая задача Сбербанка России связана с рынком недвижимости. Его основная цель — разработка алгоритмов, которые позволят прогнозировать цены на недвижимость на основе данных о жилье и макроэкономических закономерностей. Подобные конкурсы проводят многие компании, и участие в них — отличный способ проверить свои навыки и узнать что-то новое.Кроме того, участие в конкурсах, анализ собственных проектов и прохождение курсов — хороший способ подтвердить свои навыки при приеме на работу.

    Конечно, есть и образовательные программы в разных вузах. Одна из них — Школа анализа данных Яндекса, дающая хорошие базовые знания по теме. Школа имеет филиалы в Москве, Санкт-Петербурге, Екатеринбурге и Новосибирске.

    Какими базовыми компетенциями должен обладать специалист по науке о данных?

    Лекция Андрея Созыкина

    На базовом уровне это был бы хороший уровень математики, включая прикладную статистику и теорию вероятностей, а также обязательно программирование.На данный момент специалисты в области Data Science в основном работают с языком программирования Python и библиотеками для анализа данных. Кроме того, специалист должен хорошо разбираться в современных методах машинного обучения, и это будет не только глубокое обучение (это только один из методов), но и такие методы, как градиентное повышение, которые сейчас активно используются. Таким образом, специалисты должны знать все актуальные методы и уметь использовать библиотеки для машинного обучения.

    В какое время можно изучить основы и начать их применять?

    В принципе, теорию можно выучить примерно за год — этого будет достаточно, чтобы получить навыки, которые позволят выполнять задачи и работать с данными, если есть специалист, который будет консультировать вас по работам в той или иной области.Однако сейчас компаниям требуются специалисты, способные не только решать задачи на инженерном уровне, но и применять полученные данные. У компаний много данных, но они не умеют ими пользоваться, а это очень актуальная проблема, решить которую может только специалист, к тому же хорошо разбирающийся в той или иной области.

    В идеале специалист по науке о данных должен уметь многое — хорошо разбираться в программировании и математике, а также хорошо знать ту или иную область — банковский сектор, телекоммуникации, медицину или любую другую.Таким образом, специалист по науке о данных должен обладать междисциплинарными знаниями. Конечно, это могут быть компетенции не одного человека, а команды: допустим, один хорошо разбирается в программировании, другой разбирается в математике, а третий много знает о банковской сфере; в целом они могут дать отличные результаты. В нашем университете мы стремимся организовать группы таким образом, чтобы студенты могли хорошо работать в команде.

    Лекция Андрея Созыкина

    Вы сосредотачиваете свои исследования на определенной области — анализе больших данных в медицине.Расскажите, пожалуйста, о ваших текущих проектах.

    У нас есть два проекта по анализу изображений в медицине: это будет анализ изображений сердца (а именно результатов МРТ) и изображений рака кожи. Для чего это? В настоящее время врачи тратят несколько часов на обработку результатов МРТ, так как результаты МРТ содержат целые наборы изображений. По ним высококвалифицированный врач должен определить зоны поражения. Другими словами, он просматривает множество изображений (которые могут иметь шумы и тому подобное) и определяет «области интересов» на основе этих данных.Это очень сложная задача, которая требует много времени. Наша программа, как и другие в этой области, помогает определить эти области на отдельных изображениях, а также создает 3D-модели сердца, используя как можно больше изображений. Все это помогает автоматизировать работу врачей, помогает делать ее быстрее и точнее.

    В ближайшее время мы планируем начать моделирование различных заболеваний. Например, сейчас мы изучаем различные средства для лечения аритмии. В некоторых случаях аритмия вызвана спиральной волной в левом желудочке, которая заставляет сердце сокращаться в очень быстром темпе.Если это длится в течение длительного периода времени, это может причинить большой вред и даже смерть. Тем не менее, есть способы остановить волну. Конечно, мы не можем проводить эксперименты на живых людях — как по этическим, так и по техническим причинам. Тем не менее, мы можем проводить вычислительные эксперименты с использованием суперкомпьютеров. Мы изучаем различные закономерности распространения спиральной волны, а также методы лечения, которые позволят остановить ее и таким образом предотвратить вред здоровью.

    Такие исследования проводят наши студенты, которые используют в своем обучении так называемый проектный подход.В Екатеринбурге есть филиал Школы анализа данных Яндекса. Некоторые из наших студентов закончили там курсы, а затем остались в нашем университете на аспирантуру, так как хотят изучать конкретную предметную область. Они изучают медицинские изображения, и эта работа позволяет им совершенствовать свои навыки, применяя их к реальным научным задачам.

    Апинтинг, обработанный нейронной сетью. Кредит: lamcdn.net

    Если говорить о методах машинного обучения, в каких областях лучшие результаты?

    На мой взгляд, лучшее достижение в области нейронных сетей и их применения — это разработка беспилотных автомобилей — это было бы и с технической точки зрения, и прогрессом в целом.Среди других областей, получивших развитие в последнее время, — системы CAT (автоматизированный перевод) и различные чат-боты. Финтех продолжает стремительно развиваться и пользуется большим спросом у банков и других финансовых организаций.

    Наконец, очень важной областью является все, что связано с автоматизацией рутинного умственного труда. Это может найти широкое применение в бухгалтерском учете и юриспруденции, где можно автоматизировать такие вещи, как бухгалтерские операции и аудит. Такие компании уже есть, в том числе и в России.Например, компания «Кнопка» использует машинное обучение и нейронные сети для автоматизации бухгалтерских операций.

    В данном случае все достаточно просто. Поскольку уже внедрен электронный документооборот, нейронная сеть может принимать входящие документы и идентифицировать их. Тогда он выполняет работу бухгалтера-человека. Конечно, человек-бухгалтер по-прежнему должен контролировать свою работу, но благодаря автоматизации компаниям требуется меньше таких специалистов, так как им больше не придется выполнять рутинную работу вручную.

    Какие задачи и вызовы стоят сейчас перед учеными в области науки о данных?

    С технической точки зрения ученым предстоит повысить точность этих систем. Это будет связано со сбором и анализом дополнительных данных. Например, это позволит улучшить работу беспилотных автомобилей даже в тех случаях, которые действительно редки.

    Хотя нейронные сети уже имеют достаточно данных для типичных ситуаций, они иногда не могут справиться с чем-то экстраординарным, с чем-то, чего они никогда не видели.Известный пример — когда беспилотный автомобиль попал в аварию, перепутав цвет машины, которая ехала впереди. Он был почти такого же цвета, как небо, и нейросеть просто не распознала трейлер как часть автомобиля. Тем не менее, сеть теперь будет избегать таких ошибок во всех автомобилях, которыми она управляет. Человеческий опыт более ограничен, также люди часто повторяют одни и те же ошибки или могут попасть в аварию из-за плохого самочувствия. Сеть, с другой стороны, никогда не устает, не пьет, не чувствует себя больным или мрачным.

    Беспилотный автомобиль. Кредит: svopi.ru

    Что делает его намного надежнее человека?

    Тем не менее, здесь есть много этических и юридических проблем. Мы до сих пор не можем сказать, насколько мы можем доверять нейронным сетям, особенно когда речь идет о областях, связанных со здоровьем и жизнью людей. Например, вышеупомянутая медицинская диагностика. С одной стороны, нейросети могут находить такие сложные закономерности в медицинских данных и предлагать такие решения, которые не может дать ни один живой человек.С другой стороны, мы до сих пор не знаем, как они это делают. Для нас нейронные сети — это что-то вроде черных ящиков. Мы не понимаем, что происходит внутри и почему именно они предлагают те или иные решения. В медицине это неприемлемо, так как в этой области мы должны точно знать, что мы делаем и почему. Поэтому вопрос использования нейронных сетей, когда речь идет о человеческих жизнях, остается открытым.

    Удастся ли в ближайшем будущем полностью понять, как работают нейронные сети?

    Учёные постоянно предпринимают такие попытки, но пока безрезультатно.Иногда даже небольшое изменение данных может привести к тому, что сеть выдаст совершенно другой результат. Например, он распознает на изображении машину, и это правда, затем несколько пикселей изменены, и он вдруг считает, что это кот. Тем не менее, люди все еще видят автомобиль. И никто не знает, почему сеть именно так реагирует на эти изменения.

    Тем не менее, то, что мы можем сделать в ближайшем будущем — анализ больших объемов данных, разработка более сложных алгоритмов машинного обучения и тому подобное — наиболее актуально и позволит нам делать то, на что мы сейчас тратим месяц, за несколько часов.

     

    16 мая в Санкт-Петербурге прошел открытый семинар «Глубокое обучение, или Как стать Data Scientist». Организаторами мероприятия выступили Университет ИТМО и компания NVIDIA; его участники рассказали о том, как стать специалистом по анализу больших данных, а также продемонстрировали решение классической задачи по распознаванию изображений с помощью нейронных сетей. Одним из спикеров мероприятия стал Андрей Созыкин, заведующий кафедрой высокопроизводительных компьютерных технологий Уральского федерального университета.Г-н Созыкин занимается исследованиями в области анализа медицинских изображений с применением глубокого обучения и ведет канал на YouTube, где публикует лекции о технологиях глубокого обучения.

    AI-RADS: Учебная программа по искусственному интеллекту для резидентов

    Alexander L. Lindqwister

    1 Медицинская школа Гейзеля в Дартмуте, 1 Rope Ferry Rd, Hanover, NH 03775

    Saeed Hassanpour

    7 Williamson Translational Research, Ливан, Нью-Гэмпшир

    Петра Дж.Льюис

    3 Медицинский центр Дартмут-Хичкок, Ливан, Нью-Гэмпшир

    Джессика М. Син

    3 Медицинский центр Дартмут-Хичкок, Ливан, Нью-Гемпшир

    1 Медицинская школа Даристмут 1 1 Rope Ferry Rd, Hanover, NH 03775

    2 Дартмутский колледж, Williamson Translational Research, Ливан, Нью-Гэмпшир

    3 Медицинский центр Дартмут-Хичкок, Ливан, Нью-Гемпшир

    5 Адрес для корреспонденции.LL

    Поступила в редакцию 1 мая 2020 г .; Пересмотрено 27 августа 2020 г .; Принято 20 сентября 2020 г.

    Copyright © 2020 Опубликовано Elsevier Inc. от имени Ассоциации университетских рентгенологов.

    С января 2020 года Elsevier создал ресурсный центр COVID-19 с бесплатной информацией на английском и китайском языках о новом коронавирусе COVID-19. Ресурсный центр COVID-19 размещен на Elsevier Connect, общедоступном новостном и информационном веб-сайте компании. Настоящим Elsevier разрешает сделать все свои исследования, связанные с COVID-19, которые доступны в ресурсном центре COVID-19, включая этот исследовательский контент, немедленно доступными в PubMed Central и других репозиториях, финансируемых государством, таких как база данных COVID ВОЗ с правами на неограниченное повторное использование в исследованиях и анализы в любой форме и любыми средствами с указанием первоисточника.Эти разрешения предоставляются компанией Elsevier бесплатно до тех пор, пока ресурсный центр COVID-19 остается активным.

    Эта статья была процитирована другими статьями в PMC.

    Abstract

    Обоснование и цели

    Искусственный интеллект (ИИ) быстро превратился в область, способную повлиять почти на все аспекты медицины, особенно на радиологию. Поиск в PubMed по терминам «радиология искусственного интеллекта» демонстрирует экспоненциальный рост публикаций по этой теме в последние годы.Несмотря на эти надвигающиеся изменения, медицинское образование, предназначенное для будущих рентгенологов, началось лишь недавно. Мы представляем усилия нашего учреждения по решению этой проблемы в качестве модели успешной вводной программы по искусственному интеллекту в радиологии под названием AI-RADS.

    Материалы и методы

    Курс был основан на последовательности основных алгоритмов ИИ; эти алгоритмы были представлены как логические расширения друг друга и представлены как знакомые примеры (спам-фильтры, рекомендации фильмов и т. д.).). Поскольку большинство стажеров поступают в ординатуру без вычислительного опыта, в эту последовательность были включены второстепенные уроки, такие как пиксельная математика. Дидактические занятия были подкреплены параллельным клубом журналов, освещающим алгоритм, обсуждавшийся в предыдущей лекции. Чтобы обойти часто пугающие технические описания, были выпущены учебные пособия для этих статей. Анкеты применялись до и после каждой лекции для оценки уверенности в материале. В каждом клубе журналов также были представлены опросы, оценивающие готовность учащихся и уместность статьи.

    Результаты

    Курс получил оценку 9,8/10 жителей за общую удовлетворенность. За исключением заключительной лекции, у учащихся значительно повысилась уверенность в чтении журнальных статей об ИИ после каждой лекции. Резиденты продемонстрировали значительное улучшение воспринимаемого понимания основополагающих концепций искусственного интеллекта по всем контрольным вопросам для каждой лекции.

    Заключение

    Успех пилотного курса AI-RADS в нашем учреждении демонстрирует работающую модель включения ИИ в обучение резидентов.

    Ключевые слова: Искусственный интеллект, образование, ординатура, машинное обучение, радиология

    Сокращения: ИИ, искусственный интеллект; МО, машинное обучение

    Введение

    Искусственный интеллект быстро превратился в область, способную повлиять практически на все аспекты медицины, особенно на радиологию. публикаций по этой теме за последние годы.Кроме того, рентгенологи, резиденты-радиологи, студенты-медики все чаще признают необходимость базового понимания искусственного интеллекта. 4, 5, 6 Несмотря на эти надвигающиеся изменения, медицинское образование, предназначенное для будущих рентгенологов, только недавно началось.

    Появился ряд ресурсов, пытающихся специально решить эту проблему для специалистов-радиологов с разным уровнем подготовки. нашли несколько примеров формальной интеграции в резидентуру.

    Мы представляем усилия нашего учреждения по решению этой проблемы в качестве модели успешной вводной программы по искусственному интеллекту в радиологии под названием AI-RADS. Наш пилотный курс был создан с целью дать интуитивное понимание сильных и слабых сторон методов машинного обучения, а также интеллектуальную основу для критической оценки научной литературы по этому вопросу.

    Методы

    Эта интегрированная учебная программа по искусственному интеллекту (AI-RADS) была разработана для учащихся с любым уровнем вычислительной подготовки, при условии, что они понимают только базовую статистику.Каждая лекция состояла из алгоритма искусственного интеллекта, а также поддерживающих фундаментальных концепций информатики. Алгоритмы были представлены как ряд наблюдений, связанных с общими проблемами, которые пытались решить современные компьютеры, и первоначально были представлены как знакомые примеры привязки, такие как спам-фильтры, рекомендации фильмов, обнаружение мошенничества и т. д. ( ). Лекции последовательно строились на концепциях друг друга и представлялись как логические продолжения друг друга ( ).Алгоритмы были выбраны на основе того, как часто они используются, или как введение в более сложные модели, выступающие в качестве интеллектуальной основы для представления данных. Предварительной работы для дидактических занятий не предполагалось.

    Образец слайда лекции. Образец слайда лекции из лекции 3 AI-RADS: K-ближайший сосед.

    Учебная программа. Общие цели курса AI-RADS.

    Журнальный клуб

    Дидактические занятия были подкреплены активным обсуждением в параллельном журнальном клубе, посвященном алгоритму, обсуждавшемуся в предыдущей лекции (Приложение А).Чтобы обойти часто многословные и пугающие технические описания, были подготовлены учебные пособия для этих статей, в которых определялись незнакомые термины и разбивались сложные математические выражения на простые термины. Ожидалось, что учащиеся ознакомятся с документом и прочитают учебное пособие до посещения журнального клуба.

    Pacing

    Пилотный курс AI-RADS был включен в регулярную часть дидактических занятий для резидентов после одобрения факультета местным комитетом по образованию.Они были интегрированы в ранее существовавшее расписание, если был доступный 1-часовой временной интервал. Лекции 5, 6 и 7 проводились в конце рабочего дня, и резиденты были освобождены от клинических обязанностей на 1 час раньше, чтобы их посетить. Эти лекции проводились один раз в месяц в общей сложности 7 месяцев; каждый 2-часовой журнальный клуб проводился через 2 недели после соответствующей лекции. Планируя курс таким образом, резиденты подвергались значительному воздействию искусственного интеллекта каждую неделю. Этот темп был разработан, чтобы способствовать запоминанию, не перегружая учащихся.

    После AI-RADS учащиеся должны уметь:

    • 1)

      Описывать основные алгоритмы искусственного интеллекта, их интеллектуальную основу и их применение в клинической радиологии.

    • 2)

      Умение читать журнальные статьи об искусственном интеллекте в радиологии.

    • 3)

      Выявление потенциальных слабых мест в алгоритмах искусственного интеллекта, функциях баз данных и отчетах о производительности.

    • 4)

      Определите области, в которых методы искусственного интеллекта могут использоваться для решения проблем.

    • 5)

      Описать различные способы абстрактного представления и использования информации.

    • 6)

      Продемонстрировать свободное владение «модными словечками» в области искусственного интеллекта.

    Оценка

    Опросы проводились до и после лекций для оценки как качества, так и уверенности учащихся в ключевых концепциях.В каждом опросе задавались четыре содержательных вопроса (список вопросов см. в Приложении B), где участники оценивали свою способность описывать каждую тему по шкале от 1 до 5. чтение медицинской литературы по алгоритму. Параллельные журнальные клубы проводились в течение 2 недель после каждой дидактической сессии; участники заполняли анкеты после каждого обсуждения, оценивая свое восприятие статьи, а также свою уверенность в прочтении другой статьи, в которой используется та же вычислительная техника.

    Все лекции и учебные пособия для клубов журналов были написаны и прочитаны студентом-медиком по радиологии. Демонстрации курса вместе со всеми прикрепленными рисунками были выполнены с использованием онлайн-оболочки Python 3, Jupyter . Контент был проверен автором SH, профессором компьютерных наук, специализирующимся на искусственном интеллекте. Информация опроса была проанализирована с использованием пакета статистического анализа SciPy версии 1.2.3. Критерии знакового ранга Уилкоксона использовались для сравнения результатов до и после опроса.

    Результаты

    Результаты представлены в и и и .

    Степень уверенности в прочтении статьи в журнале AI in radiology. Учащихся спрашивали до и после каждой лекции об их степени комфорта (1 = не уверен, 5 = очень уверенно) при чтении научной литературы с использованием алгоритма, описанного в каждой лекции. На приведенном выше графике скрипки показаны отдельные ответы (точки). Форма каждого графика соответствует относительному распределению ответов в каждой категории, где ширина коррелирует с количеством ответов.В соответствующей таблице показаны результаты использования знакового рангового теста Уилкоксона для сравнения данных до и после лекции.

    Контрольные вопросы до и после лекций. Каждый опрос до и после лекции содержит четыре вопроса, освещающих ключевые концепции лекций, которые были сопоставлены с целями обучения. Учащиеся оценили свою уверенность в способности описать эти понятия по шкале от 1 до 5. Существует статистически значимая разница между всеми результатами вопросов до и после лекции ( p < 0.04) по ранговому критерию Уилкоксона.

    Таблица 1

    Средние меры удовлетворения для каждой лекции

    9 9 30 9 100097
    Лекция 1 Лекция 2 Лекция 3 Лекция 4 Лекция 5 Лекция 6 Лекция 7
    Интерес к AI (1=не заинтересован, 5=очень заинтересован) 4,1 4,3 4,0 4,5 4.3 4.1 4.1 4,0
    (1 = слишком мало, 3 = просто верно, 5 = слишком много) 3.0 3.1 3.25 3.3 3.4 3.4 3.2
    Качество примеров (1 = плохое, 5 = отлично) 4.6 4,6 4.7 4 4.3 4 3.9 4,7
    Количество ответов 12 10 10 10 7

    Таблица 2

    3 3 3.5
    Joins Club 1 2 3 5 6
    Подготовка
    (1=без подготовки, 5=обширная подготовка) 3,9 1003
    2 3.7 3.7 2.5 1.6
    (1 = Нет интереса, 5 = чрезвычайно интересно) 45 3.5 4.3 3.7 3.3 3.3
    (1 = Не подходит для моего уровня, 5 = Идеал) 4.0 3.5 3.5 4.3 3.5 3.5
    Уверенность в возможность объяснить эту статью
    (1 = не уверенно, 5 = чрезвычайно уверенно) 3.6 4 4 3.1
    (1 = не уверены в себе, 5 = чрезвычайно уверены ) 3.8 4 4 4.2 3.3
    Насколько полезным было Учебное пособие?
    (1 = не полезно, 5 = чрезвычайно полезно) 4.6 4.6 3.5 4.7 4.7 4.3 4.0

    Обсуждение

    AI-RAD было хорошо принят среди стажеров в нашем учреждении. Судя по нашим показателям качества, слушатели в подавляющем большинстве считают, что глубина содержания серии лекций AI-RADS идеальна, а используемые примеры являются полезными средствами для понимания ключевых концепций искусственного интеллекта.Выездные опросы продемонстрировали высокую степень удовлетворенности учащихся с общей оценкой 9,8/10. Интерес жителей к искусственному интеллекту остается на стабильно высоком уровне, что позволяет предположить, что этот курс не отпугнул учащихся от этой области.

    За исключением лекции 7, уверенность резидентов в своей способности читать журнальную статью по радиологии, связанную с искусственным интеллектом, статистически увеличивалась после каждой лекции (). Только пять резидентов смогли посетить лекцию 7, что, вероятно, способствовало ее пограничным результатам.Параметрические тесты, такие как Тест Студентов t , дали значительные значения p на всех лекциях, однако, учитывая небольшой размер выборки, знаковый ранг Уилкоксона оказался более точным, хотя и менее статистически достоверным. Как ни странно, дискуссии во время этих сессий были активными, а вопросы, которые задают жители, предполагают более глубокое понимание лежащих в основе вычислительных методов.

    С вопросами, связанными с содержанием, предполагаемая способность учащихся объяснять эти понятия показала заметное увеличение по сравнению с периодом до и после каждого дидактического занятия ().Вместо формальной оценки эти результаты демонстрируют более глубокое понимание основных принципов искусственного интеллекта. Это, в сочетании с воспринимаемой уверенностью в чтении новых статей, связанных с обсуждаемым алгоритмом, в значительной степени подразумевает повышенное чувство комфорта при работе с методами искусственного интеллекта. Будущие итерации этого курса могут включать в себя анонимные викторины с множественным выбором для конкретного содержания для дальнейшей оценки усвоения концепции.

    Журнальный клуб изначально был успешным, но продемонстрировал постепенное снижение уровня подготовки учащихся, что проявилось в более поздних дискуссиях.Жители указали, что дополнительные клинические обязанности и нехватка свободного времени были основными факторами, способствующими отсутствию участия. В письменных комментариях резиденты заявили, что журнальный клуб очень помог в закреплении концепций, представленных в лекции, и, несмотря на ограниченную подготовку, нашел беседы поучительными. Многие предложения касались того, как будут управляться клубы журналов, когда этот курс будет перераспределен, включая презентации статей под руководством резидентов при поддержке преподавателей, домашние задания, посвященные конкретным статьям, или интеграцию обсуждения статей в дидактическую сессию.

    Ограничения курса включают неоднородность посещаемости учащихся, обычно в результате выполнения клинических обязанностей при определенных ротациях, расписании и выгорании резидента. Важно отметить вероятный вклад планирования лекций в посещаемость. Для последних трех лекций в обычном дидактическом временном интервале не было свободных мест, что требовало досрочного увольнения резидентов с клинических обязанностей для посещения сеанса в конце дня. Это было неоптимально и, вероятно, способствовало относительно низкой явке.Кроме того, это могло повлиять на общее понимание, поскольку последние три лекции концептуально тесно взаимосвязаны. Переход на онлайн-платформу в идеале позволит обойти эти проблемы, поскольку учащиеся смогут проходить модули в своем собственном темпе. Однако это может происходить за счет возможностей для обсуждения в больших группах. Был предложен интерактивный сеанс обучения кодированию с уже существующими наборами данных и доступным скелетным кодом, чтобы учащиеся могли попытаться реализовать изученные алгоритмы.Несмотря на то, что интерес опрошенных жителей был высоким, многие выразили обеспокоенность по поводу нехватки времени при и без того напряженном графике. Таким образом, эти занятия считались более подходящими для будущих итераций после того, как основные учебные планы будут полностью включены. Наконец, в то время как анализ демографических данных стажеров (таких как пол, PGY и т. д.) повысил бы разрешение конкретных потребностей и удовлетворенности учащихся, размер нашей программы эффективно устранил бы анонимность обратной связи для некоторых учащихся. Для этого не была получена демографическая информация, чтобы поощрить откровенность ответов стажеров.

    Чтобы обеспечить долговечность и устойчивость этого курса как уникальной отличительной черты программы обучения в ординатуре нашего учреждения, департамент работает над созданием онлайн-инфраструктуры для постоянного размещения этого ресурса. В планы на будущее входит публикация всех материалов и свободный доступ к этой образовательной серии для всех заинтересованных учащихся. Эти видео будут загружаться на следующий канал YouTube по мере их появления: https://rb.gy/ychu2k.

    Поскольку искусственный интеллект продолжает изменять мир медицины, становится необходимым, чтобы врачи были знакомы с фундаментальными алгоритмами и методами искусственного интеллекта.Это станет важным навыком для интерпретации медицинской литературы, оценки потенциальных дополнений клинического программного обеспечения, формулирования вопросов исследования и покупки оборудования. Имея интуитивно понятную основу машинного обучения, основанную на фундаментальных алгоритмах, учащиеся, вероятно, будут лучше подготовлены к пониманию сильных и слабых сторон различных методов и смогут принимать более обоснованные решения.

    Таким образом, программы резидентуры только начинают использовать базовые вычислительные концепции в своем обучении, навык, который станет важным для рентгенологов завтрашнего дня; Владение искусственным интеллектом станет обязательным навыком в ближайшем будущем для служб обработки изображений.Мы представляем усилия нашего учреждения по решению этой проблемы в качестве модели успешной вводной программы по применению искусственного интеллекта в радиологии.

    Сноски

    Источники финансирования: Это исследование не получило каких-либо специальных грантов от финансирующих агентств в государственном, коммерческом или некоммерческом секторах.

    Приложение A. Статьи журнала Journal Club

    До, Б. Х., Ланглотц, К., и Болье, К. Ф. (2017). Диагностика опухолей костей с использованием наивной байесовской модели демографических и рентгенографических признаков. Journal of Digital Imaging, 30 (5), 640–647. https://doi.org/10.1007/s10278-017-0001-7

    Эмблема, К. Э., Пиньо, М. К., Целльнер, Ф. Г., Дью-Тоннессен, П., Халд, Дж. К., Шад, Л. Р., Мелинг, Т. Р., Рапалино, О., и Бьорнеруд, А. (2015). Общая модель машины опорных векторов для предоперационных ассоциаций выживания глиомы. Радиология, 275 (1), 228–234. https://doi.org/10.1148/radiol.14140770

    Дженсен, К., Карл, Дж., Босен, Л., Лангкилде, Н.К., и Остергаард, Л.Р. (2019). Оценка прогностической группы рака предстательной железы по Глисону с использованием зонально-специфических признаков, извлеченных из бипараметрической МРТ с использованием классификатора KNN. Журнал прикладной клинической медицинской физики, 20 (2), 146–153. https://doi.org/10.1002/acm2.12542

    Сринивасан, А., Галбан, С.Дж., Джонсон, Т.Д., Ченеверт, Т.Л., Росс, Б.Д., и Мукерджи, С.К. (2010). Полезность алгоритма кластеризации K-средних для дифференциации значений кажущегося коэффициента диффузии доброкачественных и злокачественных патологий шеи. Американский журнал нейрорадиологии, 31 (4), 736–740. https://doi.org/10.3174/ajnr.A1901

    Чжан Б., Тянь Дж., Пей С., Чен Ю., Хе Х., Дун Ю., Чжан Л., Мо X., Хуан В., Конг С. ., & Чжан, С. (2019). Система машинного обучения для диагностики узловых образований щитовидной железы. Щитовидная железа, 29 (6), 858–867. https://doi.org/10.1089/thy.2018.0380

    Приложение B. Вопросы Content

    Lecture 1
    Вопрос 1 Вопрос 2 Вопрос 3 Вопрос 4
    +
    Я могу уверенно описать разницу между искусственным интеллектом, машинным обучением и нейронными сетями. Мне удобно описывать условную вероятность. Мне удобно описывать байсеанскую статистику. Я могу описать, как байсеанская статистика может использоваться в алгоритме искусственного интеллекта для классификации интересующего объекта.
    2 Я могу с уверенностью описать разницу между контролируемым и неконтролируемым машинным обучением. Я могу описать, как изображения представляются численно. Я могу описать сегментацию k-средних. Я могу описать, как кластеризация k-средних может использоваться в алгоритме искусственного интеллекта для кластеризации интересующих элементов.
    3 Я могу уверенно описать разницу между k-средними и k-ближайшими соседями. Я могу описать различные способы измерения математического расстояния. Я могу описать проклятие размерности. Я могу описать, как можно использовать k-ближайших соседей для классификации изображений.
    4 Я могу с уверенностью описать, что подразумевается под «чистотой данных». Я могу описать, как работают групповые классификаторы (сумма больше, чем отдельные части). Я могу описать проклятие размерности. Я могу описать, как случайный лес можно использовать в алгоритме искусственного интеллекта для классификации данных.
    5 Я могу с уверенностью описать, что подразумевается под «линейным классификатором». Я могу объяснить термин «гиперплан». Я могу описать, что подразумевается под «кернелингом». Я могу описать, как алгоритм перцептрона классифицирует информацию.
    6 Я могу с уверенностью описать, что подразумевается под «линейным классификатором». Я могу определить несколько различных видов машинных ошибок. Я могу описать, как исчисление можно использовать для улучшения алгоритмов машинного обучения. Я могу описать, как можно использовать алгоритм опорных векторов для классификации информации.
    7 Я могу уверенно описать основную идею нейронных сетей. Я могу определить, как архитектура нейронной сети черпает вдохновение из биологических систем. Я могу описать процесс свертки и объединения изображений. Я могу описать, как нейронная сеть классифицирует изображение.

    Ссылки

    1. Боланд Г.В.Л., Гимарайнш А.С., Мюллер П.Р. Загадка рентгенолога: преимущества и затраты на увеличение мощности и использования КТ. Евро Радиол. 2009;19:9–11. doi: 10.1007/s00330-008-1159-7. [PubMed] [CrossRef] [Google Scholar]4. Оой С.К.Г., Сун А.Й.К., Фук-Чонг С. Отношение к искусственному интеллекту в радиологии с оценкой потребностей учащихся в рамках программ ординатуры по радиологии: национальное многопрограммное исследование.Singapore Med J. 2019 doi: 10.11622/smedj.2019141. [Бесплатная статья PMC] [PubMed] [CrossRef] [Google Scholar]5. Пинто душ Сантос Д., Гизе Д., Бродель Д. Отношение студентов-медиков к искусственному интеллекту: многоцентровое исследование. Евро Радиол. 2019;29:1640–1646. doi: 10.1007/s00330-018-5601-1. [PubMed] [CrossRef] [Google Scholar]6. Уэймел К., Бадр С., Демондион Х. Влияние развития искусственного интеллекта на рентгенологию: что думают рентгенологи? Диагноз Interv Imaging. 2019;100:327–336. дои: 10.1016/j.diii.2019.03.015. [PubMed] [CrossRef] [Google Scholar]8. Макдональд Р. Дж., Шварц К. М., Эккель Л. Дж. Влияние изменений в использовании и технологических достижений визуализации поперечного сечения на рабочую нагрузку рентгенолога. Академ Радиол. 2015;22:1191–1198. doi: 10.1016/j.acra.2015.05.007. [PubMed] [CrossRef] [Google Scholar]9. Паранджапе К., Шинкель М., Наннан Пандей Р. Внедрение обучения искусственному интеллекту в медицинском образовании. JMIR Med Educ. 2019;5:e16048. дои: 10.2196/16048. [Бесплатная статья PMC] [PubMed] [CrossRef] [Google Scholar]11.Чартранд Г., Ченг П.М., Воронцов Э. Глубокое обучение: учебник для рентгенологов. Рентгенография. 2017;37:2113–2131. doi: 10.1148/rg.2017170077. [PubMed] [CrossRef] [Google Scholar] 13. Песапане Филиппо, Кодари Марина, Сарданелли Франческо. Искусственный интеллект в медицинской визуализации: угроза или возможность? Рентгенологи снова в авангарде инноваций в медицине. Евро Радиол Опыт. 2018;2:35. [Бесплатная статья PMC] [PubMed] [Google Scholar]14. Ричардсон М.Л., Гарвуд Э.Р., Ли Ю. Неинтерпретационное использование искусственного интеллекта в радиологии.Академ Радиол. 2020 г.: 10.1016/j.acra.2020.01.012. [PubMed] [CrossRef] [Google Scholar] 15. Группа СФР-ИА.

    Post A Comment

    Ваш адрес email не будет опубликован.