8 лекций, которые помогут разобраться в машинном обучении и нейросетях / Хабр
Мы собрали интересные лекции, которые помогут понять, как работает машинное обучение, какие задачи решает и что нам в ближайшем будущем ждать от машин, умеющих учиться. Первая лекция рассчитана скорее на тех, кто вообще не понимает, как работает machine learning, в остальных много интересных кейсов.
Машинное обучение
Вводная лекция от кандидата физико-математических наук Дмитрия Ветрова. Ученый объясняет, как работает машинное обучение, что такое глубинное обучение и как устроены нейросети.
Математические методы прогнозирования объемов продаж
Другая лекция от ПостНауки — член Российской академии наук Константин Воронцов показывает частный пример применения методов машинного обучения в бизнесе. Математик объясняет, как его команда построила модель прогнозирования объемов продаж для крупной розничной сети.
Прекрасные и ужасные последствия самообучения компьютеров
Спикер TED, специалист по машинному обучению и CEO компании Enlitic Джереми Говард делает свои прогнозы о том, что произойдет, когда мы научим компьютеры учиться.
Как мы учим компьютеры понимать изображения
Еще одна лекция в рамках TED. Эксперт по компьютерному зрению Фей-Фей Ли описывает последние достижения машинного обучения, включая базу данных, содержащую 15 миллионов фотографий, которую создала её команда, чтобы научить компьютер понимать изображения.
Как мы обучаем технику не смотреть и слушать, а видеть и слышать?
Несмотря на первые 20 минут тишины, довольно бодрая лекция по глубинному обучению от теххаба KL10CH и инженера в области машинного обучения, компьютерного зрения и обработки сигналов в Исследовательского центра Samsung Дмитрия Коробченко. Для самых стойких и продвинутых.
И бонус для тех, кто настроен серьезно:
Recent Developments in Deep Learning
Лекция известного специалиста по искусственным нейросетям Джеффри Хинтона, прочитанная в Торонтском университете. Профессор Хинтон рассказывает об основных достижениях в области глубинного обучения.
Deep Learning, Self-Taught Learning and Unsupervised Feature Learning
Один из основателей Coursera, доцент Стэнфорда и специалист в области машинного обучения и робототехники Эндрю Ын объясняет тонкости обучения «с учителем» и без.
Machine Learning for Video Games
За пять минут на примере Марио вам расскажут, как машинное обучение применяется в разработке видеоигр.
YouTube: ТОП-5 самых популярных видео на тему машинного обучения
1. Машинное обучение и искусственный интеллект (8 015 просмотров)
Илья Толстихин и Борис Янгель, участники проекта «Молодые ученые», организованного T&P (Теории и практики – платформа для обмена знаниями) рассказывают о машинном обучении и его применении в реальной жизни.
2. Вводная лекция — К.В. Воронцов (5 327 просмотров)
Лекция читается в рамках курса «Машинное обучение» Школы анализа данных Яндекс. Этот курс является обязательным для всех студентов.
Лектор: Константин Вячеславович Воронцов, старший научный сотрудник Вычислительного центра РАН. Заместитель директора по науке ЗАО «Форексис». Заместитель заведующего кафедрой «Интеллектуальные системы» ФУПМ МФТИ. Доцент кафедры «Математические методы прогнозирования» ВМиК МГУ. Эксперт компании «Яндекс». Доктор физико-математических наук.
3. Машинное обучение: Начало (3 487 просмотров)
Центр современной информатики, программирования и анализа данных Computer Science Center представляет лекцию Игоря Кураленка, сотрудника Яндекс. Спикер рассказывает об истории машинного обучения, его классификации – обучении с подкреплением, обучении с учителем и без.
4. Машинное обучение — Дмитрий Ветров (3464 просмотра)
Как найти взаимосвязь между наблюдаемыми и скрытыми переменными? Что такое глубинное обучение? Каковы перспективы машинного обучения? Об этом рассказывает кандидат физико-математических наук Дмитрий Ветров в рамках проекта ПостНаука.
5. Искусственный Интеллект и Естественный Язык. Часть 1 (1 672 просмотра)
Максим Таланов, кандидат технических наук, руководитель Лаборатории Машинного Понимания Казанского федерального университета, преподаватель Университета Иннополис, рассказывает о последних достижениях в области искусственного интеллекта.
Data Science курсы: обзор и цены |
В обзор входят лучшие курсы и лекции по Data Science, Python, R как платные, так и бесплатные, как в Украине, так и в мире, поехали!
Автор настоятельно рекомендует пройти именно платные онлайн курсы, они намного качественные, обширнее и вдохновляющие.
Почему же именно эти курсы лучшие? Тут
Andrew Ng’ Machine Learning: Master the Fundamentals
Machine Learning A-Z: Hands-On Python & R In Data Science
200$ (udemy)Data Science A-Z™: Real-Life Data Science Exercises Included 200$ (udemy)
Data Science: R 442$ и Professional Certificate Provided by Harvard University (edx)
Launch Your Career in Data Science. A ten-course introduction to data science, developed and taught by leading professors. R language (coursera)
Intro to Data Analysis. Python (udacity)
Data Science Foundations (Big Data University)
Data Science and Machine Learning Bootcamp with R 195$
Доклады с конференции Data Science UA
Відео з другоі зустрічі Чернівецього клубу штучного інтелекту. Доповідь від Олександра Максимця «Машинне навчання в обробці природної мови»
Machine Learning in FinTech. Дарина Перемот (ML Engineer at SynergyOne)
Фонд BrainBasket
Доклады с конференции AI Ukraine Conference
Introduction to machine learning (Лекція ІІ) — Володимир Круглов
Русскоязычные ресурсы по Data Science:
Python
Pandas. Открытый курс OpenDataScience по машинному обучению
Как анализировать данные с Python библиотеками Pandas и Numpy
Курс «Программирование на языке Python для сбора и анализа данных», НИУ ВШЭ, 2015-16 учебный год, лектор Илья Щуров.

Курсы по R
Анализ данных на R в примерах и задачах
Основы анализа данных в R
Анализ данных в R
Наука о данных
Data Science, черные ящики – и почему вам сильно повезло
Введение в Data Science
Почему важно заниматься Computer Science прямо сейчас
Введение в Data Science и Machine Learning
Дискуссия «Тренды data science
Алексей Натёкин: «О развитии анализа данных, машинного обучения и искусственного интеллекта»
Курсы по машинному обучению
Вводная лекция — К.В. Воронцов
Машинное обучение и искусственный интеллект
Введение в машинное обучение | Григорий Сапунов
Англоязычные видеолекции:
Python cources
Python Data Science with pandas
Python For Data Science: Introduction
Python For Data Science — 2018 | Become Data Scientist
R cources
Introduction to Data Science with R — Data Analysis
R Programming Tutorial
Basic Analytical Techniques | Data Science With R Tutorial
Data Science cources
Learn Data Science lectures
Fundamentals of data science lectures
CS109 Data Science.
Machine Learning cources
Machine Learning Crash Course from Google
Machine Learning lectures
What is Machine Learning? (AI Adventures)
Introduction to Machine Learning. MIT OpenCourseWare
16 бесплатных онлайн-курсов по машинному обучению
Популярная тенденция в сфере онлайн-образования — массовые открытые онлайн-курсы (Massive open online-courses, MOOC). Появились бесплатные курсы по машинному обучению и data science. Они доступны каждому и основаны на образовательных программах от ведущих университетов, например, МФТИ.
Большинство MOOC по машинному обучению доступны на английском языке и представлены на известных платформах онлайн-образования, таких как
Отдельно стоит отметить, что курсы Coursera доступны бесплатно только для прослушивания лекций. Для того, чтобы выполнять задания или получить сертификат по окончании курса, нужно оформить подписку или оплатить курс.
Видео-материалы и лекции курса можно получить бесплатно, для этого на странице курса внизу нужно нажать кнопку «прослушать курс»
В этой статье собраны бесплатные курсы по машинному обучению и Data Science на русском языке или с русскими субтитрами.
Курсы по data science
Введение в машинное обучение
Авторы: ВШЭ и Яндекс
Платформа: Coursera
Язык: русский
На курсе Константина Воронцова Введение в машинное обучение рассматриваются популярные задачи, решаемые с помощью машинного обучения — классификация, регрессия, кластеризация. Слушателю нужно знать об основных понятиях математики: функциях, производных, векторах, матрицах, желательно иметь базовые навыки программирования и быть знакомым с python.
Продолжительность: 35 часов
Машинное обучение и анализ данных
Авторы: МФТИ и Яндекс
Платформа: Coursera
Язык: русский
Специализация Машинное обучение и анализ данных включает 6 курсов. Осваиваются основные инструменты, необходимые в работе с большим массивом данных: современные методы классификации и регрессии, поиск структуры в данных, проведение экспериментов, построение выводов, фундаментальная математика, основы программирования на python.
Продолжительность: 8 месяцев (7 часов в неделю)
Python для анализа данных
Авторы: МФТИ, ФРОО, Mail.ru Group
Платформа: Coursera
Курс Python для анализа данных ориентирован на решение практических задач. Студенты будут применять свои навыки программирования для построения предиктивных моделей, визуализации данных и работы с нейросетями.
Продолжительность: 25 часов
Введение в науку о данных
Автор: СПбГУ
Платформа: Coursera
Язык: русский
Курс Введение в науку о данных рассматривает постановку и решение типичных задач, с которыми может столкнуться в своей работе data scientist, подходы к сбору, анализу, обработке и визуализации массивов данных.
Продолжительность: 17 часов
Глубокое обучение в творчестве с TensorFlow
Автор: Google Magenta
Платформа: Kadenze
Язык: английский, русские субтитры
MOOC Использование глубокого обучения в творчестве с помощью TensorFlow расскажет о том, как строить алгоритмы глубокого обучения на основе сверточных, рекуррентных, генеративных нейросетей и применять их для создания творческих приложений.
Продолжительность: 60 часов
Data Science
Автор: Johns Hopkins University
Платформа: Courserа
Язык: английский, русские субтитры
В специализацию Data Science университета John Hopkins входят 10 курсов, включая сбор и сортировку данных, программирование на языке R, регрессионные модели, разработку продуктов для обработки данных и другие.
Продолжительность: 8 месяцев (5 часов в неделю)
Data science для руководителей
Автор: Johns Hopkins University
Платформа: Courserа
Язык: английский, русские субтитры
Data Science для руководителей — это ускоренная обучающая программа — 5 курсов, которые дают базовое понимание о том, что такое data science и как работать с проектами в этой сфере, собирать и развивать команду и даже лидерские качества.
Продолжительность: 40 часов
Нейронные сети
Автор: Институт биоинформатики
Платформа: Stepic
Язык: русский
Бесплатный курс Нейронные сети дает основы теории нейронных сетей и практики применения. Детальный разбор процесса создания и применения нейронных сетей. Алгоритмы, лежащие в основе нейросетей и множество практических задач.
Продолжительность: 33 часа
Программирование на Python
Автор: Институт биоинформатики
Платформа: Stepic
Язык: русский
На курсе Программирование на Python представлены базовые понятия программирования на python и большое количество практических задач. Решения будут проверяться автоматической системой.
Продолжительность: 22 часа
Алгоритмы: теория и практика. Методы
Автор: Computer Science Center
Платформа: Stepic
Язык: русский
Рассматриваются теоретические основы создания алгоритмов и особенности реализации на языках C++, Java и Python.
Продолжительность: 35 часов
Основы программирования на R
Автор: Институт биоинформатики
Платформа: Stepic
Язык: русский
На курсе Основы программирования на R изучаются основные типы данных и семантические правила, анализ и обработка данных.
Продолжительность: 19 часов
Анализ данных в R
Автор: Институт биоинформатики
Платформа: Stepic
Язык: русский
На курсе рассматриваются этапы статистического анализа на R — предварительная обработка данных, применение статистических методов анализа и визуализация данных.
Продолжительность: 21 час
Базы данных
Автор: СПбГУ
Платформа: Coursera
Язык: русский
В основе курса Базы данных изучение и применение языка SQL для создания, модификации объектов и управления данными в реляционных базах данных. Рассматриваются сферы применения NoSQL баз данных и современные подходы к обработке big data.
Продолжительность: 20 часов
От Excel до MySQL: способы анализа бизнес-данных
Автор: Duke University
Платформа: Coursera
Язык: английский, русские субтитры
В специализацию входят 5 курсов, которые демонстрируют, как использовать Excel, Tableau и MySQL для анализа данных, прогнозирования, создания моделей и визуализации данных для решения задач и улучшения бизнес-процессов.
Продолжительность: 8 месяцев (5 часов в неделю)
Линейная регрессия
Автор: СПбГУ
Платформа: Coursera
Язык: русский
В курсе Линейная регрессия разбираются основные методы описания взаимосвязей между количественными признаками, регрессионный анализ и построение моделей. Специальное место отводится операциям с матрицами. Курс ориентирован на людей, которые уже знакомы с базовыми понятиями анализа данных.
Продолжительность: 22 часа
Анализ данных
Автор: НГУ
Платформа: Coursera
Язык: русский
В специализацию Анализ данных Новосибирского государственного Университета входят 4 курса. Курсы содержат материалы по основам теории вероятностей и математической статистики, исследованию связей между признаками, построению прогнозов на основе регрессионных моделей, кластерному и статистическому анализу. Курсы разработаны совместно с 2GIS.
Продолжительность: 4 месяца (3 часа в неделю)
8 лекций, чтобы разобраться в машинном обучении и нейросетях
Spark.ru собрал лекции, которые помогут понять, как работает машинное обучение, какие задачи решает и что нам в ближайшем будущем ждать от машин, умеющих учиться.
Читать далее…
С работой алгоритмов машинного обучения вы сталкиваетесь каждый день. Это распознавание изображений, поисковая выдача, голосовые помощники, рекомендации контента и, конечно же, реклама. Здесь собраны лекции, которые помогут понять, как работает машинное обучение, какие задачи решает и что нам в ближайшем будущем ждать от машин, умеющих учиться.
Другая лекция от ПостНауки — член РАН Константин Воронцов показывает частный пример применения методов машинного обучения в бизнесе. Математик объясняет, как его команда построила модель прогнозирования объёмов продаж для крупной розничной сети.
Спикер TED, специалист по машинному обучению и CEO компании Enlitic Джереми Говард делает свои прогнозы о том, что произойдёт, когда мы научим компьютеры учиться.
Несмотря на первые 20 минут тишины, довольно бодрая лекция по глубинному обучению от теххаба KL10CH и инженера в области машинного обучения, компьютерного зрения и обработки сигналов Исследовательского центра Samsung Дмитрия Коробченко. Для самых стойких и продвинутых.
И бонус для тех, кто настроен серьёзно:
Лекция известного специалиста по искусственным нейросетям Джеффри Хинтона, прочитанная в Торонтском университете. Профессор Хинтон рассказывает об основных достижениях в области глубинного обучения.
Один из основателей Coursera, доцент Стэнфорда и специалист в области машинного обучения и робототехники Эндрю Ын объясняет тонкости обучения с учителем и без.
За пять минут на примере Марио вам расскажут, как машинное обучение применяется в разработке видеоигр.
Машинное обучение и анализ данных — обзор Специализации от Яндекcа & МФТИ (5 курсов + финальный… | by Vladimir Bogdanov | Breaking into Data Science, part 1
Машинное обучение и анализ данных — обзор Специализации от Яндекcа & МФТИ (5 курсов + финальный проект), предложенной на образовательной платформе Coursera.
Вам может быть полезна данная статья если:
- Вы хотите “попробовать на вкус” программирование на Python и понять для себя основные принципы работы моделей машинного обучения, использующихся для работы с данными
- Вы рассматриваете для себя возможность пройти какой-либо обучающий курс по данной тематике и Вам интересно оценить, насколько Специализация от Яндекса & МФТИ подходит для этого
Почему после прохождения всех пяти курсов Специализации появилось желание написать данную статью: если бы я “тот”, который только начинал первый курс данной Специализации, использовал советы, данные в этой статье, эффективность и скорость обучения была бы в разы выше. И плюс до начала обучения я представлял собой чистый лист: ни строчки кода в жизни, только базовые знания теории вероятности, статистики и линейной алгебры, а значит проходил путь с нуля и застревал на каждом шагу, где от студента ждали больше в плане программирования, чем было положено! Тем самым, я представляю собой репрезентативного подопытного 🙂
Почему формат Специализации — это лучшее, что можно выбрать в начале пути? В целом, для обучения на русском языке есть широкий перечень возможностей: аналогичные по форме, но иные по содержанию онлайн-программы (от Вышки и Яндекса на Coursera, курсы по теме на Stepik’e и т.д.), лекции профессора Воронцова, платные курсы типа New Professions Lab, Нетологии и многое другое. Но, на мой взгляд, именно сочетания теории, видео-лекций и контролируемых/проверяемых (!!!) практических работ без необходимости подчиняться какому-то расписанию — лучшее по форме самообразование с наивысшим соотношением цена/качество/удобство . Структура Специализации построена таким образом, что концепция “методов работы с данным” раскрывается постепенно, и ты успеваешь за темпом обучения, даже если ничего не знаешь до начала курсов (за исключением исключений :)). Если стараться просто “впитывать” теорию или неструктурированно браться за какие-то практические задачи есть риск не сдвинуться с места в общем понимании предмета!
Всего в данной Специализации курсов пять:
- Математика и Python для анализа данных — вводный курс, наполненный повторением основ мат. анализа и линейной алгебры, жизненно необходимых для прохождения пути
- Обучение на размеченных данных (обучение с учителем) — курс, посвященный моделям типа линейной/логистической регрессии, введенению в работу с решающими деревьями и другими моделями, обучение которых возможно только при наличии тех самых “размеченных” данных
- Поиск структуры в данных (обучение без учителя) — это про изучение и обучение моделей классификации/кластеризации, используемых в отсутствии размеченных данных
- Построение выводов по данным — несмотря на название, этот курс не про визуализацию данных… Он про статистику, про принципы проверки гипотез, в т.
ч. множественных, про построение доверительных интервалов и так далее, т.е. про то, как из полученных результатов вашей модели ПРАВИЛЬНО сделать выводы (правильные или нет уже зависит от самой модели и исходных данных))
- Прикладные задачи анализа данных
Какое самое важное препятствие Вас ждет, если также как и я, Вы не писали ни строчки кода до начала обучения?)) Полное непонимание структуры языка Python, с которым предстоит очень много работать в процессе обучения. К сожалению, формат Специализации не подразумевает длинного вводного курса и подготовка идет “на бегу” в ходе первого курса. Быстрое повторение основ линейной алгебры, статистики и краткий обзор Python — вот и вся подготовительная работа. Этого очень мало. Несмотря на то, что в требованиях к курсу указано базовое знание основ программирования, презентуется эта программа везде как шанс пройти путь программирования на Python c нуля. Что я хотел бы знать до начала обучения? Необходимость изучения основ Python применительно к анализу данных и только потом — прохождение курсов специализации. Очень важно понимать структуры и типы данных, основные методы работы с числовыми данными, таблицами и основными библиотеками — numpy & pandas. Понимать, уметь работать с кодом (элементарные преобразования, работа с табличными данными и так далее) и знать источники (!) информации, когда чего-то не знаешь (stock overflow, форумы, блоги, каналы в слаке и так далее). Как получить весь базовый набор на русском языке я не знаю, т.к. не ставил цели именно на русском учиться, поэтому в качестве ориентира на данном этапе считаю данную книгу, написанную создателем библиотеки Pandas: Python for Data Analysis: Data Wrangling with Pandas, NumPy, and IPython ©. Если бы всех студентов Специализации заставляли бы ее прочесть и освоить материал до начала учебы — КПД вырос бы минимум вдвое потом 🙂
Отдельно хочется попросить оторвать руки создателям первого курса за задание с работой с текстом — я сейчас делаю финальный проект по итогам пяти курсов и с ужасом вспоминаю, как пришлось тратить часы и дни поиском по форумам, чтобы не имея ни малейшего представления Python, токенизировать тексты и рассчитывать их сходство, используя примитивные циклы, потому что ничего лучше тогда ты не знаешь… Это очень жестоко, я думаю немало людей бросили всю учебу на этом моменте!
Идем дальше. Проходя второй курс Специализации, снова и снова придется возвращаться к основам — до понимания и разбора реальных моделей обучения на размеченных данных (другое название — обучение с учителем) порой просто не доходило! Сидишь и тратишь по 2–3 часа на преобразования и очистку числовой информации, подготовку таблиц и так далее, потому что нет навыка писать на Python, с трудом в голове откладывается его семантика, когда сразу бросают на работу с моделями линейной регресии и другими. В целом, курс очень насыщенный и требует много практической работы — в ходе видео-лекций дается теория по моделям линейной и логистической регрессий, объясняется принцип работы алгоритма градиентного бустинга и других ключевых для работы с данными темами (метрики, оптимизация и прочее). Общее впечатление — идеальное сочетание теории и практики, за исключением сегмента про нейронные сети — очень скомкано и ничего не понятно было тогда..)
Относительно третьего курса могу сказать, что он получился хуже остальных (исключительно мое мнение). Вам предстоит попробовать строить модели для работы с данными в ситуации, когда даже в целях обучения нет тестовых ответов (то есть нет разметки в данных). Но, судя по моему представлению по итогам завершения Специализации и дальнейшего обучения, тема обучения без учителя настолько сложная и глубокая, что реально в рамках третьего курса вы, можно сказать, успеете прочесть “определения из википедии” и сделать пару-тройку элементарных примеров, то есть ощущения того, что хоть чуть “знаешь” не возникнет, а если возникнет — это самообман 🙂
По мере движения вперед и изучения основ Python, вы будете все чаще сталкиваться с пробелами в знаниях теории вероятностей, статистики и линейной алгебры. И сильнее всего это будет чувствоваться на четвертом курсе, который по сути полностью посвящен концепциям из тер. вера и статистики в части тестирования гипотез, построения доверительных интервалов, оценки корреляций и так далее. И это вторая главная проблема всей Специализации — вроде как от студентов ждут “базовых знаний” в начале, но по мере прохождения курсов все отчетливей становится ясно — вы либо ХОРОШО знаете мат. часть, либо будет очень ПЛОХО….)) Реально не отделаться общими словами и “общим” пониманием — чтобы суметь разобраться как “под капотом” работают те или иные модели, на основании каких теорем/аксиом/концепций они строятся и почему результат именно такой, потребуется нечто большее, чем “базовые знания”. Отсюда вывод — если вы собираетесь погружаться в DS в общем и в Специализацию в частности, будьте готовы взяться за повторение мат. аппарата и вспомнить университетские годы — на коленке “попитонить и видосики посмотреть” не получится…)
Вот и все! Дальше идет практика (5 курс и отдельно 7-ми недельный финальный проект), а критически оценить насколько задания сложные или легкие я не могу: у меня опыт в инвестициях и работе на финансовых рынках, а не DS, так что мое мнение в этом вопросе не имеет “веса” …) Одно могу сказать — организовано все очень достойно, в плане разъяснения информации, разнообразия заданий и ощущения эффективности обучения по мере их самостоятельного решения! Плюс, конечно, огромную роль играет определенное community в slack’е — поток студентов на Специализации большой и всегда есть с кем обсудить любой вопрос.
Отвечая на вопрос “порекомендовал бы или нет” данную обучающую программу, отвечу однозначным да! Хотя у меня ушло на нее больше года при постоянной full-time занятости, самое важное — что пришло детальное представление о методах работы с данными с использованием моделей машинного обучения, Python теперь свободно вертится в голове (как когда изучаешь иностранный язык, после определенного уровня уже можешь на нем думать и как-то структурированно изъясняться )) и понятно, куда развивать свое хобби дальше — в работу с временными рядами, но это уже совсем другая история!)
Надеюсь, данный обзор будет вам полезен и позволит сэкономить немного времени / денег или повысит скорость обучения по данной тематике! Успехов!
специалист по Data Science Андрей Созыкин — о возможностях и «черных ящиках» нейронных сетей
Нейросети помогают лечить инфаркты, управляют автомобилями, «заставляют» нас улыбаться на фото и подсказывают банкам, какую услугу стоит нам предложить. С каждым днем они захватывают все новые сферы жизни, а компании расширяют возможности применения больших данных. Но как все это работает изнутри и с чего в принципе стоит начать путь специалиста по анализу больших данных? На эти и другие вопросы ответил специалист по Data science, заведующий кафедрой высокопроизводительных компьютерных технологий Уральского федерального университета Андрей Созыкин в ходе открытого семинара, организованного компанией NVIDIA и Университетом ИТМО. В интервью ITMO.NEWS он рассказал, без каких знаний не обойдется современный Data Scientist, при чем здесь «черный ящик» и почему «открыть» его не так просто.
Важная часть семинара была посвящена современным возможностям обучения Data science. Какие наиболее эффективные способы вы могли бы посоветовать тем, кто только начинает вливаться в эту сферу и, возможно, пока не знает, с чего начать?
Возможностей развиваться в области Data Science и стать специалистом сейчас на самом деле очень много. Во-первых, если у человека есть самодисциплина и мотивация, все можно освоить самостоятельно. Есть открытые курсы, в том числе на русском языке. Разумеется, много курсов ведется на английском, они уже позволяют понять основные алгоритмы и теорию. Из русскоязычных курсов я могу посоветовать Курс «Введение в машинное обучение» (Coursera, «Высшая школа экономики», ведет Константин Воронцов) и Специализация «Машинное обучение и анализ данных» (6 курсов на Coursera, подготовленные совместно МФТИ и «Яндексом»). Из зарубежных наиболее полезны, на мой взгляд, Курс «Machine Learning» (Coursera, ведет Andrew Ng), Курс «Neural Networks for Machine Learning» (Coursera, ведет Geoffrey Hinton), а также несколько так называемых nanodegree на платформе Udacity, подготовленных совместно с крупными компаниями: Data Analyst (совместно с Facebook), Machine Learning Engineer (совместно с Kaggle), Deep Learning.
Чтобы пойти дальше и разобраться в том, как это работает на практике, можно участвовать в соревнованиях по анализу данных. Самый крупный сайт соревнований — это платформа kaggle.com. Здесь проводятся состязания по разным направлениям, например, конкретно сейчас на платформе решается задача от «Сбербанка» по российскому рынку недвижимости. Главная цель — разработать алгоритмы, которые позволят прогнозировать цены на недвижимость, имея на руках данные о жилье и макроэкономические закономерности. Похожие соревнования проводит большое количество компаний, участие в них — хороший способ проверить свои навыки и подтянуть знания. Кроме того, такие конкурсы вкупе с пройденными курсами и статьями с анализом собственных проектов также учитываются работодателями при приеме на работу — сейчас это реальный способ подтвердить свою квалификацию.
Безусловно, есть и программы на базе университетов. Одна из них — школа анализа данных «Яндекса», которая дает хорошие базовые знания в этой области. Такие школы работают не только в Москве и Петербурге, есть они также в Екатеринбурге и Новосибирске.
Какими базовыми компетенциями должен обладать специалист, который уже начинает работать в области Data Science?
Лекция заведующего кафедрой высокопроизводительных компьютерных технологий Уральского федерального университета Андрея СозыкинаБазовый уровень — это знание математики, в частности, прикладной статистики и теории вероятностей, кроме того, безусловно, нужно обязательно знать программирование. Сейчас в области Data Science чаще всего используется язык Python и библиотеки для анализа данных. Помимо прочего, специалист должен разбираться в современных методах машинного обучения. И это не только глубокое обучение (ведь это только один из методов), но и, например, градиентный бустинг, который также активно применяется сейчас на практике. Таким образом, специалисты должны знать все актуальные методы и уметь пользоваться библиотеками для машинного обучения.
За какое время можно освоить азы и уже применять знания на практике?
В целом теорию реально освоить примерно за год — за такой срок можно получить навыки, которые позволят выполнять поставленные задачи, работать с данными при условии, что рядом с вами будет специалист, который объяснит, как эти данные можно использовать в конкретной сфере. Но сейчас компании нуждаются как раз в специалистах, которые могли бы не только выполнять задачи на инженерном уровне, но и уметь все имеющиеся данные применять. Сегодня не теряет актуальность проблема, в основе которой — наличие огромного количества данных у компаний, с одной стороны, и с другой — незнание того, как их можно использовать. Такую проблему может решить только специалист, который владеет конкретной предметной областью.
Безусловно, в идеале специалист по Data Science должен уметь все — и программировать, и знать математику, а также хорошо разбираться в какой-либо предметной области — в банковской сфере, в телекоме, в медицине или других сферах. Ведь это принципиально мультидисциплинарное направление. Другое дело, что часто эти компетенции сочетаются не в одном человеке, а в команде — допустим, кто-то отлично программирует, кто-то на очень высоком уровне знает математику, а кто-то разбирается в тех же банках, а все вместе они выдают результат. И мы в университете тоже изначально стараемся подобрать людей так, чтобы они могли хорошо работать в команде.
Лекция заведующего кафедрой высокопроизводительных компьютерных технологий Уральского федерального университета Андрея СозыкинаВ своих исследованиях вы занимаетесь конкретной предметной областью — анализом больших данных в области медицины. Расскажите, пожалуйста, подробнее о текущих проектах.
Мы занимаемся анализом медицинских изображений по двум направлениям: это анализ изображений сердца, а именно результаты магнитно-резонансной томографии, и изображений рака кожи. Зачем это нужно делать? Сейчас, чтобы обработать результаты МРТ, врач-диагност тратит достаточно большое время, как правило, это несколько часов. Ведь результаты МРТ — это не один снимок, а большое количество изображений, это снимки сердца на разных срезах. По этим снимкам врач, обладающий очень высокой квалификацией, должен определить поврежденные участки. Таким образом, ему нужно посмотреть огромное количество снимков, учитывая, что они, как правило, зашумлены, и уже по этой информации определить «области интереса». Это очень долго и сложно. Наша программа и другие существующие в этой области разработки помогают, во-первых, определить такие области на отдельных снимках, а во-вторых, на основе большого количества изображений делать трехмерную персонифицированную модель сердца. Все это в итоге позволяет автоматизировать работу врачей — делать ее быстрее и точнее.
В ближайшее время мы планируем проводить также моделирование различных болезней. Например, сейчас мы исследуем способы, которые позволят бороться с аритмией. Стоит отметить, что по одному из вариантов аритмия происходит, если в левом желудочке возникает спиральная волна и сердце начинает сокращаться очень быстро. Если этот процесс происходит в течение продолжительного времени, это создает большую опасность для человека, вплоть до летального исхода. Но есть способы остановить эту спиральную волну. Разумеется, мы не можем проводить такие исследования на живых людях — не только по этическим соображениям, но и из-за технических трудностей. Но мы можем проводить вычислительные эксперименты на суперкомпьютерах. Мы исследуем различные варианты распространения спиральной волны, а также методы воздействия, иными словами, способы, которые позволят нам остановить эту волну и предотвратить опасность для человека.
Такие исследования выполняют наши студенты и аспиранты, которые в процессе обучения используют так называемый проектный подход. В Екатеринбурге есть школа анализа данных «Яндекса». Некоторые студенты ее окончили, пошли в аспирантуру к нам в университет, соответственно, они уже умеют анализировать данные, а также, помимо этого, хотят изучить конкретную предметную область. У нас они занимаются исследованием медицинских изображений, и такая работа позволяет им продвинуться дальше изучения курсов и решения типовых заданий и выполнять вполне реальные, прикладные научные задачи.
Изображение, обработанное нейронной сетью. Источник: lamcdn.netС точки зрения развития методов машинного обучения, на ваш взгляд, в каких сферах за последнее время удалось достичь лучших результатов?
Главным достижением развития нейронных сетей и их применения, на мой взгляд, стало развитие сферы беспилотных автомобилей — и с точки зрения технической сложности, и с точки зрения важности этого для прогресса как такового. Кроме того, существенно продвинулись в последнее время системы машинного перевода, всевозможные чат-боты.
Активно развивается и продолжает быть чрезвычайно востребованным это направление в банках — все, что касается финтеха. Стремительно развиваются различные направления, касающиеся сегментации клиентов, уже работает система предложений клиенту: на основе данных о нем банк может подготовить более адресное предложение каждому конкретному человеку, а также прогнозировать отток клиентов.
И, наконец, еще одно важное направление, которое развивается и будет развиваться в ближайшее время, — это все, что связано с автоматизацией рутинного интеллектуального труда. Это работает, например, в бухгалтерии и юриспруденции. Ведь вполне можно автоматизировать и бухгалтерский учет, и такие действия, как проверка составления договоров. Уже есть компании, которые этим занимаются. В том числе и в России. Например, компания Кнопка, которая автоматизирует бухгалтерский учет с помощью машинного обучения и нейронных сетей.
В этом случае все происходит достаточно просто. Благодаря тому, что уже работает электронный документооборот, нейронная сеть может сама получать входящие документы и квалифицировать их. Далее, понимая, какие действия в каждом определенном случае должен выполнить бухгалтер, она выполняет их в предназначенной для этого системе. Бухгалтер как таковой, конечно, остается, но благодаря автоматизации процессов таких специалистов в будущем будет требоваться гораздо меньше. Ведь больше не надо будет вручную обрабатывать в разных системах огромное количество документов. Останутся специалисты, которые будут проверять, что все эти нейронные сети и алгоритмы работают правильно.
Какие основные задачи в области Data science ученым предстоит решить в ближайшее время?
С технической точки зрения перед учеными стоит задача увеличивать точность работы таких систем. Это, безусловно, накапливание и анализ еще большего объема данных. Например, это позволит улучшить работу беспилотных автомобилей даже в таких ситуациях, которые происходят достаточно редко.
Для типовых ситуаций данных уже много и все в этом случае работает уже хорошо, но, когда происходит что-то экстраординарное — то, что сеть никогда не видела, — машина пока справиться не может. Есть такой известный случай, когда беспилотный автомобиль попал в аварию, ошибившись с цветом прицепа машины, которая ехала перед ним. Этот цвет практически повторял цвет неба и нейронная сеть, управлявшая беспилотным автомобилем, попросту не распознала прицеп как часть машины, из-за чего произошло столкновение. Но, с другой стороны, учтя эту ошибку, в следующий раз сеть сможет ее избежать, причем во всех автомобилях, которыми она управляет. Опыт человека гораздо более ограничен, кроме того, человек зачастую повторяет одни и те же ошибки или, например, может спровоцировать аварию из-за плохого самочувствия. А сеть не устает, она не употребляет алкоголь, не болеет и не может заснуть за рулем.
Беспилотный автомобиль. Источник: svopi.ruЧто по этой логике делает ее гораздо более надежной, чем человека.
Есть много юридических и этических моментов на этот счет. До сих пор нельзя сказать, насколько можно доверять нейронной сети. Особенно актуально вопрос стоит, безусловно, в сфере, которая касается жизни и здоровья людей. Например, в той же медицинской диагностике. С одной стороны, нейронные сети могут выявить настолько сложные закономерности медицинских данных и предложить такие решения, которые не может найти ни один человек. Но с другой, мы до сих пор не понимаем, как именно нейронная сеть это делает. Для нас она работает в так называемом режиме black box — «черного ящика». Мы не понимаем, что у нее происходит внутри и почему она предлагает именно такие варианты. В медицине это неприемлемо, ведь в этой области мы должны четко объяснить и аргументировать каждое действие. Поэтому можем ли мы использовать то, что говорит нам нейронная сеть, в делах, касающихся жизни человека? До сих пор этот вопрос остается открытым.
Насколько реально в обозримом будущем понять причины, по которым сеть выдает те или иные результаты?
Безусловно, ученые постоянно предпринимают попытки понять причину таких действий, но пока результаты не так хороши. Есть даже такой пример, когда мы можем несущественно изменять данные, а нейронная сеть при этом будет выдавать уже совершенно другой результат. Например, в первом случае она распознает, что на изображении автомобиль и это правильно, но далее мы можем эту картинку специальным образом изменить — буквально в нескольких местах заменить несколько пикселов — и в этом случае нейронная сеть уже будет говорить, что на этой картинке изображен кот. Хотя человек по-прежнему увидит здесь автомобиль. Непонятно, почему нейронная сеть реагирует на изменения именно таким образом.
Но то, что можно осуществить уже в ближайшем будущем, касается анализа большего массива данных, разработки более сложных алгоритмов обучения и построения сетей, и с другой стороны — актуальной и реально осуществимой задачей на ближайшие годы является разработка аппаратного обеспечения для ускорения обучения, чтобы то, что раньше делалось за месяц, совершалось за считанные часы.
Открытый семинар по глубокому обучению, или как стать Data Scientist, прошел 16 мая в Петербурге. Организаторы мероприятия — компания NVIDIA и Университет ИТМО. Участникам рассказали, с чего начать путь специалиста по анализу больших данных, а также продемонстрировали решение с нуля классической задачи распознавания изображений с помощью глубокой нейросети. Спикером мероприятия выступил специалист в области Data Science, заведующий кафедрой высокопроизводительных компьютерных технологий Уральского федерального университета Андрей Созыкин. Эксперт занимается научными исследованиями в области анализа медицинских изображений с помощью глубокого обучения, ведет канал YouTube, на котором размещает видеолекции по технологиям Deep Learning.
Перейти к содержанию
1988–1994 гг. | Студент МФТИ. |
1993–1997 гг. | Программист, РТИАК (Научно-прикладной токсикологический центр федерального агентства по здравоохранению и социальному развитию). |
1994–1997 гг. | ВЦ РАН аспирант. |
1996–2000 гг. |
Разработка языка программирования ASDIEL
для описания композиций обучаемых алгоритмов.
Разработка библиотек алгоритмов классификации, кластеризации и многомерного шкалирования для ASDIEL. |
1996–2005 гг. | LaTeX-2e в примерах.Сборник наглядных примеров для быстрого изучения LaTeX2e (на русском языке). Мои ученики осваивают LaTeX за два часа! |
1997–2001 гг. |
Эксперт Московской межбанковской валютной биржи (ММВБ).
Разработка и поддержка систем анализа рынка и наблюдения САФРАН и СМАРТС. |
1998–2006 гг. | Разработка C++ библиотеки научных и бизнес-диаграмм ChartLib (документация только на русском языке). |
1999 |
кандидатская диссертация
«Локальные базисы в алгебраическом подходе к проблеме распознавания»
(на русском языке см. некоторые англоязычные статьи в публикациях).
Пожалуйста, не путайтесь в нашей (переведенной на русский язык) терминологии; на самом деле эта работа посвящена ансамблевому обучению, что-то вроде бустинга, но более общего характера. В частности, нелинейные монотонные функции слияния предлагаются как для классификации, так и для регрессии. |
2000–2002 гг. |
Разработка библиотеки C++ MoTor для моделирования торговли.
Уникальная особенность MoTor заключается в том, что мы моделируем каждого участника торгов (трейдера, бухгалтерскую фирму) отдельно.
Конфиденциальные данные участников используются для настройки модели.
После построения модели вся конфиденциальная информация может быть забыта, что позволяет всем использовать и изучать модель.![]() Разработка и управление проектом FORECSYS Торговый симулятор ImiTrade. |
2001 – настоящее время |
Исследователь,
Вычислительный центр Российской академии наук (ВЦ РАН).
Заместитель директора по научной работе ФОРЭКСИС. |
2002 г. | Разработка и управление проектом Системы мониторинга рынка фьючерсов и опционов ММВБ FORECSYS. |
2002 | Разработка внутреннего стандарта FORECSYS «Компоненты матричных алгоритмов маКом» для многомерного анализа данных. |
2003–2005 гг. | Разработка внутреннего стандарта FORECSYS «CommFace» для более быстрой разработки демо- и пилотных проектов. |
2003 | Разработка пилотной версии системы прогнозирования продаж FORECSYS Goods4Cast. |
2004 |
Разработка пилотной версии кредитной скоринговой системы FORECSYS ScoringPilot.![]() |
2004 – настоящее время | Доцент, заместитель заведующего кафедрой «Интеллектуальные системы» из СМАМ МФТИ. |
2004 |
Разработка годового курса по машинному обучению для МФТИ.
Конспекты лекций здесь. |
2004 | Управление проектом по выбору портфеля и механической торговой системе. |
2005 | Руководство проектом по совместной фильтрации и визуализации карты сходства в Интернете. |
2007 |
Редактирование материалов Российской конференции
«Математические методы распознавания образов»,
ММРО-2007.
Разработка конференции в стиле LaTeX (например, комбинированный стиль, поддерживающий примечания рецензента внутри текста). |
2007 | Разработка односеместрового курса прикладной статистики для Факультет ВМК. |
2007–2008 гг. |
Разработка годового курса вычислительной теории обучения для
Факультет ВМК.![]() |
2008 – настоящее время |
Разработка концепции, администрирование, редактирование
вики-ресурс
www.MachineLearning.ru.
Моя страница участника : Воков (на русском). |
Константин Воронцов | Московский физико-технический институт
Константин Воронцов | Московский физико-технический институт — Academia.eduAcademia.edu больше не поддерживает Internet Explorer.
Чтобы просматривать Academia.edu и более широкий Интернет быстрее и безопаснее, потратьте несколько секунд на обновление браузера.
Papers
Lecture Notes in Computer Science, 2011
Страница 1.Учимся ранжировать с помощью нелинейного монотонного ансамбля Никита Спирин1 и Константин Воронцов… подробнее Страница 1. Учимся ранжировать с помощью нелинейного монотонного ансамбля Никита Спирин1 и Константин Воронцов2 … партитуры). Обучающий набор пар объект-выход {(xk,yk)}l k=1 из Ω×Y и набор базовых алгоритмов b1,.
Paperrank:
Paperrank: Читателей Learning, 2014PaperRank:
Читатели Связанные статьи УпоминанияПросмотр Влияние Вероятностное тематическое моделирование текстовых коллекций — мощный инструмент для статистического анализа текстов… далее Вероятностное тематическое моделирование текстовых коллекций является мощным инструментом статистического анализа текстов. В этой статье мы объявляем о проекте с открытым исходным кодом BigARTM (http://bigartm.org), который предоставляет параллельный онлайн-алгоритм EM для изучения аддитивно регуляризованных мультимодальных тематических моделей больших коллекций. Мы показываем, что BigARTM превосходит другие популярные пакеты по качеству, времени выполнения и многокритериальной функциональности… далее Мы предлагаем комбинаторный метод получения жестких границ обобщения, зависящих от данных, на основе графа расщепления и связности (SC-графа) набора классификаторов.
PaperRank:
Читатели Связанные статьи УпоминанияПросмотреть ВлияниеПредложена новая методика оптимизации для слияния классификаторов — Кооперативный коэволюционный ансамбль… подробнее Предлагается новая методика оптимизации для слияния классификаторов — Кооперативное коэволюционное ансамблевое обучение (CCEL). Он основан на специфическом многопопуляционном эволюционном алгоритме — кооперативной коэволюции. Его можно использовать в качестве оболочки для любых слабых алгоритмов, процедур обучения и функций слияния как для задач классификации, так и для задач регрессии. Эксперименты над реальными задачами из репозитория UCI показывают, что CCEL имеет довольно высокую производительность обобщения и генерирует ансамбли гораздо меньшего размера, чем метод бустинга, бэггинга и случайного подпространства.
PaperRank:
Читатели Связанные статьи УпоминанияПросмотр влиянияPaperRank:
Читатели Связанные статьи УпоминанияПросмотр влиянияКонспекты лекций по информатике, 2011
Страница 1. Учимся ранжировать с помощью нелинейного монотонного ансамбля Никита Спирин1 и Константин Воронцо… подробнее 1. Обучение ранжированию с нелинейным монотонным ансамблем Никита Спирин1 и Константин Воронцов2 … партитуры). Обучающий набор пар объект-выход {(xk,yk)}l k=1 из Ω×Y и набор базовых алгоритмов b1,…,bp индуцирует последовательность векторов оценки {uk}l k=1 …PaperRank:
Читатели Связанные статьи MentionsView ImpactLecture Notes in Computer Science, 2015
PaperRank:
Читатели Связанные статьи MentionsView ImpactLecture Notes in Computer Science, 2013
PaperRank:
Читатели Связанные статьи MentionsView ImpactMachine Learning, 2014
PaperRank:
Читатели Связанные статьи MentionsView Impact Вероятностное тематическое моделирование текстовых коллекций — мощный инструмент для статистического анализа текста.

PaperRank:
Читатели Связанные статьи УпоминанияПросмотреть ВлияниеПредложена новая методика оптимизации для слияния классификаторов — Кооперативный коэволюционный ансамбль… подробнее Предлагается новая методика оптимизации для слияния классификаторов — Кооперативное коэволюционное ансамблевое обучение (CCEL). Он основан на специфическом многопопуляционном эволюционном алгоритме — кооперативной коэволюции. Его можно использовать в качестве оболочки для любых слабых алгоритмов, процедур обучения и функций слияния как для задач классификации, так и для задач регрессии. Эксперименты над реальными задачами из репозитория UCI показывают, что CCEL имеет довольно высокую производительность обобщения и генерирует ансамбли гораздо меньшего размера, чем метод бустинга, бэггинга и случайного подпространства.PaperRank:
Читатели Связанные статьи УпоминанияПросмотр влиянияPaperRank:
Читатели Связанные статьи УпоминанияПросмотр влияния Войти с FacebookВойти с Google
В вашем браузере отключен JavaScript.
Верхние оценки для классификаторов на основе функции различияK.Воронцов В. Комбинаторная вероятность и точность границ обобщения // Распознавание образов и анализ изображений. 2008. Т. 18, № 2. С. 243–259. В. Вапник, Природа статистической теории обучения, Спрингер, Нью-Йорк (2000). МАТЕМАТИКА Google ученый Ю. Журавлев И., Алгебраический подход к задачам распознавания или классификации, Проблемы кибернетики, 33 , 5–68 (1978). Google ученый К. В. Воронцов, Машинное обучение и анализ данных: цикл лекций «Математические методы обучения на прецедентах», http://www.ccas.ru/voron/teaching.html. Шлезингер М., Главач В. Десять лекций по статистическому и структурному распознаванию. Киев: Наукова думка, 2004. Google ученый Т.К. Мун и У. К. Стирлинг, Математические методы и алгоритмы обработки сигналов, Прентис-Холл, Нью-Йорк (2000). Google ученый Капустий Б.Е., Русин Б.П., Таянов В.А. Оптимизация классификатора в условиях малой выборки // Автоматическое управление и информатика. 2006. № 5. С. 17–22. Google ученый Б. О. Капустий, Б.Русин П., Таянов В.А. Комбинаторная оценка влияния уменьшения информационного покрытия класса на обобщающую способность алгоритмов классификации 1NN // Искусственный интеллект. 2008. № 1. С. 49–54. Карлин С. Основы теории случайных процессов. М.: Мир, 1971. Королюк В. С., Портенко Н. И., Скороход А. В., Турбин А. Ф. Руководство по теории вероятностей и математической статистике. М.: Наука, 1985. Google ученый К. М. Бишоп, Распознавание образов и машинное обучение (информатика и статистика), Springer, Лондон (2006). Google ученый Э. В. Вайсштейн, Неравенство Чебышева, http://mathworld.wolfram.com/Chebyshev Inequality.html, 10.12.2008. Э. В. Вайсштейн, Неравенство Гаусса, http://mathworld.wolfram.com/GaussInequality.html, 10.12.2008. Г. Ту. и Гонсалес Р. Принципы распознавания образов. М.: Мир, 1978. Капустий Б.О., Русин Б.П., Таянов В.А. Новый подход к определению вероятности правильного распознавания объектов из множеств // УСИМ. 2005. № 2. С. 8–13. DL Теоретический классЭто старая версия класса. Для последней итерации класса проверьте здесь. Классная дискуссионная группа: подпишитесь, чтобы получать объявления и участвовать в обсуждениях. ОписаниеИсследования в области глубокого обучения дают самые современные результаты по ряду задач машинного обучения. Большинство этих достижений основаны на интуиции и обширных исследованиях методом проб и ошибок. В результате теория в настоящее время отстает от практики. Сообщество машинного обучения не до конца понимает, почему работают лучшие методы.
Симптомом этого непонимания является то, что методам глубокого обучения в значительной степени не хватает гарантий и интерпретируемости, двух необходимых свойств для критически важных приложений.Что еще более важно, прочная теоретическая основа может помочь в разработке эффективных методов нового поколения без необходимости слепого исследования методом проб и ошибок. На этом занятии мы рассмотрим ряд недавних публикаций, пытающихся пролить свет на эти вопросы. Прежде чем обсуждать новые результаты в каждой статье, мы сначала представим необходимые фундаментальные инструменты из оптимизации, статистики, теории информации и статистической механики. Цель этого класса — вовлечь студентов в новые исследования в этой области.С этой целью большая часть кредита будет дана за отчет о проекте класса и презентацию по соответствующей теме. Предпосылки: Это предназначено для продвинутых выпускников для студентов, которые хотят участвовать в теоретических исследованиях глубокого обучения. Мы представим некоторые необходимые теоретические инструменты, но начните с предположения, что учащимся удобно:
Если вы не посещали курсы по всем вышеперечисленным темам, этот курс не предназначен для вас. Вместо этого вы должны взять другой класс. ЛюдиЛектор: Иоаннис Митлягкас, Информация о классеЗимний семестр 2019 г.:
Комната: Новая аудитория Mila, 6650 St. Urbain. Часы работы: с 10:45 до 11:45 в четверг сразу после занятий. СвязьМы будем использовать классную дискуссионную группу на все вопросы. Если у вас есть что-то личное / деликатное для обсуждения, не стесняйтесь, напишите мне.Если вы начнете тему электронной почты с «IFT6085:», это гарантирует, что ваша электронная почта не будет классифицирована неправильно. ОценкаКласс проекта: 40% Бумажная презентация: 25% Викторины-сюрпризы, промежуточные: 20% Скрайбинг: 10% Участие класса: 5% Используйте этот латексный шаблон для надписей. Предварительные темы — будут обновляться по мере продвижения
Обширная библиография класса РасписаниеПРИМЕЧАНИЕ. В первой половине урока мы будем внимательно следить за предыдущая итерация класса. 9 января Введение в класс [слайды, викторина] Ускоренный курс оптимизации10 января Основы выпуклого анализа и градиентного спуска [ новых исписанных заметок] Чтение: Основы выпуклого анализа из «Выпуклой оптимизации» Бойда, Ванденберге ([5] по ссылкам):
Доказательства сходимости: из главы 3 [1] («Выпуклая оптимизация…» С. Бубека в разделе «Ссылки»)
16-17 января Разные скорости градиентного спуска: от липшицевого до сильно выпуклого [ новых исписанных заметок] Чтение: Доказательства сходимости из главы 3 книги [1] («Выпуклая оптимизация…» С.Бубек под ссылками)
23 января Модели черного ящика и нижние границы [ новых исписанных заметок] Чтение: [1, теорема 3.15], [6] 24 января Ускоренные методы: импульс Поляка (метод тяжелого шара) [ новых исписанных заметок] [слайды] Чтение: [6], [7, стр. 67-76], [8], [9] 30 января Ускоренный градиент Нестерова, стохастический градиентный спуск [ новых исписанных заметок] Чтение: разделы с 6 по 6.2 из [1], раздел 14.3 из [4] Ускоренный курс статистической теории обучения31 января Элементы статистической теории обучения [ новых исписанных заметок] Чтение: Разделы 2 (если вам нужно введение), 3, 4 и 6 из [4]. 6 февраля Границы PAC-Байеса [ новых исписанных заметок] Чтение: [12] Чтение (сложнее): Раздел 6 из [2] 7 февраля Стабильность и обобщение [ новых исписанных заметок] Чтение: [13,14] Семинарская часть класса13 февраля: Приглашенный лектор, Гийом Рабюссо Теоремы о выразительности и универсальной аппроксимации [ новых исписанных заметок] 20 февраля Приложения стабильности [ новых исписанных заметок] Чтение: [14] 21 февраля Генеративные модели [ новых исписанных заметок] Чтение: [16,17] 27 февраля ГАН Вассерштейна [ новых исписанных заметок] Чтение: [18,19] 28 февраля Числа GAN [ новых исписанных заметок] [слайды] 6 марта ПЕРЕРЫВ Нет класса 7 марта ПЕРЕРЫВ Нет класса 13 марта Промежуточный экзамен 14 марта: Приглашенный лектор, Гийом Лажуа Введение в динамические системы с приложением к нейронным сетям [ новых исписанных заметок] Чтение: [31, 32, 33] 20 марта, утро Презентации студенческих работ, A Форма оценки 20 марта, вторая половина дня Презентации студенческих работ, B Форма оценки 21 марта Взвешенные суммы случайных кухонных раковин: замена минимизация с рандомизацией в обучении [ новых исписанных заметок] Чтение: [23] 27 марта, утро Основные результаты обучения с подкреплением [ новых исписанных заметок] Чтение: [34], главы 3 и 4 27 марта, вторая половина дня Презентации студенческих работ, D Форма оценки 28 марта, утро Презентации студенческих работ, C Форма оценки 3 апреля Распределенное обучение с подкреплением [ новых исписанных заметок] Бонусные лекцииЭтот раздел содержит полезный материал (старые лекции), которые были заменены новым материалом, но все равно очень интересно и полезно.Студенты не будут экзаменоваться по этому материалу. 21 марта 2018 г. Методы уменьшения дисперсии для стохастической оптимизации [заметки] Чтение: [22], раздел 5.3 из [21] 29 марта 2018 г. PacGAN: сила двух образцов в генеративно-состязательных сетях Чтение: [24] 4 апреля 2018 г. Некоторые результаты по невыпуклой оптимизации Чтение: [25,26] 5 апреля 2018 г. Выход из седловых точек [записанные заметки] слайды Ян Юаня Чтение: [27, 28] 11 апреля 2018 г. Теория спиновых стекол Гостевая лекция Алекса Фриберга , UdeM Math. Чтение: [29] 12 апреля 2018 г. Поверхности потерь многоуровневых сетей Чтение: [30] Ресурсы
Недавнее обсуждениеСпециалист по Data Science Андрей Созыкин о возможностях нейронных сетейНейронные сети помогают лечить сердечные приступы, управлять трафиком, анализировать изображения и советуют банкам, какие услуги предлагать. С каждым днем они входят в новые сферы нашей жизни, а компании находят для них все больше применений. Но какова их внутренняя работа и как начать свой путь к тому, чтобы стать специалистом по анализу больших данных? На эти вопросы ответил заведующий кафедрой высокопроизводительных компьютерных технологий Уральского федерального университета Андрей Созыкин в ходе открытой лекции, организованной Университетом ИТМО и компанией NVIDIA. Ваш совет тем, кто только начал заниматься этой сферой и не знает, с чего начать? На самом деле сейчас есть много возможностей стать специалистом в Data Science. Во-первых, если у человека есть самодисциплина и мотивация, он может всему научиться сам. Есть открытые курсы, в том числе и на русском языке. Наверняка многие на английском, и их достаточно для понимания основных алгоритмов и теории.Из российских курсов могу порекомендовать «Введение в машинное обучение» (Coursera, НИУ ВШЭ, руководитель Константин Воронцов) и специализацию «Машинное обучение и анализ данных» (шесть курсов на Coursera от МФТИ и Яндекса) . Что касается зарубежных курсов, то я считаю наиболее полезными «Машинное обучение» (Coursera, руководитель Эндрю Нг), «Нейронные сети для машинного обучения» (Coursera, руководитель Джеффри Хинтон), а также так называемые наностепени на платформе Udacity, созданные в сотрудничество с крупными компаниями: Data Analyst (совместно с Facebook), Machine Learning Engineer (совместно с), Deep Learning. Чтобы углубиться и понять, как это работает на практике, можно поучаствовать в конкурсах по анализу данных. Самая большая платформа для этого — kaggle.com https://www.kaggle.com/competitions. Проводятся конкурсы по разным направлениям; например, текущая задача Сбербанка России связана с рынком недвижимости. Его основная цель — разработка алгоритмов, которые позволят прогнозировать цены на недвижимость на основе данных о жилье и макроэкономических закономерностей. Подобные конкурсы проводят многие компании, и участие в них — отличный способ проверить свои навыки и узнать что-то новое.Кроме того, участие в конкурсах, анализ собственных проектов и прохождение курсов — хороший способ подтвердить свои навыки при приеме на работу. Конечно, есть и образовательные программы в разных вузах. Одна из них — Школа анализа данных Яндекса, дающая хорошие базовые знания по теме. Школа имеет филиалы в Москве, Санкт-Петербурге, Екатеринбурге и Новосибирске. Какими базовыми компетенциями должен обладать специалист по науке о данных? Лекция Андрея Созыкина На базовом уровне это был бы хороший уровень математики, включая прикладную статистику и теорию вероятностей, а также обязательно программирование.На данный момент специалисты в области Data Science в основном работают с языком программирования Python и библиотеками для анализа данных. Кроме того, специалист должен хорошо разбираться в современных методах машинного обучения, и это будет не только глубокое обучение (это только один из методов), но и такие методы, как градиентное повышение, которые сейчас активно используются. Таким образом, специалисты должны знать все актуальные методы и уметь использовать библиотеки для машинного обучения. В какое время можно изучить основы и начать их применять? В принципе, теорию можно выучить примерно за год — этого будет достаточно, чтобы получить навыки, которые позволят выполнять задачи и работать с данными, если есть специалист, который будет консультировать вас по работам в той или иной области.Однако сейчас компаниям требуются специалисты, способные не только решать задачи на инженерном уровне, но и применять полученные данные. У компаний много данных, но они не умеют ими пользоваться, а это очень актуальная проблема, решить которую может только специалист, к тому же хорошо разбирающийся в той или иной области. В идеале специалист по науке о данных должен уметь многое — хорошо разбираться в программировании и математике, а также хорошо знать ту или иную область — банковский сектор, телекоммуникации, медицину или любую другую.Таким образом, специалист по науке о данных должен обладать междисциплинарными знаниями. Конечно, это могут быть компетенции не одного человека, а команды: допустим, один хорошо разбирается в программировании, другой разбирается в математике, а третий много знает о банковской сфере; в целом они могут дать отличные результаты. В нашем университете мы стремимся организовать группы таким образом, чтобы студенты могли хорошо работать в команде. Лекция Андрея Созыкина Вы сосредотачиваете свои исследования на определенной области — анализе больших данных в медицине.Расскажите, пожалуйста, о ваших текущих проектах. У нас есть два проекта по анализу изображений в медицине: это будет анализ изображений сердца (а именно результатов МРТ) и изображений рака кожи. Для чего это? В настоящее время врачи тратят несколько часов на обработку результатов МРТ, так как результаты МРТ содержат целые наборы изображений. По ним высококвалифицированный врач должен определить зоны поражения. Другими словами, он просматривает множество изображений (которые могут иметь шумы и тому подобное) и определяет «области интересов» на основе этих данных.Это очень сложная задача, которая требует много времени. Наша программа, как и другие в этой области, помогает определить эти области на отдельных изображениях, а также создает 3D-модели сердца, используя как можно больше изображений. Все это помогает автоматизировать работу врачей, помогает делать ее быстрее и точнее. В ближайшее время мы планируем начать моделирование различных заболеваний. Например, сейчас мы изучаем различные средства для лечения аритмии. В некоторых случаях аритмия вызвана спиральной волной в левом желудочке, которая заставляет сердце сокращаться в очень быстром темпе.Если это длится в течение длительного периода времени, это может причинить большой вред и даже смерть. Тем не менее, есть способы остановить волну. Конечно, мы не можем проводить эксперименты на живых людях — как по этическим, так и по техническим причинам. Тем не менее, мы можем проводить вычислительные эксперименты с использованием суперкомпьютеров. Мы изучаем различные закономерности распространения спиральной волны, а также методы лечения, которые позволят остановить ее и таким образом предотвратить вред здоровью. Такие исследования проводят наши студенты, которые используют в своем обучении так называемый проектный подход.В Екатеринбурге есть филиал Школы анализа данных Яндекса. Некоторые из наших студентов закончили там курсы, а затем остались в нашем университете на аспирантуру, так как хотят изучать конкретную предметную область. Они изучают медицинские изображения, и эта работа позволяет им совершенствовать свои навыки, применяя их к реальным научным задачам. Апинтинг, обработанный нейронной сетью. Кредит: lamcdn.net Если говорить о методах машинного обучения, в каких областях лучшие результаты? На мой взгляд, лучшее достижение в области нейронных сетей и их применения — это разработка беспилотных автомобилей — это было бы и с технической точки зрения, и прогрессом в целом.Среди других областей, получивших развитие в последнее время, — системы CAT (автоматизированный перевод) и различные чат-боты. Финтех продолжает стремительно развиваться и пользуется большим спросом у банков и других финансовых организаций. Наконец, очень важной областью является все, что связано с автоматизацией рутинного умственного труда. Это может найти широкое применение в бухгалтерском учете и юриспруденции, где можно автоматизировать такие вещи, как бухгалтерские операции и аудит. Такие компании уже есть, в том числе и в России.Например, компания «Кнопка» использует машинное обучение и нейронные сети для автоматизации бухгалтерских операций. В данном случае все достаточно просто. Поскольку уже внедрен электронный документооборот, нейронная сеть может принимать входящие документы и идентифицировать их. Тогда он выполняет работу бухгалтера-человека. Конечно, человек-бухгалтер по-прежнему должен контролировать свою работу, но благодаря автоматизации компаниям требуется меньше таких специалистов, так как им больше не придется выполнять рутинную работу вручную. Какие задачи и вызовы стоят сейчас перед учеными в области науки о данных? С технической точки зрения ученым предстоит повысить точность этих систем. Это будет связано со сбором и анализом дополнительных данных. Например, это позволит улучшить работу беспилотных автомобилей даже в тех случаях, которые действительно редки. Хотя нейронные сети уже имеют достаточно данных для типичных ситуаций, они иногда не могут справиться с чем-то экстраординарным, с чем-то, чего они никогда не видели.Известный пример — когда беспилотный автомобиль попал в аварию, перепутав цвет машины, которая ехала впереди. Он был почти такого же цвета, как небо, и нейросеть просто не распознала трейлер как часть автомобиля. Тем не менее, сеть теперь будет избегать таких ошибок во всех автомобилях, которыми она управляет. Человеческий опыт более ограничен, также люди часто повторяют одни и те же ошибки или могут попасть в аварию из-за плохого самочувствия. Сеть, с другой стороны, никогда не устает, не пьет, не чувствует себя больным или мрачным. Беспилотный автомобиль. Кредит: svopi.ru Что делает его намного надежнее человека? Тем не менее, здесь есть много этических и юридических проблем. Мы до сих пор не можем сказать, насколько мы можем доверять нейронным сетям, особенно когда речь идет о областях, связанных со здоровьем и жизнью людей. Например, вышеупомянутая медицинская диагностика. С одной стороны, нейросети могут находить такие сложные закономерности в медицинских данных и предлагать такие решения, которые не может дать ни один живой человек.С другой стороны, мы до сих пор не знаем, как они это делают. Для нас нейронные сети — это что-то вроде черных ящиков. Мы не понимаем, что происходит внутри и почему именно они предлагают те или иные решения. В медицине это неприемлемо, так как в этой области мы должны точно знать, что мы делаем и почему. Поэтому вопрос использования нейронных сетей, когда речь идет о человеческих жизнях, остается открытым. Удастся ли в ближайшем будущем полностью понять, как работают нейронные сети? Учёные постоянно предпринимают такие попытки, но пока безрезультатно.Иногда даже небольшое изменение данных может привести к тому, что сеть выдаст совершенно другой результат. Например, он распознает на изображении машину, и это правда, затем несколько пикселей изменены, и он вдруг считает, что это кот. Тем не менее, люди все еще видят автомобиль. И никто не знает, почему сеть именно так реагирует на эти изменения. Тем не менее, то, что мы можем сделать в ближайшем будущем — анализ больших объемов данных, разработка более сложных алгоритмов машинного обучения и тому подобное — наиболее актуально и позволит нам делать то, на что мы сейчас тратим месяц, за несколько часов.
16 мая в Санкт-Петербурге прошел открытый семинар «Глубокое обучение, или Как стать Data Scientist». Организаторами мероприятия выступили Университет ИТМО и компания NVIDIA; его участники рассказали о том, как стать специалистом по анализу больших данных, а также продемонстрировали решение классической задачи по распознаванию изображений с помощью нейронных сетей. Одним из спикеров мероприятия стал Андрей Созыкин, заведующий кафедрой высокопроизводительных компьютерных технологий Уральского федерального университета.Г-н Созыкин занимается исследованиями в области анализа медицинских изображений с применением глубокого обучения и ведет канал на YouTube, где публикует лекции о технологиях глубокого обучения. AI-RADS: Учебная программа по искусственному интеллекту для резидентовAlexander L. Lindqwister1 Медицинская школа Гейзеля в Дартмуте, 1 Rope Ferry Rd, Hanover, NH 03775 Saeed Hassanpour
Таблица 2
ОбсуждениеAI-RAD было хорошо принят среди стажеров в нашем учреждении. Судя по нашим показателям качества, слушатели в подавляющем большинстве считают, что глубина содержания серии лекций AI-RADS идеальна, а используемые примеры являются полезными средствами для понимания ключевых концепций искусственного интеллекта.Выездные опросы продемонстрировали высокую степень удовлетворенности учащихся с общей оценкой 9,8/10. Интерес жителей к искусственному интеллекту остается на стабильно высоком уровне, что позволяет предположить, что этот курс не отпугнул учащихся от этой области. За исключением лекции 7, уверенность резидентов в своей способности читать журнальную статью по радиологии, связанную с искусственным интеллектом, статистически увеличивалась после каждой лекции (). Только пять резидентов смогли посетить лекцию 7, что, вероятно, способствовало ее пограничным результатам.Параметрические тесты, такие как Тест Студентов t , дали значительные значения p на всех лекциях, однако, учитывая небольшой размер выборки, знаковый ранг Уилкоксона оказался более точным, хотя и менее статистически достоверным. Как ни странно, дискуссии во время этих сессий были активными, а вопросы, которые задают жители, предполагают более глубокое понимание лежащих в основе вычислительных методов. С вопросами, связанными с содержанием, предполагаемая способность учащихся объяснять эти понятия показала заметное увеличение по сравнению с периодом до и после каждого дидактического занятия ().Вместо формальной оценки эти результаты демонстрируют более глубокое понимание основных принципов искусственного интеллекта. Это, в сочетании с воспринимаемой уверенностью в чтении новых статей, связанных с обсуждаемым алгоритмом, в значительной степени подразумевает повышенное чувство комфорта при работе с методами искусственного интеллекта. Будущие итерации этого курса могут включать в себя анонимные викторины с множественным выбором для конкретного содержания для дальнейшей оценки усвоения концепции. Журнальный клуб изначально был успешным, но продемонстрировал постепенное снижение уровня подготовки учащихся, что проявилось в более поздних дискуссиях.Жители указали, что дополнительные клинические обязанности и нехватка свободного времени были основными факторами, способствующими отсутствию участия. В письменных комментариях резиденты заявили, что журнальный клуб очень помог в закреплении концепций, представленных в лекции, и, несмотря на ограниченную подготовку, нашел беседы поучительными. Многие предложения касались того, как будут управляться клубы журналов, когда этот курс будет перераспределен, включая презентации статей под руководством резидентов при поддержке преподавателей, домашние задания, посвященные конкретным статьям, или интеграцию обсуждения статей в дидактическую сессию. Ограничения курса включают неоднородность посещаемости учащихся, обычно в результате выполнения клинических обязанностей при определенных ротациях, расписании и выгорании резидента. Важно отметить вероятный вклад планирования лекций в посещаемость. Для последних трех лекций в обычном дидактическом временном интервале не было свободных мест, что требовало досрочного увольнения резидентов с клинических обязанностей для посещения сеанса в конце дня. Это было неоптимально и, вероятно, способствовало относительно низкой явке.Кроме того, это могло повлиять на общее понимание, поскольку последние три лекции концептуально тесно взаимосвязаны. Переход на онлайн-платформу в идеале позволит обойти эти проблемы, поскольку учащиеся смогут проходить модули в своем собственном темпе. Однако это может происходить за счет возможностей для обсуждения в больших группах. Был предложен интерактивный сеанс обучения кодированию с уже существующими наборами данных и доступным скелетным кодом, чтобы учащиеся могли попытаться реализовать изученные алгоритмы.Несмотря на то, что интерес опрошенных жителей был высоким, многие выразили обеспокоенность по поводу нехватки времени при и без того напряженном графике. Таким образом, эти занятия считались более подходящими для будущих итераций после того, как основные учебные планы будут полностью включены. Наконец, в то время как анализ демографических данных стажеров (таких как пол, PGY и т. д.) повысил бы разрешение конкретных потребностей и удовлетворенности учащихся, размер нашей программы эффективно устранил бы анонимность обратной связи для некоторых учащихся. Для этого не была получена демографическая информация, чтобы поощрить откровенность ответов стажеров. Чтобы обеспечить долговечность и устойчивость этого курса как уникальной отличительной черты программы обучения в ординатуре нашего учреждения, департамент работает над созданием онлайн-инфраструктуры для постоянного размещения этого ресурса. В планы на будущее входит публикация всех материалов и свободный доступ к этой образовательной серии для всех заинтересованных учащихся. Эти видео будут загружаться на следующий канал YouTube по мере их появления: https://rb.gy/ychu2k. Поскольку искусственный интеллект продолжает изменять мир медицины, становится необходимым, чтобы врачи были знакомы с фундаментальными алгоритмами и методами искусственного интеллекта.Это станет важным навыком для интерпретации медицинской литературы, оценки потенциальных дополнений клинического программного обеспечения, формулирования вопросов исследования и покупки оборудования. Имея интуитивно понятную основу машинного обучения, основанную на фундаментальных алгоритмах, учащиеся, вероятно, будут лучше подготовлены к пониманию сильных и слабых сторон различных методов и смогут принимать более обоснованные решения. Таким образом, программы резидентуры только начинают использовать базовые вычислительные концепции в своем обучении, навык, который станет важным для рентгенологов завтрашнего дня; Владение искусственным интеллектом станет обязательным навыком в ближайшем будущем для служб обработки изображений.Мы представляем усилия нашего учреждения по решению этой проблемы в качестве модели успешной вводной программы по применению искусственного интеллекта в радиологии. СноскиИсточники финансирования: Это исследование не получило каких-либо специальных грантов от финансирующих агентств в государственном, коммерческом или некоммерческом секторах. Приложение A. Статьи журнала Journal ClubДо, Б. Х., Ланглотц, К., и Болье, К. Ф. (2017). Диагностика опухолей костей с использованием наивной байесовской модели демографических и рентгенографических признаков. Journal of Digital Imaging, 30 (5), 640–647. https://doi.org/10.1007/s10278-017-0001-7 Эмблема, К. Э., Пиньо, М. К., Целльнер, Ф. Г., Дью-Тоннессен, П., Халд, Дж. К., Шад, Л. Р., Мелинг, Т. Р., Рапалино, О., и Бьорнеруд, А. (2015). Общая модель машины опорных векторов для предоперационных ассоциаций выживания глиомы. Радиология, 275 (1), 228–234. https://doi.org/10.1148/radiol.14140770 Дженсен, К., Карл, Дж., Босен, Л., Лангкилде, Н.К., и Остергаард, Л.Р. (2019). Оценка прогностической группы рака предстательной железы по Глисону с использованием зонально-специфических признаков, извлеченных из бипараметрической МРТ с использованием классификатора KNN. Журнал прикладной клинической медицинской физики, 20 (2), 146–153. https://doi.org/10.1002/acm2.12542 Сринивасан, А., Галбан, С.Дж., Джонсон, Т.Д., Ченеверт, Т.Л., Росс, Б.Д., и Мукерджи, С.К. (2010). Полезность алгоритма кластеризации K-средних для дифференциации значений кажущегося коэффициента диффузии доброкачественных и злокачественных патологий шеи. Американский журнал нейрорадиологии, 31 (4), 736–740. https://doi.org/10.3174/ajnr.A1901 Чжан Б., Тянь Дж., Пей С., Чен Ю., Хе Х., Дун Ю., Чжан Л., Мо X., Хуан В., Конг С. ., & Чжан, С. (2019). Система машинного обучения для диагностики узловых образований щитовидной железы. Щитовидная железа, 29 (6), 858–867. https://doi.org/10.1089/thy.2018.0380 Приложение B. Вопросы Content
Ссылки1. Боланд Г.В.Л., Гимарайнш А.С., Мюллер П.Р. Загадка рентгенолога: преимущества и затраты на увеличение мощности и использования КТ. Евро Радиол. 2009;19:9–11. doi: 10.1007/s00330-008-1159-7. [PubMed] [CrossRef] [Google Scholar]4. Оой С.К.Г., Сун А.Й.К., Фук-Чонг С. Отношение к искусственному интеллекту в радиологии с оценкой потребностей учащихся в рамках программ ординатуры по радиологии: национальное многопрограммное исследование.Singapore Med J. 2019 doi: 10.11622/smedj.2019141. [Бесплатная статья PMC] [PubMed] [CrossRef] [Google Scholar]5. Пинто душ Сантос Д., Гизе Д., Бродель Д. Отношение студентов-медиков к искусственному интеллекту: многоцентровое исследование. Евро Радиол. 2019;29:1640–1646. doi: 10.1007/s00330-018-5601-1. [PubMed] [CrossRef] [Google Scholar]6. Уэймел К., Бадр С., Демондион Х. Влияние развития искусственного интеллекта на рентгенологию: что думают рентгенологи? Диагноз Interv Imaging. 2019;100:327–336. дои: 10.1016/j.diii.2019.03.015. [PubMed] [CrossRef] [Google Scholar]8. Макдональд Р. Дж., Шварц К. М., Эккель Л. Дж. Влияние изменений в использовании и технологических достижений визуализации поперечного сечения на рабочую нагрузку рентгенолога. Академ Радиол. 2015;22:1191–1198. doi: 10.1016/j.acra.2015.05.007. [PubMed] [CrossRef] [Google Scholar]9. Паранджапе К., Шинкель М., Наннан Пандей Р. Внедрение обучения искусственному интеллекту в медицинском образовании. JMIR Med Educ. 2019;5:e16048. дои: 10.2196/16048. [Бесплатная статья PMC] [PubMed] [CrossRef] [Google Scholar]11.Чартранд Г., Ченг П.М., Воронцов Э. Глубокое обучение: учебник для рентгенологов. Рентгенография. 2017;37:2113–2131. doi: 10.1148/rg.2017170077. [PubMed] [CrossRef] [Google Scholar] 13. Песапане Филиппо, Кодари Марина, Сарданелли Франческо. Искусственный интеллект в медицинской визуализации: угроза или возможность? Рентгенологи снова в авангарде инноваций в медицине. Евро Радиол Опыт. 2018;2:35. [Бесплатная статья PMC] [PubMed] [Google Scholar]14. Ричардсон М.Л., Гарвуд Э.Р., Ли Ю. Неинтерпретационное использование искусственного интеллекта в радиологии.Академ Радиол. 2020 г.: 10.1016/j.acra.2020.01.012. [PubMed] [CrossRef] [Google Scholar] 15. Группа СФР-ИА. |