Изучаются методы интеллектуального анализа данных по целям и особенностям данных, подбор метода интеллектуального анализа данных для конкретной образовательной задачи, использование пакетов прикладных задач для решения задач интеллектуального анализа данных в образовании.
Цель освоения дисциплины
Сформировать у студентов общее понимание современных технологий наук о данных [data science].
Планируемые результаты обучения
Понимает направления развития образовательной аналитики, способен выбрать и протестировать перспективные средства аналитики
Способен выбрать метод и инструмент анализа данных, поставить задачу аналитику, интерпретировать результаты
Способен построить реляционную модель данных, заполнить её данными из внешних источников, провести базовый эксплораторный анализ
Понимает особенности современных подходов к управлению данными и принятию решений на основе данных
Содержание учебной дисциплины
Данные в образовании
Информация и данные. Метаданные и их уровни. Форматы данных. Наборы данных и источники данных. Понятие качества данных и его основные метрики. Протоколы и интерфейсы доступа к данным. Открытые данные.
Управление данными. Базы данных (БД) и системы управления базами данных (СУБД). Хранилища данных и витрины данных. Мастер-данные. Политики управления данными. Персональные данные, ФЗ152 и другие нормативные акты. Защищённое хранение и локализация персональных данных.
Цифровой след и цифровая память. Идентификация пользователей.
Виды и типы данных в области образования. Сообщество Linked Open Data. Интероперабельность информационных систем в образовании, инициативы и стандарты, IMS LTI.
Реляционные данные и базовый уровень аналитики
Моделирование данных. Дополнительно об уровнях абстракции. Концептуальные, логические и физические модели данных. Как связаны понятия Business Intelligence (BI), Data Analysis, Data Analytics, Data Mining.
Реляционная модель данных и её свойства. От предметной области к моделям данных. Концептуальная модель «сущность-связь», ER-диаграммы. Сущности и их выделение, экземпляры сущностей. Связи, их модальность и множественность. Концептуальные процессные модели. Стандарты BPMN и UML. Модель «таблица-связь» и основы реляционный алгебры для понимания соединений.
Реляционные БД. Системы управления реляционными БД. Язык SQL. Доступ к SQL-серверам. Версионирование реляционных данных.
Математическая статистика как инструмент аналитика. Особенно генеральной совокупности, выборок и распределений для основных видов данных в образовании. Эксплораторный анализ данных. Визуализация статистических характеристик. Корреляционный и регрессионный анализ на практике. Различные трактовки факторного анализа. Анализ выживаемости.
Стек Microsoft: современный Excel.
Неструктурированные данные и интеллектуальный анализ данных
Понятие искусственного интеллекта, различные трактовки этого понятия. Машинное обучение. Объекто-признаковое представление данных для задач машинного обучения. Задачи классификации, кластеризации и ранжирования объектов.
Неструктурированные тексты на естественном языке и их анализ. Неструктурированные данные в цифровом следе.
Графовые модели и социальные сети. Визуализация сетей.
Автоматизация машинного обучения, AutoML.
Стек Microsoft: Machine Learning Service.
Методология Data-driven Decision Management и дополнительные инструменты
Принятие решений на основе данных и управление этой деятельностью. Поддержка процессов сквозной аналитики в организации. Промышленные процессы обработки данных для принятия решений. Версионирование мастер-данных и моделей машинного обучения. Команды для внедрения DDDM: основные роли и компетенции.
Интерактивная аналитика. Специализированные языки обработки данных для аналитики, отличия от SQL. Визуализация интерактивных отчётов.
Стек Microsoft: Power BI.
Развитие образовательной аналитики
Адаптивные образовательные технологии и специфика их данных. Learning Analytics в современных средствах поддержки учебного процесса. Как оценить реальную результативность образовательной аналитики?
Современные подходы к анализу образовательных данных [Educational Data Mining]. Перспективные подходы и тренды
Элементы контроля
Домашнее задание 1
Домашнее задание 2
Домашнее задание 3
Эссе
Экзамен
Экзамен проводится в устной форме. Экзамен проводится в среде MS-Teams в канале команды https://teams.microsoft.com/l/team/19%3a977f69d7279148a392ba900ab296afd7%40thread.skype/conversations?groupId=bf5d0ae1-7fe4-4089-b635-ba5a9cc1f64b&tenantId=21f26c24-0793-4b07-a73d-563cd2ec235f - поскольку у всех студентов есть оттестированный доступ к этому каналу, то мы уверены в том, что ваши компьютеры удовлетворяют необходимым требованиям. Для участия в экзамене студент обязан: поставить на аватар фотографию, включить камеру и микрофон. Во время экзамена студентам разрешено: пользоваться любыми внешними источниками информации. Процедура пересдачи аналогична процедуре сдачи и подразумевает использование усложненных заданий.
Anca IANCU, & Daniel-Mihai IONESCU. (2017). Learning Analytics Mobile Application for the Bucharest University of Economic Studies’ Students. Informatică Economică, (3), 65. https://doi.org/10.12948/issn14531305/21.3.2017.06
ElAtia, S., Ipperciel, D., & Zaiane, O. R. (2017). Data Mining and Learning Analytics : Applications in Educational Research. Hoboken, New Jersey: Wiley. Retrieved from http://search.ebscohost.com/login.aspx?direct=true&site=eds-live&db=edsebk&AN=1351385
Molnar, C. (2018). iml: An R package for Interpretable Machine Learning. https://doi.org/10.5281/zenodo.1299058
Phillips, Tim. Data-Driven Business: Use Real-Life Numbers to Improve Your Business by 352% [Электронный ресурс] / Tim Phillips; БД books24х7. – Infinite Ideas, 2016. – 160 pages. – ISBN 978-1908984609. –Режим доступа: http://common.books24x7.com/toc.aspx?bookid=130361. – Загл. с экрана.
Structural Gamification for Adaptation based on Learning Analytics. (2019). Retrieved from http://search.ebscohost.com/login.aspx?direct=true&site=eds-live&db=edsbas&AN=edsbas.3B76FE8F
Рекомендуемая дополнительная литература
A Tutorial on Machine Learning and Data Science Tools with Python. (2017). Retrieved from http://search.ebscohost.com/login.aspx?direct=true&site=eds-live&db=edsbas&AN=edsbas.E5F82B62
D. Kachan A., & Д. Качан А. (2018). Open Data: Analysis of Trends ; Открытые Данные: Анализ Тенденций. Retrieved from http://search.ebscohost.com/login.aspx?direct=true&site=eds-live&db=edsbas&AN=edsbas.5271C977
Explainable and interpretable models in computer vision and machine learning. (2018). https://doi.org/10.1007/978-3-319-98131-4
Gutschow, E. (2019). Big Data-driven Smart Cities: Computationally Networked Urbanism, Real-Time Decision-Making, and the Cognitive Internet of Things. Geopolitics, History & International Relations, 11(2), 48–54. https://doi.org/10.22381/GHIR11220197
Producing, analyzing and sharing Open Data in Digital Humanities: some good practices ; Produire, analyser et partager des données ouvertes en Humanités Numériques : quelques bonnes pratiques. (2019). Retrieved from http://search.ebscohost.com/login.aspx?direct=true&site=eds-live&db=edsbas&AN=edsbas.DB923C58
Буч Г., Рамбо Д., Якобсон И. - Язык UML. Руководство пользователя - Издательство "ДМК Пресс" - 2008 - 496с. - ISBN: 5-94074-334-X - Текст электронный // ЭБС ЛАНЬ - URL: https://e.lanbook.com/book/1246
Розенберг Д., Скотт К. - Применение объектного моделирования с использованием UML и анализ прецедентов - Издательство "ДМК Пресс" - 2007 - 160с. - ISBN: 5-94074-050-2 - Текст электронный // ЭБС ЛАНЬ - URL: https://e.lanbook.com/book/1226
Instructor
Neznanov, Alexey
Программа дисциплины
Аннотация
Цель освоения дисциплины
Планируемые результаты обучения
Содержание учебной дисциплины
Элементы контроля
Промежуточная аттестация
Список литературы
Рекомендуемая основная литература
Рекомендуемая дополнительная литература