Первый мастер-класс Skills Lab
23 ноября в Институте образования стартовал проект Skills Lab, задачей которого является формирование компетенций и обмен методологическими и практическими навыками между сотрудниками Института. Серию мастер-классов открыла Екатерина Черняк, доцент департамента больших данных и информационного поиска ФКН НИУ ВШЭ, data scientist Sberbank, специалист в области автоматической обработки текстов с темой “Современные задачи и методы анализа текстов”.
Екатерина подробно рассказала о задачах обработки текстовых данных: морфологический и синтаксический парсинг, извлечение ключевых слов, словосочетаний, именованных сущностей и фактов, анализ дискурса и аргументации. В ходе мастер-класса были рассмотрены задачи анализа текстовых данных, требующие использования алгоритмов машинного обучения: классификация текстов и разработка вопросно-ответных систем. Подобный инструментарий может быть использован для изучения больших неструктурированных объемов текстов и классификации полученных текстов. Пример проекта с использованием такого инструментария - проект ИСИЭЗ Mapping the Radical Innovations in Food Industry: A Text Mining Study. Типичный пример анализа больших объемов текстовых данных, где могли бы быть применены методы и подходы текстового анализа (программно реализованные в среде Python), но анализ выполнялся “вручную” - Проект по анализу дорожных карт развития региональных систем образования (проект Института образования, 2013 г.).
На семинаре стало понятно, что для анализа огромных массивов текстов стоит привлекать в команду проекта специалиста в области автоматической обработки текстов, либо “наращивать” такую компетентность у сотрудника проектной команды.
Презентация и видео доступны по ссылкам:
Если у вас есть желание и возможность поделиться уникальными знаниями и навыками с коллегами, мы будем рады видеть вас в качестве спикера на площадке Skills Lab.