Разработка инструмента для автоматизированной обработки текстов заявок, поступающих на конкурс
Участники: Чувилина Анна, Андреева Анастасия
Руководители: Королева Диана, Хавенсон Татьяна
Содержание:
Цель проекта — разработка модели обучения алгоритма предсказанию кодовых значений на основе информации, содержащейся в массиве текстовых описаний инновационных проектов, действующих в поле образования. Что позволит, изучив описание инновационных стартапов выявить характерные тренды модернизации системы российского образования.
Текущий результат:
Осуществлена распаковка и предобработка данных. Разработан детальный план дальнейших действий. Предполагается использование дерева решений, так как подобная модель позволяет достигать высокой интерпретируемости и скорости работы, но есть вероятность проблем с переобучением, поэтому также планируется рассмотреть вариант использования ансамблей деревьев. В ходе исследования будут опробованы и другие модели, приемлемые для использования в подобных постановках задач: k-ближайших соседей, SVM, линейные модели.