Разработка инструмента для автоматизированной обработки текстов заявок, поступающих на конкурс

Участники: Чувилина Анна, Андреева Анастасия

Руководители: Королева Диана, Хавенсон Татьяна

Содержание:

Цель проекта — разработка модели обучения алгоритма предсказанию кодовых значений на основе информации, содержащейся в массиве текстовых описаний инновационных проектов, действующих в поле образования. Что позволит, изучив описание инновационных стартапов выявить характерные тренды модернизации системы российского образования.

Текущий результат:

Осуществлена распаковка и предобработка данных. Разработан детальный план дальнейших действий. Предполагается использование дерева решений, так как подобная модель позволяет достигать высокой интерпретируемости и скорости работы, но есть вероятность проблем с переобучением, поэтому также планируется рассмотреть вариант использования ансамблей деревьев. В ходе исследования будут опробованы и другие модели, приемлемые для использования в подобных постановках задач: k-ближайших соседей, SVM, линейные модели.