Мы используем файлы cookies для улучшения работы сайта НИУ ВШЭ и большего удобства его использования. Более подробную информацию об использовании файлов cookies можно найти здесь, наши правила обработки персональных данных – здесь. Продолжая пользоваться сайтом, вы подтверждаете, что были проинформированы об использовании файлов cookies сайтом НИУ ВШЭ и согласны с нашими правилами обработки персональных данных. Вы можете отключить файлы cookies в настройках Вашего браузера.

Разработка инструмента для автоматизированной обработки текстов заявок, поступающих на конкурс

Участники: Чувилина Анна, Андреева Анастасия

Руководители: Королева Диана, Хавенсон Татьяна

Содержание:

Цель проекта — разработка модели обучения алгоритма предсказанию кодовых значений на основе информации, содержащейся в массиве текстовых описаний инновационных проектов, действующих в поле образования. Что позволит, изучив описание инновационных стартапов выявить характерные тренды модернизации системы российского образования.

Текущий результат:

Осуществлена распаковка и предобработка данных. Разработан детальный план дальнейших действий. Предполагается использование дерева решений, так как подобная модель позволяет достигать высокой интерпретируемости и скорости работы, но есть вероятность проблем с переобучением, поэтому также планируется рассмотреть вариант использования ансамблей деревьев. В ходе исследования будут опробованы и другие модели, приемлемые для использования в подобных постановках задач: k-ближайших соседей, SVM, линейные модели.


 

Нашли опечатку?
Выделите её, нажмите Ctrl+Enter и отправьте нам уведомление. Спасибо за участие!