Ученый из Тартуского университета в мировых соревнованиях по анализу данных занял третье место | Universitas Tartuensis
AAA

Ученый из Тартуского университета в мировых соревнованиях по анализу данных занял третье место

Научный сотрудник биоинформатики Тартуского университета Константин Третьяков на мировых соревнованиях по анализу супермассивов данных (big data) «TEXATA» среди более 2000 конкурентов занял III место.

«TEXATA», впервые состоявшееся в нынешнем году, является инновационным международным соревнованием, бросающим вызов студентам и профессионалам, позволяя участникам развивать и тестировать свои аналитические способности в big data. Для попадания в финал соперники должны пройти два квалификационных online-тура. В финал, проходящий в Остине, в штате Техас, попадают 12 лучших участников.

В число 12 финалистов попал также и Константин Третьяков, научный сотрудник биоинформатики, пишущий докторскую диссертацию в Тартуском университете. В первом туре, в котором участвовало более 2000 человек со всего мира, молодой ученый должен был в течение четырех часов в online-среде ответить на 50 вопросов с вариантами ответов и решить десять практических заданий, используя технологию Hadoop для параллельных вычислений.

Во втором online-туре, в который прошли 200 соперников, участники должны были снова в течение четырех часов ответить на десять вопросов в стиле загадок и решить главное задание. В качестве задания было дано ~60 ГБ текстовых данных медиакомпании Thomson Reuters и общее направление для решения.

«В своем решении я установил, что искомого сигнала в действительности не обнаруживается, но вероятно благодаря рациональному и практичному подходу я оказался одним из 12 счастливчиков, который встретились на финальном мероприятии в Остине», – сказал ученый.

В финальном туре соперникам были предоставлены дискуссии форума Cisco Support. «В своем решении я реализовал в качестве прототипа поиск связанных дискуссий и их маркирование (связывание тегами)», – рассказал Третьяков.

В конце соревнования каждому финалисту давалось 3 минуты времени на презентацию своего решения. После этого участники должны были еще 10 минут в частном порядке показать одному из судей технические детали. «Каждый судья выставлял по своему мнению пункты в нескольких категориях, оценивая, например, практичность, ценность, качество исполнения, использование технологий и т.д., и по общим набранным пунктам был выявлен победитель», – сказал занявший третье место призер и обладатель титула «Top Student».

Руководитель института компьютерных наук профессор Яак Вило добавил, что анализ больших массивов данных требует одновременно хорошей многосторонней подготовки в разработке алгоритмов, глубинном анализе данных, машинном обучении, визуализации и иных прикладных областях.

«Методы зачастую можно перенести из одной прикладной сферы в другую, и это позволило также Третьякову продемонстрировать свои многосторонние способности. Тартуский университет в сфере анализа объемных массивов данных в последнее время приложил большие усилия, которые были реализованы в различных исследовательских группах, в обучении, а также в сотрудничестве с предприятиями – например, Tarkvara TAK все больше сосредотачивается именно на создании решений в анализе данных. У Третьякова благодаря этому была достаточная многосторонняя подготовка», – сказал Вило.

С подробной информацией о соревновании можно ознакомиться на сайте http://www.texata.com/.

Дополнительная информация: Константин Третьяков, научный сотрудник биоинформатики Тартуского университета, e-mail: kt [ät] ut.ee.

Вирге Tамме
пресс-секретарь тартуского университета
тел. +372 737 5683
GSM: +(372) 5815 5392
Адрес электронной почты: virge.tamme [ät] ut.ee
www.ut.ee

 

Category: