Лаборатория компьютерных наук

Руководитель лаборатории:Олжас Махамбетов

  1. Анализ данных и визуализация

Группа анализа и визуализации больших данных исследует, комбинирует и разрабатывает методы из разных областей Computer Science. Основные области исследования включают в себя, но не ограничиваются топологическим анализом данных, машинным обучением, визуализацией, численными методами, вейвлет анализом, и др. И хотя существенная часть научных результатов имеет подавляющую теоретическую составляющую, они находят много конкретизированных применений в различных областях (анализ химических данных, анализ данных производительности HPC, анализ больших текстовых данных, распознавание образов, визуальная аналитика, психометрия, и др.).

Среди системных целей группы существенно выделяется задача по исследованию и разработке технологий облачной визуальной аналитики, ориентированной на два основных типа больших данных: многомерных численных данных и больших текстовых данных. Впоследствии предполагается интеграция вышесказанных технологий с другими группами, для получения полноценного облачного решения по направлениям.

Проекты:

  • Исследование и разработка топологических методов применимых для анализа климатических и метеорологических данных и реконструкций.
  • Анализ производительности и автоматическая настройка алгоритмов в области термоядерного синтеза на высокопроизводительных вычислительных системах
  • Теоретическое моделирование и симуляция нового коаксиального зонда для сканирующей оптической микроскопии ближнего поля.
  1. Облачные и высокопроизводительные вычисления

С целью повышения эффективности и гибкости использования существующих вычислительных ресурсов группа занимается развертыванием облачной инфраструктуры на базе платформы OpenStack. Данная платформа позволяет прозрачно объединить все имеющиеся физические машины в единый пул виртуальных ресурсов, одновременно предоставляя удобный интерфейс для управления этими ресурсами как внешним пользователям (исследовательским группам), так и администраторам.

На настоящий момент развернута базовая сборка Openstack с архитектурой Neutron и имеется возможность пробрасывать графические карты (Tesla K20) в виртуальные машины для пользователей, требующих высокопроизводительных вычислений на CUDA. Среди основных задач по развитию системы можно назвать гибкое управление пользователями, обеспечение безопасности и масштабируемости системы (fault tolerance, high availability), а также создание среды для высоконагруженных и распределенных вычислений(Apache Spark, MPI, NoSQL базы).

3. Вычислительная лингвистика

Группа вычислительной лингвистики занимается разработкой методов и алгоритмов обработки и анализа естественного языка, с акцентом на изучение проблем в области машинного перевода, семантического анализа текстов в мультиязычной среде, рекомендательных систем, анализа социальных сетей и т.д.

4.Обработка сигналов и речи

 Группа занимается разработкой методов и алгоритмов по распознаванию и синтезу казахской речи с использованием подходов машинного обучения и искусственного интеллекта, а также ведет исследования в области фонетики, акустики и обработки сигналов. Целью группы является создание удобного интерфейса взаимодействия пользователей с компьютерными системами, поиска и обработки информации на естественном для человека способе - речи. Несмотря на то, что казахский язык является основным объектом исследования, в данной группе применяются языконезависимые подходы и методы анализа речи. Кроме того, в группе уделяется особое внимание на создание и обработку речевых корпусов для широкого круга исследователей.

  1. Мультимедийные технологии

Группа мультимедийных технологий выходит за рамки известных границ и дисциплин, поощряя наиболее нетрадиционные направления путем смешивания и сопоставления, казалось бы, разрозненных научных направлений. Это дает возможность создавать новаторские технологии, которые находятся на пересечении таких направлений, как компьютерное зрение, вычислительная лингвистика, логопедия, педагогика, психология и т.д. На сегодняшний день исследовательская группа работает над разработкой системы распознавания жестового языка для глухонемых, технологий умного класса, интерактивных технологий для маркетинга и т.д.