Привет, я Кайрат — специалист в области LLM Engineering, AI Systems Architecture, Machine Learning и Deep Learning.
Опыт включает построение масштабируемых AI-систем, разработку классических ML/Deep Learning моделей, работу с традиционной NLP, интеграцию больших языковых моделей (LLM) в продакшн, а также сопровождение полного цикла разработки — от архитектуры до развертывания.
Отличаюсь умением объединять современные подходы (LLM, мультиагентные системы, RAG) с проверенными методами классического ML и DL, обеспечивая стабильность, предсказуемость и высокую производительность систем.
LLM Engineering
- Построение RAG и GraphRAG систем.
- Fine-tuning моделей (LoRA, QLoRA, PEFT) для узких доменов.
- Оптимизация inference (vLLM, TensorRT, llama.cpp, Ollama).
- Prompt-инжиниринг (Zero-shot, Few-shot, CoT, ReAct, Planning).
Multi-Agent Systems
- Архитектура многоагентных систем (LangGraph, AutoGEN, Planning Agents, Langchain).
- Интеграция агентов с API и внешними сервисами.
- Построение систем с динамическим выбором инструментов.
Classical Machine Learning
- Регрессия (Linear, Ridge, Lasso), классификация (Logistic Regression, SVM, Decision Trees, Random Forest).
- Ансамблевые методы (Gradient Boosting, XGBoost, LightGBM, CatBoost).
- Кластеризация (K-Means, DBSCAN, Hierarchical Clustering).
- Feature engineering, подбор гиперпараметров, валидация моделей.
Deep Learning
- Построение и обучение нейросетей на PyTorch (MLP, CNN, RNN, LSTM, GRU).
- Transfer Learning и fine-tuning предобученных моделей (ResNet, EfficientNet, BERT).
- Оптимизация архитектур, регуляризация, использование scheduler’ов.
- Работа с большими датасетами и ускорение обучения на GPU.
Classical NLP
- Предобработка текста: токенизация, стемминг, лемматизация, удаление стоп-слов.
- Векторизация текста (Bag-of-Words, TF-IDF, Word2Vec, FastText, GloVe).
- Классификация текста, анализ тональности, тематическое моделирование (LDA).
- Создание чат-ботов и диалоговых систем на основе традиционных методов NLP.
- Интеграция NLTK, spaCy, gensim в ML-проекты.
Backend & API Development
- FastAPI для создания REST API.
- PostgreSQL и Redis для хранения и кэширования данных.
- Оптимизация API для высоких нагрузок.
MLOps & Production
- Контейнеризация (Docker, Docker Compose).
- CI/CD (GitHub Actions, GitLab CI).
- Мониторинг, логирование и управление моделями (MLFlow, LangSmith).
Vector Search & Databases
- Внедрение и оптимизация поиска (ChromaDB, Pinecone, Weaviate, FAISS).
- Построение гибридных систем поиска.
- Реализовал Enterprise RAG-систему с интеграцией в корпоративные процессы и поддержкой гибридного поиска.
- Создал многоагентную платформу на LangGraph для автоматизации образовательных процессов.
- Построил GraphRAG Knowledge System с использованием Neo4j и LLM для семантического поиска.
- Разработал и внедрил модели классического ML для предсказания цен, классификации данных и оценки рисков.
- Обучил и оптимизировал CNN и LSTM для задач анализа изображений и обработки последовательностей.
- Наставлял команду стажёров, внедрял стандарты разработки, проводил code review.
- Довёл несколько AI-продуктов от прототипа до стабильной работы в продакшне.
Tanym (Астана) | NLP/LLM Engineer
31.12.2024 — настоящее время
- Основной разработчик NLP/LLM-модулей в AI-ассистенте.
- Создание мультиагентных систем, интеграция LLM в процессы обучения.
- Реализация RAG-пайплайнов, разработка API и контейнеризация сервисов.
- Оптимизация inference и качества генерации.
- Языки: Python, C++
- ML/DL: PyTorch, scikit-learn, XGBoost, LightGBM, CatBoost, numpy, pandas
- LLM: LangChain, LangGraph, AutoGEN, vLLM, Hugging Face, OpenAI API(И другие)
- NLP: NLTK, spaCy, Word2Vec, FastText, TF-IDF
- БД и поиск: PostgreSQL, Redis, ChromaDB, Pinecone, Weaviate, FAISS, pgvector
- MLOps: Docker, Docker Compose, GitHub Actions, MLFlow, LangSmith, ClearML
- Оптимизация inference: vLLM, TensorRT, llama.cpp, Ollama