LangChain - Using Hugging Face Models locally (code walkthrough)
Speedrun deploying LLM Embedding models into Production
Онлайн-курс «Создание чат-бота с нейросетью»: RAG моделирование сокращаем ресурсы для генерации