
Kurumsal yapay zeka projelerinde başarılı bir sistem kurmak yalnızca model seçmekten ibaret değildir. Modelin hangi GPU üzerinde çalışacağı, ne kadar VRAM'e ihtiyaç duyacağı, nasıl ölçekleneceği, inference servisinin nasıl tasarlanacağı, verinin nasıl hazırlanacağı ve sistemin üretim ortamında nasıl izleneceği birlikte düşünülmelidir. S1T — Yapay Zeka Altyapı Mühendisliği eğitimi, yapay zeka sistemlerini teknik olarak tasarlamak, çalıştırmak ve üretim ortamına hazırlamak isteyen mühendislik ekipleri için hazırlanmıştır. Eğitim; GPU mimarisi, VRAM hesaplama, kuantizasyon, LoRA / QLoRA ile fine-tuning, vLLM / TGI / TensorRT-LLM tabanlı inference altyapısı, RAG mimarileri ve ajan sistemleri gibi başlıkları uygulama odaklı bir teknik çerçevede ele alır. Amaç, katılımcıların yalnızca kavramları öğrenmesi değil; bir kurumsal AI altyapısının temel bileşenlerini uçtan uca nasıl değerlendireceğini, hangi teknik kararların performans ve maliyeti etkilediğini ve üretim ortamına geçerken hangi mimari konulara dikkat edilmesi gerektiğini anlamasıdır.
Hedef Kitle
Mühendisler, MLOps, Altyapı ekipleri
Bu modül, yapay zeka sistemlerinin neden GPU altyapısına ihtiyaç duyduğunu mühendislik perspektifinden açıklar. Katılımcılar CPU ve GPU arasındaki temel farkları, paralel işleme mantığını, tensor core'ların rolünü ve modern AI iş yüklerinin donanım üzerindeki etkisini öğrenir. Ayrıca VRAM ile sistem RAM arasındaki fark, HBM mimarisi, GPU interconnect yapıları ve çoklu GPU sistemlerinde NVLink / NVSwitch gibi bileşenlerin neden önemli olduğu ele alınır.
Detayları & İçeriği GörBu modül, model çalıştırma ve GPU boyutlandırma süreçlerinde ihtiyaç duyulan temel hesaplama mantığını ele alır. Katılımcılar bir modelin bellekte yaklaşık ne kadar yer kaplayacağını, precision değerlerinin VRAM ihtiyacını nasıl değiştirdiğini ve KV cache'in inference sırasında neden kritik hale geldiğini öğrenir. Ayrıca INT8, INT4 ve NF4 gibi kuantizasyon yöntemleri, kalite / performans / bellek dengesi üzerinden karşılaştırılır. Amaç, farklı model boyutları ve kullanım senaryoları için daha bilinçli GPU planlaması yapabilmektir.
Detayları & İçeriği GörBu modül, kurumsal ihtiyaçlara göre model özelleştirme süreçlerini teknik düzeyde ele alır. Katılımcılar full fine-tuning, LoRA ve QLoRA yaklaşımlarının farklarını, hangi durumda hangi yöntemin daha uygun olabileceğini ve eğitim sürecinde hangi kaynaklara ihtiyaç duyulacağını öğrenir. Veri hazırlama, eğitim konfigürasyonu, değerlendirme, model versiyonlama ve deployment adımları bir pipeline mantığıyla aktarılır. Amaç, fine-tuning'i yalnızca "model eğitmek" olarak değil, ölçülebilir ve yönetilebilir bir mühendislik süreci olarak ele almaktır.
Detayları & İçeriği GörBu modül, eğitilmiş veya hazır bir modelin üretim ortamında nasıl servis edileceğini ele alır. Katılımcılar inference servislerinin temel mimarisini, request yönetimini, batching stratejilerini ve ölçeklenebilir servis tasarımını öğrenir. vLLM, TGI ve TensorRT-LLM gibi popüler inference framework'leri karşılaştırılır. Continuous batching, PagedAttention, tensor parallelism, throughput, latency ve concurrency gibi kavramlar üretim senaryoları üzerinden açıklanır.
Detayları & İçeriği GörBu modül, kurumsal yapay zeka uygulamalarında sık kullanılan RAG ve ajan mimarilerini teknik açıdan ele alır. Katılımcılar doküman tabanlı arama, embedding, vector database, retrieval, re-ranking ve context oluşturma süreçlerini uçtan uca öğrenir. Ayrıca tool use, function calling, MCP ve tek ajan / multi-agent sistemleri temel mimari prensipleriyle açıklanır. Amaç, RAG ve agentic AI sistemlerinin yalnızca demo seviyesinde değil, üretim ortamında nasıl düşünülmesi gerektiğini göstermektir.
Detayları & İçeriği GörBilgilerinizi bırakın; içerik ve takvim için ekiplerimiz sizinle iletişime geçsin.