Yapay Zeka Altyapı Mühendisliği

Mad Cat Labs Academy

Kurumsal yapay zeka projelerinde başarılı bir sistem kurmak yalnızca model seçmekten ibaret değildir. Modelin hangi GPU üzerinde çalışacağı, ne kadar VRAM'e ihtiyaç duyacağı, nasıl ölçekleneceği, inference servisinin nasıl tasarlanacağı, verinin nasıl hazırlanacağı ve sistemin üretim ortamında nasıl izleneceği birlikte düşünülmelidir. S1T — Yapay Zeka Altyapı Mühendisliği eğitimi, yapay zeka sistemlerini teknik olarak tasarlamak, çalıştırmak ve üretim ortamına hazırlamak isteyen mühendislik ekipleri için hazırlanmıştır. Eğitim; GPU mimarisi, VRAM hesaplama, kuantizasyon, LoRA / QLoRA ile fine-tuning, vLLM / TGI / TensorRT-LLM tabanlı inference altyapısı, RAG mimarileri ve ajan sistemleri gibi başlıkları uygulama odaklı bir teknik çerçevede ele alır. Amaç, katılımcıların yalnızca kavramları öğrenmesi değil; bir kurumsal AI altyapısının temel bileşenlerini uçtan uca nasıl değerlendireceğini, hangi teknik kararların performans ve maliyeti etkilediğini ve üretim ortamına geçerken hangi mimari konulara dikkat edilmesi gerektiğini anlamasıdır.

Hedef Kitle

Mühendisler, MLOps, Altyapı ekipleri

Bu Eğitimde Ne Öğreneceksiniz?

GPU mimarisinin yapay zeka iş yükleri için neden kritik olduğunu kavrar

CPU, GPU, VRAM, HBM, tensor core ve NVLink gibi temel altyapı bileşenlerini ayırt eder

Model boyutu, precision ve KV cache üzerinden temel VRAM hesabı yapabilir

Kuantizasyon yöntemlerinin bellek, hız ve kalite üzerindeki etkisini değerlendirebilir

LoRA, QLoRA ve full fine-tuning yaklaşımlarını karşılaştırabilir

Fine-tuning pipeline'ının veri hazırlama, eğitim, değerlendirme ve deployment adımlarını anlayabilir

vLLM, TGI ve TensorRT-LLM gibi inference altyapılarını karşılaştırabilir

Throughput, latency, concurrency ve batching kavramlarını üretim senaryosunda değerlendirebilir

RAG sistemlerinin temel mimarisini ve üretim ortamındaki kritik bileşenlerini kavrar

Tool use, function calling, MCP ve multi-agent mimarilerinin temel çalışma mantığını öğrenir

Kurumsal AI altyapısı için daha bilinçli mimari kararlar alabilir

Eğitim İçeriği (5 modül)

S1T-01~90 dk

GPU Mimarisi ve Yapay Zeka İş Yükleri

Bu modül, yapay zeka sistemlerinin neden GPU altyapısına ihtiyaç duyduğunu mühendislik perspektifinden açıklar. Katılımcılar CPU ve GPU arasındaki temel farkları, paralel işleme mantığını, tensor core'ların rolünü ve modern AI iş yüklerinin donanım üzerindeki etkisini öğrenir. Ayrıca VRAM ile sistem RAM arasındaki fark, HBM mimarisi, GPU interconnect yapıları ve çoklu GPU sistemlerinde NVLink / NVSwitch gibi bileşenlerin neden önemli olduğu ele alınır.

Detayları & İçeriği Gör

S1T-02~100 dk

VRAM Matematiği ve Kuantizasyon

Bu modül, model çalıştırma ve GPU boyutlandırma süreçlerinde ihtiyaç duyulan temel hesaplama mantığını ele alır. Katılımcılar bir modelin bellekte yaklaşık ne kadar yer kaplayacağını, precision değerlerinin VRAM ihtiyacını nasıl değiştirdiğini ve KV cache'in inference sırasında neden kritik hale geldiğini öğrenir. Ayrıca INT8, INT4 ve NF4 gibi kuantizasyon yöntemleri, kalite / performans / bellek dengesi üzerinden karşılaştırılır. Amaç, farklı model boyutları ve kullanım senaryoları için daha bilinçli GPU planlaması yapabilmektir.

Detayları & İçeriği Gör

S1T-03~120 dk

Fine-tune Derinlik: LoRA, QLoRA, Pipeline

Bu modül, kurumsal ihtiyaçlara göre model özelleştirme süreçlerini teknik düzeyde ele alır. Katılımcılar full fine-tuning, LoRA ve QLoRA yaklaşımlarının farklarını, hangi durumda hangi yöntemin daha uygun olabileceğini ve eğitim sürecinde hangi kaynaklara ihtiyaç duyulacağını öğrenir. Veri hazırlama, eğitim konfigürasyonu, değerlendirme, model versiyonlama ve deployment adımları bir pipeline mantığıyla aktarılır. Amaç, fine-tuning'i yalnızca "model eğitmek" olarak değil, ölçülebilir ve yönetilebilir bir mühendislik süreci olarak ele almaktır.

Detayları & İçeriği Gör

S1T-04~110 dk

Inference Altyapısı: Üretim Servis Mimarisi

Bu modül, eğitilmiş veya hazır bir modelin üretim ortamında nasıl servis edileceğini ele alır. Katılımcılar inference servislerinin temel mimarisini, request yönetimini, batching stratejilerini ve ölçeklenebilir servis tasarımını öğrenir. vLLM, TGI ve TensorRT-LLM gibi popüler inference framework'leri karşılaştırılır. Continuous batching, PagedAttention, tensor parallelism, throughput, latency ve concurrency gibi kavramlar üretim senaryoları üzerinden açıklanır.

Detayları & İçeriği Gör

S1T-05~130 dk

RAG ve Ajan Mimarileri

Bu modül, kurumsal yapay zeka uygulamalarında sık kullanılan RAG ve ajan mimarilerini teknik açıdan ele alır. Katılımcılar doküman tabanlı arama, embedding, vector database, retrieval, re-ranking ve context oluşturma süreçlerini uçtan uca öğrenir. Ayrıca tool use, function calling, MCP ve tek ajan / multi-agent sistemleri temel mimari prensipleriyle açıklanır. Amaç, RAG ve agentic AI sistemlerinin yalnızca demo seviyesinde değil, üretim ortamında nasıl düşünülmesi gerektiğini göstermektir.

Detayları & İçeriği Gör

Eğitim Talebi

Bu eğitime ilgi duyuyorum

Bilgilerinizi bırakın; içerik ve takvim için ekiplerimiz sizinle iletişime geçsin.