16 Architektur künstlicher neuronaler Netze

16.1 Einführung

Ein künstliches neuronales Netz (KNN) ist ein mehrschichtiges System künstlicher Neuronen, das darauf ausgelegt ist, aus Daten zu lernen. Die Architektur eines KNN bestimmt seine Leistungsfähigkeit und seinen Anwendungsbereich.


16.2 Grundlegende Struktur eines neuronalen Netzes

Ein neuronales Netz besteht typischerweise aus drei Hauptschichten:

  1. Eingabeschicht (Input Layer)
  2. Verborgene Schichten (Hidden Layers)
  3. Ausgabeschicht (Output Layer)


16.3 Arten von neuronalen Netzarchitekturen

16.3.1 Feedforward-Neuronale Netze (FNN)

Mathematische Darstellung eines MLP:

y = f(W₂ ⋅ f(W₁ ⋅ x + b₁) + b₂)

fastforwardweight.svg

16.3.2 Konvolutionale neuronale Netze (CNNs)


16.3.3 Rekurrente neuronale Netze (RNNs)

Mathematische Darstellung eines RNN:

hₜ = f(Wₕ ⋅ hₜ₋₁ + Wₓ ⋅ xₜ + b)


16.3.4 Transformer-Architekturen

Self-Attention Mechanismus:

Attention(Q, K, V) = softmax((QKᵀ) / √dₖ) ⋅ V


16.4 Tiefe vs. Breite eines neuronalen Netzes