huggingface/transformers

7 articles

前提知識

frozenset をキーとするインポート構造、_LazyModule、そして450以上のアーキテクチャを起動時にすべてインポートせずに管理する自動モデル探索の仕組みを解説します。

Hub のモデル名から CONFIG_MAPPING_NAMES、_LazyAutoMapping、PreTrainedConfig を経て正しいモデルクラスに到達するまでの解決チェーンを追う。

LLaMAモデル階層の全体像を解剖する。PreTrainedModelのmixin群、AttentionInterfaceのディスパッチシステム、Hubカーネルのホットスワップ、そして1行で書けるヘッドクラスの仕組みを詳しく解説します。

from_pretrained() のパイプラインを追いながら、meta デバイス初期化・safetensors シャーディング・量子化器の選択・デバイスマップへのディスパッチまでを解説します。

テキスト生成パイプラインを全工程にわたって解説します。GenerationConfig によるモード選択、KV キャッシュの階層構造、logits 処理、投機的デコーディング、そしてストリーミングまで。

Trainer の train() → training_step() → compute_loss() の処理フロー、コールバックシステム、分散バックエンドとの統合、そして損失関数レジストリを詳しく解説します。

pipeline() API、3バックエンド構成のトークナイザシステム、マルチモーダルモデル向け ProcessorMixin、そして新しいモデルをコントリビュートするための拡張ポイント。