ThinkTransformer experiments - a amang1802 Collection

amang1802 's Collections

ThinkTransformer experiments

Small model pretraining experiments

PPO experiments

Synthetic Data rewrite (model checkpoints)

Synthetic Data rewrite research (training and eval datasets)

WildeWeb Research

ThinkTransformer experiments

updated Feb 22, 2025

Experiments with new architecture that enables latent space reasoning