TY - CONF
T1 - Confidence Regulation Neurons in Language Models
JO - Advances in Neural Information Processing Systems
PY - 2024/01/01
AU - Stolfo A
AU - Wu B
AU - Gurnee W
AU - Belinkov Y
AU - Song X
AU - Sachan M
AU - Nanda N
ED -
Y2 - 2025/07/06
ER -